ВИВЧЕННЯ ОСНОВ ШТУЧНОГО ІНТЕЛЕКТУ ПРИ СТВОРЕННІ ГОЛОСОВОГО АСИСТЕНТУ
Анотація
В статті розглядаються персональні цифрові помічники.
Вирішувати повсякденні завдання допомагає галузь штучного інтелекту. Масове впровадження штучного інтелекту у повсякденне життя користувачів сприяє переходу на голосові програми.
Голосові асистенти можуть виконувати різноманітні дії після того, як почули слово або команду пробудження. Вони можуть вмикати світло, відповідати на запитання, відтворювати музику, робити онлайн-замовлення тощо.
Авторами статті, розроблений голосовий асистент, розпізнає й синтезує мову. Голосовий помічник може в режимі реального часу аналізувати запит клієнта і відтворювати попередньо записані репліки, надає можливість мінімізувати дію руками для перегляду контенту в інтернеті.
Студенти Центральноукраїнського державного університету імені Володимира Винниченка спільно зі студентами-іноземцями Донецького національного медичного університету розв’язували задачі зі штучного інтелекту з використанням мови програмування. В результаті роботи створений голосовий україномовний бот, який запускається на персональному комп’ютері і його можна використовувати, як приклад програмування в навчальному процесі.
Для створення голосового помічника використовували малу модель на 50 Мб, для того, щоб він більш швидше розпізнавав мову та реагував на команди оперативніше.
Текст мовлення TTS працює з персональними цифровими пристроями. Голос TTS генерується комп’ютером. Якість розмовного голосу залежить від мовного механізму, але деякі голоси звучать як людські. В нашому випадку це голос модулю Torch з єдиним українським спікером 'mykyta_v2'.
Для розуміння та розпізнавання української мови користувача, використали модуль vosk, для обробки, та sounddevice для ретрансляції.
Розробили функцію виклику голосового асистента із фонового режиму на своє ім’я, фільтрацію голосового трафіку, орієнтацію по функціоналу помічника.
Дана програма пройшла апробацію студентами-іноземцями Донецького національного медичного університету під час практичних занять з медичної інформатики для виведення на екран статей медичного словника.
Посилання
А.с. на твір Комп’ютерна програма «Голосовий асистент із використанням штучного інтелекту» / В.О. Болілий, Л.П. Суховірська, Ю.М. Гордієнко – № c202203822; заявл. 26.08.22; № 114761; зареєстр. 13.09.22.
Гордієнко Ю.М., Болілий В.О. Голосовий асистент із використанням штучного інтелекту. Стан, досягнення та перспективи інформаційних систем і технологій : Матеріали XXII Всеукраїнської науково-технічної конференції молодих вчених, аспірантів та студентів, м. Кропивницький, 29 квітня 2022 р. Кропивницький, 2022.
Prepare for the voice revolution. URL: https://www.pwc.com/us/en/services/consulting/library/consumer-intelligence-series/voice-assistants.html (дата звернення: 25.12.2022).
DIGITAL VOICE ASSISTANTS IN USE TO TRIPLE TO 8 BILLION BY 2023, DRIVEN BY SMART HOME DEVICES. URL: https://www.juniperresearch.com/press/digital-voice-assistants-in-use-to-8-million-2023 (дата звернення: 25.12.2022).
Diana Ramos. Voice Assistants: How Artificial Intelligence Assistants Are Changing Our Lives Every Day. URL: https://www.smartsheet.com/voice-assistants-artificial-intelligence (дата звернення: 25.12.2022).
Pascal Hérard. Assistants vocaux "intelligents": quand les constructeurs font écouter les conversations des utilisateurs. URL: https://information.tv5monde.com/info/assistants-vocaux-intelligents-quand-les-constructeurs-font-ecouter-les-conversations-des (дата звернення: 25.12.2022).
Marie-Alix Payeur. L’essor de l’intelligence artificielle dans un monde vocal. URL: https://www.abcvoice.fr/assistance-vocale/ (дата звернення: 25.12.2022).
Assistants vocaux : ces outils du quotidien (et du confinement) !. URL: https://www.intelligence-artificielle-school.com/actualite/assistants-vocaux-outils-quotidien-confinement/ (дата звернення: 25.12.2022).
TechTarget Contributor. Natural language understanding (NLU). URL: https://www.techtarget.com/
searchenterpriseai/definition/natural-language-understanding-NLU (дата звернення: 25.12.2022).
Cheyenne Noelle. Comment l'intelligence artificielle va perturber la reconnaissance vocale. URL: https://www.processmaker.com/fr/blog/how-artificial-intelligence-will-disrupt-speech-recognition/ (дата звернення: 25.12.2022).
Célia Garcia-Montero. Assistant vocal : savoir le choisir et connaître les risques. URL: https://www.journaldunet.fr/web-tech/dictionnaire-de-l-iot/1440654-assistant-vocal-savoir-le-choisir-et-connaitre-les-risques/ (дата звернення: 25.12.2022).
Lina F. NLP- Natural Language Processing : Introduction. URL: https://datascientest.com/introduction-au-nlp-natural-language-processing (дата звернення: 26.12.2022).
Vosk. Documentation. URL: https://alphacephei.com/vosk (дата звернення: 26.12.2022).
P. Olivier, Introduction au NLP (Partie I), Ekino. URL: https://www.ekino.fr/publications/introduction-au-nlp-partie-i/ (дата звернення: 25.12.2022).
P. Olivier, Introduction au NLP (Partie II), Ekino. URL: https://www.ekino.fr/publications/introduction-au-nlp-partie-ii/ (дата звернення: 25.12.2022).
Fuzzywuzzy. Documentation. URL: https://pypi.org/project/fuzzywuzzy/ (дата звернення: 25.12.2022).
Visual Studio Code. Documentation. URL: https://code.visualstudio.com/docs (дата звернення: 25.12.2022).
PyOWM documentation. URL: https://pyowm.readthedocs.io/en/latest/ (дата звернення: 26.12.2022).
Garazd Creation. Numbers to Ukrainian text. URL: https://apps.odoo.com/apps/modules/11.0/l10n_ua_num2text/ (дата звернення: 27.12.2022).
Sounddevice. Documentation. URL: https://python-sounddevice.readthedocs.io/en/0.4.4/ (дата звернення: 25.12.2022).
NumPy. Documentation. URL: https://numpy.org/doc/stable/ (дата звернення: 27.12.2022).
Torch. Documentation. URL: https://pytorch.org/docs/stable/torch.html (дата звернення: 25.12.2022).
DateTime. Documentation. URL: https://docs.python.org/3/library/datetime.html (дата звернення: 27.12.2022).