Pозроблення методики транскрибації на основі нейронних мереж

DOI: 10.31673/2412-9070.2024.022326

  • Сачук О. В. (Sachuk O. V.) Державний університет інформаційно-комунікаційних технологій, Київ
  • Сагайдак В. А. (Sahaydak V. A.) Державний університет інформаційно-комунікаційних технологій, Київ

Анотація

У сучасному світі, де технології стрімко розвиваються, все частіше використовуються аудіо- та відеоматеріали для різноманітних цілей: навчання, досліджень, розроблень, а також у повсякденному спілкуванні та передаванні інформації. Цей підхід є зручним, ефективним та не відвертає нашої уваги від інших справ, на відміну від, наприклад, ручного письма або набору тексту на комп'ютері, який може бути незручним у певних ситуаціях, як-от під час поїздки в автомобілі. Водночас часто постає потреба перевести аудіо- та відеоінформацію в текстовий формат для її подальшого редагування, перенабору чи розшифрування, оскільки не всі здатні або мають змогу сприймати інформацію як звук чи відео. Окрім того, не кожен аудіо- чи відеозапис має чітку та зрозумілу вимову, що також зумовлює потребу в транскрибації — перекладі інформації з аудіо та відео в текстову форму. Одним із ключових аспектів цього процесу є розпізнавання важливої інформації, що є головним компонентом сучасного використання комп'ютерних технологій. Стосовно реалізації таких завдань людство постійно шукає нові підходи, серед яких особливе місце посідають нейронні мережі — складні алгоритмічні конструкції, здатні навчатися та адаптуватися до різноманітних типів даних для їх ефективного оброблення.

Ключові слова: транскрибація; нейронні мережі; методика транскрибації.

Список використаної літератури
1. Zou J., Han Y., So S. S. Overview of Artificial Neural Networks. In: Livingstone D.J. (Eds) Artificial Neural Networks // Methods in Molecular Biology™. 2008. vol. 458. Р. 14–22.
2. Голямина И. П. Звук. Физическая энциклопедия. URL: www.femto.com.ua/articles/part_1/1222.html
3. Шум. Вікіпедія. URL: https://uk.wikipedia.org/wiki/Шум
4. GetAClass — Физика в опытах и экспериментах. Источники звука. URL: https://youtu.be/nFcmTTT9yiE
5. Suryo Wijoyo. Speech Recognition Using Linear Predictive Coding and Artificial Neural Network for Controlling Movement of Mobile Robot // International Conference on Information and Electronics Engineering IPCSIT. Singapore, 2011. vol. 6, IACSIT Press. Р. 179–183.

Номер
Розділ
Статті