Аналіз методів розпізнавання та синтезу зображень для розширення навчальної вибірки

О. Ю. Котул; О. В. Сеньков; О. В. Жидка

Котул О. Ю. (Kotul O. Yu.) Державний університет інформаційно-комунікаційних технологій, Київ
Сеньков О. В. (Senkov O. V.) Державний університет інформаційно-комунікаційних технологій, Київ
Жидка О. В. (Zhydka O. V.) Державний університет інформаційно-комунікаційних технологій, Київ

Анотація

Розглянуто важливий аспект у сфері машинного навчання — розпізнавання та синтез зображень для ефективного розширення навчальної вибірки. Наведено методи розпізнавання зображень, виокремлено метод згорткових нейронних мереж. Також виявлено одну з основних проблем у процесі використання цих методів, зокрема недостатню навчальну вибірку для навчання мережі. У сучасному машинному навчанні, де доступ до великих обсягів реальних даних часто обмежений, проблема відсутності навчальних прикладів постає як ключова. У статті проаналізовано методи розширення, які дають змогу збільшити обсяг даних завдяки введенню різноманітних перетворень та модифікацій вихідного набору.
Особливу увагу приділено генеративним моделям, таким як Variation Autoencoder (VAE). Детально досліджено їхню здатність синтезувати нові, реалістичні образи та їх вплив на підвищення ефективності для розпізнавання моделей. Розглянуто здатність створювати реалістичні зображення, зазначено важливість використання таких методів у сценаріях із невеликою кількістю доступних даних.
Приклади та результати досліджень підкреслюють практичність застосування запропонованих методів у різних сценаріях машинного навчання. У статті не тільки розкрито сучасні підходи, а й сформульовано перспективи подальших досліджень у цьому важливому напрямі.

Ключові слова: нейронні мережі; варіаційний автокодувальник; розпізнавання зображень; генерація зображень; аугментація; навчальна вибірка.

Аналіз методів розпізнавання та синтезу зображень для розширення навчальної вибірки

DOI: 10.31673/2412-9070.2024.022729

Анотація