Виявлення потенціалу застосування нейромережних моделей у контексті обробки природної мови
DOI: 10.31673/2412-9070.2025.050517
Анотація
На сьогоднішній день психічне здоров'я людини є пріоритетною проблемою. Згідно з останнім звітом на 2024 рік про стан охорони здоров'я, 45% респондентів вважають психічне здоров'я однією з головних проблем охорони здоров'я, з якими стикається їхня країна. На другому місці — рак (38%), а на третьому — стрес (31%) у 31 країні [1].
Дана стаття фокусується на визначенні потенціалу моделей обробки природної мови для аналізу діагностики психологічних розладів. У статті було обрано три моделі для аналізу та дослідження, класифікатор на основі методу опорних векторів, модель логістичної регресії та трансформерна модель DistilBERT. Було об’єднано дані з відкритих датасетів Reddit Mental Health Dataset та датасету з Kaggle для класу нейтральних даних без виражених маркерів психологічних розладів.
Спершу було проведено аналіз загальних відмінностей алгоритмів та принципів роботи моделей. Потім практично виконано тестування на однаковому обсязі попередньо оброблених даних. За результатами проведених досліджень та порівнянь було підбито підсумки та визначено, що трансформерна модель, на відносно не великому обсязі даних все ж таки показує кращі результати ніж звичні класичні моделі. Класичні ж моделі теж показали гарні результати, але, якщо зробити кількість даних більшою, результати стрімко погіршуються, коли ж у трансформерної моделі покращуються.
Ключові слова: нейромережні моделі; логістична регресія; метод опорних векторів; трансформерні моделі; психологічна діагностика; психологічні розлади; обробка природної мови.