Порівняльний аналіз підходів, що базуються на правилах та машинного навчання для виявлення шахрайських транзакцій
DOI: 10.31673/2412-9070.2025.050346
Анотація
Фінансові установи сьогодні значною мірою покладаються на системи, побудовані на логічних правилах, що включають порогові значення, «білі»/«чорні» списки, перевірки кількості, щоб знаходити підозрілі транзакції. Такі методи використовуються широко насамперед через високу пояснюваність, так як для фінансових установ важливо мати можливість показати кінцевому користувачу, чому саме внутрішні системи та/або співробітники прийняли певне рішення. Також, важливим є те, що такі методи просто побудувати і підтримувати, бо через відсутність складних алгоритмів за допомогою їх легше навчити співробітників. Моделі машинного навчання, з іншого боку, хоча й обіцяють вищу точність і адаптивність, залежать від характеристик даних, дисбалансу класів, часових рамок та вимог до інтерпретованості. Для побудови ансамблів подібних моделей необхідно мати багато кваліфікованого людського ресурсу. При масштабуванні такого ансамблю на компанію, витрати часу і людських ресурсів будуть значно вищими. У цій статті описується контрольована оцінка конфігурованої системи правил і кількох моделей контрольованого ML (логістична регресія, випадковий ліс, градієнтний бустинг) на незбалансованому наборі транзакційних даних. Вимірюється якість виявлення шахрайства за допомогою метрик ROC-AUC, PR-AUC, а також точності і повноти. Вимірюються операційні витрати (рівень хибнопозитивних результатів, кількість сповіщень на 1 тис. транзакцій) та інженерні компроміси, наприклад, інтерпретованість. Результати показують, що хоча правила залишаються конкурентними в режимах високої точності при низькій повноті, ML-підходи забезпечують суттєво кращу повноту за подібної точності, особливо у поєднанні з методами обробки дисбалансу класів. Однак, вказується, що простіші алгоритми суттєво виграють в часі, особливо на середньому обладнанні, та у вартості, що може зробити їх привабливішими для менших установ з обмеженими ресурсами. Обговорюються аспекти застосування методів у реальних робочих просторах та окреслюється гібридна стратегія, яка поєднує правила та машинне навчання. Закладається фундамент для поглибленого дослідження таких підходів саме в рамках метрик «вартості» і «швидкості».
Ключові слова: виявлення шахрайства; фінансовий ризик; виявлення аномалій; логічні правила; машинне навчання; дисбаланс класів; інтерпретованість.