Верифікація документів на вебресурсі методом розпізнавання тексту

Ю. М. Тертична; О. В. Негоденко; О. С. Дзядович

Тертична Ю. М. (Tertychna Yu. M.) Державний університет телекомунікацій, Київ
Негоденко О. В. (Nehodenko O. V.) Державний університет телекомунікацій, Київ
Дзядович О. С. (Dzyadovych O. S.) Державний університет телекомунікацій, Київ

Анотація

Висвітлено актуальні питання, пов’язані з верифікацією документів на вебресурсі за допомогою методів розпізнавання тексту. Встановлено, що існують різні методи та програмні рішення для цифрової перевірки особистості. Важливим є впровадження технологій штучного інтелекту і можливість доопрацювання під індивідуальні завдання, що підвищує ефективність бізнесу в рази. Вагомим недоліком є розгортання платформ на серверах, у такий спосіб підвищуючи фінансову затратність на інтеграцію та беручи в оренду потрібне програмне забезпечення. Розроблено метод, в якому використовується спосіб інтеграції у вигляді API. Застосовано модуль «Tesseract» для JavaScript, створено модуль для кращого та швидшого методу верифікації, розбитого на кілька блоків визначення коефіцієнтів для підтвердження ліквідності документа. Побудовано алгоритм для знаходження коефіцієнтів для підтвердження ліквідності документа та математичну модель автентифікації документів.

Ключові слова: верифікація; автентифікація; штучний інтелект; API; JavaScript; Еrusted Identity Network.

Список використаної літератури
1. Wang T., Wu D. J., Coates A. End-to-End Text Recognition with Convolution Neural Networks // IEEE Conf. Pattern Recognition. 2012. Р. 3304–3308.
2. Zhu Y., Sun J., Naoi S. Recognizing Naural Scene Characters by Convolutional Neural Network and Bimodal Image Enhancement // Workshop on Camera-Based Document Analysis and Recognition. 2012. Р. 69–82.
3. Chen X., Yang J., Zhang J. Automatic Detection and Recognition of Signs from Natural Scenes // IEEE Image Processing. 2004. vol. 13, no. 1. Р. 87–99.
4. Васильєв В. Н., Гуров І. П., Потапов А. С. Математичні методи і алгоритмічне забезпечення аналізу та розпізнавання зображень в інформаційно-телекомунікаційних системах. 2008. С. 22–28.
5. Koo H., Kim D. H. Scene Text Detection via Connected Component Clustering and Non-text Filtering // IEEE Processing. 2013. vol. 22, no. 6. Р. 2295–2304.
6. Hanif S. M., Prevost L. Text Detection and Localization in Complex Scenes using Constrained Adaboost Algorithm // IEEE Conf. Document Analysis and Recognition. 2009. Р. 1–5.
7. Mosleh A., Bouguila N., Hamza A. Image Text Detection Using a Bandlet-Based Edge Detector and Stroke Width Transform // British Machine Vision Conference. 2012. Р. 1–2.
8. Rosset, Zhu, Hastie. Boosting as a Regularized Path to a Maximum Margin Classifier // Journal of Machine Learning Research. 2004. №5. Р. 941–973.
9. Garcia C., Apostolidis X. Text Detection and Segmentation in Complex Color Images // IEEE Conf. Acoustics, Speech and Signal Processing. 2000. Р. 2326–2330.
10. Karatzas D., Antonacopoulos A. Text Extraction from Web Images Based on a Split-and-Merge Segmentation Method Using Colour Perception // IEEE Conf. Pattern Recognition. 2004. Р. 634–637.
11. Lienhart R., Kuranov A., Pisarevsky V. Empirical Analysis of Detection Cascades of Boosted Classifiers for Rapid Object Detection // MRL Technical Report. 2002. Р. 12–15, 17.
12. Hunspell spell chacker dictionary [Електронний ресурс]. URL: http://hunspell.sourceforge.net/.
13. Jaderberg M., Simonyan K. Synthetic data and artificial neural networks for natural scene text recognition. NIPS Deep Learning Workshop, 2014.
14. Lucas S. M., Panaretos A. ICDAR 2003 robust reading competitions: entries, results, and future directions. IJDAR, 2005. Р. 105–122.
15. Krizhevsky A., Sutskever I. Imagenet classification with deep convolutional neural networks. NIPS, 2012.

Верифікація документів на вебресурсі методом розпізнавання тексту

DOI: 10.31673/2412-9070.2022.035159

Анотація