Дослідження та впровадження нейронної мережі на основі TensorFlow
DOI: 10.31673/2412-9070.2020.062025
Анотація
TensorFlow — це механізм машинного навчання та глибокого навчання з відкритим кодом, який є зручним та гнучким для побудови поточної загальноприйнятої моделі глибинного навчання. Нейронна мережа — це класична модель глибинного навчання, перевага якої полягає у її потужних можливостях вилучення конволюційних блоків. Нейронна мережа в найпростішому випадку — математична модель, яка складається з кількох шарів елементів, що виконують паралельні обчислення. Спочатку таку архітектуру було створено за аналогією з дрібними обчислювальними елементами людського мозку — нейронами. Мінімальні обчислювальні елементи штучної нейронної мережі теж називаються нейронами. Нейронні мережі, зазвичай, складаються з трьох або більше шарів: вхідного шару, прихованого шару (або шарів) і вихідного шару. Важливою особливістю нейронної мережі є її вміння навчатися на прикладах, це називається навчанням з учителем. Нейронна мережа навчається на великій кількості прикладів, що складаються з пар вхід-вихід (відповідні один одному вхід і вихід). У задачах розпізнавання об’єктів такою парою буде вхідне зображення і відповідний йому лейбл — назва об’єкта. Навчання нейронної мережі — ітеративний процес, що зменшує відхилення виходу мережі від заданого («відповіді вчителя») — лейбла, яке відповідає даному зображенню. Цей процес охоплює кроки, названі епохами навчання (вони зазвичай обчислюються тисячами), на кожному з яких відбувається підгонка «ваг» нейронної мережі — параметрів прихованих шарів мережі. Після завершення процесу навчання якість роботи нейронної мережі переважно досить гарна для виконання завдання, під яке її було навчено, хоча оптимальний набір параметрів, котрі ідеально розпізнають усі зображення, часто підібрати неможливо. На основі платформи TensorFlow було побудовано модель нейронної мережі з двома згортковими шарами. Модель пройшла навчання та тестування за допомогою набору даних MNIST. Показник точності тесту може досягати 99,15% і порівняно з коефіцієнтом 98,69% у моделі з однією згорткою шару показує, що модель нейронної мережі з двома згортаннями має кращу здатність щодо виокремлення ознак і класифікації прийняття рішень.
Ключові слова: нейронна мережа; глибинне навчання; згорткові шари; tensorflow.
Список використаної літератури
1. Zheng Z. TensorFlow actual Google deep learning framework // Electronic Industry Press. 2018. 287 р.
2. Jing T., Zhang Y. Digital recognition based on deep learning under the TensorFlow platform. 2018. 37(04). 78 р.
3. Xiao J. The application prospect of clustering algorithm in TensorFlow platform is discussed // Digital technology and applications. 2018. №36. Р. 203.
4. Goodfellow I., Bengio Y., Aaron Courville A. DEEP LEARNING // Posts and Telecom Press. 2018. Р. 203.
5. He Y. Python works with machine learning // Electronic Industry Press. 2017. №200. Р. 222.
6. Han S., Tan S. Design and implementation of a deep learning model for stock forecasting based on TensorFlow // Computer applications and software. 2018. №35. Р. 291.
7. Xu Y. Application of deep learning in handwritten numeral recognition // Suzhou University. 2017. №255. Р. 136.
8. Xu Y., Li Z. Handwritten numeral recognition in convolutional neural network and TensorFlow // Shanghai electric technology. 2018. №11. Р. 61.
9. Handwritten numeral recognition system based on TensorFlow / H. Chen, H. Guo, D. Liu, J. Zhang. // Information communication. 2018. №3. Р. 110.
10. Zheng P., Guo L., Ding L. Research and implementation of convolutional neural network based on TensorFlow // Electronic technology and software engineering. 2018. №18. Р. 22.
11. Jin Z. Comparison and analysis of different deep convolutional neural networks based on TensorFlow // Electronics World. 2018. №6. Р. 26.
12. Hou Y., Ding S., Sun T. The mixed depth learning model C-RF and its application in handwritten numeral recognition // Data acquisition and processing. 2018. №33. Р. 350.
13. Ertam F., Aydin G. Data classification with deep learning using Tensorflow // International Conference on Computer Science and Engineering (UBMK) Antalya, 2017. 758 р.
14. Analogizing time complexity of KNN and CNN in recognizing handwritten digits / T. Makkar, Y. Kumar, A. K. Dubey, A. Rocha // Fourth International Conference on Image Information Processing (ICIIP) Shimla, 2017. 1256 р.
15. Alif M., Ahmed S., Hasan M. Isolated Bangla handwritten character recognition with convolutional neural network // 20th International Conference of Computer and Information Technology (ICCIT) Dhaka, 2017. 523 р.
16. Iamsa S., Horata P. Handwritten Character Recognition Using Histograms of Oriented Gradient Features in Deep Learning of Artificial Neural Network // International Conference on IT Convergence and Security (ICITCS) Macao, 2013. 312 р.