Naive Bayes Classifier як один із варіантів фільтрації небажаної електронної пошти

DOI: 10.31673/2412-9070.2019.065860

  • Підмогильний О. О. (Pidmohylʹnyy O. O.) Державний університет телекомунікацій, м. Київ
  • Ткаченко О. М. (Tkachenko O. M.) Державний університет телекомунікацій, м. Київ
  • Голубенко О. І. (Holubenko O. I.) Державний університет телекомунікацій, м. Київ
  • Дробик О. В. (Drobyk O. V.) Державний університет телекомунікацій, м. Київ

Анотація

Розглянуто проблему класифікації електронної кореспонденції для визначення приналежності листів до небажаної електронної пошти. Запропоновано три підходи для розв’язання даної проблеми. Детально проаналізовано Naive Bayes Classifier як найбільш ефективний спосіб, що дає змогу з високою точністю класифікувати листи і водночас є економним вирішенням стосовно витрат обчислювальних ресурсів.

Ключові слова: Naive Bayes Classifier; обчислювальна ефективність; Rule based classification; Weight based classification; фільтрація спам-листів; класифікатор.

Список використаної літератури
1. Guzella T. S., Caminhas W. M. A review of machine learning approaches to Spam filtering // Expert Systems with Applications. 2009. Vol. 36, no. 7. P. 10206–10222. DOI:10.1016/j.eswa.2009.02.037.
2. Metsis V., Androutsopoulos I., Paliouras G. Spam Filtering with Naive Bayes — Which Naive Bayes? // CEAS 2006: Third Conference on Email and Anti-Spam (July 27-28, 2006). Mountain View, California, USA, 2006.
3. A Bayesian approach to filtering junk email / M. Sahami, S. Dumais, D. Heckerman, E. Horvitz // AAAI Workshop on Learning for Text Categorization. Technical Report. 1998.

Номер
Розділ
Статті