Naive Bayes Classifier як один із варіантів фільтрації небажаної електронної пошти
DOI: 10.31673/2412-9070.2019.065860
Анотація
Розглянуто проблему класифікації електронної кореспонденції для визначення приналежності листів до небажаної електронної пошти. Запропоновано три підходи для розв’язання даної проблеми. Детально проаналізовано Naive Bayes Classifier як найбільш ефективний спосіб, що дає змогу з високою точністю класифікувати листи і водночас є економним вирішенням стосовно витрат обчислювальних ресурсів.
Ключові слова: Naive Bayes Classifier; обчислювальна ефективність; Rule based classification; Weight based classification; фільтрація спам-листів; класифікатор.
Список використаної літератури
1. Guzella T. S., Caminhas W. M. A review of machine learning approaches to Spam filtering // Expert Systems with Applications. 2009. Vol. 36, no. 7. P. 10206–10222. DOI:10.1016/j.eswa.2009.02.037.
2. Metsis V., Androutsopoulos I., Paliouras G. Spam Filtering with Naive Bayes — Which Naive Bayes? // CEAS 2006: Third Conference on Email and Anti-Spam (July 27-28, 2006). Mountain View, California, USA, 2006.
3. A Bayesian approach to filtering junk email / M. Sahami, S. Dumais, D. Heckerman, E. Horvitz // AAAI Workshop on Learning for Text Categorization. Technical Report. 1998.