Розроблення методу пошуку схожих акаунтів у соціальних мережах на основі кластерного аналізу
DOI: 10.31673/2412-9070.2022.063842
Анотація
В останні десятиліття істотно зросла кількість користувачів мережі «Інтернет». Водночас збільшується кількість людей, які використовують соціальні мережі для зв’язку та отримання інформації. Активний розвиток соціальних мереж також надзвичайно вплинув на ринок реклами, адже завдяки інформації про користувачів, яку збирають ці мережі, рекламодавці мають змогу таргетувати рекламу з величезною точністю, що значно впливає на зріст продажів товарів та послуг. Адже за допомогою визначення схожих акаунтів можна легко встановити, що товар, який сподобався одному користувачу, швидше за все привабить й іншого. Щоб відшукати найбільш доцільний за вибраною тематикою метод кластерного аналізу, було проведено системний аналіз методів кластерного аналізу. Проаналізовано, що одним із підходів до пошуку схожих акаунтів у соціальних мережах є аналіз акаунтів за певними ознаками, що широко використовується сучасними компаніями, які мають соціальні мережі для таргетованої реклами. Аналіз методів кластеризації показав, що не існує певного універсального методу для аналізу кластеризації даних, а отже, було проаналізовано різні методи кластеризації та зроблено висновок про те, що поліпшений алгоритм k-means – k-means mini batch найкраще підходить для пошуку схожих акаунтів.
Ключові слова: метод кластерного аналізу; інформаційні технології; кластер; методи кластеризації; спрощений алгоритм кластеризації; метод статистичного аналізу; системний аналіз; великі дані.
Список використаної літератури
1. Internet users 2017 forecast. [Електронний ресурс]. URL: https://stats.areppim.com/stats/stats_internetxfcstx2017.htm
2. Hadoop: The Definitive Guide. T. White, 2012.
3. Association Rule Mining: Models and Algorithms. Chengqi Zhang, 2002.
4. Big data market forecast worldwide from 2011 to 2026 [Електронний ресурс]. URL: https://www.statista.com/statistics/255970/global-big-data-market-forecast-by-segment/
5. Seetha Hari, Murty Narasimha, B. K. Tripathy. Modern Technologies for Big Data Classification and Clustering. IGI Global, 2015 р.
6. Grid-Based Clustering - STING, WaveCluster & CLIQUE [Електронний ресурс]. URL: https://www.datamining365.com/2020/04/grid-based-clustering.html