ВИЯВЛЕННЯ НЕПРИРОДНЬОЇ ПОВЕДІНКИ КОРИСТУВАЧІВ У СОЦІАЛЬНИХ МЕРЕЖАХ З ВИКОРИСТАННЯМ ТЕХНОЛОГІЙ МАШИННОГО НАВЧАННЯ

Iryna Mysiuk, Roman Shuwar

Анотація


Інформація з соціальних мереж впливають на суспільні настрої, поширення думок та реакцій на події. На поширення часто підставної інформації та підбурювання людей в чутливій тематиці часто впливають штучно створенні користувачі для певних подій. Іншими словами такі користувачі називаються боти, яких варто швидко виявляти та блокувати для зупинки просування певних вигідних питань замовникам. Процес виявлення може бути автоматизований за допомогою натренованих моделей на основі зібраних даних та кластеризації користувачів за ознаками притаманним ботам. Серед згаданих відмінностей є інформація про кількість підписників та друзів, активність публікації постів, наявність фото, дата створення акаунта та інше.

Більшість часу для аналітичних етапів витрачається для формування наборів даних. У роботі використано метод збору з вмісту веб елементів веб сторінок у браузері. Враховуючи використання комплексного підходу зі збору даних про користувачів з кількох соціальних мереж Instagram, Facebook та Twitter, великий об’єм даних різного формату та структури стандартизовано під однаковий шаблон. Для тренування та тестування моделей описаний спосіб автоматизованого збору даних з допомогою фреймворку Selenium зі сторінок користувачів в набори даних. Показано кореляцію різних атрибутів та показано результати класифікації для визначення користувачів з неприродньою поведінкою у соціальних мережах.

Для класифікації користувачів за ознакою боту з відмінними від користувачів рисами використано для порівняння кілька методів машинного навчання Random Forest, Decision Tree, Gaussian Naive Bayes, K-Nearest Neighbors, Support Vector Classification. Серед яких найкращим по точності виявився Decision Tree. На основі тестового набору даних виконано класифікацію даних про користувачів на основі навченої моделі. Отже, у роботі показано можливості реалізації операцій збору, опрацювання, проміжного аналізу та класифікації користувачів на наявність ботів у соціальних мережах.

Ключові слова: бот, машинне навчання, соціальна мережа, класифікація даних, збір даних.


Повний текст:

PDF (English)

Посилання


  1. Mysiuk I., Mysiuk R., Shuvar R. Collecting and analyzing news from newspaper posts in Facebook using machine learning / Stuc. intelekt. // 2023; 28(1):147-154 DOI: https://doi.org/10.15407/jai2023.01.147
  2. I. Mysiuk, R. Mysiuk, R. Shuvar, V. Yuzevych. Methods of analytics of big data of popular electronic newspapers on Facebook // Electronics and information technologies 2022 – Vol. 19. – P. 66–74, DOI: http://dx.doi.org/10.30970/eli.19.6
  3. Agarwal, Isha & Rana, Dipti & Bhatia, Devanshi & Rathod, Jay & Gandhi, Kaneesha & Sodagar, Harshit. (2021). Detection of Bot Accounts on Social Media Considering Its Imbalanced Nature. Data Preprocessing, Active Learning, and Cost Perceptive Approaches for Resolving Data Imbalance. DOI: https://doi.org/10.4018/978-1-7998-7371-6.ch009
  4. Mariam Orabi, Djedjiga Mouheb, Zaher Al Aghbari, Ibrahim Kamel. Detection of Bots in Social Media: A Systematic Review, Information Processing & Management, Vol. 57, Issue 4, 2020, 102250, ISSN 0306-4573, DOI: https://doi.org/10.1016/j.ipm.2020.102250.
  5. Aljabri, M., Zagrouba, R., Shaahid, A. et al. Machine learning-based social media bot detection: a comprehensive literature review. Soc. Netw. Anal. Min. 13, 20 (2023). DOI: https://doi.org/10.1007/s13278-022-01020-5.
  6. [scikit-learn Machine Learning in Python – Retrieved from: https://scikit-learn.org/stable/
  7. Machine Learning Visualization with Yellowbrick – Retrieved from: https://medium.com/akava/machine-learning-visualization-with-yellowbrick-42e3142c41b9




DOI: http://dx.doi.org/10.30970/eli.22.5

Посилання

  • Поки немає зовнішніх посилань.