МЕТОДИ АНАЛІТИКИ ВЕЛИКИХ ДАНИХ ПОПУЛЯРНИХ ЕЛЕКТРОННИХ ГАЗЕТНИХ ВИДАНЬ У FACEBOOK

I. Mysiuk, R. Mysiuk, R. Shuvar, V. Yuzevych

Анотація


У зв’язку із набуттям популярності соціальних мереж усі відомі бренди використовують їх для просування та підтримки свого продукту. Газетні видання активно використовують соціальні мережі як альтернативу паперовим варіантам. Найбільш популярними соціальними мережами є Facebook, Instagram, Twitter та TikTok. До прикладу відомі іноземні газетні видання такі, як: Washington Post, New York Times, Time, Reuters, Forbes дублюють інформацію про новини в соціальній мережі Facebook для більшого охоплення читачів. Перед початком збирання необіхдно здійснити пріоритезацію ключових елементів публікації та порівняти їх присутність з іншими газетними виданнями. Методами автоматизованого збирання даних з веб сторінок сформовано список публікацій на основі яких проведено аналітику даних. З великого об’єму даних було отримано статистичні результати періодичності, популярності певних статтей, охоплення аудиторії та реакції людей на публікації. Проведено нормалізацію даних для спільного формату всіх зібраних даних. Цей процес розідлений на кілька етапів: видалення дублікатів, переведення схожих даних до єдиного формату та заміна допоміжних символів на зрозумілі для комп’ютера мову. Використано лінійне та стовбчасте відображення результатів, завдяки якому найкраще відображено різницю між значеннями в кожен період часу.

 Мовою програмування Java та з використанням додаткових Selenium, JavaFX бібліотек розроблено всі процеси для нормалізації даних та використано візуалізацію даних. У розробленій програмі зібрано всі етапи для аналізу та відображення результатів.  Крім того було досліджено залежність охоплення публікації газетних видань від кількості публікації виставлених протягом дня. У роботі також досліджено найбільш популярних публікації та їх тематику. Проаналізовано звязок ключових слів з реальним подіями. Отримані результати по найвживаніших словах  в певному періоді часу можуть бути використані для визначення акцентів певних газетних видань у соціальних мережах. Такий підхід може бути застосований для аналізу, порівняння чи прогнозування даних з використанням інформаційних технологій базуюючись на тенденції та відслідковувати їх тенденції з часом.

Ключові слова: великі дані, соціальні мережі, аналітика даних, автоматизоване збирання даних, опрацювання даних.


Повний текст:

PDF (English)

Посилання


  1. Popenoe R., Langius-Eklöf A., Stenwall E., Jervaeus A. A practical guide to data analysis in general literature reviews // Nordic Journal of Nursing Research. 2021. Vol. 41, No 4: P. 175-186. doi: https://doi.org/10.1177/2057158521991949
  2. Domingue J., Lasierra N., Fensel A., van Kasteren T., Strohbach M., Thalhammer A. // Big Data Analysis. In: Cavanillas, J., Curry, E., Wahlster, W. (eds) New Horizons for a Data-Driven Economy. Springer, Cham. 2016. doi: https://doi.org/10.1007/978-3-319-21569-3_5.
  3. New York Times [Online]. URL: https://www.facebook.com/nytimes/
  4. Reuters [Online]. URL: https://www.facebook.com/Reuters/
  5. Washington Post [Online]. URL: https://www.facebook.com/washingtonpost/
  6. Forbes [Online]. URL: https://www.facebook.com/forbes/
  7. Selenium automates browsers. [Online]. URL: https://www.selenium.dev/
  8. JavaFX. [Online]. URL: https://openjfx.io/
  9. Crews B., Drees J., Greene D. Data-driven quality assurance to prevent erroneous test results // Critical Reviews in Clinical Laboratory Sciences, 2020. Vol. 57. No 3, P. 146-160, DOI: https://doi.org/10.1080/10408363.2019.1678567
  10. Singh D., Singh B. Investigating the impact of data normalization on classification performance // Applied Soft Computing, Volume 97, Part B, 2020, 105524, ISSN 1568-4946, doi: https://doi.org/10.1016/j.asoc.2019.105524.
  11. Mysiuk R., Yuzevych V., Mysiuk I. Api test automation of search functionality with artificial intelligence // Stuc. intelekt. 2022. Vol. 27, No 1. P. 269-274 doi: https://doi.org/10.15407/jai2022.01.269
  12. Hızal, A. Frequency domain data merging in operational modal analysis based on least squares approach // Measurement, 2021. Vol. 170, 108742. https://doi.org/10.1016/j.measurement.2020.108742
  13. Marino C, Gini G, Vieno A, Spada M. A comprehensive meta-analysis on Problematic Facebook Use // Computers in Human Behavior, 2018. Vol. 83, P. 262-277, ISSN 0747-5632, https://doi.org/10.1016/j.chb.2018.02.009.
  14. Ostic Dragana, Qalati Sikandar Ali, Barbosa Belem, Shah Syed Mir Muhammad, Galvan Vela Esthela, Herzallah Ahmed Muhammad, Liu Feng. Effects of Social Media Use on Psychological Well-Being: A Mediated Model // Frontiers in Psychology. 2021. Vol. 12. ISSN 1664-1078. doi: https://doi.org/10.3389/fpsyg.2021.678766
  15. Ji Changqing & Li Yu & Qiu Daowen & Jin Yingwei & Xu Yujie & Awada Uchechukwu & Li Keqiu & Qu Wenyu. Big data processing: Big challenges. Journal of Interconnection Networks. 2013. doi: https://doi.org/10.1142/S0219265912500090.




DOI: http://dx.doi.org/10.30970/eli.19.6

Посилання

  • Поки немає зовнішніх посилань.