ВИЯВЛЕННЯ АГРЕСИВНОЇ РИТОРИКИ В ТЕКСТІ З ВИКОРИСТАННЯМ АЛГОРИТМІВ МАШИННОГО НАВЧАННЯ

M. Prytula, Igor Olenych

Анотація


У роботі реалізовано моделі класифікації текстової інформації, яка містить агресивну лексику та емоційні вирази. За допомогою алгоритмів машинного / глибокого навчання проведено аналіз новинних повідомлень в електронних ЗМІ та соціальних мережах українською та російською мовами, пов’язаних з повномасштабним російським вторгненням на територію України. Досліджено ефективність розпізнавання агресивної риторики у текстових повідомленнях за допомогою наївного класифікатора Байєса, методів опорних векторів, k-найближчих сусідів, випадкового лісу, логістичної регресії, рекурентних нейронних мереж з архітектурою LSTM і Bidirectional LSTM. Встановлено, що збалансованість навчальної вибірки текстових даних суттєво впливає на точність класифікації. Виявлено лінійну кореляцію між фейковими новинами і агресивною риторикою в інформаційних повідомленнях.

Ключові слова: комп’ютерний аналіз тексту, сентимент-аналіз, глибоке навчання, машинне навчання з учителем. 


Повний текст:

PDF

Посилання


  1. Mansour S. Social Media Analysis of User’s Responses to terrorism using sentiment analysis and text mining // Procedia Computer Science. – 2018. – Vol. 140. – P. 95–103.
  2. Hao J., Dai H. Social Media Content and Sentiment Analysis on Consumer Security Breaches // Journal of Financial Crime. – 2016. – Vol. 23, No 4. – P. 855–869.
  3. Hosseinmardi H., Rafiq R.I., Han R., Lv Q., Mishra S. Prediction of cyberbullying incidents in a media-based social network // Proceedings of the 2016 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM), San Francisco, CA, USA. – 2016. DOI: 10.1109/ASONAM.2016.7752233.
  4. Khan A., Baharudin B., Lee L.H., Khan K. A Review of Machine Learning Algorithms for Text-Documents Classification // Journal of Advances in Information Technology. – 2010. - Vol. 1. – P. 4–20.
  5. Luo X. Efficient English text classification using selected Machine Learning Techniques // Alexandria Engineering Journal. – 2021. – Vol. 60. – P. 3401–3409.
  6. Gasparetto A., Marcuzzo M., Zangari A., Albarelli A. A Survey on Text Classification Algorithms: From Text to Predictions // Information. – 2022. – Vol. 13. – P. 83.
  7. Hassan S.U., Ahamed J., Ahmad K. Analytics of machine learning-based algorithms for text classification // Sustainable Operations and Computers. – 2022. – Vol. 3. – P. 238–248.
  8. Kowsari K., Meimandi K.J., Heidarysafa M., Mendu S., Barnes L., Brown D. Text Classification Algorithms: A Survey // Information. – 2019. – Vol. 10. – P. 150.
  9. Raza S., Ding C. Fake news detection based on news content and social contexts: a transformer-based approach // Int. J. Data Sci. Anal. – 2022. – Vol. 13. – P. 335–362.
  10. Chopra F.K., Bhatia R. Sentiment Analyzing by Dictionary based Approach // International Journal of Computer Applications. – 2016. – Vol. 152, No.5. – P. 32–34.
  11. Оленич І., Притула М., Сінькевич О., Хамар О. Система автоматичного визначення тональності тексту // Електроніка та інформаційні технології. – 2021. – Випуск 15. – С. 16–23.
  12. Thelwall M., Buckley K., Paltoglou G., Kappas A., Cai D. Sentiment strength detection in short informal text // Journal of the American Society for Information Science and Technology. – 2010. – No. 61. – P. 2544–2558.
  13. Olenych I., Prytula M., Sinkevych O., Khamar O. System of Automatic Determination of Ukrainian Text Tone // IEEE 12th International Conference on Electronics and Information Technologies (ELIT). – 2021. – P. 80–83.
  14. Olenych I., Sinkevych O., Salamakha M., Prytula M. Text Tone Determination using Fuzzy Logic // Applied Computer Systems. – 2021. – Vol. 26 – P. 158–163.
  15. Khan U., Khan S., Rizwan A., Ghada A., Jamjoom M.M., Samee N.A. 2022. Aggression Detection in Social Media from Textual Data Using Deep Learning Models // Applied Sciences. – 2022. – Vol. 12, No. 10. – P. 5083.
  16. Robertson S. Understanding Inverse Document Frequency: On Theoretical Arguments for IDF // Journal of Documentation. – 2004. – Vol. 60, No. 5. – P. 503–520.
  17. Vijayarani S., Nithya M.N. Efficient machine learning classifiers for automatic information classification // Int. J. Mod. Trends Eng. Res. – 2015. – Vol. 2. – P. 685–694.




DOI: http://dx.doi.org/10.30970/eli.22.4

Посилання

  • Поки немає зовнішніх посилань.