МОДЕЛЮВАННЯ ПОШИРЕННЯ COVID-19 ТА йОГО ВПЛИВУ НА ФОНДОВИЙ РИНОК IЗ ВИКОРИСТАННЯМ ДАНИХ РIЗНИХ ТИПIВ

Bohdan Pavlyshenko

Анотація


У роботі розглянуто моделювання поширення COVID-19 на основі історичних даних. Для прогнозної аналітики поширення COVID-19 використано модель логiстичної кривої. Для оцінки параметрів моделі використано байєсiвську регресiю. Цей пiдхiд дозволяє отримати постерiорний розподiл ймовiрностi для параметрiв моделi. У байєсiвському виведеннi можна використовувати заданi експертом iнформативнi апрiорнi розподiли i результат можна розглядати як компромiс мiж iсторичними даними та думкою експерта. Це важливо у тих випадках, коли є невелика кiлькiсть iсторичних даних. Iмовiрнiсний пiдхiд дозволяє отримати функцiю щiльностi ймовiрностi для цiльової змiнної. Показано, що байесiвську регресiйну модель iз використанням логiстичної кривої можна використовувати для прогнозної аналiтики поширення коронавiрусу. Така модель може бути ефективною, коли є експоненцiйне зростання кiлькостi пiдтверджених випадкiв коронавiрусу. Важливо знайти максимум випадкiв зараження коронавiрусом за добу. Цей максимум вiдображає половину часового перiоду поширення коронавiрусу. Очевидно, що новi данi та експертне формування апрiорних розподiлiв параметрiв моделi можуть суттєво коректувати попереднi результати прогнозування. Пандемiя коронавiрусу має великий вплив на фiнансовий ринок. Аналiз такого впливу є важливим, зокрема при формуваннi стабiльних iнвестицiйних портфелiв. Дослiджено вплив COVID-19 на динамiку iндекса S&P-500 на фондовому ринку. Як регресiйнi ознаки, використано часовi ряди кiлькостi вiдвiдувань сторiнок Вiкiпедiї, якi мають пряме чи опосередковане вiдношення до тематики коронавiрусу. Як цiльову змiнну використано кiлькiснi характеристики iндексу S&P-500. Отриманi результати свiдчать, що рiзнi ознаки мають рiзний вплив та рiзну невизначенiсть щодо цiльової змiнної. Найефективнiшою та найменш варiативною серед розглянутих ознак була ознака на основi кiлькостi вiдвiдувань сторiнки Вiкiпедiї про вакцину. Розглянуто вплив кризи, зумовленої пандемiєю коронавiрусу на акцiї компанiй на фондовому ринку та проведено порiвняльний аналiз цього впливу iз впливом кризи 2008 року та спадом ринку 2018 року. Для цього використано лiнiйну класичну та байесiвську регресiї. Отриманi результати показують, що рiзнi кризи по-рiзному впливають на динамiку цiн акцiй внаслiдок реалiзацiї рiзних механiзмiв впливу. Пiдхiд на основi байєсiвського виведення дозволяє аналiзувати невизначенiсть впливу рiзних фiнансових криз. Результати показують, що невизначенiсть коронавiрусної кризи бiльша порiвняно з iншими кризами. Розрахунок невизначеностi дозволяє робити оцiнку ризикiв для iнвестицiйних портфелiв та рiзних фiнансових та бiзнес-процесiв. COVID-19 активно обговорюється у соцiальних мережах, тому характеристики повiдомлень, зокрема у мережi Твiтер можуть мати прогнознi власивостi. Використовуючи теорiю графiв розглянуто зв’язки мiж користувачами мережi Твiтер у масивi повiдомлень, пов’язаних iз COVID-19. Показано, що за допомогою алгоритмiв теорiї графiв, можна виявляти спiльноти користувачiв та знаходити впливових користувачiв за рiзними оцiнками вершин. Показано, що використовуючи теорiю частих множин та асоцiативних правил, можна знайти семантичну структуру у масивi повiдомлень в межах заданого тематичного поля.

Ключовi слова: коронавiрус, COVID-19, байєсiвська регресiя, фондовий ринок, прогнозна аналiтика.


Повний текст:

PDF (English)

Посилання


IHME COVID, Christopher JL Murray, et al. Forecasting COVID-19 impact on hospital bed-days, ICU-days, ventilator-days and deaths by US state in the next 4 months. https://www.medrxiv.org/content/10.1101/2020.03.27.20043752v1.

COVID19 Global Forecasting (Week 2). Kaggle.Com. https://www.kaggle.com/c/ covid19-global-forecasting-week-2.

CSSE COVID-19 Dataset. GitHub.Com. https://github.com/CSSEGISandData/ COVID-19/tree/master/csse_covid_19_data.

Coronavirus (Covid-19) Data in the United States. GitHub.Com. https://github. com/nytimes/covid-19-data.

COVID-19 reports. https://www.imperial.ac.uk/ mrc-global-infectious-disease-analysis/covid-19/.

COVID-19 Kaggle community contributions. Kaggle.Com. https://www.kaggle. com/covid-19-contributions.

B.M. Pavlyshenko. Bitcoin Price Predictive Modeling Using Expert Correction. In 2019 XIth International Scientific and Practical Conference on Electronics and Infor- mation Technologies (ELIT),September 16 – 18, 2019 Lviv, Ukraine, pages 163–167, 2019.

Bohdan M. Pavlyshenko. Linear, machine learning and probabilistic approaches for time series analysis. In Data Stream Mining & Processing (DSMP), IEEE First International Conference, pages 377–381, 2016.

Bohdan Pavlyshenko. Machine learning, linear and Bayesian models for logistic re- gression in failure detection problems. In Big Data (Big Data), 2016 IEEE Interna- tional Conference on, IEEE, Washington D.C., pages 2046–2050, 2016.

B. Pavlyshenko. Using Bayesian Regression for Stacking Time Series Predictive Mod- els. In 2020 IEEE Third International Conference on Data Stream Mining & Pro- cessing (DSMP), pages 305–309, 2020.

John Kruschke. Doing Bayesian data analysis: A tutorial with R, JAGS, and Stan. Academic Press, 2014.

Andrew Gelman, John B Carlin, Hal S Stern, David B Dunson, Aki Vehtari, and Donald B Rubin. Bayesian data analysis. Chapman and Hall/CRC, 2013.

Bob Carpenter, Andrew Gelman, Matthew D Hoffman, Daniel Lee, Ben Goodrich, Michael Betancourt, Marcus Brubaker, Jiqiang Guo, Peter Li, and Allen Riddell. Stan: A probabilistic programming language. Journal of statistical software, 76(1), 2017.

Bayesian Model for COVID-19 Spread Prediction. GitHub.Com. https://github. com/pavlyshenko/covid19.

Pascal Pons and Matthieu Latapy. Computing communities in large networks using random walks. In International symposium on computer and information sciences, pages 284–293. Springer, 2005.

Gabor Csardi, Tamas Nepusz, et al. The igraph software package for complex network research. InterJournal, complex systems, 1695(5):1–9, 2006.

Thomas M.J., Fruchterman and Edward M Reingold. Graph drawing by force-directed placement. Software: Practice and experience, 21(11):1129–1164, 1991.

Rakesh Agrawal, Ramakrishnan Srikant, et al. Fast algorithms for mining association rules. In Proc. 20th int. conf. very large data bases, VLDB, volume 1215, pages 487– 499, 1994.

Rakesh Agrawal, Heikki Mannila, Ramakrishnan Srikant, Hannu Toivonen, A Inkeri Verkamo, et al. Fast discovery of association rules. Advances in knowledge discovery and data mining, 12(1):307–328, 1996.

Chun-Kit Chui, Ben Kao, and Edward Hung. Mining frequent itemsets from un- certain data. In Pacific-Asia Conference on knowledge discovery and data mining, pages 47–58. Springer, 2007.

Karam Gouda and Mohammed Javeed Zaki. Efficiently mining maximal frequent itemsets. In Proceedings 2001 IEEE International Conference on Data Mining, pages 163–170. IEEE, 2001.

Ramakrishnan Srikant, Quoc Vu, and Rakesh Agrawal. Mining association rules with item constraints. In Kdd, volume 97, pages 67–73, 1997.

Mika Klemettinen, Heikki Mannila, Pirjo Ronkainen, Hannu Toivonen, and A Inkeri Verkamo. Finding interesting rules from large sets of discovered association rules. In Proceedings of the third international conference on Information and knowledge management, pages 401–407, 1994.

Nicolas Pasquier, Yves Bastide, Rafik Taouil, and Lotfi Lakhal. Discovering frequent closed itemsets for association rules. In International Conference on Database Theory, pages 398–416. Springer, 1999.

Sergey Brin, Rajeev Motwani, and Craig Silverstein. Beyond market baskets: Gen- eralizing association rules to correlations. In Proceedings of the 1997 ACM SIGMOD international conference on Management of data, pages 265–276, 1997.

Bohdan Pavlyshenko. Data Mining of the Concept" End of the World" in Twitter Microblogs. arXiv preprint arXiv:1302.2131, 2013.

Bohdan M. Pavlyshenko. Forecasting of Events by Tweets Data Mining. Electronics and information technologies, (10):71–85, 2018.

Bohdan M. Pavlyshenko. Can Twitter Predict Royal Baby’s Name ? Electronics and information technologies, (11):52–60, 2019.




DOI: http://dx.doi.org/10.30970/eli.14.1

Посилання

  • Поки немає зовнішніх посилань.