МОДЕЛЮВАННЯ КРЕДИТНОГО СКОРИНГУ МЕТОДАМИ МАШИННОГО НАВЧАННЯ

Myroslav Datsko, Nazarii Drushchak

Анотація


Анотація. Кредитний скоринг можна вважати однією з найуспішніших сфер застосування і методологічною підмножиною інтелектуального аналізу даних. Проблему кредитного скорингу у рамках інтелектуального аналізу даних можна віднести до класу класифікаційних методів машинного навчання. Метою статті є виявлення та моделювання залежності між факторними змінними, які показують певні характеристики клієнта банку та на основі цього визначити його відповідність до певного класу позичальників. У дослідженні використано методи моделювання кредитного скорингу з використанням машинного навчання. Результати дослідження дозволили виділити, серед побудованих, дві моделі з найкращими характеристиками: модель «випадкових лісів» та TPOT модель. За допомогою класифікаційного звіту та ROC кривої було сформульовано висновок про те, що обидві моделі досягають значення показника f1 рівного 0.71 для досліджуваної вибірки, що є цілком прийнятним результатом для задачі кредитного скорингу.

Ключові слова: машинне навчання, кредитний скоринг, «випадкові ліси», TPOT модель, ROC крива.


Повний текст:

PDF

Посилання

  • Поки немає зовнішніх посилань.