ОТРИМАННЯ СПИСКУ ВИДОБУВАЧІВ ОЗНАК НА ОСНОВІ МЕТОДІВ ОЦІНКИ ВАЖЛИВОСТІ ОЗНАК

M. Lyashkevych, V. Lyashkevych, Roman Shuwar

Анотація


Як відомо, ми живемо у цифровій індустріальній епосі і ми маємо багато накопичених структурованих і неструктурованих даних. Насправді, структуровані дані можуть допомогти нам зробити наші рішення більш ефективними у різних областях діяльності людини. Це тому ми намагаємося розпізнати які типи даних, які саме типи проблем розв’язують. З цією метою, ми маємо багато корисних методів для оцінки важливості ознак даних. Scikit-learn це є найбільш популярна бібліотека серед науковців, реалізована на мові Python, яка дозволяє досліджувати важливість ознак даних.

Зазвичай, науковці більш упевнені у методах важливості ознак коли вони працюють з числовими значеннями структурованих даних тому, що об’єкти, які розпізнаються,  описані конкретними значеннями у таблицях. Нажаль, коли ми видобуваємо ознаки з неструктурованих даних, як наприклад рисунків, це ще є питання наскільки методи оцінки важливості ознак є корисними тому, що це є скоріше питання опису об’єктів, що розпізнаються чи яка множина ознак могла би бути оптимальною.

Насправді не можливо однозначно відповісти на питання скільки різних ознак з об’єктів, що детектуються, нам потрібно аби ми могли їх класифікувати з високою імовірністю. Наскільки це “достатньо” у випадку, коли ми хочемо розпізнати ці об’єкти зі списку інших об’єктів?  Дану проблему ми збираємося вирішити підходом, коли ми описуємо фізичну природу об’єктів, що детектуються через їх унікальні ознаки скоріше ніж із використання методів оцінки важливості ознак. Методи оцінки важливості ознак є корисними для нас на початкових етапах, а також для оцінки отриманих результатів.

У статті, ми розглядаємо сучасні методи оцінки важливості ознак, алгоритми видобування ознак і методологію як саме створити оптимальну множину видобувачів ознак. Для того, щоб краще засвоїти наведені методики, ми розпізнавали у своїх дослідах рівень забруднення води, а також тип забруднення.

Ключові слова: Комп’ютерний зір, розпізнавання об’єктів, важливість ознак, машинне навчання, забруднення води, забруднення речовини.


Повний текст:

PDF (English)

Посилання


  1. Melissa Denchak. Water Pollution: Everything You Need to Know. - 2022. - Mode access: https://www.nrdc.org/stories/water-pollution-everything-you-need-know
  2. Linquip Team.10 Types of Water Pollution in 2022 + PDF. - 2021. - Mode access: https://www.linquip.com/blog/types-of-water-pollution/
  3. Lærke Isabella, Nørregaard Hansen. Turbidity measurement based on computer vision. - Mode access: https://projekter.aau.dk/projekter/files/306657262/master.pdf.
  4. S::can GmbH. Waste Water Monitoring. - 2021. - Mode access: https://www.s-can.at/en/applications/waste-water/?gclid=CjwKCAiAp7GcBhA0EiwA9U0mtgPirdjVNR2UTTnYmKscQzG7uUbTYCJX-ToT2ADVESgftwG2tebxURoCOyEQAvD_BwE
  5. Ding, X.; Zhang, J.; Jiang, G.; Zhang, S. Early Warning and Forecasting System of Water Quality Safety for Drinking Water Source Areas in Three Gorges Reservoir Area, China. Water 2017, 9, 465. https://doi.org/10.3390/w9070465
  6. Wikipedia. Water pollution. - Mode access: https://en.wikipedia.org/wiki/Water_pollution
  7. Umair Ahmed, Rafia Mumtaz, Hirra Anwar, Sadaf Mumtaz, Ali Mustafa Qamar; Water quality monitoring: from conventional to emerging technologies. Water Supply 1 February 2020; 20 (1): 28–45. DOI: https://doi.org/10.2166/ws.2019.144
  8. Patel J. Y. Vaghani M. V. 2015 Correlation study for assessment of water quality and its parameters of par river Valsad, Gujarat, India. IJIERE 2, 150–156.
  9. Recent advances and challenges for water evaporation-induced electricity toward applications / Van-Duong Dao, Ngoc HungVu, Hai-LinhThi Dang, SiningYun // Nano Energy. - V. 85. - 2021. - Mode access: https://doi.org/10.1016/j.nanoen.2021.105979.




DOI: http://dx.doi.org/10.30970/eli.20.6

Посилання

  • Поки немає зовнішніх посилань.