ПОРІВНЯННЯ МЕТОДУ ОПОРНИХ ВЕКТОРІВ У ПОЄДНАННІ З АЛГОРИТМАМИ ВИЯВЛЕННЯ ОСОБЛИВИХ ТОЧОК ТА НЕЙРОМЕРЕЖ ДЛЯ РОЗПІЗНАВАННЯ ОБ'ЄКТІВ

V.-T. Luchka, V. Vdovychenko, Yuriy Furgala

Анотація


Виявлення об'єктів є одним із важливих завдань у галузі комп'ютерного зору, а прогрес у розвитку як традиційних алгоритмів виявлення особливих точок, так і нейромереж значно сприяє його вдосконаленню. У роботі порівняно та оцінено ефективність використання методу опорних векторів (SVС) разом із традиційними алгоритмами виявлення особливих точок, зокрема SIFT, ORB, BRISK, FREAK, із найновішим підходом на основі нейромереж, зокрема YOLOv5. За допомогою комплексного аналізу з'ясовано переваги та недоліки цих методів, виокремлено їхній потенціал для точного та ефективного виявлення об'єктів. Для порівняння ефективності двох підходів до розпізнавання об’єктів на зображеннях проведено серію експериментів із визначеним набором зображень. Під час експерименту вибрано декілька параметрів для спостереження. Спочатку оцінено швидкодію алгоритмів SIFT, ORB, BRISK, FREAK на наборі даних, проаналізовано та порівняно кількість особливих точок, знайдених на зображені. Створено власну вирішальну функцію для розпізнавання обʼєктів на зображенні, вхідними даними для якої були координати обраних особливих точок. Також створено модель класифікатора, що базується на методі опорних векторів із використанням особливих точок. Для порівняння результатів класифікатору на методі опорних векторів натреновано модель нейронної мережі на обраному наборі зображень. Для ефективної репрезентації можливостей нейронної мережі використано 3 моделі з різним розміром та різною кількістю епох тренування. Зважаючи на те, що метод опорних векторів (SVM) належить до парадигми контрольованого машинного навчання, встановлено різницю в ефективність і швидкість роботи із моделями нейромережі YOLOv5, а також час, потрібний для навчання моделей.

Ключові слова: ключові точки, метод опорних векторів, нейронні мережі, SIFT, ORB, BRISK, FREAK, YOLOv5


Повний текст:

PDF (English)

Посилання


  1. Lowe, D. G. (2004). Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision, 60(2), 91-110.
  2. Rublee, E., Rabaud, V., Konolige, K., & Bradski, G. (2011). ORB: An efficient alternative to SIFT or SURF. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) (pp. 2564-2571). IEEE.
  3. Leutenegger, S., Chli, M., & Siegwart, R. Y. (2011). BRISK: Binary robust invariant scalable keypoints. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) (pp. 2548-2555). IEEE.
  4. Alahi, A., Ortiz, R., & Vandergheynst, P. (2012). FREAK: Fast retina keypoint. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (pp. 510-517). IEEE.
  5. Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine learning, 20(3), 273-297.
  6. Burges, C. J. (1998). A tutorial on support vector machines for pattern recognition. Data mining and knowledge discovery, 2(2), 121-167.
  7. Hsu, C. W., Chang, C. C., & Lin, C. J. (2003). A practical guide to support vector classification. National Taiwan University, Taipei, Taiwan.
  8. Nguyen, T., Park, EA., Han, J., Park, DC., Min, SY. (2014). Object Detection Using Scale Invariant Feature Transform. In: Pan, JS., Krömer, P., Snášel, V. (eds) Genetic and Evolutionary Computing. Advances in Intelligent Systems and Computing, vol 238. Springer, Cham. https://doi.org/10.1007/978-3-319-01796-9_7
  9. Calonder, M., Lepetit, V., Strecha, C., & Fua, P. (2010). BRIEF: Binary robust independent elementary features. In European Conference on Computer Vision (pp. 778-792). Springer.
  10. Bochkovskiy, A., Wang, C. Y., & Liao, H. Y. M. (2020). YOLOv4: Optimal speed and accuracy of object detection. arXiv preprint arXiv:2004.10934.
  11. Bochkovskiy, A., Wang, C. Y., & Liao, H. Y. M. (2021). YOLOv5: Improved real-time object detection. arXiv preprint arXiv:2104.02123.




DOI: http://dx.doi.org/10.30970/eli.25.7

Посилання

  • Поки немає зовнішніх посилань.