ITMO
en/ en

ISSN: 1023-5086

en/

ISSN: 1023-5086

Научно-технический

Оптический журнал

Полнотекстовый перевод журнала на английский язык издаётся Optica Publishing Group под названием “Journal of Optical Technology“

Подача статьи Подать статью
Больше информации Назад

УДК: 004.93'1

Исследование методов построения дескрипторов изображений применительно к задаче глобальной визуальной локализации

Ссылка для цитирования:

Недошивина Л.С., Петерсон М.В. Исследование методов построения дескрипторов изображений применительно к задаче глобальной визуальной локализации // Оптический журнал. 2017. Т. 84. № 6. С. 21–29.

 

Nedoshivina L.S., Peterson M.V. Methods for the construction of image descriptors for the global visual localization problem [in Russian] // Opticheskii Zhurnal. 2017. V. 84. № 6. P. 21–29.

Ссылка на англоязычную версию:

L. S. Nedoshivina and M. V. Peterson, "Methods for the construction of image descriptors for the global visual localization problem," Journal of Optical Technology. 84(6), 377-383 (2017). https://doi.org/10.1364/JOT.84.000377

Аннотация:

Рассмотрены методы построения дескрипторов изображений на основе агрегации локальных признаков и свёрточных сетей глубокого обучения применительно к задаче глобальной визуальной локализации внутри помещений. Предложен критерий для оценки качества результатов сопоставления изображений и методика выбора опорных кадров в тестовой выборке, состоящей из изображений, полученных при последовательном перемещении камеры. Представлены оценки эффективности работы и быстродействия рассмотренных методов, из которых можно заключить, что методы на основе свёрточных сетей обеспечивают более надёжное сопоставление изображений, чем методы на основе локальных признаков, хотя и характеризуются более низкой скоростью работы.

Ключевые слова:

признаковое описание, сопоставление изображений, визуальная локализация, свёрточные нейронные сети

Благодарность:

Работа выполнена при финансовой поддержке Минобрнауки РФ (проект № 2323) и Правительства РФ (грант 074-U01).

Коды OCIS: 150.5758, 100.4996, 150.1135

Список источников:

1. Рассел С., Норвиг П. Искусственный интеллект: современный подход. М.: Вильямс, 2007. 1408 с.
2. Что такое iBeacon от Apple? [Электронный ресурс]. — Режим доступа: http://www.wi-life.ru/stati/wi-fi/marketingovye-stati-2/what-is-ibeacon-from-apple, свободный, дата обращения 31.08.2016.
3. Warehouse Navigation [Электронный ресурс]. — Режим доступа: http://www.mcfa.com/en/jungheinrich/customerfocused-solutions/warehousenav, свободный, дата обращения 17.08.2016.
4. Потапов А.С. Проблемы реализации зрительных систем роботов для недетерминированных сред // Оптический журнал. 2010. Т. 77. № 11. С. 5–11.
5. Booij O., Terwijn B., Zivkovic Z., Kröse B. Navigation using an appearance based topological map // Robotics and Automation. IEEE International Conference on. IEEE. 2007. P. 3927–3932.
6. Krizhevsky A., Sutskever I., Hinton G.E. ImageNet classification with deep convolutional neural networks // In Advances in Neural Information Processing Systems (NIPS). 2012. P. 1106–1114.
7. Razavian A.S., Azizpour H., Sullivan J., Carlsson S. CNN features off-the-shelf: An astounding baseline for recognition // In IEEE Conference on Computer Vision and Pattern Recognition, CVPR Workshops. 2014. P. 512–519.
8. Babenko A., Lempitsky V. Aggregating local deep features for image retrieval // Proceedings of the IEEE International Conference on Computer Vision. 2015. P. 1269–1277.
9. Lowe D. Distinctive image features from scale-invariant keypoints // International Journal of Computer Vision. 2004. V. 60. № 2. P. 91–110.
10. Bay H., Gool L.V. SURF: Speeded Up Robust Features // Computer vision — ECCV. Berlin Heidelberg: Springer, 2006. P. 404–417.
11. Rublee E., Rabaud V., Konolige K., Bradski G. ORB: an efficient alternative to SIFT or SURF // Computer Vision (ICCV). IEEE International Conference on. 2011. P. 2564–2571.
12. Ledwich L.,Williams S. Reduced SIFT features for image retrieval and indoor localisation // Australasian Conference on Robotics and Automation. 2004. V. 322. P. 3.
13. Valgren C., Lilienthal A. SIFT, SURF and Seasons: Long-term Outdoor Localization Using Local Features // Robotics and Autonomous Systems. 2010. V. 58. № 2. P. 149–156.
14. Csurka G., Dance C., Fan L., Willamowski J., Bray C. Visual categorization with bags of keypoints // Workshop on statistical learning in computer vision. ECCV. 2004. V. 1. № 1–22. P. 1, 2.
15. Yang Y., Newsam Y. Bag-of-visual-words and spatial extensions for land-use classification // Proceedings of the 18th SIGSPATIAL International Conference on Advances in Geographic Information Systems. ACM. 2010. P. 270–279.
16. Perronnin F., Dance C. Fisher kernels on visual vocabularies for image categorization // Computer Vision and Pattern Recognition CVPR’07. IEEE Conference on. 2007. P. 1–8.
17. J´egou H., Douze M., Schmid C., P´erez P. Aggregating local descriptors into a compact image representation // Computer Vision and Pattern Recognition (CVPR). IEEE Conference on. 2010. P. 3304–3311.
18. Places. The scene recognition database [Электронный ресурс]. — Режим доступа: http://places.csail.mit.edu, свободный, дата обращения 19.05.2016.
19. Decorrelating and then whitening data [Электронный ресурс]. — Режим доступа: http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf, свободный, дата обращения 31.08.2016.
20. Базы изображений Corridor_kennedy [Электронный ресурс]. — Режим доступа: http://cogrob.ensta-paristech.fr/loopclosure.html, свободный, дата обращения 31.08.2016.
21. База изображений Freiburg_kidnap [Электронный ресурс]. — Режим доступа: http://vision.in.tum.de/data/datasets/rgbd-dataset/download, свободный, дата обращения 31.08.2016.
22. Powers D.M. Evaluation: from precision, recall and F-factor to ROC, informedness, markedness & correlation // Journal of Machine Learning Technologies. 2011. V. 2. P. 37–63.
23. Библиотека VLFeat [Электронный ресурс]. — Режим доступа: http://www.vlfeat.org, свободный, дата обращения 31.08.2016.
24. Библиотека Caffe [Электронный ресурс]. — Режим доступа: http://caffe.berkeleyvision.org, свободный, дата обращения 31.08.2016.
25. ImageNet database [Электронный ресурс]. — Режим доступа: http://image-net.org, свободный, дата обращения 31.08.2016.