© 2017 г. Л. С. Недошивина, студентка; М. В. Петерсон, канд. техн. наук
Университет ИТМО, Санкт-Петербург
E-mail: nedshivina@gmail.com, maxim.peterson@gmail.com
УДК 004.93'1
Поступила в редакцию 21.11.2016
Рассмотрены методы построения дескрипторов изображений на основе агрегации локальных признаков и свёрточных сетей глубокого обучения применительно к задаче глобальной визуальной локализации внутри помещений. Предложен критерий для оценки качества результатов сопоставления изображений и методика выбора опорных кадров в тестовой выборке, состоящей из изображений, полученных при последовательном перемещении камеры. Представлены оценки эффективности работы и быстродействия рассмотренных методов, из которых можно заключить, что методы на основе свёрточных сетей обеспечивают более надёжное сопоставление изображений, чем методы на основе локальных признаков, хотя и характеризуются более низкой скоростью работы.
Ключевые слова: признаковое описание, сопоставление изображений, визуальная локализация, свёрточные нейронные сети.
Коды OCIS: 150.5758, 100.4996, 150.1135
Литература
1. Рассел С., Норвиг П. Искусственный интеллект: современный подход. М.: Вильямс, 2007. 1408 с.
2. Что такое iBeacon от Apple? [Электронный ресурс]. — Режим доступа: http://www.wi-life.ru/stati/wi-fi/marketingovye-stati-2/what-is-ibeacon-from-apple, свободный, дата обращения 31.08.2016.
3. Warehouse Navigation [Электронный ресурс]. — Режим доступа: http://www.mcfa.com/en/jungheinrich/customer-focused-solutions/warehousenav, свободный, дата обращения 17.08.2016.
4. Потапов А.С. Проблемы реализации зрительных систем роботов для недетерминированных сред // Оптический журнал. 2010. Т. 77. № 11. С. 5–11.
5. Booij O., Terwijn B., Zivkovic Z., Kröse B. Navigation using an appearance based topological map // Robotics and Automation. IEEE International Conference on. IEEE. 2007. P. 3927–3932.
6. Krizhevsky A., Sutskever I., Hinton G.E. ImageNet classification with deep convolutional neural networks // In Advances in Neural Information Processing Systems (NIPS). 2012. P. 1106–1114.
7. Razavian A.S., Azizpour H., Sullivan J., Carlsson S. CNN features off-the-shelf: An astounding baseline for recognition // In IEEE Conference on Computer Vision and Pattern Recognition, CVPR Workshops. 2014. P. 512–519.
8. Babenko A., Lempitsky V. Aggregating local deep features for image retrieval // Proceedings of the IEEE International Conference on Computer Vision. 2015. P. 1269–1277.
9. Lowe D. Distinctive image features from scale-invariant keypoints // International Journal of Computer Vision. 2004. V. 60. № 2. P. 91–110.
10. Bay H., Gool L.V. SURF: Speeded Up Robust Features // Computer vision — ECCV. Berlin Heidelberg: Springer, 2006. P. 404–417.
11. Rublee E., Rabaud V., Konolige K., Bradski G. ORB: an efficient alternative to SIFT or SURF // Computer Vision (ICCV). IEEE International Conference on. 2011. P. 2564–2571.
12. Ledwich L.,Williams S. Reduced SIFT features for image retrieval and indoor localisation // Australasian Conference on Robotics and Automation. 2004. V. 322. P. 3.
13. Valgren C., Lilienthal A. SIFT, SURF and Seasons: Long-term Outdoor Localization Using Local Features // Robotics and Autonomous Systems. 2010. V. 58. № 2. P. 149–156.
14. Csurka G., Dance C., Fan L., Willamowski J., Bray C. Visual categorization with bags of keypoints // Workshop on statistical learning in computer vision. ECCV. 2004. V. 1. № 1–22. P. 1, 2.
15. Yang Y., Newsam Y. Bag-of-visual-words and spatial extensions for land-use classification // Proceedings of the 18th SIGSPATIAL International Conference on Advances in Geographic Information Systems. ACM. 2010. P. 270–279.
16. Perronnin F., Dance C. Fisher kernels on visual vocabularies for image categorization // Computer Vision and Pattern Recognition CVPR’07. IEEE Conference on. 2007. P. 1–8.
17. J´egou H., Douze M., Schmid C., P´erez P. Aggregating local descriptors into a compact image representation // Computer Vision and Pattern Recognition (CVPR). IEEE Conference on. 2010. P. 3304–3311.
18. Places. The scene recognition database [Электронный ресурс]. — Режим доступа: http://places.csail.mit.edu, свободный, дата обращения 19.05.2016.
19. Decorrelating and then whitening data [Электронный ресурс]. — Режим доступа: http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf, свободный, дата обращения 31.08.2016.
20. Базы изображений Corridor_kennedy [Электронный ресурс]. — Режим доступа: http://cogrob.ensta-paristech.fr/loopclosure.html, свободный, дата обращения 31.08.2016.
21. База изображений Freiburg_kidnap [Электронный ресурс]. — Режим доступа: http://vision.in.tum.de/data/datasets/rgbd-dataset/download, свободный, дата обращения 31.08.2016.
22. Powers D.M. Evaluation: from precision, recall and F-factor to ROC, informedness, markedness & correlation // Journal of Machine Learning Technologies. 2011. V. 2. P. 37–63.
23. Библиотека VLFeat [Электронный ресурс]. — Режим доступа: http://www.vlfeat.org, свободный, дата обращения 31.08.2016.
24. Библиотека Caffe [Электронный ресурс]. — Режим доступа: http://caffe.berkeleyvision.org, свободный, дата обращения 31.08.2016.
25. ImageNet database [Электронный ресурс]. — Режим доступа: http://image-net.org, свободный, дата обращения 31.08.2016.
Полный текст