Научно-технический
«ОПТИЧЕСКИЙ ЖУРНАЛ»
издается с 1931 года
 
   
Русский вариант сайта Английский вариант сайта
   
       
   
       
Статьи последнего выпуска

Электронные версии
выпусков начиная с 2008


Алфавитный указатель
2000-2010 гг


444
Архив оглавлений
выпусков 2002-2007 гг


Реквизиты и адреса

Вниманию авторов и рецензентов!
- Порядок публикации
- Порядок рецензирования статей
- Типовой договор
- Правила оформления
- Получение авторского вознаграждения
- Редакционная этика


Контакты

Подписка

Карта сайта




Журнал с 01.12.2015 допущен ВАК для публикации основных результатов диссертаций как издание, входящее в международные реферативные базы систем цитирования (Web Science, Scopus) (см. Vak.ed.gov.ru Перечень журналов МБД 16.03.2018г)

ИССЛЕДОВАНИЕ МЕТОДОВ ПОСТРОЕНИЯ ДЕСКРИПТОРОВ ИЗОБРАЖЕНИЙ ПРИМЕНИТЕЛЬНО К ЗАДАЧЕ ГЛОБАЛЬНОЙ ВИЗУАЛЬНОЙ ЛОКАЛИЗАЦИИ

© 2017 г.       Л. С. Недошивина, студентка; М. В. Петерсон, канд. техн. наук

Университет ИТМО, Санкт-Петербург

E-mail: nedshivina@gmail.com, maxim.peterson@gmail.com

УДК 004.93'1

Поступила в редакцию 21.11.2016

Рассмотрены методы построения дескрипторов изображений на основе агрегации локальных признаков и свёрточных сетей глубокого обучения применительно к задаче глобальной визуальной локализации внутри помещений. Предложен критерий для оценки качества результатов сопоставления изображений и методика выбора опорных кадров в тестовой выборке, состоящей из изображений, полученных при последовательном перемещении камеры. Представлены оценки эффективности работы и быстродействия рассмотренных методов, из которых можно заключить, что методы на основе свёрточных сетей обеспечивают более надёжное сопоставление изображений, чем методы на основе локальных признаков, хотя и характеризуются более низкой скоростью работы.

Ключевые слова: признаковое описание, сопоставление изображений, визуальная локализация, свёрточные нейронные сети.

Коды OCIS: 150.5758, 100.4996, 150.1135

 

Литература

1.         Рассел С., Норвиг П. Искусственный интеллект: современный подход. М.: Вильямс, 2007. 1408 с.

2.         Что такое iBeacon от Apple? [Электронный ресурс]. — Режим доступа: http://www.wi-life.ru/stati/wi-fi/marketingovye-stati-2/what-is-ibeacon-from-apple, свободный, дата обращения 31.08.2016.

3.         Warehouse Navigation [Электронный ресурс]. — Режим доступа: http://www.mcfa.com/en/jungheinrich/customer-focused-solutions/warehousenav, свободный, дата обращения 17.08.2016.

4.        Потапов А.С. Проблемы реализации зрительных систем роботов для недетерминированных сред // Оптический журнал. 2010. Т. 77. № 11. С. 5–11.

5.         Booij O., Terwijn B., Zivkovic Z., Kröse B. Navigation using an appearance based topological map // Robotics and Automation. IEEE International Conference on. IEEE. 2007. P. 3927–3932.

6.        Krizhevsky A., Sutskever I., Hinton G.E. ImageNet classification with deep convolutional neural networks // In Advances in Neural Information Processing Systems (NIPS). 2012. P. 1106–1114.

7.         Razavian A.S., Azizpour H., Sullivan J., Carlsson S. CNN features off-the-shelf: An astounding baseline for recognition // In IEEE Conference on Computer Vision and Pattern Recognition, CVPR Workshops. 2014. P. 512–519.

8.        Babenko A., Lempitsky V. Aggregating local deep features for image retrieval // Proceedings of the IEEE International Conference on Computer Vision. 2015. P. 1269–1277.

9.        Lowe D. Distinctive image features from scale-invariant keypoints // International Journal of Computer Vision. 2004. V. 60. № 2. P. 91–110.

10.       Bay H., Gool L.V. SURF: Speeded Up Robust Features // Computer vision — ECCV. Berlin Heidelberg: Springer, 2006. P. 404–417.

11.       Rublee E., Rabaud V., Konolige K., Bradski G. ORB: an efficient alternative to SIFT or SURF // Computer Vision (ICCV). IEEE International Conference on. 2011. P. 2564–2571.

12.       Ledwich L.,Williams S. Reduced SIFT features for image retrieval and indoor localisation // Australasian Conference on Robotics and Automation. 2004. V. 322. P. 3.

13.       Valgren C., Lilienthal A. SIFT, SURF and Seasons: Long-term Outdoor Localization Using Local Features // Robotics and Autonomous Systems. 2010. V. 58. № 2. P. 149–156.

14.       Csurka G., Dance C., Fan L., Willamowski J., Bray C. Visual categorization with bags of keypoints // Workshop on statistical learning in computer vision. ECCV. 2004. V. 1. № 1–22. P. 1, 2.

15.       Yang Y., Newsam Y. Bag-of-visual-words and spatial extensions for land-use classification // Proceedings of the 18th SIGSPATIAL International Conference on Advances in Geographic Information Systems. ACM. 2010. P. 270–279.

16.       Perronnin F., Dance C. Fisher kernels on visual vocabularies for image categorization // Computer Vision and Pattern Recognition CVPR’07. IEEE Conference on. 2007. P. 1–8.

17.       J´egou H., Douze M., Schmid C., P´erez P. Aggregating local descriptors into a compact image representation // Computer Vision and Pattern Recognition (CVPR). IEEE Conference on. 2010. P. 3304–3311.

18.       Places. The scene recognition database [Электронный ресурс]. — Режим доступа: http://places.csail.mit.edu, свободный, дата обращения 19.05.2016.

19.       Decorrelating and then whitening data [Электронный ресурс]. — Режим доступа: http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf, свободный, дата обращения 31.08.2016.

20.      Базы изображений Corridor_kennedy [Электронный ресурс]. — Режим доступа: http://cogrob.ensta-paristech.fr/loopclosure.html, свободный, дата обращения 31.08.2016.

21.       База изображений Freiburg_kidnap [Электронный ресурс]. — Режим доступа: http://vision.in.tum.de/data/datasets/rgbd-dataset/download, свободный, дата обращения 31.08.2016.

22.      Powers D.M. Evaluation: from precision, recall and F-factor to ROC, informedness, markedness & correlation // Journal of Machine Learning Technologies. 2011. V. 2. P. 37–63.

23.      Библиотека VLFeat [Электронный ресурс]. — Режим доступа: http://www.vlfeat.org, свободный, дата обращения 31.08.2016.

24.      Библиотека Caffe [Электронный ресурс]. — Режим доступа: http://caffe.berkeleyvision.org, свободный, дата обращения 31.08.2016.

25.      ImageNet database [Электронный ресурс]. — Режим доступа: http://image-net.org, свободный, дата обращения 31.08.2016.

 

 

Полный текст