ITMO
en/ en

ISSN: 1023-5086

en/

ISSN: 1023-5086

Научно-технический

Оптический журнал

Полнотекстовый перевод журнала на английский язык издаётся Optica Publishing Group под названием “Journal of Optical Technology“

Подача статьи Подать статью
Больше информации Назад

УДК: 004.932

Модификация метода распознавания образов по критерию ближайшего соседа с использованием локальной метрики

Ссылка для цитирования:

Потапов А.С. Модификация метода распознавания образов по критерию ближайшего соседа с использованием локальной метрики // Оптический журнал. 2016. Т. 83. № 12. С. 48–53.

 

Potapov A.S. Modification of the nearest-neighbor-based image recognition method using a local metric [in Russian] // Opticheskii Zhurnal. 2016. V. 83. № 12. P. 48–53.

Ссылка на англоязычную версию:

A. S. Potapov, "Modification of the nearest-neighbor-based image recognition method using a local metric," Journal of Optical Technology. 83(12), 749-752 (2016). https://doi.org/10.1364/JOT.83.000749

Аннотация:

В работе проведён анализ причин недостаточной эффективности метода ближайшего соседа по сравнению с сетями глубокого обучения. В качестве первичной причины выделена некорректность использования евклидова расстояния до ближайшего соседа при оценке расстояния от распознаваемого образа до области, занимаемой классом. Для её устранения необходимо строить локальную оценку метрики. Предложен способ выполнения такой оценки, совмещающий идеи “тангенсального расстояния” и расстояния Махаланобиса, и разработана модификация метода ближайшего соседа на его основе. Эксперименты показали снижение ошибок распознавания на базе MNIST с 3,8% до 0,8%, что также меньше, чем 1,1% ошибок в модификации метода ближайшего соседа на основе “тангенсального расстояния”, вычисление которого при этом требует априорной информации о допустимых трансформациях образов.

Ключевые слова:

распознавание образов, метод ближайшего соседа, MNIST

Благодарность:

Работа выполнена при поддержке Министерства образования и науки Российской Федерации и частично при государственной поддержке ведущих университетов Российской Федерации (субсидия 074-U01).

Коды OCIS: 150.1135

Список источников:

1. Schmidhuber J. Deep learning in neural networks: An overview // Neural Networks. 2015. V. 61. P. 85–117.
2. Луцив В.Р. Сверточные искусственные нейронные сети глубокого обучения // Оптический журнал. 2015. Т. 82. № 8. С. 11–23.
3. Le Cun Y. The Unreasonable effectiveness of deep learning. [Электронный ресурс]. Режим доступа: https://www.cs.princeton.edu/events/event/unreasonable-effectiveness-deep-learning, свободный. Яз. англ. (дата обращения 18.05.2016).

4. Le Cun Y., Cortes C., Burges C.J. The MNIST database of handwritten digits. [Электронный ресурс]. Режим доступа: http://yann.lecun.com/exdb/mnist/, свободный. Яз. англ. (дата обращения 18.05.2016).
5. Bengio Y. Deep learning of representations for unsupervised and transfer learning // JMLR W&CP. 2012. V. 27. P. 17–36.
6. Малашин Р.О., Кадыков А.Б. Исследование обобщающих способностей свёрточных нейронных сетей при формировании признаков, инвариантных к вращению // Оптический журнал. 2015. Т. 82. № 8. С. 24–32.
7. Simard P., Le Cun Y., Denker J.S. Efficient pattern recognition using a new transformation distance // Advances in Neural Information Processing Systems. 1992. V. 5. P. 50–58.
8. Le Cun Y., Bottou L., Bengio Y., Haffner P. Gradient-based learning applied to document recognition // Proceedings of the IEEE. 1998. V. 86. № 11. P. 2278–2324.
9. Yang L., Jin R., Sukthankar R., Liu Y. An efficient algorithm for local distance metric learning // Proc. 21st National Conference on Artificial Intelligence. USA: Boston, Massachusetts. 2006. V. 1. P. 543–548.
10. Wang J., Woznica A., Kalousis A. Parametric local metric learning for nearest neighbor classification // [Электронный ресурс]. Режим доступа: http://arxiv.org/abs/1209.3056, свободный. Яз. англ. (дата обращения 18.05.2016).