DOI: 10.17586/1023-5086-2019-86-11-40-50
УДК: 612.82, 004.93
Джоконда и неопределенность распознавания улыбки человеком и искусственной нейронной сетью
Полный текст «Оптического журнала»
Полный текст на elibrary.ru
Публикация в Journal of Optical Technology
Жукова О.В., Малахова Е.Ю., Шелепин Ю.Е. Джоконда и неопределенность распознавания улыбки человеком и искусственной нейронной сетью // Оптический журнал. 2019. Т. 86. № 11. С. 40–50. http://doi.org/10.17586/1023-5086-2019-86-11-40-50
Zhukova O.V., Malakhova E.Yu., Shelepin Yu.E. La Gioconda and the indeterminacy of smile recognition by a person and by an artificial neural network [in Russian] // Opticheskii Zhurnal. 2019. V. 86. № 11. P. 40–50. http://doi.org/10.17586/1023-5086-2019-86-11-40-50
O. V. Zhukova, E. Yu. Malakhova, and Yu. E. Shelepin, "La Gioconda and the indeterminacy of smile recognition by a person and by an artificial neural network," Journal of Optical Technology. 86(11), 706-715 (2019). https://doi.org/10.1364/JOT.86.000706
Проведен сравнительный анализ возможностей распознавания улыбки человеком и искусственной нейронной сетью в условиях неопределенности. Методом функциональной магнитно-резонансной томографии исследованы основные паттерны мозговой активности. Существуют фундаментальные ограничения, свойственные естественным и искусственным нейронным сетям, поэтому получены общности результатов распознавания тестовых изображений в надпороговых и пороговых условиях. Так, вероятность распознавания улыбки в обычных условиях достаточно высока, но в условиях неопределенности (пороговые и зашумленные изображения) и у человека, и у искусственной нейронной сети она снижается. Например, распознавание улыбки в мимике Джоконды человеком и искусственной нейросетью происходит с вероятностью 0,69. Предполагаем, что важнейшим принципом работы в обеих сетях является механизм согласованной фильтрации как меры соответствия предъявленного изображения с выученным нейронной сетью шаблоном, в частности, улыбки.
улыбка, искусственная нейронная сеть, распознавание, крупномасштабная нейронная сеть, паттерн мозговой активности
Благодарность:Нейрофизиологическая часть исследования выполнена при финансовой поддержке научно-исследовательского проекта «Психофизиологические и нейролингвистические аспекты процесса распознавания вербальных и невербальных паттернов», проект Российского научного фонда №14-18-02135.
Моделирование на сверточной нейронной сети глубокого обучения выполнено при финансовой поддержке Программы фундаментальных научных исследований государственных академий на 2013–2020 гг. (ГП-14, раздел 63), Институт физиологии им И.П. Павлова.
Коды OCIS: 100.4996, 170.6960, 330.5020
Список источников:1. Розенблатт Ф. Принципы нейродинамики (перцептрон и теория механизмов мозга). М.: Мир, 1965. 480 с.
2. Hubel D.H., Wiesel T.N. Receptive fields, binocular interaction and functional architecture in the cat’s visual cortex // J. Physiology. 1962. V. 160. P. 106–154.
3. Fukushima K., Miyake S. Neocognitron. A self-organizing neural network model for a mechanism of visual pattern recognition / in Competition and cooperation in neural nets. Berlin: Springer Heidelberg, 1982. P. 267–285.
4. Guclu U., van Gerven M.A. Deep neural networks reveal a gradient in the complexity of neural representations across the ventral stream // J. Neuroscience: The Official Journal of the Society for Neuroscience. 2015. V. 35. P. 10005–10014 .
5. Kriegeskorte N. Deep neural networks: A new framework for modeling biological vision and brain information processing // Annual Review of Vision Sci. 2015. V. 1. P. 417–446.
6. Parkhi O.M., Vedaldi A., Zisserman A. Deep face recognition // In BMVC. 2015. V. 1. № 3. P. 6.
7. Малахова Е.Г. Обработка зрительной информации в искусственных и биологических нейронных сетях // Нейротехнологии / Под ред. Шелепина Ю.Е., Чихмана В.Н. СПб.: изд. ВВМ, 2018. C. 338–349.
8. Красильников Н.Н., Шелепин Ю.Е. Маскирование как результат согласованной фильтрации // Физиология человека. 1996. Т. 22. № 5. С. 99–103.
9. Шелепин Ю.Е., Борачук (Жукова) О.В., Пронин С.В. и др. Лицо и невербальные средства коммуникации // Петербургский психологический журнал. 2014. № 9. С. 1–43.
10. Жукова О.В. Закономерности перестройки крупномасштабной нейронной сети головного мозга человека при распознавании лиц в условиях неопределенности // Автореф. канд. дис. СПб.: CПбГУ, 2017. 25 с.
11. Подвигин Н.Ф., Макаров Ф.Н., Шелепин Ю.Е. Элементы структурно-функциональной организации зрительно-глазодвигательной системы. Л.: Наука, 1986. 252 с.
12. Tanaka K., Saito H., Fukada Y., et al. Coding visual images of objects in the inferntemporal cortex of the macaque monkey // J. Neurophysid. 1991. V. 66. № 1. P. 170–189.
13. Шелепин Ю.Е., Фокин В.А., Хараузов А.К. и др. Локализация методами нейроиконики механизмов принятия решений об упорядоченности текстур // Оптический журнал. 2014. T. 81. № 1. С. 57–69.
14. Cadieu C.F., Hong H., Yamins D.L., et al. Deep neural networks rival the representation of primate IT cortex for core visual object recognition // PLoS Computational Biology 10:e1003963. 2014.
15. Kohonen T. Analysis of simple self-organizing process // Biological Cybernetics. 1982. V. 44. P. 135–140.
16. Fukushima K. Neural network model for selective attention in visual pattern recognition and associative recall // Appl. Opt. 1987. V. 26. № 23. P. 4985–4992.