DOI: 10.17586/1023-5086-2024-91-08-99-109
УДК: 612.821
Модель модулей В.Д. Глезера — возможная основа для описания зрительного восприятия
Полный текст на elibrary.ru
Бондарко В.М. Модель модулей В.Д. Глезера — возможная основа для описания зрительного восприятия // Оптический журнал. 2024. Т. 91. № 8. С. 99–109. http://doi.org/10.17586/1023-5086-2024-91-08-99-109
Bondarko V.M. Vadim Glezer’s modules model is a possible basis of vision perception description [in Russian] // Opticheskii Zhurnal. 2024. V. 91. № 8. P. 99–109. http://doi.org/10.17586/1023-5086-2024-91-08-99-109
Предмет исследования. Исследовали механизмы зрительного восприятия. Цель работы. Целью настоящей работы является дальнейшее изучение возможности применения модели модулей В.Д. Глезера, описание с её помощью основных механизмов зрительного восприятия: распознавания, оценки размера и сегментации изображений. Методы. Использовали психофизические методы исследования и моделирование. Проведены эксперименты по распознаванию изображений, а также по оценке размеров пространственных интервалов и окружностей в иллюзиях Дельбёфа и Эббингхауза. Данные промоделированы как с использованием полных спектров изображений, так и моделью модулей, в которой изображения разлагались в конечные ряды Фурье. Для каждого изображения подбирали модуль оптимального размера, обеспечивающий сохранение наибольшего количества энергии в изображении. Рассмотрели две комбинации таких модулей. Основные результаты. Оказалось, что размер оптимального модуля зависит от формы изображения. Показано, что ошибки распознавания изображений и субъективные оценки их близости скоррелированы с расстояниями между изображениями, вычисленными в пространстве признаков как нормы разности спектров при совмещении у изображений центров тяжести, и частично с расстояниями, полученными в одном из вариантов модели модулей. Ранее моделью модулей были успешно аппроксимированы данные по сегментации и оценке размера изображений. Адекватность использованных моделей процессам переработки информации в зрительной системе в настоящем исследовании подтвердилась при сопоставлении полученных экспериментальных данных с проведённым анализом произведений живописи. Модель модулей может описывать механизмы оценки размера изображений и их сегментацию. Для моделирования процесса распознавания требуется усовершенствовать модель: ввести взаимодействие между модулями разных размеров. Тем самым модель модулей можно рассматривать как первое приближение к описанию зрительного восприятия. Практическая значимость. Модель модулей можно использовать для разработки моделей зрительного восприятия и для создания искусственных нейронных сетей, обеспечивающих сегментацию и распознавание объектов.
распознавание, оценка размера, сегментация, моделирование, пространственно-частотный анализ, модель модулей, оптические иллюзии
Благодарность:Коды OCIS: 330.7326, 330.4060, 330.5510, 330.5370
Список источников:1. Явна Д.В., Бабенко В.В., Горбенкова О.А. и др. Категоризация объектов и сцен нейронной сетью, входы которой предварительно обучены декодированию пространственных неоднородностей текстуры // Оптический журнал. 2023. Т. 90. № 1. С. 37–48. https://doi.org/10.17586/1023-5086-2023-90-01-37-48
2. Ермаченкова М.К., Малашин Р.О., Бойко А.А. Обучение нейронных сетей для классификации тепловизионных изображений на основе изображений видимого спектра // Оптический журнал. 2023. Т. 90. № 10. С. 48–66. https://doi.org/10.17586/1023-5086-2023-90-10-48-66
3. Цыцулин А.К., Бобровский А.И., Морозов А.В. и др. Применение свёрточных нейронных сетей для автоматической селекции малоразмерных искусственных космических объектов на оптических изображениях звёздного неба // Оптический журнал. 2019. Т. 86. № 10. С. 30–38. https://doi.org/10.17586/1023-5086-2019-86-10-30-38
4. Жукова О.В., Малахова Е.Ю., Шелепин Ю.Е. Джоконда и неопределенность распознавания улыбки человеком и искусственной нейронной сетью // Оптический журнал. 2019. Т. 86. № 11. С. 40–50. https://doi.org/10.17586/1023-5086-2019-86-11-40-50
5. Луцив В.Р. Сверточные искусственные нейронные сети глубокого обучения // Оптический журнал. 2015. Т. 82. № 8. С. 11–23.
6. Малахова Е.Ю. Пространство описания зрительной сцены в искусственных и биологических нейронных сетях // Оптический журнал. 2020. Т. 87. № 10. С. 50–58. https://doi.org/10.17586/1023-5086-2020-87-10-50-58
7. Малахова Е.Ю. Представление категорий посредством прототипов согласованной активности нейронов в свёрточных нейронных сетях // Оптический журнал. 2021. Т. 88. № 12. С. 36–41. https://doi.org/10.17586/1023-5086-2021-88-12-36-41
8. Глезер В.Д. Зрение и мышление. Л.: Наука, 1985. 300 с.
9. Glezer V.D. Vision and mind: Modeling mental functions. NJ.: Lawrens Erlbaum Ass., 1995. 274 p.
10. Glezer V.D., Tcherbach T.A., Gauzelman V.E., Bondarko V.M. Linear and non-linear properties of simple and complex receptive fields in area 17 of the cat visual cortex: A model of the fields // Biol. Cybern. 1980. V. 37. P. 195–208.
11. Вол И.А. Пространственно-частотная модель гиперостроты зрительной системы // Сенсорные системы. 1988. T. 2. № 2. C. 133–138.
12. Kaliteevsky N.A., Semenov V.E., Glezer V.D., Gauselman V.E. Algorithm of invariant image description by the use of a modified Gabor transform // Applied Optics. 1994. V. 33. № 23. Р. 5256–5261. https://doi.org/10.1364/AO.33.005256
13. Glezer V.D., Yakovlev V.V., Gauselman V.E. Harmonic basis function for spatial coding in the cat striate cortex // Visual Neurosci. 1989. V. 3. P. 351–383. https:// doi.org/ 10.1017/s0952523800005526
14. Burst P.J. Fast filter transforms for image processing // Comput. Graph. and Image Proc. 1981. V. 16. P. 20–51.
15. Бондарко В.М., Данилова М.В., Чихман В.Н. Сегментация зрительных изображений: экспериментальные данные и моделирование // Оптический журнал. 2021. Т. 88. № 12. С. 7–17. http://doi.org/10.17586/1023-5086-2021-88-12-17-27
16. Бондарко В.М., Данилова М.В. Связь размера локального окна в модели модулей с оценкой размера зрительных изображений и их сегментацией // Оптический журнал. 2022. Т. 89. № 8. С. 43–53. https:// doi.org/10.17586/1023-5086-2022-89-08-43-53
17. Blakemore G., Campbell F.W. On the existence in human visual system of neurones selectively sensitive to the orientation and size of retinal image // J. Physiology. 1969. V. 203. № 1. P. 237–260.
18. Campbell F.W., Robson J.G. Application of Fourier analyses to the visibility of gratings // J. Physiol. 1968. V. 197. P. 551–566.
19. Вол И.А., Павловская М.Б. Корреляция между близостью фурье-спектров изображений и ошибками распознавания // Физиол. чел. 1986. Т. 12. № 3. С. 400–406.
20. Gervais M. J., Harvey L.O., Roberts Y.O. Identification confusions among letters of the alphabet // J. Exp. Psychol. Hum. Percept. 1984. V. 10. № 5. P. 655–666.
21. Vol I.A., Pavlovskaya M.B., Bondarko V.M. Similarity between Fourier transform of images predicts their experimental confusion // Perception and Psychophysics. 1990. V. 47. № 1. P. 12–21.
22. Patil A., Rane M. Convolutional neural networks: an overview and its applications in pattern recognition // Information and Communication Technology for Intelligent Systems: Proceedings of ICTIS 2020. 2021. V. 1. P. 21–30. https://doi.org/10.1007/978-981-15-7078-0_3
23. Rawat W., Wang Z. Deep convolutional neural networks for image classification: A comprehensive review // Neural computation. 2017. V. 29. № 9. P. 2352–2449. https://doi.org/10.1162/neco_a_00990
24. Sharma N., Jain V., Mishra A. An analysis of convolutional neural networks for image classification // Procedia computer science. 2018. V. 132. P. 377–384. https://doi.org/10.1016/j.procs.2018.05.198
25. Титаренко М.А., Малашин Р.О. Исследование способностей нейронных сетей к извлечению и использованию семантической информации при обучении восстановлению зашумлённых изображений // Оптический журнал. 2022. Т. 89. № 2. С. 25–35. https:// doi.org/ 10.17586/1023-5086-2022-89-02-25-35
26. Альес М.Ю., Антонов Е.А., Калугин А.И., Зарипов М.Р. Применение искусственных нейронных сетей для анализа мультиспектральных изображений // Оптический журнал. 2021. Т. 88. № 8. С. 48–53. https://doi.org/10.17586/1023-5086-2021-88-08-48-53
27. Mihaylova M., Stomonyakov V., Vassilev A. Peripheral and central delay in processing high spatial frequencies: reaction time and VEP latency studies // Vision research. 1999. V. 39. № 4. P. 699–705. https://doi.org/10.1016/s0042-6989(98)00165-5
28. Бондарко В.М., Семенов Л.А. Оценка размера в иллюзии Эббингхауза у взрослых и детей различного возраста // Физиология человека. 2004. Т. 30. № 1. С. 31–37.
29. Weintraub D.J., Schneck M.K. Fragments of Delboeuf and Ebbinghaus illusions: Contour context explorations of misjudged circle size // Perception and Psychophysics. 1986. V. 40 (3). P. 147–158.