DOI: 10.17586/1023-5086-2022-89-08-43-53
УДК: 612.821
Связь размера локального окна в модели модулей с оценкой размера зрительных изображений и их сегментацией
Полный текст «Оптического журнала»
Полный текст на elibrary.ru
Публикация в Journal of Optical Technology
Бондарко В.М., Данилова М.В. Связь размера локального окна в модели модулей с оценкой размера зрительных изображений и их сегментацией // Оптический журнал. 2022. Т. 89. № 8. С. 43–53. http://doi.org/10.17586/1023-5086-2022-89-08-43-53
Bondarko V.M., Danilova M.V. Relation of local window size in a model of modules with estimation of the size of visual images and their segmentation [in Russian] // Opticheskii Zhurnal. 2022. V. 89. № 8. P. 43–53. http://doi.org/10.17586/1023-5086-2022-89-08-43-53
V. M. Bondarko and M. V. Danilova, "Relation of local window size in a model of modules with estimation of the size of visual images and their segmentation," Journal of Optical Technology. 89(8), 461-468 (2022). https://doi.org/10.1364/JOT.89.000461
Предмет исследования. Рассмотрены основные механизмы обработки зрительных изображений — оценка размера и их сегментация. Изучена возможность описания этих механизмов моделью модулей, предложенной Глезером В.Д. на основании электрофизиологических данных по изучению рецептивных полей нейронов зрительной коры. Цель работы заключается в исследовании механизмов оценки размера и процесса сегментации посредством сопоставления полученных авторами экспериментальных данных и результатов моделирования. Методы. В экспериментальной части использовали психофизические методы исследования. При оценке размера применили две различные парадигмы: модифицированную иллюзию Эббингхауза с разным окружением тестируемых стимулов или сравнивали размеры изображений прямых и косых крестов, которые также ранее использовали в экспериментах по сегментации. При моделировании осуществляли пространственно-частотную фильтрацию изображений в локальных участках поля зрения конечным набором фильтров. Основные результаты. Впервые показано, что оценка размера зависит от расстояния между изображениями и их формы и связана с сегментацией. Новым является и результат, свидетельствующий о том, что изображения разной формы кажутся равными по размеру, если модули, оптимально описывающие изображения (т.е. с максимальным сохранением энергии у изображений при ограниченном числе фильтров), имеют одинаковый размер. Полученные результаты показывают, что модель модулей в первом приближении может аппроксимировать механизм, осуществляющий оценку размера изображений и их сегментацию. Впервые выявлено соответствие между данными нейрофизиологических, психофизических и модельных исследований. Подтверждением полученных выводов служит проведённый авторами анализ по сопоставлению результатов экспериментов по зрительному восприятию и моделированию с закономерностями традиционной византийской иконописи и опирающимся на неё русским авангардом в живописи начала ХХ века. Практическую значимость может иметь применение и дальнейшее усовершенствование модели модулей как искусственной нейронной сети, обеспечивающей сегментацию и оценку размера изображений, а также опознание зрительных объектов.
оценка размера, сегментация, пространственно-частотный анализ, модель модулей, оптические иллюзии, иллюзия Эббингхауза, живопись
Благодарность:Работа выполнена при поддержке Госпрограммы 47 ГП «Научно-технологическое развитие Российской Федерации» (2019–2030), тема 0134-2019-0005.
Коды OCIS: 330.7326 330.4060 330.5510
Список источников:1. Wundt W. Die geometrisch-optischen Tauschungen. Leipzig: Teubner, 1898. 203 p.
2. Бондарко В.М., Данилова М.В., Чихман В.Н. Сегментация зрительных изображений: экспериментальные данные и моделирование // Оптический журнал. 2021. Т. 88. № 12. С. 7–17.
3. Луцив В.Р. Сверточные искусственные нейронные сети глубокого обучения // Оптический журнал. 2015. Т. 82. № 8. С. 11–23.
4. Цыцулин А.К., Бобровский А.И., Морозов А.В., Павлов В.А., Галеева М.А. Применение свёрточных нейронных сетей для автоматической селекции малоразмерных искусственных космических объектов на оптических изображениях звёздного неба // Оптический журнал. 2019. Т. 86. № 10. С. 30–38.
5. Xie Y., Zhu F., Fu Y. Main-secondary network for defect segmentation of textured surface images // IEEE Winter Conference on Applications of Computer Vision (WACV). 2020. P. 3531–3540.
6. Beck J. Textural segmentation, second-order statistics, and textural elements // Biological Cybernetics. 1983. V. 48. P. 125–130.
7. Шелепин Ю.Е., Глезер В.Д., Бондарко В.М., Павловская М.Б., Вол И.А., Данилов Ю.П. Пространственное зрение // Физиология зрения / Под ред. Бызова А.Л. М.: Наука, 1992. С. 528–586.
8. Julesz B. Experiment in the visual perception of texture // Sci. Am. 1975. V. 232. P. 34–43.
9. Julesz B. Textons, the elements of texture perception, and their interactions // Nature. 1981. V. 290. P. 91–97.
10. Julesz B. Texton gradients: The texton theory revisited // Biological Cybernetics. 1986. V. 54. P. 245–251.
11. Beck J., Sutter A., Ivry R. Spatial frequency channels and perceptual grouping in texture perception // Computer Vision, Graphics and Image Processing. 1987. V. 37. P. 299–325.
12. Bovik A.C., Clark M., Geisler W.S. Multichannel texture analysis using localized spatial filters // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1990. V. 12. P. 55–73.
13. Turner M.R. Texture discrimination by Gabor functions // Biological Cybernetics. 1986. V. 55. P. 71–82.
14. Arsenault E., Yoonessi A., Baker C. Higher order texture statistics impair contrast boundary segmentation // J. Vision. 2011. V. 11(10):14. P. 1–15.
15. Prakash M.J., Kezia S., I. Santhi Prabha S., Kumar V.V. A New approach for texture segmentation using gray level textons // International J. Signal Processing, Image Processing and Pattern Recognition. 2013. V. 6. № 3. P. 81–90.
16. Глезер В.Д. Зрение и мышление. Л.: Наука, 1985. 300 с.
17. Kaliteevsky N.A., Semenov V.E., Glezer V.D., Gauselman V.E. Algorithm of invariant image description by the use of a modified Gabor transform // Applied optics. 1994. V. 33. № 23. Р. 5256–5261.
18. Glezer V.D., Yakovlev V.V., Gauselman V.E. Harmonic basis function for spatial coding in the cat striate cortex // Visual Neurosci. 1989. V. 3. P. 351–383.
19. Вол И.А. Пространственно-частотная модель гиперостроты зрительной системы // Сенсорные системы. 1988. T. 2. № 2. C. 133–138.
20. Жукова О.В., Малахова Е.Ю., Шелепин Ю.Е. Джоконда и неопределенность распознавания улыбки человеком и искусственной нейронной сетью // Оптический журнал. 2019. Т. 86. № 11. С. 40–50.
21. Малахова Е.Ю. Пространство описания зрительной сцены в искусственных и биологических нейронных сетях // Оптический журнал. 2020. Т. 87. № 10. С. 50–58.
22. Титаренко M.A., Малашин Р.О. Метод улучшения изображений с помощью глубоких нейронных сетей при использовании высокоуровневой информации // Оптический журнал. 2020. Т. 87. № 10. С. 59–68.
23. Жукова О.В., Васильев П.П. Перестройка нейронной сети и изменение стратегий операторов в процессе распознавания изображений лиц // Оптический журнал. 2020. Т. 87. № 10. С. 25–37.
24. Хараузов А.К., Шелепин Ю.Е, Цветков О.В., Жукова О.В., Пронин С.В. Методы маскировки угрожающих изображений и электрофизиологические маркеры их неосознанного восприятия // Оптический журнал. 2020. Т. 87. № 10. С. 69–80.
25. Шелепин Ю.Е., Хараузов А.К., Жукова О.В., Пронин С.В., Куприянов М.С., Цветков О.В. Маскировка и обнаружение скрытых сигналов в динамических изображениях //Оптический журнал. 2020. Т. 87. № 10. С. 89–102.
26. Ronneberger O., Fischer P., Brox T. U-net: Convolutional networks for biomedical image segmentation. Switzerland: MICCAI, 2015. Part III. LNCS 9351. P. 234–241.
27. Maлашин Р.О. Принцип наименьшего действия в динамически конфигурируемых системах анализа изображений // Оптический журнал. 2019. Т. 86. № 11. С. 5–13.
28. Ebbinghaus H. Grundzüge der Psychologie. 1908. V. II. Part I. Leipzig: Veit.
29. Ehrenstein W.H., Hamada J. Structural factors of size contrast in the Ebbinghaus illusion // Ed. by Sumi S., Noguchi K. / New horizons in the study of Gestalt perception. Hiyoshi, Yokohama 223, Japan: Keio Univ., Chiba Univ., 1996. P. 158–169.
30. Бондарко В.М., Семенов Л.А. Оценка размера в иллюзии Эббингхауза у взрослых и детей различного возраста // Физиология человека. 2004. Т. 30. № 1. С. 31–37.
31. Wilson H.R., Gelb D.J. Modified line element theory for spatial frequency and width discrimination // J. Opt. Soc. Amer. A. 1984. V. 1. P. 124–131.
32. Danilova M.V., Bondarko V.M. Foveal contour interactions and crowding effects at the resolution limit of the visual system // J. Vision. 2007. V. 7(2). P. 1–18.
33. Бычков В.В. Икона и русский авангард начала ХХ века // Книга неклассической эстетики / Под ред. Коревище О.Б. М.: ИФ РАН, 1998. С. 58–75.
34. Douglas C.C. Swans of other worlds: Kazimir Malevich and the origins of suprematism 1908-1915. USA: UMI Research Press, 1980. 211 p.
35. Сарабьянов Д., Шатских А. Казимир Малевич: живопись, теория. М.: Искусство, 1993. 416 с.
36. Griber Y.A., Egorov A.G. The Vitebsk project by Kazimir Malevich: A case-study of urban life modernization // Mediterranean Journal of Social Sciences. 2015. V. 6. № 4. P. 4–18.
37. Vidrih R. Iconisation at work. Malevich's Black Square, the modern icon at Tate Modern // IKON. 2016. V. 9. P. 343–354.
38. Girgus J.S., Coren S., Agdern M. The interrelationship between the Ebbinghaus and Delboeuf illusions // J. Exp. Psychology. 1972. V. 95. № 2. P. 453–455.
39. Weintraub D.J., Schneck M.K. Fragments of Delboeuf and Ebbinghaus illusions: Contour context explorations of misjudged circle size // Perception and Psychophysics. 1986. V. 40 (3). P. 147–158.
40. Bulatov A., Bertulis A. Distortions of length perception // Biological Cybernetics. 1999. V. 80. P. 185–193.
41. Bulatov A., Bertulis A., Mickiene L. Geometrical illusions: study and modelling // Biological Cybernetics. 1997. V. 77. P. 395–406.
42. Burt P.J. Fast filter transforms for image processing // Comput. Graph. and Image Proc. 1981. V. 16. P. 20–51.