Генеративные и вероятностные модели изображений в задачах их обработки и распознавания
Полный текст «Оптического журнала»
Полный текст на elibrary.ru
Публикация в Journal of Optical Technology
Специальный выпуск “Оптического журнала” посвящен генеративным и вероятностным моделям в задачах автоматического анализа изображений. Эти задачи связаны с такими областями, как иконика, обработка изображений, компьютерное зрение, распознавание образов и т.д., и в каждой из этих областей к настоящему времени разработан обширный и разнообразный набор методов, зачастую применимых лишь к задачам определенного типа. В этой связи естественным является стремление исследователей выработать некоторый обобщающий подход, в рамках которого можно было
бы единообразно поставить различные задачи и описать решающие их методы.
Уже на этапе зарождения указанных областей было замечено, что многие задачи могут быть поставлены как задачи статистического вывода. Однако такая постановка не освобождала от необходимости разработки ad hoc критериев качества решения и алгоритмов их оптимизации, что нередко оказывалось менее практично, чем разработка альтернативных детерминистских алгоритмов.
Новый виток развития вероятностного подхода связан с разработкой теории так называемых графических моделей – графов, в узлах которых располагаются случайные величины, а дугами задаются статистические связи между ними. Унифицированное представление вероятностных моделей изображений и наличие стандартных средств статистического вывода над ними стали основой для эффективного решения определенного круга задач обработки и распознавания изображений. Однако графические модели являются ограниченными и не все задачи можно решить с их использованием.
В то же время, успех графических моделей в области анализа изображений привлек большое внимание в целом к вероятностным генеративным моделям, которые описывают процесс порождения некоторых объектов (например изображений) на основе значений непосредственно не наблюдаемых величин, а вывод над которыми заключается в восстановлении значений скрытых величин по результатам наблюдений. Подход на основе генеративных моделей уточняет общий вероятностный подход, выдвигая на передний план разработку моделей и отделяя ее от проблемы вывода.
Такое разделение не устраняет необходимость разработки алгоритмов вывода, но делает процесс создания новых методов менее эвристическим. Некоторые передовые методы в данной области были разработаны отчасти благодаря этому. Например, один распространенный класс сетей глубокого обучения, показывающих сейчас лучшие результаты в ряде задач распознавания изображений, основан на ограниченных машинах Больцмана. Сама же машина Больцмана является вероятностной генеративной моделью, а наложение на ее структуру определенных ограничений позволяет добиться достаточно эффективного для практического использования вывода над нею.
В полной мере подход на основе генеративных моделей реализуется в вероятностном программировании, в котором генеративными моделями являются сами программы, а общие механизмы вывода над ними заложены в интерпретатореязыка. Вероятностное программирование уже начинает применяться к задачам анализа изображений, хотя существенной преградой здесь является недостаточная эффективность общих механизмов вывода.
До сих пор остаются задачи, в особенности сопоставления изображений сложных сцен, для которых подход на основе генеративных моделей не позволяет достичь эффективного решения. примеры методов решения таких задач, разработанных в рамках традиционной парадигмы, также представлены в данном выпуске. Тем не менее, вероятностные генеративные модели представляются важным компонентом методологии обработки и анализа изображений.