УДК: 004.932
Сверточный автоэнкодер как генеративная модель изображений для задач выделения признаков и восстановления изображений в утерянных областях
Полный текст «Оптического журнала»
Полный текст на elibrary.ru
Публикация в Journal of Optical Technology
Щербаков О.В., Жданов И.Н., Лушин Я.А. Сверточный автоэнкодер как генеративная модель изображений для задач выделения признаков и восстановления изображений в утерянных областях // Оптический журнал. 2015. Т. 82. № 8. С. 48–53.
Shcherbakov O.V., Zhdanov I.N., Lushin Ya.A. A convolutional autoencoder as a generative model of images for problems of distinguishing attributes and restoring images in missing regions [in Russian] // Opticheskii Zhurnal. 2015. V. 82. № 8. P. 48–53.
O. V. Shcherbakov, I. N. Zhdanov, and Ya. A. Lushin, "A convolutional autoencoder as a generative model of images for problems of distinguishing attributes and restoring images in missing regions," Journal of Optical Technology. 82(8), 528-532 (2015). https://doi.org/10.1364/JOT.82.000528
В данной работе рассмотрен подход к описанию структуры моделей, способных к обучению представлениям с позиций генеративных моделей, в частности, подробно рассмотрена архитектура сверточного автоэнкодера. Также приведены достоверные качественные результаты работы сверточного автоэнкодера, которые показывают обоснованность рассмотрения данной модели как генеративной за счет возможности реализации процедур вывода и сэмплирования на примере решения задачи восстановления изображений в утерянных областях.
генеративные модели, сверточный автоэнкодер, восстановление изображений в утерянных областях
Благодарность:Работа выполнена при поддержке Министерства образования и науки Российской Федерации и частично при государственной поддержке ведущих университетов Российской Федерации (субсидия 074-U01).
Коды OCIS: 150.1135
Список источников:1. Potapov A.S. Comparative analysis of structural representations of images, based on the principle of representational minimum description length //Journal of Optical Technology. 2008. V. 75. Is. 11. P. 715–720. (Оптический журнал. 2008. Т. 75. № 11. 2008. С. 35–41.)
2. Potapov A.S., Malyshev I.A., Puysha A.E., Averkin A.N. New paradigm of learnable computer vision algorithms based on the representational MDL principle // Proc. SPIE. 2010. V. 7696. P. 769606.
3. Vincent P., Larochelle H., Lajole I., Bengio Y., Manzagol P.-A. Stacked denoising autoencoders: learning useful representations in a deep network with a local denoising criterion // Journal of Machine Learning Research. 2010. V. 11. P. 3371–3408.
4. Masci J., Meier U., Ciresan D., Schmidhuber J. Stacked convolutional auto-encoders for hierarchical feature extraction // Lecture Notes in Computer Science. 2011. V. 6791. P. 52–59.
5. Erhan D., Bengio Y., Courville A., Manzagol P.-A., Vincent P., Bengio S. Why does unsupervised pre-training help deep learning? // Journal of Machine Learning Research. 2010. V. 11. P. 625–660.
6. Shcherbakov O., Batishcheva V. Image inpainting based on stacked autoencoders // Journal of Physics: Conference Series. 2014. V. 536. P. 012020.
7. Potapov A.S., Scherbakov O.V., Zhdanov I.N. Method of prediction based on algorithmic probability in the problem of image restoration in missing regions // JOT. 2013. V. 80. Is. 11. P. 680–684. (Оптический журнал. 2013. Т. 80. № 11. С. 48–53.)
8. Potapov A., Scherbakov O., Zhdanov I. Practical algorithmic probability: an image inpainting example // Proc. SPIE 9067. Sixth International Conference on Machine Vision (ICMV 2013). 2014. V. 9067. P. 906719-906719-5.