В официальном блоге корпорации Google появилась статья об исследовании «Создание высокоточных изображений с использованием моделей диффузии». Искусственный интеллект, над которым работает Brain Team, научился повышать разрешение фотографий до 16 раз без потери качества.

Хотя в последние годы набирала популярность другая интеллектуальная технология – глубокие генеративные модели – в Google изучение и разработка диффузионных моделей велась с 2015 года. Технология на их основе получила название SR3. Разработчики используют модель диффузии с очень высоким разрешением, которая на базе исходной картинки с низким разрешением формирует изображение из чистого шума. Модель обучается процессу искажения изображения, при котором шум постепенно добавляется к изображению до тех пор, пока не останется только чистый шум. Затем алгоритм обращает процесс вспять, постепенно удаляя шум с изображения, руководствуясь исходной картинкой с низким разрешением. Наилучшие результаты SR3 продемонстрировала при масштабировании портретов и снимков природы. Алгоритм позволяет добиться фотореалистичного изображения при повышении разрешения портретов до шестнадцати раз.

Читать дальше
ещё