Airec

Skip to content

26 Января 2018

Искусственный интеллект научился рисовать по текстовым описаниям

Ранее специалисты компании Google научили свою систему искусственного интеллекта делать зарисовки, в результате чего на свет появились картины, словно вышедшие из-под кисти какого-нибудь художника-абстракциониста. Однако если перед этой системой поставить задачу «нарисовать желтую птицу с черными крыльями и коротким клювом», она, скорее всего, не сможет успешно справиться с ее выполнением. Тем не менее, такая задача вполне по силам новой системе, созданной специалистами компании Microsoft. Чем подробней будет текстовое описание объекта, тем более точный рисунок она сможет нарисовать.

Отметим, что новая система не использует никаких готовых рисунков, она создает изображение абсолютно с нуля. «Bing или другая поисковая система выдаст вам множество изображений птиц. Но в нашем случае компьютер создает изображения с чистого листа, создавя их пиксель за пикселем», — рассказывает Сяодун Хе (Xiaodong He), ведущий исследователь: «Нарисованные птицы, возможно, не существуют в реальном мире, они являются лишь отражением воображения нашего компьютера».

Основой новой системы являются технологии компьютерного видения SeeingAI и технология обработки естественного языка CaptionBot. Такой набор технологий уже используется для составления заголовков для снимков, для ответов на вопросы, задаваемых людьми касательно конкретных фотографий и т.п. Данная технология состоит из двух частей: одна – Generative Adversarial Network (GAN), генерирует изображения, и вторая – нейронная сеть-дискриминатор, оценивает качество создаваемых изображений. Изначально эта система была обучена на парах изображений и заголовков, которые помогли создать базу данных, связывающих элементы изображений с элементами текстового описания.

В настоящее время работу новой системы еще нельзя считать идеальной. Но перспективы использования таких систем в будущем весьма обширны. Такие системы смогут стать помощниками художникам и дизайнерам, с их помощью можно будет работать над фотографиями, используя голосовое управление. А «венцом» использования такой технологии могут стать мультипликационные фильмы, составленные компьютерами на основе письменных художественных произведений.

Источник: Engadget

в разделе: В мире Просмотров: 877

Рубрики

Все рубрики

В мире

Мероприятия

В России

Архив новостей

Loading ...

Институт программных систем РАН
152021, Россия, г. Переславль-Залесский