Ученые университета Торонто создали нейросеть, которая умеет в режиме реального времени сочинять песни про предметы, показанные на фотографиях.

В основе данной работы – созданная ими ранее рекуррентная нейросеть, генерирующая песни в стиле «поп». Программа была обучена сочинению простых мелодий в темпе 120 ударов в минуту, с типичными для поп-музыки аккордами и аранжировками. Далее был создан словарь для создания текстов: сетью был проанализирован 51 час аудиозаписей текстов, и из этого материала были извлечены все слова, повторяющиеся более четырех раз. К слову, глоссарий получился не таким уж большим – всего 3390 слов.

Читать дальше
ещё