Google запускает нейросеть, создающую HD-видео по описанию

07.10.2022

0 134 Less than a minute

Новая система от Google под названием Imagen Video способна создавать видео в высоком качестве на основе текстового описания. Система генерирует ролики длительностью до 5 секунд в разрешении 1280х768 px. Система находится в закрытом доступе исключительно для сотрудников компании, чтобы ограничить появления в ней шокирующего или запрещенного контента.

Imagen Video умеет работать в разных стилях. Она способна имитировать работы художников, создавать вращающиеся 3D-объекты, которые сохраняют свою форму по мере вращения. Нейросеть обучена на десятках миллионов фотографий, видео и текстовых описаний. Ознакомиться с примерами работ можно по ссылке.

При подаче текстового запроса система генерирует прототип видео из 16 кадров в разрешении 24х48 px и частотой в 3 FPS. Другая система увеличивает разрешение и выдает готовый результат.

Примечательно, что на прошлой неделе аналогичную технологию представила Meta*. Ее нейросеть под названием Make-a-video также умеет создавать видео по описанию и также находится в закрытом доступе, а прототипы кадров генерируются в разрешении 64х64 px.

Напоминаем, что весной Google представил нейросеть для генерации изображений по текстовому описанию DALL-E 2, а в середине лета в открытом доступе появился ее аналог — Midjourney.