Google представила свой ИИ для создания HD-видеороликов из текстовых подсказок
Google объявила о разработке Imagen Video - нейросети, способной создавать видео 1280×768 с частотой 24 кадра в секунду на основе письменной подсказки.
Ключом к возможностям Imagen Video является "каскад" из семи диффузионных моделей, которые преобразуют исходный текст. Например, "медведь моет посуду" в видео низкого разрешения (16 кадров, со скоростью 3 кадра в секунду), а затем с каждым шагом увеличивают его до все более высокого разрешения с более высокой частотой кадров. Длина конечного видео на выходе составляет 5,3 секунды.
Примеры видео, представленные на сайте Imagen Video, варьируются от обыденных "тающее мороженое стекает по рожку", до более фантастических "Полет во время напряженной битвы между пиратскими кораблями в бурном океане".
Фото: Imagen Video
- Комментарии