Google запустила мультимодальный ИИ-конструктор Gemini Omni для генерации видео

Google анонсировала мультимодальную модель искусственного интеллекта Gemini Omni. Она объединяет возможности Gemini с инструментами генерации видео и музыки.

20 мая 2026, среда 14:36

Global_Chronicles для раздела Блоги

На конференции Google I/O 2026 компания показала новую разработку в области генеративного ИИ. Глава DeepMind Демис Хассабис (Demis Hassabis) представил Gemini Omni — модель, которая создает видео на основе текстовых описаний и других входных данных.

Gemini Omni соединяет аналитические способности Gemini с генеративными моделями Veo, Nano Banana и Genie. Первый релиз под названием Omni Flash появится на платформах Flow (для создания фильмов) и Flow Music (для генерации музыки).

Хассабис назвал Omni шагом к модели мира, которая понимает и имитирует окружающую среду. Компания уже год работает над этим направлением.

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Задание сделать скульптуру из мыльных пузырей

&nbsp;&nbsp;&nbsp;&nbsp;Задание: Когда человек коснется зеркала, пусть по зеркалу пойдут круги, как по воде, а рука человека станет сделанной из зеркала

Во время презентации Google показала обучающий ролик о сворачивании белков, выполненный в стиле пластилиновой анимации. Еще компания продемонстрировала диалоговое редактирование видео. Пользователь может менять фон, добавлять объекты и перестраивать сцену без ручной настройки каждого элемента.

Google также выпустила Flow Agent — помощника, который генерирует идеи, организует материалы и редактирует проекты. Еще одно нововведение — Flow Tools для создания рабочих процессов без знаний в программировании.

Хассабис отметил, что компания начинает с видео, но в будущем расширит доступ к Omni. Мультимодальный подход закладывали в Gemini с самого начала.

Перейти к полной версии Комментарии

Google запустила мультимодальный ИИ-конструктор Gemini Omni для генерации видео

Теги

Лента материалов