На конференции Google I/O 2026 компания показала новую разработку в области генеративного ИИ. Глава DeepMind Демис Хассабис (Demis Hassabis) представил Gemini Omni — модель, которая создает видео на основе текстовых описаний и других входных данных.
Gemini Omni соединяет аналитические способности Gemini с генеративными моделями Veo, Nano Banana и Genie. Первый релиз под названием Omni Flash появится на платформах Flow (для создания фильмов) и Flow Music (для генерации музыки).
Хассабис назвал Omni шагом к модели мира, которая понимает и имитирует окружающую среду. Компания уже год работает над этим направлением.
Задание сделать скульптуру из мыльных пузырей
Задание: Когда человек коснется зеркала, пусть по зеркалу пойдут круги, как по воде, а рука человека станет сделанной из зеркала
Во время презентации Google показала обучающий ролик о сворачивании белков, выполненный в стиле пластилиновой анимации. Еще компания продемонстрировала диалоговое редактирование видео. Пользователь может менять фон, добавлять объекты и перестраивать сцену без ручной настройки каждого элемента.
Google также выпустила Flow Agent — помощника, который генерирует идеи, организует материалы и редактирует проекты. Еще одно нововведение — Flow Tools для создания рабочих процессов без знаний в программировании.
Хассабис отметил, что компания начинает с видео, но в будущем расширит доступ к Omni. Мультимодальный подход закладывали в Gemini с самого начала.

