Платим блогерам
Блоги
Global_Chronicles
Google анонсировала мультимодальную модель искусственного интеллекта Gemini Omni. Она объединяет возможности Gemini с инструментами генерации видео и музыки.

На конференции Google I/O 2026 компания показала новую разработку в области генеративного ИИ. Глава DeepMind Демис Хассабис (Demis Hassabis) представил Gemini Omni — модель, которая создает видео на основе текстовых описаний и других входных данных.

Gemini Omni соединяет аналитические способности Gemini с генеративными моделями Veo, Nano Banana и Genie. Первый релиз под названием Omni Flash появится на платформах Flow (для создания фильмов) и Flow Music (для генерации музыки).

Хассабис назвал Omni шагом к модели мира, которая понимает и имитирует окружающую среду. Компания уже год работает над этим направлением.

Задание сделать скульптуру из мыльных пузырей

Задание: Когда человек коснется зеркала, пусть по зеркалу пойдут круги, как по воде, а рука человека станет сделанной из зеркала

Во время презентации Google показала обучающий ролик о сворачивании белков, выполненный в стиле пластилиновой анимации. Еще компания продемонстрировала диалоговое редактирование видео. Пользователь может менять фон, добавлять объекты и перестраивать сцену без ручной настройки каждого элемента.

Google также выпустила Flow Agent — помощника, который генерирует идеи, организует материалы и редактирует проекты. Еще одно нововведение — Flow Tools для создания рабочих процессов без знаний в программировании.

Хассабис отметил, что компания начинает с видео, но в будущем расширит доступ к Omni. Мультимодальный подход закладывали в Gemini с самого начала.

Источник: x.com
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости