Последняя модель Google Gemini 2.0 открывает эру «агентов»

Gemini 2.0 Flash Experimental показывает отличные результаты по невысокой цене
12 декабря 2024, четверг 14:45
Блогер для раздела Блоги

Примерно через 10 месяцев после выпуска нынешнего поколения моделей искусственного интеллекта компания Google демонстрирует будущее: Gemini 2.0. Начиная с сегодняшнего дня, меньшая экспериментальная модель Gemini 2.0 Flash станет доступна разработчикам и пользователям Gemini. Большее количество версий и реализаций появится в следующем году.

Google рассматривает следующий этап развития ИИ как «эру агентов». В блоге компании описано, как модели Gemini 2.0 специально разработаны для поддержки агентов искусственного интеллекта. Это станет основой для самых амбициозных проектов Google: от мультимодальных помощников до расширений Chrome, которые смогут выполнять сёрфинг за пользователей.

«За последний год мы инвестировали в разработку моделей, которые могут понимать больше о мире вокруг, думать на несколько шагов вперёд и действовать от вашего имени под вашим контролем», — написал генеральный директор Google Сундар Пичаи. «Благодаря новым достижениям в мультимодальности — таким, как нативный вывод изображений и аудио, а также нативное использование инструментов — мы сможем создавать новые ИИ-агенты, которые приблизят нас к цели создания универсального помощника».

Сегодня доступна только экспериментальная версия самой маленькой ИИ-модели Google. По некоторым тестам Gemini 2.0 Flash не только превосходит Gemini 1.5 Flash, но и более крупную и мощную модель Gemini 1.5 Pro. Gemini 2.0 Flash теперь поддерживает мультимодальные входные и выходные данные. Это означает, что модель может нативно генерировать изображения, текст, речь или их комбинации.

Gemini 2.0 Flash Experimental уже доступна глобально как опция в веб-клиенте Gemini, а вскоре появится в мобильном приложении Gemini. Кроме того, разработчики могут протестировать экспериментальную версию Gemini 2.0 Flash через API Gemini в Google AI Studio или Vertex AI.

В итоге Gemini 2.0 станет основой для большинства функций Google, оснащённых ИИ. Модели специально адаптированы для работы с ИИ-агентами, такими как Project Astra, который был представлен на Google I/O 2024. Это мультимодальный помощник, который может воспринимать, что происходит вокруг вас, и отвечать на вопросы с учётом вашего окружения. Есть также новые проекты, такие как Project Mariner. В настоящее время Project Mariner — это расширение Chrome, тестируемое как исследовательский прототип, который может выполнять задачи сёрфинга за вас.

Видение Google в области агентов амбициозно и включает множество других приложений. Например, есть Jules — помощник для разработчиков, который интегрируется с рабочими процессами GitHub. Другим примером является сотрудничество компании с Supercell, тестирующее применение ИИ-агентов в стратегических и симуляционных играх.

Наконец, появился новый режим Deep Research в Gemini Advanced, который использует длинные контекстные окна и передовые методы рассуждений для работы в качестве исследовательского помощника.

Многие идеи Google, основанные на Gemini 2.0, пока недоступны, но находятся в активной разработке. Например, Project Astra тестируется внешне через программу доверенных тестировщиков Google. Однако некоторые доступны уже сегодня, такие как Gemini 2.0 Flash Experimental в Gemini и Gemini 2.0 в AI Overviews — который сейчас находится в ограниченном тестировании и станет доступен широкой аудитории в следующем году.