Платим блогерам
Блоги
Vizir47
OpenAI представила новый “agent mode”, который может самостоятельно просматривать веб-страницы, переходить по интерфейсам и выполнять задачи от начала до конца, от планирования до создания слайдов для анализа конкурентов, не нуждаясь в пошаговом руководстве.

OpenAI представила новый “agent mode” для пользователей Pro, Plus и Team: теперь он может самостоятельно сделать всю работу. Обновленный искусственный интеллект может просматривать веб-страницы, переходить по интерфейсам и выполнять задачи от начала до конца, от планирования до создания слайдов для анализа конкурентов, не нуждаясь в пошаговом руководстве. После активации, ChatGPT может анализировать веб-сайты, взаимодействовать с API, запускать код и предоставлять файлы, такие как слайд-шоу или электронные таблицы. Система использует свой собственный виртуальный компьютер, чтобы сочетать просмотр веб-страниц, рассуждения и использование инструментов, подобно полноценному цифровому помощнику.

Это означает, что теперь можно попросить ChatGPT “проанализировать трех конкурентов и создать слайд-шоу”, и он выполнит это, фильтруя вводимый текст и предоставляя редактируемые результаты.

Может быть интересно

Обновление объединяет две предыдущие возможности. Оператор может нажимать на веб-сайты и прокручивать их, в то время как deep research фокусируется на глубоком анализе информации. По сообщению OpenAI, объединение сильных сторон позволяет ChatGPT “активно привлекать веб-сайты - кликать, фильтровать и получать более точные и эффективные результаты”.

Благодаря поддержке Gmail или GitHub, новый “agent mode” может подключаться к приложениям и рабочим процессам пользователя. Когда требуется аутентификация, пользователи могут использовать браузер для безопасного входа в систему, после чего ChatGPT возобновляет выполнение задачи. Теперь он может переключаться между просмотром веб-страниц, загрузкой файлов, их анализом в терминале и продолжением рабочего процесса - и все это в одном непрерывном цикле.

Система запоминает контекст между шагами и поддерживает прерывание. Если пользователям нужно изменить инструкции на полпути, они могут переключиться, задать направление, и агент скорректирует их, не начиная заново. OpenAI называет это “гораздо более интерактивным и гибким, чем предыдущие модели”.

Как отмечают западные эксперты в области IT, эта модель уже превосходит своих предшественников в оценках. На последнем Humanity’s Last Exam (HLE) она показала результат 41,6 балла. Она также достигла точности 27,4% на FrontierMath, который считается одним из самых сложных математических тестов. Гистограмма, на которой сравниваются показатели точности FrontierMath, показывает, что ChatGPT agent лидирует с 27,4%, опережая OpenAI o4-mini (19,3%) и o3 (10,3%).

Поскольку “agent mode” может взаимодействовать с веб-сайтами и получать доступ к персональным коннекторам, OpenAI внедрил множество мер предосторожности. Для выполнения задач, связанных с последствиями, таких как покупки или электронные письма, требуется подтверждение пользователя. Для действий с высокой степенью риска, таких как финансовые переводы, модель обучена полностью отказываться.

Основная угроза, к которой подготовился OpenAI, - это быстрое внедрение. Эти атаки скрывают вредоносные инструкции в коде веб-сайта, которые могут манипулировать поведением ИИ. Чтобы смягчить эту проблему, OpenAI обучил “agent mode” противостоять таким внедрениям, разместил системы мониторинга для обнаружения атак и позаботился о том, чтобы перед любым важным шагом требовалось действие пользователя.

Сеансы просмотра также остаются конфиденциальными. В OpenAI указывают: “ChatGPT не собирает и не хранит данные, которые вы вводите во время этих сеансов, такие как пароли, потому что модели это не нужно, и будет безопаснее, если она никогда их не увидит”.

Несмотря на то, что внедрение системы знаменует собой значительное нововведение, OpenAI считает, что эти изменения еще не полные. Некоторые функции, такие как форматирование слайд-шоу и редактирование электронных таблиц, все еще находятся в стадии бета-тестирования. Но компания заявляет, что в ближайшие месяцы она разработает расширение возможностей для сокращения количества ошибок и поддержки еще более сложных реальных задач.

+
Написать комментарий (0)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают