Еще в ноябре 2024 года агентство Bloomberg сообщило, что OpenAI работает над ИИ-агентом под названием Operator. Согласно отчету, инструмент может получить прямой контроль над ПК. После этого Operator, помимо прочего, сможет писать код или самостоятельно бронировать поездки. Разработчик программного обеспечения Тибор Блахо теперь утверждает, что нашел новые доказательства существования ИИ-агента. По словам Блахо, в приложении ChatGPT для macOS есть скрытые опции, которые можно использовать для управления Operator.
По данным американского издательства The Information, выпуск инструмента запланирован на январь 2025 года. Выводы Блахо могли бы по крайней мере дополнительно подтвердить эти временные рамки. Но не только эти данные указывают на скорый запуск ИИ-агента.
По словам Блахо, на сайте OpenAI есть и другие подсказки. По его словам, там он обнаружил скрытые ссылки на Operator, которые пока не опубликованы. По словам Блахо, на сайте OpenAI будут размещены таблицы, сравнивающие производительность инструмента с другими компьютерными системами искусственного интеллекта.
На сайте OpenAI уже есть ссылки на Operator/OpenAI CUA (Computer Use Agent) - "Таблица карт операторской системы", "Таблица оценки исследований операторов" и "Таблица показателей отказов операторов".
Однако, как следует из таблицы, инструмент не всегда столь надежен. В OSWorld (тесте, имитирующем компьютерные среды) Operator смог успешно выполнить только 38,1 процента задач. Для сравнения: у людей этот показатель составляет 72,4%.
Однако в тесте WebVoyager дела показатели лучше. Тест позволяет оценить, насколько хорошо человек или ИИ умеет ориентироваться и взаимодействовать с веб-сайтами. Здесь инструмент, вероятно, достигает 82 процентов эффективности. Однако пока неизвестно, будут ли эти цифры в конечном итоге применимы к готовой версии ИИ-агента.

