
Источник изображений: Mariia Shalabaieva/Unsplash
На 12-дневном мероприятии Shipmas компания OpenAI представила модель o3, которая является преемником ранее выпущенной в этом году модели o1, ориентированной на рассуждения. Модель o3 представляет собой семейство моделей, включающее как основную версию, так и уменьшенную o3-mini, адаптированную для выполнения конкретных задач.
OpenAI сделала смелое заявление о том, что o3 подходит к уровню искусственного общего интеллекта (AGI) при определённых условиях, хотя и с оговорками. Что касается названия модели - почему o3, а не o2, то, как поясняет TechCrunch, причины кроются в товарных знаках. А именно компания избежала названия o2 из-за возможного конфликта с британским оператором связи O2. Это косвенно подтвердил CEO Сам Альтман (Sam Altman) во время утреннего стрима.
Пока что модели o3 и o3-mini не доступны для широкой публики, но исследователи по безопасности уже могут подать заявку на предварительный просмотр o3-mini с сегодняшнего дня, а просмотр o3 последует позже. Альтман упомянул, что запуск o3-mini планируется в конце января, после чего последует полноценная версия o3.
Несмотря на заявления Альтмана о желании создать федеральную структуру тестирования для новых моделей рассуждений перед их выпуском, новые модели уже практически на подходе. Правда, есть некоторые опасения, связанные с тем, что модели вроде o1 иногда демонстрируют повышенную склонность к обману пользователей по сравнению с традиционными моделями ИИ.
В новой модели OpenAI использует технику «осознанного выравнивания», чтобы синхронизировать модели вроде o3 с их принципами безопасности. Особенностью o3 является способность к самопроверке фактов, что делает её более надежной в таких областях, как физика, наука и математика, хотя это и увеличивает время ответа. Также функциональность o3 позволяет устанавливать время на рассуждения, предлагая пользователям три уровня вычислительной мощности: низкий, средний и высокий. Чем выше мощность, тем эффективнее модель справляется с задачами. Однако как бы ни была высока вычислительная мощность, модели рассуждений не являются безупречными. Они всё ещё могут ошибаться, как было замечено при игре в крестики-нолики для модели o1.
По одному из показателей OpenAI медленно, но верно приближается к AGI. На тесте ARC-AGI, разработанном для оценки способности ИИ быстро адаптироваться к новым задачам, o3 показала 87.5% на максимальных настройках, значительно превосходя предшественника. Однако, как отметил Франсуа Шолле (François Chollet), соавтор ARC-AGI, модель всё ещё сталкивается с проблемами в выполнении очень легких задач, что указывает на фундаментальные различия с интеллектом человека.
Ожидается, что вскоре конкуренты OpenAI также представят свои модели рассуждений, стимулируя дальнейшее развитие в этой области искусственного интеллекта.

