Платим блогерам
Блоги
kosmos_news
В рейтинге Chatbot Arena последняя модель ИИ OpenAI уже превзошла все другие большие языковые модели (LLM).

Несмотря на все противоречия, последняя модель искусственного интеллекта OpenAI уже превзошла все другие LLM и заняла первое место в рейтинге Chatbot Arena — опередив обе другие модели OpenAI, а также его основных конкурентов Google, xAI и Anthropic. OpenAI o1 была представлена в предварительной версии всего десять дней назад.
Фото: OpenAI В рейтинге Chatbot Arena пользователи оценивают результаты программ LLM, и затем платформа рассчитывает общий балл, а также оценивает модели в отдельных категориях, таких как языки, математика и программирование. 

OpenAI o1 теперь имеет 1335 баллов и, следовательно, оставила позади все остальные LLM в рейтинге.
Меньшая версия OpenAI o1 mini, имеющая пониженную производительность и более низкую цену за использование, также превзошла почти все другие модели ИИ — только Gemini 1.5 Pro от Google немного лучше мини-версии. Вот текущий рейтинг:

По словам провайдера, OpenAI o1 способна решать задачи на уровне докторанта — проходя через процессы, имитирующие человеческое мышление. (Докторант — обладатель учёной степени кандидата наук, зачисленный в докторантуру для подготовки диссертации на получение научной степени доктора наук.) LLM может показать пользователю шаги к решению задач. В настоящее время платные подписчики ChatGPT уже могут использовать ИИ.
Может быть интересно

OpenAI o1 вызывает споры, поскольку компания уже отнесла ИИ к категории среднего риска. Эксперты могут использовать его для создания биологического оружия. 

«Мы осознаем, что эти новые возможности могут стать основой для опасных приложений», — заявляет разработчик OpenAI. 

Однако о запрете LLM пока не идёт речи, хотя власти, безусловно, внимательно следят за новыми разработками. OpenAI, которая собирается привлечь масштабное финансирование в размере 6,5 миллиардов долларов, может значительно обогнать конкурентов. В частности, Google, которая в настоящее время имеет версию Gemini 1.5, и Anthropic, которая недавно представила Claude 3.5, должны активизировать свою работу. Совсем недавно Grok от xAI, соучредителем которого является Илон Маск, вошла в топ-10 рейтинга лучших ИИ-моделей. Значительно отстают Llama 3.1 и модели ИИ от Mistral AI из Франции.

+
Написать комментарий (0)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают