Grok-4 превосходит лучшие модели от Google и OpenAI в предварительных тестах

Блоги

11 июл. 2025, 15:42 kosmos_news

Возможно, Илон Маск был прав, когда сказал, что последнее изобретение его стартапа xAI — это «самый умный ИИ в мире».

Всего через день после выпуска новейшей модели ИИ Grok-4 предварительные результаты испытаний в сравнении с ведущими моделями OpenAI, Google и Anthropic показывают, что новая ИИ -модель стартапа Илона Маска xAI может конкурировать с ними.

Последние результаты тестов Artificialanalysis.ai рисуют интересную картину: Grok-4 от xAI стал абсолютным лидером в тестах на интеллектуальность, заняв первое место, опередив Gemini 2.5 Pro от Google и o4-mini (high) от OpenAI.

Этот результат знаменует собой важный поворотный момент в конкуренции в области ИИ и подчеркивает быстрое развитие ИИ-компании Маска, которая была основана всего лишь в 2023 году и уже является компанией мирового уровня.

Пока еще не определен рейтинг Grok-4 в важной базе данных LMarena, где пользователи регулярно оценивают LLM. Его предшественника Grok-3 в настоящее время все еще можно там найти, но он находится несколько ниже в рейтинге, уступая моделям от Google, OpenAI, DeepSeek и Anthropic.

Однако новый чат-бот Grok от xAI неоднократно подвергался критике в последние недели и месяцы. Ранее вокруг xAI уже было несколько скандалов, включая использование экологически вредных газовых турбин для работы центра обработки данных Colossus, а также политически некорректные и антисемитские высказывания чат-бота.

Хотя Grok-4 лидирует в плане интеллекта, анализ также показывает сильные и слабые стороны различных моделей в других областях:

Скорость. Здесь доминируют модели Gemini от Google, особенно версии Flash Lite, которые достигают скорости до 691 токена в секунду.

Задержка. Наименьшее время задержки характерно для специализированных моделей, таких как LFM 40B (0,15 секунды) и Command-R (0,16 секунды).

Экономическая эффективность. Модели Gemma лидируют с точки зрения ценообразования: всего 0,03 доллара за миллион токенов.

Контекстное окно (объем текста, который большая языковая модель может одновременно удерживать в «оперативной памяти»). Llama 4 Scout устанавливает новые стандарты в 10 миллионов токенов.

Лидирующая позиция Grok-4 в категории интеллекта — весомый сигнал о конкурентоспособности xAI. Компания, основанная всего лишь в 2023 году, доказала, что может конкурировать с устоявшимися игроками в плане технологий. Стоит отметить, что китайскому стартапу в области искусственного интеллекта DeepSeek также удалось сделать это, затратив сравнительно меньше ресурсов.

Что особенно интересно, Grok-4 достигает таких показателей, хотя другие модели лидируют по отдельным показателям, таким как скорость или экономическая эффективность. Это говорит о том, что xAI сознательно выбрал максимальный интеллект и производительность, возможно, в ущерб другим факторам.

#google #искусственный интеллект #openai #чат-бот #anthropic #grok-4

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Популярные статьи