Всего через день после выпуска новейшей модели ИИ Grok-4 предварительные результаты испытаний в сравнении с ведущими моделями OpenAI, Google и Anthropic показывают, что новая ИИ -модель стартапа Илона Маска xAI может конкурировать с ними.
Последние результаты тестов Artificialanalysis.ai рисуют интересную картину: Grok-4 от xAI стал абсолютным лидером в тестах на интеллектуальность, заняв первое место, опередив Gemini 2.5 Pro от Google и o4-mini (high) от OpenAI.
Этот результат знаменует собой важный поворотный момент в конкуренции в области ИИ и подчеркивает быстрое развитие ИИ-компании Маска, которая была основана всего лишь в 2023 году и уже является компанией мирового уровня.

Пока еще не определен рейтинг Grok-4 в важной базе данных LMarena, где пользователи регулярно оценивают LLM. Его предшественника Grok-3 в настоящее время все еще можно там найти, но он находится несколько ниже в рейтинге, уступая моделям от Google, OpenAI, DeepSeek и Anthropic.
Однако новый чат-бот Grok от xAI неоднократно подвергался критике в последние недели и месяцы. Ранее вокруг xAI уже было несколько скандалов, включая использование экологически вредных газовых турбин для работы центра обработки данных Colossus, а также политически некорректные и антисемитские высказывания чат-бота.
Хотя Grok-4 лидирует в плане интеллекта, анализ также показывает сильные и слабые стороны различных моделей в других областях:
Скорость. Здесь доминируют модели Gemini от Google, особенно версии Flash Lite, которые достигают скорости до 691 токена в секунду.
Задержка. Наименьшее время задержки характерно для специализированных моделей, таких как LFM 40B (0,15 секунды) и Command-R (0,16 секунды).
Экономическая эффективность. Модели Gemma лидируют с точки зрения ценообразования: всего 0,03 доллара за миллион токенов.
Контекстное окно (объем текста, который большая языковая модель может одновременно удерживать в «оперативной памяти»). Llama 4 Scout устанавливает новые стандарты в 10 миллионов токенов.


Лидирующая позиция Grok-4 в категории интеллекта — весомый сигнал о конкурентоспособности xAI. Компания, основанная всего лишь в 2023 году, доказала, что может конкурировать с устоявшимися игроками в плане технологий. Стоит отметить, что китайскому стартапу в области искусственного интеллекта DeepSeek также удалось сделать это, затратив сравнительно меньше ресурсов.
Что особенно интересно, Grok-4 достигает таких показателей, хотя другие модели лидируют по отдельным показателям, таким как скорость или экономическая эффективность. Это говорит о том, что xAI сознательно выбрал максимальный интеллект и производительность, возможно, в ущерб другим факторам.

