
В январе этого года к китайскому стартапу DeepSeek неожиданно пришла популярность. Завоевать её удалось благодаря выпуску «рассуждающей» нейросети DeepSeek R1, которая впечатлила пользователей решением логических задач, навыками математики и программирования.
Вдобавок DeepSeek R1 умела показывать свои «мысли». Конкуренты, напомним, либо вообще лишены данной функции и генерируют ответ сразу же без предварительного «обдумывания», либо скрывают цепочку рассуждений от пользователя.
Впрочем, с момента выхода R1 уже многое изменилось. Свет увидели такие наиболее сильные конкуренты, как модель o3 от авторов ChatGPT, Gemini 2.5 Pro от Google, Claude 3.7 и 4.0 от Anthropic, а также Grok 3 от Илона Маска. Несмотря на различные слухи о появлении версии R2, команда DeepSeek всё это время больших новых релизов так и не выпускала. А версия R1 всё ещё остаётся неизменной с момента своего январского выхода.
Портал ITHome, ссылаясь на чат DeepSeek для доверенных тестеров, сообщил, что для R1 готовится первое минорное (небольшое) обновление. Избранным тестерам предлагается принять участие в его оценке перед запуском для всех пользователей, который может состояться уже весьма скоро, возможно, даже в ближайшие дни.

Полученный ITHome скриншот с уведомлением (перевод с китайского).
Журналисты ITHome в этом контексте вспоминают мартовское обновление V3. Напомним, помимо R1 у DeepSeek также есть более простая и недорогая в плане цен на API модель V3. Она была выпущена в декабре 2024, а в марте получила обновление. Тогда его выход сопровождался идентичным комментарием разработчиков про минорность и незначительность апдейта.
Однако на практике мартовская версия V3 оказалась значительно лучше. Например, согласно данным независимой исследовательской фирмы Artificial Analysis, обновлённая V3 улучшила свои показатели в тесте GPQA Diamond (проверяет научные знания и рассуждения) с 56 до 66%. В свою очередь, в олимпиадных математических задачах AIME 2024 показатели новой V3 усилились с 25 до 52%.
Таким образом, в марте разработчики DeepSeek назвали весьма крупное обновление минорным. Возможно, нечто похожее произойдёт и сейчас. Однако теперь обновляться будет не младшая версия V3, а старшая R1, благодаря которой DeepSeek и завоевали свою популярность.
Что касается версии R2, то она, согласно ранним данным Reuters, была в разработке и готовилась к релизу до конца весны. Якобы на то же время готовилась и GPT-5 от OpenAI, однако позже Сэм Альтман публично сообщил о задержке с выходом модели «на несколько месяцев». Возможно, команда DeepSeek, для которой ChatGPT является как раз основным конкурентом, также решила не спешить с R2 и не делать поспешных релизов.
Обновлено: релиз модели состоялся через час после публикации новости. Обновление получило название DeepSeek-R1-0528. Судя по всему, новинка уже работает в чате на официальном сайте DeepSeek. Веса модели также доступны энтузиастам. Данные по приросту показателей в бенчмарках и доступ к обновлённому API команда разработчиков, скорее всего, раскроет в течение суток. Напомним, это первое обновление R1 с момента её выхода в январе.

