Платим блогерам
Блоги
Alex040
Грядущий апдейт описывается как незначительный, но, исходя из предыдущего опыта, улучшения все равно могут оказаться существенными.

В январе этого года к китайскому стартапу DeepSeek неожиданно пришла популярность. Завоевать её удалось благодаря выпуску «рассуждающей» нейросети DeepSeek R1, которая впечатлила пользователей решением логических задач, навыками математики и программирования.

Может быть интересно

Вдобавок DeepSeek R1 умела показывать свои «мысли». Конкуренты, напомним, либо вообще лишены данной функции и генерируют ответ сразу же без предварительного «обдумывания», либо скрывают цепочку рассуждений от пользователя.

Впрочем, с момента выхода R1 уже многое изменилось. Свет увидели такие наиболее сильные конкуренты, как модель o3 от авторов ChatGPT, Gemini 2.5 Pro от Google, Claude 3.7 и 4.0 от Anthropic, а также Grok 3 от Илона Маска. Несмотря на различные слухи о появлении версии R2, команда DeepSeek всё это время больших новых релизов так и не выпускала. А версия R1 всё ещё остаётся неизменной с момента своего январского выхода.

Портал ITHome, ссылаясь на чат DeepSeek для доверенных тестеров, сообщил, что для R1 готовится первое минорное (небольшое) обновление. Избранным тестерам предлагается принять участие в его оценке перед запуском для всех пользователей, который может состояться уже весьма скоро, возможно, даже в ближайшие дни.

Полученный ITHome скриншот с уведомлением (перевод с китайского).

Журналисты ITHome в этом контексте вспоминают мартовское обновление V3. Напомним, помимо R1 у DeepSeek также есть более простая и недорогая в плане цен на API модель V3. Она была выпущена в декабре 2024, а в марте получила обновление. Тогда его выход сопровождался идентичным комментарием разработчиков про минорность и незначительность апдейта.

Однако на практике мартовская версия V3 оказалась значительно лучше. Например, согласно данным независимой исследовательской фирмы Artificial Analysis, обновлённая V3 улучшила свои показатели в тесте GPQA Diamond (проверяет научные знания и рассуждения) с 56 до 66%. В свою очередь, в олимпиадных математических задачах AIME 2024 показатели новой V3 усилились с 25 до 52%.

Таким образом, в марте разработчики DeepSeek назвали весьма крупное обновление минорным. Возможно, нечто похожее произойдёт и сейчас. Однако теперь обновляться будет не младшая версия V3, а старшая R1, благодаря которой DeepSeek и завоевали свою популярность.

Что касается версии R2, то она, согласно ранним данным Reuters, была в разработке и готовилась к релизу до конца весны. Якобы на то же время готовилась и GPT-5 от OpenAI, однако позже Сэм Альтман публично сообщил о задержке с выходом модели «на несколько месяцев». Возможно, команда DeepSeek, для которой ChatGPT является как раз основным конкурентом, также решила не спешить с R2 и не делать поспешных релизов.

Обновлено: релиз модели состоялся через час после публикации новости. Обновление получило название DeepSeek-R1-0528. Судя по всему, новинка уже работает в чате на официальном сайте DeepSeek. Веса модели также доступны энтузиастам. Данные по приросту показателей в бенчмарках и доступ к обновлённому API команда разработчиков, скорее всего, раскроет в течение суток. Напомним, это первое обновление R1 с момента её выхода в январе.

Источник: ithome.com
+
Написать комментарий (0)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают