Платим блогерам
Блоги
Alex040
Новая версия самого популярного китайского чат-бота может выйти раньше, чем ожидалось.

Около месяца назад китайский стартап DeepSeek наделал немало шума выпуском своей рассуждающей модели DeepSeek R1. Компания создавала большие языковые модели и раньше, но именно январская R1, умеющая использовать так называемые «цепочки мыслей», показала на удивление сильные результаты во всевозможных бенчмарках.

Может быть интересно

После этого DeepSeek моментально стала флагманом и самым узнаваемым ИИ-брендом Китая. Основатель компании буквально через двое суток после релиза R1 уже сидел в кресле напротив премьер-министра страны. Многие китайские госкорпорации, городские администрации, ИТ-гиганты, производители смартфонов и автомобилей внедрили R1 в свои сайты и сервисы.

Между тем сама DeepSeek всё это время работает над вторым поколением модели. В социальных сетях сотрудники признались, что занимались этим даже тогда, когда страна неделю праздновала Китайский Новый Год. Как сообщает Reuters со ссылкой сразу на несколько источников, DeepSeek решила существенно ускорить выход модели R2.

Если изначально система должна была стартовать в начале мая, то теперь ожидать её можно как минимум в апреле. Всесторонних улучшений явно будет много. Среди прочего Reuters подчёркивает усиленные возможности программирования, которые, впрочем, и у DeepSeek R1 находятся на высоком уровне.

Такая спешка, когда следующее поколение модели выйдет всего через несколько месяцев после предыдущего, вполне понятна. Конкуренция на ИИ-рынке обострилась до предела. На прошлой неделе большой апгрейд для своего умного бота Grok представил Илон Маск.

Сайт и приложение DeepSeek почти месяц работали с перебоями из-за экстремальной нагрузки, но сейчас снова доступны.

На этой неделе уже вышел Claude 3.7, поставив рекорды в бенчмарках программирования и следования инструкциям. При этом в математических тестах новый Claude оказался несколько хуже представленной за месяц до него DeepSeek R1.

В ближайшие дни ожидается выпуск GPT 4.5 от OpenAI, а к концу мая они же намерены представить мощнейшую систему GPT 5. Весьма обострена конкуренция в сфере нейросетей и на рынке самого Китая. Там действует около 15 опытных команд, включая как ИТ-гигантов, так и успешные ИИ-стартапы, которые могут перехватить у DeepSeek лидерство.

Наконец, самой большой загвоздкой для DeepSeek и других китайских компаний является крайне ограниченное санкциями число ИИ-ускорителей. Китай уже практически лишён возможности покупать их у Nvidia и других западных компаний. А собственные китайские компании вроде Huawei способны производить максимум сотни тысяч систем вместо необходимых для паритета с США миллионов.

Впрочем, именно относительно скромное число ИИ-укорителей, которое потребовалось для обучения модели R1, стало визитной карточкой DeepSeek. Теперь же предстоит узнать, способна ли компания поддерживать пришедший к ней внезапно успех и насколько сильно R2 превзойдёт R1.

Источник: reuters.com
+
Написать комментарий (0)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают