
Тема искусственного интеллекта всё сильнее начинает выходить на максимально высокий, правительственный уровень. Пока в сети широко обсуждается выделение Дональдом Трампом до 500 млрд. долларов группе компаний во главе с создателями ChatGPT, любопытные новости приходят и из Китая.
Там на встрече с премьер-министром Ли Цяном был замечен основатель компании DeepSeek Лян Вэньфэн. Инженер вошёл в состав группы отраслевых экспертов из области технологий, науки, образования и здравоохранения.
Непосредственные подробности встречи раскрываются китайскими СМИ весьма сухо, однако по представленным фотографиям несложно заметить, что главу DeepSeek посадили прямо напротив премьер-министра, хотя ранее в таких встречах участия он не принимал.

Премьер-министр Ли Цян (слева) и глава DeepSeek Лян Вэньфэн.

Авторство фото: Синьхуа.
Портал South China Morning Post предполагает, что такое внимание к Лян Вэньфэну приковано благодаря декабрьскому релизу нейросети DeepSeek V3. Это прямой конкурент ChatGPT (GPT-4o), который показывает весьма высокие цифры в тестах, а в ряде из них существенно превосходит американского конкурента.
Однако ещё более впечатляющий релиз был сделан DeepSeek буквально на днях, незадолго до встречи с премьер-министром.
На базе V3 команда разработчиков создала «думающую» нейросеть DeepSeek R1, которая бросает вызов уже не GPT-4o, а самому передовому, что есть в ассортименте OpenAI – нейросетям семейства o1. DeepSeek R1 в большинстве тестов держится на уровне или даже превосходит результаты o1. Хотя последняя ещё буквально месяц назад казалась недосягаемой для конкурентов.
Напомним, классические большие языковые модели в последнее время замедлились в своём развитии. Гиганты вроде Microsoft, Google и Amazon в разы увеличили инвестиции в подобные проекты, однако масштабирование оказалось не слишком эффективным: прирост качества ИИ-моделей вышел не таким высоким, как ожидалось.
На этом фоне в сентябре прошлого года компания OpenAI (создатели ChatGPT) выпустила первые в отрасли «думающие» модели o1 mini и o1 Preview. Такие системы не выдают ответ сходу, а «мыслят», генерируя долгие внутренние цепочки рассуждений и только потом – окончательный ответ на их основе.

Показатели DeepSeek R1 в ключевых тестах на фоне ряда сильных конкурентов.
Новинки показали впечатляющий прирост в задачах, связанных с математикой, логическими рассуждениями и программированием. В декабре OpenAI выпустила финальную версию o1, а также анонсировала следующее поколение – o3 mini и o3, которые выйдут в ближайшие месяцы.
DeepSeek стала первой китайской компанией, которая бросила вызов OpenAI в области «думающих» систем. Уже в ноябре DeepSeek представила модель R1 Lite, которая показывала результаты схожие с OpenAI o1 Preview. Теперь же, сократив отставание с 2 до 1 месяца, DeepSeek в ответ на финальную версию o1 выпустили полноценную модель R1 уже без приставки «lite» в названии.
Впрочем, оказаться в кресле напротив премьер-министра Китая главе DeepSeek позволил ещё один фактор. Нейросети V3 и R1 не только показывают результаты близкие к сильнейшему конкуренту, но и стоят в разы дешевле.
Так, на обучение модели V3 было потрачено всего около 6 миллионов долларов, что кратно меньше затрат американских компаний на обучение больших языковых моделей с сотнями миллиардов и триллионами параметров.
В свою очередь, цены для сторонних разработчиков на «думающие» модели R1 оказались радикально ниже цен, которые установила на свои продукты OpenAI:

Цены DeepSeek R1 (первый столбец) на фоне трёх решений OpenAI.
Именно этот фактор может стать решающим в противостоянии американских и китайских компаний.
С другой стороны, праздновать победу китайской стороне явно рано, т. к. команды, занимающиеся ИИ в Китае, сталкиваются с критическим дефицитом ИИ-ускорителей. Всему виной санкции США, которые в последние дни президентства Джозефа Байдена стали гораздо сильнее. В итоге пока американские компании сотнями тысяч ускорителей стремительно наращивают свои мощности, китайские бренды оказались сильно скованны в числе и доступности подобных систем.
Также заметим, что «мыслящие» ИИ-модели вовсю пытаются освоить и другие участники рынка. Среди западных компаний своё решение уже начала тестировать Google. В свою очередь, в Китае в этом направлении наиболее активен гигант Alibaba, а также стартапы Moonshot и StepFun. В самое ближайшее время ожидается выход подобных ИИ-моделей и от других игроков.
Попробовать ИИ-модели DeepSeek можно бесплатно на сайте компании. Регистрация проста, русский язык в диалоге поддерживается. По умолчанию его ведёт модель V3, для активации R1 следует нажать кнопку «DeepThink». Ограничение на запросы: не более 50 в день.

