Китайская компания DeepSeek, занимающаяся разработкой искусственного интеллекта, недавно произвела огромный фурор во всем мире, представив модели искусственного интеллекта V3 и R1, которые в некоторых областях приближаются по производительности к ведущим американским моделям, при этом, по-видимому, имея гораздо меньшую стоимость. Но Дарио Амодеи, генеральный директор Anthropic, смотрит на вещи объективно. Anthropic, наряду с OpenAI, Google, xAI и несколькими другими стартапами, разрабатывает модели искусственного интеллекта в США, и сейчас ей бросает вызов DeepSeek.
Соучредитель и генеральный директор Anthropic Дарио Амодеи. Фото: Techcrunch
«DeepSeek создала модель, которая по производительности близка к моделям США возрастом 7–10 месяцев, при этом стоит дешевле, но находится далеко не на том уровне, который предлагают конкуренты из США», — объясняет Амодей.
Таким образом, он опровергает утверждения о том, что DeepSeek всего за 6 миллионов долларов добилась того, на что американским компаниям пришлось потратить миллиарды.
По имеющимся данным, DeepSeek располагает примерно 50 000 чипами поколения Nvidia Hopper, что, по оценкам Амодеяй, «примерно в 2–3 раза меньше, чем у основных американских компаний в сфере искусственного интеллекта». Необходимо учитывать не только заявленные затраты, но и общее оборудование, которое позволило DeepSeek выпустить модели V3 и R1. Это оборудование стоимостью около миллиарда долларов показывает, что общие расходы DeepSeek не сильно отличаются от расходов американских разработчиков.
«Все это означает, что DeepSeek-V3 не является уникальным прорывом или чем-то, что кардинально меняет экономику LLM; это ожидаемая точка на кривой постоянного снижения затрат», — поясняет Амодей.
Это значит следующее: затраты на обучение моделей ИИ снижаются примерно в четыре раза каждый год. Таким образом, прогресс DeepSeek соответствует ожидаемой тенденции, учитывая, что R1 была обучена в ноябре 2024 года, тогда как сравниваемые американские модели имеют возраст от семи до десяти месяцев.
Примечательно, что впервые такое снижение затрат продемонстрировала китайская компания, а не американская.
«Такого никогда раньше не случалось, и это имеет геополитическое значение. Однако американские компании вскоре последуют этому примеру — не потому, что они копируют DeepSeek, а потому, что они тоже следуют обычной тенденции сокращения расходов», — заявил генеральный директор Anthropic.
Особый интерес представляет модель DeepSeeks V3, которая поражает настоящими инновациями в области инженерии. С другой стороны, опубликованная позднее модель R1 в основном воспроизводит уже известные подходы к обучению.
Аппаратная часть DeepSeek состоит из различных чипов Nvidia: H100, H800 и H20.
«H100 были запрещены для экспорта с момента их выпуска, так что если они есть у DeepSeek, то были ввезены контрабандой», — объясняет Амодей.
Амодеи предсказывает решающий момент в 2026–2027 годах: тогда понадобятся «миллионы чипов и десятки миллиардов долларов» для разработки ИИ, который будет «умнее почти всех людей почти во всех областях». Центральный вопрос: будут ли у Китая необходимые чипы? Это во многом будет зависеть от эффективности экспортного контроля.
По словам Амодеи, успехи DeepSeek не свидетельствуют о провале экспортного контроля. Амодей подчеркивает, что саму компанию DeepSeek не следует рассматривать как врага:
«В интервью они кажутся умными, любознательными исследователями, которые просто хотят разработать полезную технологию».
Однако он подчеркивает геополитический аспект:
«Они привержены авторитарному режиму, который совершил нарушения прав человека и вел себя агрессивно на мировой арене».
Вывод генерального директора Anthropic очевиден: экспортный контроль остается одним из важнейших инструментов, гарантирующих демократическим странам сохранение технологического преимущества, особенно с учетом растущей производительности систем искусственного интеллекта.

