Финансовые разногласия, связанные с расходами компании DeepSeek на обучение R1, вызвали обсуждение на рынке, но теперь многое из того, что было сказано вначале, представляется неверным. Фактические цифры рисуют совершенно иную картину.
Исследовательская компания SemiAnalysis провела исчерпывающее расследование настоящих расходов DeepSeek, разрушив представление о том, что R1 стала настолько эффективной в вычислениях, что зависимость от NVIDIA и других аппаратных гигантов была минимальной. Прежде чем углубиться в детали инфраструктуры DeepSeek, необходимо проанализировать первоначальное восприятие рынка. В отчетах утверждалось, что DeepSeek удалось обучить R1 "всего за 5 миллионов долларов" – сумма, сопоставимая с ранними версиями GPT от OpenAI. Теперь, когда пыль улеглась, реальные цифры говорят о гораздо более сложной истории.
В качестве примера можно привести тот факт, что изначально DeepSeek рассматривалась как побочный проект китайского хедж-фонда High-Flyer. По данным SemiAnalysis, компания незаметно приобрела 10 000 графических процессоров NVIDIA A100 в 2021 году, до введения строгих ограничений на экспорт. В конечном итоге High-Flyer выделила DeepSeek в отдельную компанию, что способствовало ее расширению и ускорению приобретения вычислительных ресурсов.
В отчете также сообщается, что в настоящее время DeepSeek располагает примерно 10 000 единиц ИИ-NVIDIA H800 для Китая, а также еще 10 000 высококлассных чипов H100. В дополнение к ним компания также инвестировала в ускорители ИИ H20 от NVIDIA. Примечательно, что между DeepSeek и High-Flyer существует соглашение о совместном использовании ресурсов, включающее в себя торговлю, выводы, обучение моделей и более широкие исследовательские операции. Эти активы в совокупности дают DeepSeek оценку капитальных затрат в 1,6 миллиарда долларов, а операционные расходы составляют около 944 миллионов долларов – поразительное отклонение в четыреста раз от первоначально заявленных цифр.

