Профессор Стэнфорда похвалил DeepSeek и заявил, что Китай догоняет США в области генеративного ИИ

Эндрю Нг, профессор Стэнфорда, опубликовал статью, в которой рассматривает достижения китайской компании DeepSeek в области генеративного ИИ. Он утверждает, что Китай значительно сократил разрыв с США и подчеркивает важность открытого исходного кода для будущего технологий.
1 февраля 2025, суббота 17:40
Global_Chronicles для раздела Блоги

31 января Эндрю Нг, известный ученый в области искусственного интеллекта и приглашенный профессор в Стэнфорде, опубликовал статью на платформе X (заблокирована в РФ), в которой отметил прогресс китайской компании DeepSeek в генеративном ИИ. Он утверждает, что Китай догоняет США в этой области, что имеет серьезные последствия для глобальной цепочки поставок технологий. Нг выделяет несколько ключевых тенденций, которые становятся все более очевидными в результате недавних разработок.

Недавно DeepSeek представила свою новую модель DeepSeek-R1, которая по результатам тестов оказалась на уровне с o1 от OpenAI. Эта модель доступна по лицензии MIT, что позволяет разработчикам легко использовать и адаптировать ее под свои нужды. В отличие от многих американских компаний, которые акцентируют внимание на регулировании и потенциальных угрозах, таких как вымирание человечества из-за ИИ, DeepSeek предлагает практическое решение, которое может изменить подход к разработке приложений.

Нг отмечает, что с момента запуска ChatGPT в ноябре 2022 года США значительно опередили Китай, но за последние два года ситуация изменилась. Модели, такие как Tongyi Qianwen, Kimi и Shusheng InternVL, продемонстрировали высокий уровень производительности и сократили разрыв с американскими аналогами. Особенно это заметно в области видеогенерации, где китайские разработки иногда превосходят их западные аналоги.

По мнению эксперта, открытые модели становятся важным компонентом цепочки поставок ИИ. Их использование позволяет разработчикам создавать приложения с меньшими затратами. Например, стоимость токенов для использования моделей сильно варьируется: DeepSeek-R1 стоит всего $2,19 за миллион выходных токенов, в то время как o1 от OpenAI обходится в $60. Разница в цене делает DeepSeek-R1 привлекательной альтернативой для разработчиков, стремящихся сократить расходы.

Нг также подчеркивает, что масштабирование моделей не является единственным путем развития ИИ. Хотя многие компании сосредоточены на увеличении вычислительных мощностей, алгоритмические инновации также играют важную роль в снижении затрат на обучение. Команда DeepSeek, например, оптимизировала свою модель для работы на менее производительном графическом процессоре H800, что позволило значительно сократить расходы на обучение.

Снижение цен на вычислительные ресурсы может повлиять на спрос. Нг считает, что потребность в интеллекте и вычислениях останется высокой, даже если стоимость их получения снизится. Он отмечает, что спрос на ИИ будет продолжать расти, и это открывает возможности для разработчиков, желающих использовать новые технологии.

Подводя итог, Нг отметил, что ситуация на рынке ИИ меняется, и важно оставаться в курсе новых тенденций. DeepSeek, с ее открытыми моделями и инновационным подходом, может стать важным игроком на глобальном рынке.