В мир искусственного интеллекта ворвался новый игрок — китайский стартап DeepSeek. Его создатель, 40-летний Лян Вэньфэн, прошел необычный путь: от управления хедж-фондами до амбициозных экспериментов с нейросетями. История этого перевоплощения раскрывает не только личную трансформацию предпринимателя, но и амбиции Китая в технологической гонке.
До прихода в ИИ-индустрию Лян более восьми лет развивал фонд High-Flyer Quantitative Investment Management, специализирующийся на алгоритмической торговле ценными бумагами. Сначала он занимался сложными алгоритмами, которые прогнозировали развитие различных рынков, а позже — системами машинного обучения для их оптимизации. Полученный опыт стал фундаментом для научного прорыва: в 2023 году Лян использовал наработки и ресурсы фонда для запуска DeepSeek.
Интересный факт: к моменту старта проекта у команды уже имелся некоторый актив — 10 000 графических процессоров NVIDIA A100. Эти «цифровые кузнецы», собранные в 2022 году, стали производственной мощью для обучения моделей. Примечательно, что уже через несколько месяцев после их приобретения США ввели экспортные ограничения на такие чипы, сделав подобные ресурсы де-факто недоступными для Китая.
2024 год стал настоящим испытанием для стартапа: китайские власти ужесточили контроль над алгоритмической торговлей, что ударило по фонду High-Flyer. Однако $8 млрд под управлением фонда обеспечили DeepSeek финансовую устойчивость. «Мы поняли, что именно сейчас должны рискнуть, — объясняет Лян в интервью TechWaves. — Ни корпорации, ни стартапы не имеют безоговорочного лидерства. Мир искусственного интеллекта сегодня — это открытые исследования и общий старт».
Основатель отрицает коммерческую расчетливость как главный двигатель проекта: "Когда мы начали эксперименты с LLM (large language models), многие искали скрытую бизнес-стратегию. Но истинная причина — желание понять природу интеллекта. Это как ребёнок, разбирающий механические часы: иногда нужно просто посмотреть, как всё устроено внутри".
Парадоксально, но собственный ИИ DeepSeek плохо «знает» своего создателя. На запрос о биографии Ляна модель R1 (обученная на данных до октября 2023 года) путает его с однофамильцем, а о деталях карьеры сообщает: «Информация не раскрывается». Это создаёт своеобразный миф — технократа, сознательно стирающего личное ради идеи.
Лян резко критикует подход «догоняющего развития»: "Разрыв с Западом измеряют годами, но настоящая пропасть — между созданием новых парадигм и их копированием. Без собственных прорывов Китай обречён на вторичность".
Эту позицию подкрепляют действия: 80% сотрудников DeepSeek работают над фундаментальными исследованиями, а не коммерческими продуктами. Необычный акцент для стартапа объясняют философией «долгой игры» — инвестиции в базовые технологии, которые могут дать результат через 5-10 лет.
На снимке — ранняя версия приложения, где ИИ демонстрирует нестандартный подход: вместо шаблонных ответов модель предлагает пользователю совместно достраивать логические цепочки.
Необычный визуал символизирует амбиции проекта: не повторять ChatGPT, а создавать новый тип взаимодействия. Как отмечают эксперты, DeepSeek делает ставку на «когнитивную эргономику» — адаптацию ИИ под особенности человеческого восприятия, а не наращивание параметров модели.
История Лян Вэньфэна — это яркая иллюстрация китайской технической революции: переход от заимствования технологий к их переосмыслению. Его успех или провал станет индикатором способности Китая рождать оригинальные идеи в условиях санкций и геополитической конкуренции. Как сказал сам предприниматель в финале интервью: «Мы не хотим быть вторыми в чужой гонке. Наша цель — определить новые правила».