Платим блогерам
Блоги
Fantoci
По словам Лян Вэньфэна, он, как и другие исследователи, проводит дни за чтением научных работ, написанием кода и участием в дискуссиях с коллегами.

В мир искусственного интеллекта ворвался новый игрок — китайский стартап DeepSeek. Его создатель, 40-летний Лян Вэньфэн, прошел необычный путь: от управления хедж-фондами до амбициозных экспериментов с нейросетями. История этого перевоплощения раскрывает не только личную трансформацию предпринимателя, но и амбиции Китая в технологической гонке.

Может быть интересно

До прихода в ИИ-индустрию Лян более восьми лет развивал фонд High-Flyer Quantitative Investment Management, специализирующийся на алгоритмической торговле ценными бумагами. Сначала он занимался сложными алгоритмами, которые прогнозировали развитие различных рынков, а позже — системами машинного обучения для их оптимизации. Полученный опыт стал фундаментом для научного прорыва: в 2023 году Лян использовал наработки и ресурсы фонда для запуска DeepSeek.

Интересный факт: к моменту старта проекта у команды уже имелся некоторый актив — 10 000 графических процессоров NVIDIA A100. Эти «цифровые кузнецы», собранные в 2022 году, стали производственной мощью для обучения моделей. Примечательно, что уже через несколько месяцев после их приобретения США ввели экспортные ограничения на такие чипы, сделав подобные ресурсы де-факто недоступными для Китая.

2024 год стал настоящим испытанием для стартапа: китайские власти ужесточили контроль над алгоритмической торговлей, что ударило по фонду High-Flyer. Однако $8 млрд под управлением фонда обеспечили DeepSeek финансовую устойчивость. «Мы поняли, что именно сейчас должны рискнуть, — объясняет Лян в интервью TechWaves. — Ни корпорации, ни стартапы не имеют безоговорочного лидерства. Мир искусственного интеллекта сегодня — это открытые исследования и общий старт».

Основатель отрицает коммерческую расчетливость как главный двигатель проекта: "Когда мы начали эксперименты с LLM (large language models), многие искали скрытую бизнес-стратегию. Но истинная причина — желание понять природу интеллекта. Это как ребёнок, разбирающий механические часы: иногда нужно просто посмотреть, как всё устроено внутри".

Парадоксально, но собственный ИИ DeepSeek плохо «знает» своего создателя. На запрос о биографии Ляна модель R1 (обученная на данных до октября 2023 года) путает его с однофамильцем, а о деталях карьеры сообщает: «Информация не раскрывается». Это создаёт своеобразный миф — технократа, сознательно стирающего личное ради идеи.

Лян резко критикует подход «догоняющего развития»: "Разрыв с Западом измеряют годами, но настоящая пропасть — между созданием новых парадигм и их копированием. Без собственных прорывов Китай обречён на вторичность".

Эту позицию подкрепляют действия: 80% сотрудников DeepSeek работают над фундаментальными исследованиями, а не коммерческими продуктами. Необычный акцент для стартапа объясняют философией «долгой игры» — инвестиции в базовые технологии, которые могут дать результат через 5-10 лет.

На снимке — ранняя версия приложения, где ИИ демонстрирует нестандартный подход: вместо шаблонных ответов модель предлагает пользователю совместно достраивать логические цепочки.

Необычный визуал символизирует амбиции проекта: не повторять ChatGPT, а создавать новый тип взаимодействия. Как отмечают эксперты, DeepSeek делает ставку на «когнитивную эргономику» — адаптацию ИИ под особенности человеческого восприятия, а не наращивание параметров модели.

История Лян Вэньфэна — это яркая иллюстрация китайской технической революции: переход от заимствования технологий к их переосмыслению. Его успех или провал станет индикатором способности Китая рождать оригинальные идеи в условиях санкций и геополитической конкуренции. Как сказал сам предприниматель в финале интервью: «Мы не хотим быть вторыми в чужой гонке. Наша цель — определить новые правила».

1
Показать комментарии (1)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают