Китайские компании начали использовать гибридный подход для обучения своих моделей ИИ

В связи с наложенными санкциями со стороны США, местные фирмы начали объединять множества различных ускорителей в единые обучающие кластеры.
4 июля 2024, четверг 03:10
Zelikman для раздела Блоги

  В соответствии с информацией от Digitimes Asia, выяснилось, что различные стартапы и технологические компании Поднебесной, специализирующиеся на разработке ИИ, применяют гибридный подход, объединяя несколько чипов для расширения своих ресурсов. Этот подход имеет несколько плюсов, включая ускорение обучения модели LLM за счет одновременного обучения с несколькими графическими ускорителями, обработку большего объема данных для оптимального использования памяти и сокращения расходов путем отказа от дорогостоящих ускорителей от NVIDIA.

  Техногиганты из КНР объединяют видеоускорители различных производителей для решения своих задач по обучению ИИ в обход ограничений, налагаемых санкциями Соединённых Штатов на использование передового оборудования. В связи с тем, что администрация Байдена принимает срочные меры по ограничению поставок технологий из США в КНР, например, отозвала 8 лицензий на экспорт Huawei в 2024 году, использование графических ускорителей в дата-центрах, необходимых для продвинутой работы с данными ИИ, становится всё сложнее в Восточной Азии.

  Отечественные компании в Китае стараются заполнить пробел на рынке, и ускоритель Ascend от Huawei остается единственным доступным чипом ИИ в стране. Однако, появились некоторые сложности с выпуском чипов Ascend 910b, что может привести к повышению цен на эти чипы и увеличению времени производства. Для улучшение ситуации, китайские компании начали работать над "гибридными технологиями с несколькими чипами", позволяющими объединять различные ускорители в единый обучающий кластер. Baidu заявила во время своего финансового отчета за 2024 год, что способна комбинировать графические ускорители от различных брендов для обучения ИИ. Еще одна крупная китайская корпорация, Alibaba, уже с 2021 года ведёт работу над разработкой решения "одно облако, несколько чипов".

  Эксплуатация различных графических ускорителей на одном сервере ИИ сопряжено с трудностями, так как для эффективного взаимодействия между разными ускорителями требуется высокоскоростная сеть, аналогичная NVLink от NVIDIA. Всё же китайские компании работают над инновациями в этой области, и Alibaba Cloud отказывается от использования NVLink в пользу своей высокопроизводительной сети на базе Ethernet.

  Санкции со стороны США серьезно затрудняют развитие ИИ в Китае. Однако, Китай не прекратит свой технологический прогресс. Несмотря на заявления экспертов о том, что страна отстает от Штатов по ряду ключевых технологических аспектов как минимум на десять лет, китайские компании продолжат двигаться вперед и искать пути к успеху, невзирая на геополитические препятствия.