Китайская видеокарта Moore Threads MTT S80 показала высокую производительность в DeepSeek-R1

Китайская компания также решила обратить внимание на новую модель DeepSeek-R1, учитывая её низкие требования к оборудованию
7 февраля 2025, пятница 15:12
goldas для раздела Блоги

 Китайский производитель графических процессоров - Moore Threads является одной из последних компаний, которые обратили свое внимание на DeepSeek-R1. С конца января такими компаниями стали, например, NVIDIA, Microsoft и AMD. По мировым стандартам графические процессоры Moore Threads отстают от западных разработок. Оценки начала 2024 года показали, что дискретная настольная видеокарта MTT S80 этой компании может побороться с интегрированным решением AMD Radeon 760M. Недавнее появление моделей DeepSeek с открытым исходным кодом стало сигналом об отказе от чрезвычайно мощного и дорогого оборудования для обработки ИИ часто доступного через облако. Широкий ажиотаж был вызван тем, что решения DeepSeek относительно экономичны с точки зрения требований к обработке. Например, на портале Tom's Hardware был приведен пример о работе моделей ИИ с открытым исходным кодом на недорогом оборудовании, таком как Raspberry Pi.

 Согласно недавним сообщениям китайской прессы, Moore Threads объявила об успешном развертывании модели DeepSeek R1-Distill-Qwen-7B на вышеупомянутом графическом процессоре MTT S80. Компания также сообщила, что предприняла аналогичные шаги со своим графическим процессором MTT S4000, ориентированным на центры обработки данных. По поводу адаптации представитель Moore Threads заявил, что на основе фреймворка с открытым исходным кодом Ollama компания Moore Threads завершила развертывание модели DeepSeek-R1-Distill-Qwen-7B и продемонстрировала отличную производительность в различных китайских задачах, проверив универсальность и совместимость с CUDA полнофункционального графического процессора собственной разработки. Точные показатели производительности, результаты тестов и технические подробности не были раскрыты общественности.

 Ресурс ITHome сообщил: "Пользователи также могут выполнять развертывание вывода модели DeepSeek-R1 на основе MTT S80 и MTT S4000. Некоторые пользователи ранее выполнили эту задачу вручную на MTT S80". Moore Threads считает, что ее самостоятельно разработанный высокопроизводительный механизм вывода в сочетании с технологией программной и аппаратной совместной оптимизации значительно повышает вычислительную эффективность модели и использование ресурсов за счет настраиваемого ускорения и управления памятью. Этот механизм не только поддерживает эффективную работу модели DeepSeek, но и обеспечивает техническую поддержку для развертывания более масштабных моделей в будущем.