На этой неделе Apple представила новую версию Mac Studio с чипом M3 Ultra, который установил новые рекорды производительности компании. Чип оснащен 32-ядерным процессором и графическим процессором с 80 ядрами, что значительно повышает вычислительные и графические возможности по сравнению с предыдущим поколением M2 Ultra. Одним из главных достижений стало успешное использование M3 Ultra для работы с моделью DeepSeek R1, содержащей 671 миллиард параметров, что делает её одной из крупнейших моделей машинного обучения на сегодняшний день.
Модель DeepSeek R1 весит 404 ГБ и требует большого объема высокоскоростной памяти, аналогичной видеопамяти (VRAM). Благодаря архитектуре унифицированной памяти, M3 Ultra обеспечивает высокую производительность при минимальном энергопотреблении. Эти результаты были продемонстрированы на канале YouTube Dave2D, где сравнивалась работа M3 Ultra с предыдущими версиями чипов Apple.
Для эффективной работы крупных моделей, таких как DeepSeek R1, традиционно требуются мощные графические карты с большим объемом VRAM, что увеличивает потребление энергии. Однако M3 Ultra справился с задачей гораздо эффективнее, используя всего один чип. Архитектура унифицированной памяти позволяет совместно использовать ресурсы системы, обеспечивая работу модели на уровне, сопоставимом с несколькими видеокартами.
При запуске DeepSeek R1 на M3 Ultra пришлось вручную увеличить лимит доступной оперативной памяти через терминал macOS до 448 ГБ, поскольку по умолчанию система ограничивает выделение ресурсов. Тем не менее, даже в версии с пониженной точностью (4-битная квантификация), модель показала высокие результаты, сохранив свои 671 миллиардов параметров.
Блоги
Mac Studio с M3 Ultra: мощь и энергоэффективность в работе с моделями глубокого обучения.

