Платим блогерам
Блоги
Moleculo
Уровень производительности приближается к NVIDIA A100.

реклама

Китайская компания Cambricon представила свой новый процессор MLU290 для ускорения операций машинного обучения и OAM-модуль MLU290-M5 на его основе. Чип произведен по 7-нм техпроцессу TSMC, объединяет в себе 46 миллиардов транзисторов и 64 ядра, обеспечивая вычислительную производительность до 1024 TOPS в целочисленных операциях INT4. Для сравнения, новейший ускоритель NVIDIA A100 в аналогичных задачах обладает производительностью 1248 TOPS, но может удвоить ее за счет технологи Structural Sparsity.


В новейшем решении Cambricon используется обновленная архитектура MLUv02 Extended. Необходимость увеличения вычислительной мощности и пропускной способности потребовала внедрения памяти HBM2, интерфейса PCIe 4.0 и разработки быстрой шины для связи нескольких модулей с пропускной способностью 600 ГБ/с. В результате, вычислительную мощность удалось увеличить в 4 раза, пропускную способность в 12 раз и скорость взаимодействия между модулями в 19 раз, по сравнению с предыдущим решением компании.

реклама

Процессор поддерживает ряд интересных технологий, например виртуализация vMLU позволяет разделять ресурсы между 4 независимыми процессами машинного обучения, а технология горячей миграции дает возможность перемещать рабочие операции между модулями и отдельными машинами.

Источник: cambricon.com
+
Написать комментарий (0)

Популярные новости

Популярные статьи

Сейчас обсуждают