Cabricon представила первый 7-нм чип для ускорения машинного обучения
Китайская компания Cambricon представила свой новый процессор MLU290 для ускорения операций машинного обучения и OAM-модуль MLU290-M5 на его основе. Чип произведен по 7-нм техпроцессу TSMC, объединяет в себе 46 миллиардов транзисторов и 64 ядра, обеспечивая вычислительную производительность до 1024 TOPS в целочисленных операциях INT4. Для сравнения, новейший ускоритель NVIDIA A100 в аналогичных задачах обладает производительностью 1248 TOPS, но может удвоить ее за счет технологи Structural Sparsity.
реклама
В новейшем решении Cambricon используется обновленная архитектура MLUv02 Extended. Необходимость увеличения вычислительной мощности и пропускной способности потребовала внедрения памяти HBM2, интерфейса PCIe 4.0 и разработки быстрой шины для связи нескольких модулей с пропускной способностью 600 ГБ/с. В результате, вычислительную мощность удалось увеличить в 4 раза, пропускную способность в 12 раз и скорость взаимодействия между модулями в 19 раз, по сравнению с предыдущим решением компании.
Процессор поддерживает ряд интересных технологий, например виртуализация vMLU позволяет разделять ресурсы между 4 независимыми процессами машинного обучения, а технология горячей миграции дает возможность перемещать рабочие операции между модулями и отдельными машинами.
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила