реклама
В июне глава подразделения искусственного интеллекта Tesla рассказал о кластере на базе ускорителей NVIDIA A100. Система объединила 5760 графических процессоров и предлагала производительность машинного обучения 1,8 экзафлопс. Это первый из трех суперкомпьютеров Tesla, следующим стал Project Dojo, полностью разработанный компанией и представленный на Tesla AI Day.
реклама
Project Dojo — энерго и экономически эффективная, легко масштабируемая система, способная решать сложные задачи с большим количеством условий. Система основана на распределенной 2D-структуре, оптимизированной по критериям максимальной пропускной способности и минимальной задержки.
Наименьшим вычислительным элементом структуры является тренировочный узел — 64-битный суперскалярный процессор, способный обрабатывать до 4 потоков, работать с матрицами 8×8 и форматами чисел FP32, BFP16, CFP8, INT32, INT16, INT8. В операциях машинного обучения вычислительная производительность узла достигает 1024 гигафлопс, а внешняя пропускная способность на каждое направление 512 ГБ/с.
Узлы объединяются в массивы по 354 штуки, чипы D1. Площадь D1 645 мм2, он состоит из 50 миллиардов транзисторов, производится по 7-нм техпроцессу и обладает TDP 400 Вт. Пропускная способность D1 на каждой стороне достигает 4 ТБ/с.
Чипы D1 объединяются в MCM-модули, тренировочные плитки размером 5×5, с производительностью 9 петафлопс и пропускной способностью 9 ТБ/с на сторону. Каждая плитка это готовый модуль с уникальной вертикально надстроенной системой питания и системой жидкостного охлаждения производительностью 15 кВт.
Наконец, плитки объединяются в двухуровневый кластер из матриц 2×3, помещаемый в шкаф и 10 таких шкафов формируют ExaPOD — суперкомпьютер с общей производительностью 1,1 экзафлопс. При одинаковой стоимости, Project Dojo в 4 раза производительнее, на 30% эффективнее и в 5 раз компактнее аналогичных систем.