Платим блогерам
Блоги
Moleculo
Развитие автономных систем опирается на нейронные сети, обучение которых требует больших вычислительных мощностей. Нейронные сети являются основой автопилота электромобилей Tesla и в будущем распространятся на другие продукты компании, например, гуманойда Tesla Bot.

реклама

В июне глава подразделения искусственного интеллекта Tesla рассказал о кластере на базе ускорителей NVIDIA A100. Система объединила 5760 графических процессоров и предлагала производительность машинного обучения 1,8 экзафлопс. Это первый из трех суперкомпьютеров Tesla, следующим стал Project Dojo, полностью разработанный компанией и представленный на Tesla AI Day.

Источник изображения Gerd Altmann, Pixabay

 

реклама

Project Dojo — энерго и экономически эффективная, легко масштабируемая система, способная решать сложные задачи с большим количеством условий. Система основана на распределенной 2D-структуре, оптимизированной по критериям максимальной пропускной способности и минимальной задержки.

Наименьшим вычислительным элементом структуры является тренировочный узел — 64-битный суперскалярный процессор, способный обрабатывать до 4 потоков, работать с матрицами 8×8 и форматами чисел FP32, BFP16, CFP8, INT32, INT16, INT8. В операциях машинного обучения вычислительная производительность узла достигает 1024 гигафлопс, а внешняя пропускная способность на каждое направление 512 ГБ/с.

Источник: Tesla YouTube

Узлы объединяются в массивы по 354 штуки, чипы D1. Площадь D1 645 мм2, он состоит из 50 миллиардов транзисторов, производится по 7-нм техпроцессу и обладает TDP 400 Вт. Пропускная способность D1 на каждой стороне достигает 4 ТБ/с.

Источник: Tesla YouTube

Чипы D1 объединяются в MCM-модули, тренировочные плитки размером 5×5, с производительностью 9 петафлопс и пропускной способностью 9 ТБ/с на сторону. Каждая плитка это готовый модуль с уникальной вертикально надстроенной системой питания и системой жидкостного охлаждения производительностью 15 кВт.

Наконец, плитки объединяются в двухуровневый кластер из матриц 2×3, помещаемый в шкаф и 10 таких шкафов формируют ExaPOD — суперкомпьютер с общей производительностью 1,1 экзафлопс. При одинаковой стоимости, Project Dojo в 4 раза производительнее, на 30% эффективнее и в 5 раз компактнее аналогичных систем.

Источник: youtube.com
9
Показать комментарии (9)

Популярные новости

Сейчас обсуждают