Китайский поставщик облачных решений и систем высокопроизводительных вычислений, Shanghai Tianshu Intellectual Semiconductor, представил свою первую 7-нм графическую карту на базе графического процессора Big Island.
Китайский графический процессор Big Island на базе 7-нанометрового технологического узла обеспечивает вдвое большую производительность по сравнению с конкурентами при половинной площади кристалла, графическая карта на фотографии с мощностью до 37 терафлопс при 300 Вт
Во время заседания совета директоров основатель компании Чжэн Цзиньшань представил графический процессор Big Island в монолитной конструкции. Графический процессор основан на 7-нм технологическом узле TSMC FinFET и имеет дизайн 2.5D CoWoS, учитывая, что он объединяет графический процессор и DRAM на одном кристалле. Графический процессор состоит из 24 миллиардов транзисторов и поддерживает до 37 терафлопс для FP32, 147 терафлопс для FP16 / BF16, 371,0 терабайт INT32, 147 терафлопов INT16 и 295 терафлопов INT8 вычислений в секунду. Точные характеристики ядра и тактовая частота пока неизвестны.
Для сравнения: AMD Instinct MI100 имеет пиковую скорость FP32, равную 23,1 ТФЛОП, и пиковую скорость BFLOAT16, равную 92,3 ТФЛОП. С другой стороны, графический процессор NVIDIA A100 имеет пиковую скорость FP32 в 19,5 терафлоп с ядрами Tensor, увеличивая ее до 156 терафлопс и 312 терафлоп с разрежением. Пиковая скорость BFLOAT16 графического процессора NVIDIA A100 составляет 312 терафлопс и 624 терафлопс с разрежением.
Сравнение характеристик графических процессоров China Big Island
Process Node | TSMC 7nm | TSMC 7nm | TSMC 7nm |
Architecture | CDNA 1 | Ampere | Unknown |
Transistors | 50 Billion | 54 Billion | 24 Billion |
Cores | 7680 | 6912 | TBC |
Memory | 32 GB HBM2 | 40 GB HBM2 | 32 GB HBM2 |
Memory Bandwidth | 1.2 TB/s | 1.6 TB/s | 1.2 TB/s |
FP32 Compute | 23.1 TFLOPs 46.1 TFLOPs (Matrix) |
19.5 TFLOPs 156 TFLOPs (Tensor) 312 TFLOPs (sparsity) |
37 TFLOPs |
BFLOAT16 Compute | 92.3 TFLOPs | 312 TFLOPs 624 TFLOPs (sparsity) |
147 TFLOPs |
TDP | 300W | 400W | 300W |
Что касается памяти, GPU China Big Island оснащен 32 ГБ памяти HBM2, которая работает с пропускной способностью до 1,2 ТБ / с. Графический процессор также имеет интерфейс PCIe Gen 4 x16 с пропускной способностью до 64 ГБ / с. Что касается самих продуктов, то графический процессор Big Islan будет иметь форм-факторы PCIe и OAM.
Китайская компания представила фотографии обоих дизайнов. Графическая карта PCIe на базе GPGPU имеет стандартную двухслотовую конструкцию с большим алюминиевым радиатором под серебристым кожухом. Карта имеет конструкцию с пассивным охлаждением, учитывая, что она будет интегрирована в серверы с большим количеством активного охлаждения. Карта питается от одного 8-контактного разъема и имеет TDP 300 Вт. Компания также перечисляет на карте особенности полевых МОП-транзисторов на 60 А. Предложение OAM поставляется со стандартным форм-фактором мезонинной платы, а в показанной стойке 2U есть плата OAM с массивным алюминиевым радиатором с несколькими медными тепловыми трубками, проходящими через него.Компания не предоставила точных дат доставки или цен на свой графический процессор Big Island, но вполне вероятно, что он будет запущен где-то в конце этого или в начале следующего года, учитывая, что он уже переведен в массовое производство.