
Напомним, в августе 2023 года Google анонсировала серверы A3 с ускорителями NVIDIA H100. Позже дебютировали виртуальные машины A3 Mega с поддержкой конфиденциальных вычислений. А до конца текущего месяца клиенты должны были получить доступ к A3 Ultra со значительно более высокой производительностью.
Представленные варианты построены на серверах с новыми DPU Titanium ML, оптимизированными для высокопроизводительных облачных рабочих нагрузок ИИ. Заявленная пропускная способность RDMA - соединений между GPU достигает 3,2 Тбит/с (RoCE).
Теперь же Google запускает эти новые сверхмощные виртуальные компьютеры под названием A3 Ultra на своей облачной платформе. Эти компьютеры специально разработаны для сложных задач искусственного интеллекта (ИИ), таких как обучение больших языковых моделей (например, Chat GPT).
Они используют специальную высокоскоростную сеть под названием Google Jupiter. По сравнению с A3 Mega, A3 Ultra может похвастать удвоенной скоростью связи между своими процессорами. Это идеально подходит для больших моделей, поскольку они могут обрабатывать большие языковые модели в два раза быстрее, чем A3 Mega. Кроме того, пользователи могут объединить десятки тысяч таких машин, чтобы создать огромный суперкомпьютер ИИ для решения масштабных задач ИИ и HPC (высокопроизводительных вычислений).
A3 Ultra будет доступен через Google Kubernetes Engine (GKE) и как часть Hypercompute Cluster — специализированной платформы Google Cloud для передового искусственного интеллекта. Google планирует выпустить еще более мощные системы на базе NVIDIA GB200 NVL72 в начале 2025 года. Они даже продемонстрировали свою собственную версию этого супер ускорителя.
Экземпляры A3 Ultra будут доступны к концу этого месяца и предложат значительно более высокую производительность.

