Google предлагает в аренду суперкомпьютеры с искусственным интеллектом на базе Nvidia H100

Зачем создавать собственный суперкомпьютер, если можно обучать ИИ в облаке.
12 мая 2023, пятница 18:21
Fantoci для раздела Блоги

В настоящее время вся индустрия информационных технологий одержима идеей генеративного ИИ. Так что неудивительно, что Google потратил большую часть выступления на обсуждение всех способов внедрения искусственного интеллекта в свои продукты. На фоне всех разговоров о Gmail, Поиске и Переводчике, Google также представила новый класс мощных суперкомпьютеров с искусственным интеллектом, которые она будет сдавать в аренду компаниям, желающим обучить алгоритмы искусственного интеллекта.

Генеративный ИИ - это просто алгоритм машинного обучения, который может создавать новый контент, например, изображения или текст. Он делает это, изучая огромный объем существующих данных, что позволяет ему понимать закономерности и ассоциации для создания новых результатов. Однако этот инструмент не обладает реальной интуицией или знанием объективной истины. Он может верить неверным вещам и пытаться убедить вас, что эти «галлюцинации» верны, потому что именно для этого он и создан. У генеративного ИИ есть свои преимущества, и он совершенствуется с головокружительной скоростью, но для этого его нужно обучить большому объему данных. Именно здесь на помощь приходят новые виртуальные машины A3 от Google.

Клиенты Google Cloud скоро смогут арендовать виртуальные машины A3 для обучения моделей искусственного интеллекта. Системы Google A3 будут иметь восемь графических процессоров Nvidia H100 Hopper в сочетании с процессорами Intel Xeon Scalable 4-го поколения и 2 ТБ оперативной памяти DDR5-4800. Графические процессоры используют NVSwitch и NVLink 4.0, чтобы обеспечить двунаправленную пропускную способность 3,6 ТБ/с между картами. Благодаря перемещению данных непосредственно между графическими процессорами в обход центрального процессора виртуальные машины A3 имеют пропускную способность в 10 раз большую, чем старые виртуальные машины A2.

Nvidia H100 по своей сути является видеокартой, но она предназначена для рабочих нагрузок машинного обучения. 

Google утверждает, что все это оборудование дает 26 эксафлопсов вычислительной мощности. Это на порядок больше, чем у самых мощных современных суперкомпьютеров, ведь мы только в 2022 году увидели первый в истории эксафлопсный суперкомпьютер. Это звучит подозрительно, но может быть есть какой-то нюанс, который мы не до конца понимаем при таком измерении. В любом случае, A3 оптимизирован для самых интенсивных современных рабочих нагрузок машинного обучения. Google Cloud A3 может заинтересовать многие компании, поскольку приобретение необходимого оборудования обходится очень дорого, а с учетом гигантского энергопотребления затраты возрастают еще больше. Эти видеокарты продаются в розницу по цене более 10 000 долларов, если вы вообще сможете их найти. Google утверждает, что A3 на 80% быстрее и на 50% дешевле любой альтернативы.

Компании, заинтересованные в использовании виртуальной машины A3 для обучения ИИ, могут подать заявку на ранний доступ к программе предварительного тестирования. Однако Google не может гарантировать, что все желающие получат место. Спрос на такого рода услуги облачных вычислений сейчас заоблачный, и он останется таким, пока шумиха не утихнет. Учитывая комплексный подход Google к генеративному ИИ, это маловероятно.