Nvidia модернизирует серверы из-за перегрева Blackwell: задержки в поставках для Google и Meta*

Nvidia сталкивается с серьезными проблемами перегрева своих графических процессоров Blackwell, что приводит к задержкам поставок. Компании, такие как Google и Microsoft, выражают беспокойство по поводу сроков развертывания новых серверов.
18 ноября 2024, понедельник 18:21
Global_Chronicles для раздела Блоги

Графические процессоры Blackwell от Nvidia, предназначенные для высокопроизводительных вычислений и искусственного интеллекта, столкнулись с серьезными проблемами перегрева. Эти чипы, установленные в серверные стойки с 72 процессорами, потребляют до 120 кВт на стойку, что создает значительные трудности в охлаждении. Инсайдеры сообщают, что такие обстоятельства заставили Nvidia пересмотреть конструкцию своих серверов, вызывая задержки и беспокойство у крупных клиентов, включая Google, Meta* и Microsoft.

Клиенты компании опасаются, что проблемы с перегревом могут помешать их планам по развертыванию новых серверов в срок. Nvidia активно работает над изменениями в дизайне своих стоек, сотрудничая с поставщиками, чтобы улучшить охлаждение и повысить надежность. Несмотря на то что подобные корректировки часто встречаются в рамках крупных технологических запусков, они приводят к дополнительным задержкам в поставках.

Ранее Nvidia уже сталкивалась с проблемами, отложив начало производства Blackwell из-за конструктивного недостатка. Графические процессоры Blackwell B100 и B200 используют сложную технологию упаковки от TSMC, и несоответствия в характеристиках различных компонентов привели к сбоям. Чтобы решить эти проблемы, Nvidia внесла изменения в верхние металлические слои чипов, что повысило надежность производства.

В результате окончательная версия графических процессоров Blackwell поступила в массовое производство только в конце октября. Это означает, что Nvidia сможет начать поставки только в конце января следующего года. Большие технологические компании, такие как Google и Microsoft, полагаются на графические процессоры Nvidia для обучения своих мощных языковых моделей. В условиях растущего спроса на вычислительные мощности, проблемы с перегревом становятся серьезным препятствием для всех участников рынка.

* Meta признана в РФ экстремистской организацией