Мы приближаемся к моменту, когда традиционные медные соединения не смогут передавать достаточно данных для полной загрузки графических процессоров и других специализированных чипов. Рынок искусственного интеллекта срочно требует решения для устранения этого узкого места в межсетевых соединениях, и Broadcom, похоже, работает над решением на основе оптики.

Компания разрабатывает новую технологию кремниевой фотоники, направленную на значительное увеличение пропускной способности, доступной для графических процессоров и других ускорителей искусственного интеллекта. Используя совместно упакованную оптику (CPO), производитель стремится интегрировать компоненты оптического подключения непосредственно в графические процессоры, обеспечивая более высокую скорость передачи данных и одновременно снижая требования к энергопотреблению.
Компания уже несколько лет работает над решениями CPO и продемонстрировала свои последние достижения на недавней конференции Hot Chips. Сообщается, что технология Broadcom обеспечивает общую пропускную способность соединения 1,6 ТБ/с, что эквивалентно 6,4 Тбит/с или 800 ГБ/с в каждом направлении.

Это новое соединение может обеспечить «безошибочную» передачу данных на один чиплет, достигая уровня производительности, сравнимого с NVLink от Nvidia и другими специализированными решениями для центров обработки данных. Однако Broadcom еще не внедрила свои оптические соединения в готовые к выпуску на рынок графические процессоры, такие как A100 или MI250X. Вместо этого он использует тестовый чип, предназначенный для эмуляции реального графического процессора в демонстрационных целях.
По словам Маниша Мехты, вице-президента подразделения оптических систем Broadcom, медные соединения начинают снижать пропускную способность уже через пять метров. Хотя оптическая связь уже давно рассматривается как решение проблемы ухудшения качества сигнала, она традиционно требует гораздо больше энергии, чем технологии на основе медных проводов.
Например, по оценкам Nvidia, для системы NVL72 с оптической связью потребуется дополнительно 20 киловатт на стойку сверх 120 киловатт, которые уже потребляет система.
Broadcom удалось снизить энергопотребление за счет использования объединенной оптики, которая обеспечивает прямой контакт с графическим процессором. Компания использовала технологию упаковки CoWoS от TSMC, чтобы соединить пару стеков памяти с высокой пропускной способностью с вычислительным кристаллом. Компоненты логики и памяти чипа расположены на кремниевом переходнике, а оптический механизм Broadcom расположен на подложке.
Мехта пояснил, что технология CPO позволяет подключать до 512 отдельных графических процессоров в восьми стойках, позволяя всей установке функционировать как единая система. Для сравнения, NVL72 от Nvidia может достичь аналогичных унифицированных вычислительных возможностей «всего» с 72 графическими процессорами, это позволяет предположить, что решение Broadcom в конечном итоге может стать конкурентным преимуществом для рабочих нагрузок ИИ следующего поколения.

