
Google Cloud представила новый TPU Trillium — шестое поколение своих специализированных чипов для ИИ, созданное для решения сложных задач. Этот чип был впервые презентован в мае 2024 года и разработан для крупного обучения, настройки и выводов, обеспечивая улучшенную эффективность и производительность.
Выпуск Trillium является частью инфраструктуры гиперкомпьютеров ИИ компании, которая интегрирует TPU, GPU и CPU с открытым программным обеспечением для удовлетворения растущих запросов генеративного ИИ. Чип обещает значительные преимущества по сравнению с TPU v5e, включая более чем четырехкратное увеличение обучающей производительности и до трехкратного увеличения пропускной способности вывода.

Trillium предлагает удвоенный объем HBM и пропускную способность Interchip Interconnect (ICI), что делает его идеальным для крупных языковых моделей, таких как Gemma 2 и Llama, а также для вычислительных приложений с высокой нагрузкой, например, модели диффузии, такие как Stable Diffusion XL.
Кроме того, Google подчеркивает, что Trillium фокусируется на энергоэффективности, сообщая о 67% повышении по сравнению с предыдущими чипами.

