На конференции Cadence Live 2026 глава NVIDIA рассказал, как компания оценивает эффективность своих систем для искусственного интеллекта. Дженсен Хуанг заявил, что NVIDIA производит токены с самой низкой себестоимостью. Он подчеркнул, что речь идет не только о мощности оборудования. Важную роль играет вся система — от архитектуры ускорителей до программной среды.
Источник изображения: NVIDIA
Токены представляют собой базовые элементы, которые модели используют при обработке текста. Их количество и скорость генерации напрямую зависят от того, как настроено взаимодействие между железом и программным обеспечением. Простое увеличение вычислительной мощности не решает задачу, если система работает неэффективно.
NVIDIA развивает экосистему CUDA, которая управляет работой оборудования и помогает оптимально использовать ресурсы. За счет этого компания повышает объем генерируемых токенов без лишних затрат энергии. Хуанг отметил, что сами системы остаются дорогими. Платформы вроде Blackwell требуют значительных вложений. При этом они способны генерировать большой объем токенов, что снижает стоимость каждого из них. Компания также оценивает эффективность по затратам энергии на один токен, а не только по общей производительности.

