Характеристики GeForce RTX 40
| |
4090 | 4080 16GB | 4080 12GB |
|---|---|---|---|
| Графический процессор | AD102-300 | AD103-300 | AD104-400 |
| Изготовитель / Технология | TSMC / 5-нм (4N) | TSMC / 5-нм (4N) | TSMC / 5-нм (4N) |
| Архитектура | Ada Lovelace | Ada Lovelace | Ada Lovelace |
| Блоки | |||
| Графические кластеры, GPC | 11 | 7 | 5 |
| Текстурные кластеры, TPC | 64 | 38 | 30 |
| Потоковые мультипроцессоры, SM | 128 | 76 | 60 |
| CUDA-ядра, CUDA Cores | 16384 | 9728 | 7680 |
| Ядра трассировки лучей, RT Cores | 128 | 76 | 60 |
| Тензорные ядра, Tensor Cores | 512 | 304 | 240 |
| Текстурирования, TMU | 512 | 304 | 240 |
| Растеризации, ROP | 176 | 112 | 80 |
| Тактовые частоты | |||
| Базовая, МГц | 2230 | 2210 | 2310 |
| Форсированная, МГц | 2520 | 2510 | 2610 |
| Теоретическая пиковая производительность | |||
| Ядра RT (эквивалент), Тфлопс | 191 | 112,7 | 92,7 |
| Ускоритель оптического потока, Топс | 305 | 305 | 305 |
| Скорость заполнения текстур, Гтекс/с | 1290,2 | 763 | 626,4 |
| Скорость заполнения пикселей, Гпикс/с | 443,5 | 281,1 | 208,8 |
| Векторная | |||
| FP32, Тфлопс | 82,6 | 48,8 | 40,1 |
| FP16, Тфлопс | 82,6 | 48,8 | 40,1 |
| BF16, Тфлопс | 82,6 | 48,8 | 40,1 |
| INT32, Топс | 41,3 | 24,4 | 20 |
| Матричная (через косую черту указана производительность с разреженными матрицами) | |||
| Умножение FP8 и сложение с FP16, Тфлопс | 660,6 / 1321,2 | 390,7 / 781,4 | 320,7 / 641,4 |
| Умножение FP8 и сложение с FP32, Тфлопс | 660,6 / 1321,2 | 390,7 / 781,4 | 320,7 / 641,4 |
| Умножение FP16 и сложение с FP16, Тфлопс | 330,3 / 660,6 | 195,3 / 390,7 | 160,4 / 320,7 |
| Умножение FP16 и сложение с FP32, Тфлопс | 165,2 / 330,3 | 97,7 / 195,3 | 80,2 / 160,4 |
| Умножение BF16 и сложение с FP32, Тфлопс | 165,2 / 330,3 | 97,7 / 195,3 | 80,2 / 160,4 |
| TF32, Тфлопс | 82,6 / 165,2 | 48,8 / 97,7 | 40,1 / 80,2 |
| INT8, Топс | 660,6 / 1321,2 | 390,7 / 781,4 | 320,7 / 641,4 |
| INT4, Топс | 1321,2 / 2642,4 | 781,4 / 1562,7 | 641,4 / 1282,9 |
| Подсистема памяти | |||
| Размер регистра, КБ | 32768 | 19456 | 15360 |
| Кэш-память | |||
| 1-го уровня (L1), КБ | 16384 | 9728 | 7680 |
| 2-го уровня (L2), КБ | 73728 |
65536 | 49152 |
| Видеопамять | |||
| Тип | GDDR6X | GDDR6X | GDDR6X |
| Скорость работы, Гбит/с | 21 | 22,4 | 21 |
| Объем, МБ | 24576 | 16384 | 12288 |
| Ширина шины, бит | 384 | 256 | 192 |
| Пропускная способность, ГБ/с | 1008 | 717 | 504 |
| Тепловыделение и энергопотребление | |||
| Базовая мощность платы, Вт | 450 | 320 | 285 |
| Дополнительное питание | 16-pin PCIe Gen5 12VHPWR | 16-pin PCIe Gen5 12VHPWR | 16-pin PCIe Gen5 12VHPWR |
| Рекомендованная цена на старте | |||
| США, USD | 1599 | 1199 | 899 |
| * для RTX 4080 частота может отличаться в пределах 5 МГц из-за округления при переводе МГц в ГГц в разных разделах сайта и спецификаций NVIDIA, расчётная производительность тоже может немного отличаться | |||
- Источник:
- NVIDIA Ada GPU architecture V1.01 (PDF)

