Видеокарта AMD Radeon RX 7900 XTX обходит RTX 4090 при использовании модели DeepSeek R

AMD продемонстрировала результаты внутреннего тестирования своей новой видеокарты RX 7900 XTX, которая в задачах, связанных с искусственным интеллектом, опережает конкурентов, таких как Nvidia RTX 4090.
18 февраля 2025, вторник 11:50
Speis для раздела Блоги

Компания AMD опубликовала результаты внутренних тестов своей видеокарты RX 7900 XTX, демонстрирующих её превосходство над моделью RTX 4090 от Nvidia в определённых сценариях, связанных с использованием модели DeepSeek R1.

Согласно результатам тестирования, RX 7900 XTX показала производительность на 13% выше, чем у RTX 4090 в задаче Distill Qwen 7B, и на 34% выше, чем у RTX 4080 Super. При этом AMD отмечает преимущество своей карты в 11% при тесте Distill Llama 8B и 2% при Distill Qwen 14B. Однако в одном из тестов RTX 4090 опередила RX 7900 XTX на 4%, что свидетельствует о вариативности результатов в зависимости от используемой модели искусственного интеллекта и параметров тестирования.

Следует отметить, что предыдущие исследования, например, с использованием Stable Diffusion, выявили, что некоторые алгоритмы ИИ могут не полностью использовать потенциал графических процессоров, такие как FP8 и оптимизации TensorRT. Это может ограничить демонстрацию полного потенциала видеокарт. Учитывая, что внутренние тесты были проведены AMD, важно учитывать возможный вклад архитектуры тестовой среды, версий драйверов и других технических деталей в полученные результаты. К ним следует относиться с определённой долей осторожности.

Тем не менее, архитектура RDNA 3, на которой основана RX 7900 XTX, включает в себя 192 ускорителя ИИ и поддержку форматов BF16 и INT8, что делает её хорошо приспособленной для решения сложных задач в области ИИ. Несмотря на то, что карта в основном ориентирована на игровые приложения, AMD выпустила руководство по запуску DeepSeek R1 на своих графических процессорах, демонстрируя амбиции в сфере ИИ-вычислений.

DeepSeek R1 позиционируется как высокопроизводительная модель ИИ, требующая меньших вычислительных ресурсов благодаря интеграции инструкций PTX, изначально разработанных для оборудования Nvidia.