Компания AMD опубликовала результаты внутренних тестов своей видеокарты RX 7900 XTX, демонстрирующих её превосходство над моделью RTX 4090 от Nvidia в определённых сценариях, связанных с использованием модели DeepSeek R1.
Согласно результатам тестирования, RX 7900 XTX показала производительность на 13% выше, чем у RTX 4090 в задаче Distill Qwen 7B, и на 34% выше, чем у RTX 4080 Super. При этом AMD отмечает преимущество своей карты в 11% при тесте Distill Llama 8B и 2% при Distill Qwen 14B. Однако в одном из тестов RTX 4090 опередила RX 7900 XTX на 4%, что свидетельствует о вариативности результатов в зависимости от используемой модели искусственного интеллекта и параметров тестирования.
Следует отметить, что предыдущие исследования, например, с использованием Stable Diffusion, выявили, что некоторые алгоритмы ИИ могут не полностью использовать потенциал графических процессоров, такие как FP8 и оптимизации TensorRT. Это может ограничить демонстрацию полного потенциала видеокарт. Учитывая, что внутренние тесты были проведены AMD, важно учитывать возможный вклад архитектуры тестовой среды, версий драйверов и других технических деталей в полученные результаты. К ним следует относиться с определённой долей осторожности.
Тем не менее, архитектура RDNA 3, на которой основана RX 7900 XTX, включает в себя 192 ускорителя ИИ и поддержку форматов BF16 и INT8, что делает её хорошо приспособленной для решения сложных задач в области ИИ. Несмотря на то, что карта в основном ориентирована на игровые приложения, AMD выпустила руководство по запуску DeepSeek R1 на своих графических процессорах, демонстрируя амбиции в сфере ИИ-вычислений.
DeepSeek R1 позиционируется как высокопроизводительная модель ИИ, требующая меньших вычислительных ресурсов благодаря интеграции инструкций PTX, изначально разработанных для оборудования Nvidia.

