API Vulkan начал превосходить CUDA в машинном обучении

Сравнение двух API выявило высокую производительность открытого стандарта
3 марта 2025, понедельник 18:14
Razg0n_blog для раздела Блоги

Как известно, сфера машинного обучения не ограничивается одними лишь вычислениями на CUDA. Хотя абсолютное большинство ИИ приложений ориентировано на платформу от NVIDIA, помимо нее существует открытый вариант в виде комбинации из API Vulkan и SPIR-V.

ИИ алгоритмы, написанные на шейдерном языке (GLSL, HLSL) или OpenCL C конвертируются в промежуточное бинарное представление, именуемое SPIR-V. Далее оно может быть выполнено на любом устройстве с поддержкой API Vulkan, включая видеокарты от AMD, NVIDIA и Intel.

Что характерно, "зеленый" лагерь не только не противится открытым разработкам, но и способствует их развитию. Так, на конференции Vulkanised 2025 Джефф Больц из NVIDIA выступил с докладом и рассказал о работах компании над расширение VK_NV_cooperative_matrix2.

Данное расширение привносит в API Vulkan новые функции, выходящие за пределы стандартного алгоритма GEMM. Презентация содержала тесты графических ускорителей NVIDIA с Llama.cpp, которые в целом продемонстрировали практически равенство API Vulkan и CUDA, а в ряде случаев даже превосходство первого, при использовании VK_NV_cooperative_matrix2.

Так, на RTX 6000 Ada задача обработки пользовательского ввода выполнялась на Vulkan + SPIR-V быстрее на 3-15%. Это показывает, что открытый стандарт вполне способен конкурировать с CUDA по производительности. Функция VK_NV_cooperative_matrix2 будет доступна, начиная с драйвера NVIDIA 575.