Как известно, сфера машинного обучения не ограничивается одними лишь вычислениями на CUDA. Хотя абсолютное большинство ИИ приложений ориентировано на платформу от NVIDIA, помимо нее существует открытый вариант в виде комбинации из API Vulkan и SPIR-V.

ИИ алгоритмы, написанные на шейдерном языке (GLSL, HLSL) или OpenCL C конвертируются в промежуточное бинарное представление, именуемое SPIR-V. Далее оно может быть выполнено на любом устройстве с поддержкой API Vulkan, включая видеокарты от AMD, NVIDIA и Intel.
Что характерно, "зеленый" лагерь не только не противится открытым разработкам, но и способствует их развитию. Так, на конференции Vulkanised 2025 Джефф Больц из NVIDIA выступил с докладом и рассказал о работах компании над расширение VK_NV_cooperative_matrix2.

Данное расширение привносит в API Vulkan новые функции, выходящие за пределы стандартного алгоритма GEMM. Презентация содержала тесты графических ускорителей NVIDIA с Llama.cpp, которые в целом продемонстрировали практически равенство API Vulkan и CUDA, а в ряде случаев даже превосходство первого, при использовании VK_NV_cooperative_matrix2.
Так, на RTX 6000 Ada задача обработки пользовательского ввода выполнялась на Vulkan + SPIR-V быстрее на 3-15%. Это показывает, что открытый стандарт вполне способен конкурировать с CUDA по производительности. Функция VK_NV_cooperative_matrix2 будет доступна, начиная с драйвера NVIDIA 575.

