Компания AMD утверждает свои позиции в качестве одного из лидеров по внедрению масштабных вычислений, связанных с ИИ, в потребительские устройства, используя для этого свои движки XDNA. Гибридные процессоры AMD, такие как Strix Point и Strix Halo, отличаются высокой производительностью в задачах ИИ. Теперь же AMD подняла планку ещё выше: последний драйвер Adrenalin Edition 25.8.1 обеспечивает поддержку большой языковой модели (LLM).

Примечательно, что благодаря технологии переменной графической памяти (VGM) пользователи могут выделить до 96 ГБ памяти для встроенного графического процессора (iGPU), что делает возможным локальный запуск крупномасштабных моделей.
Более того, AMD добилась значительных успехов в увеличении размера контекста модели. В то время как стандартный размер контекста для потребительских процессоров составлял около 4096 токенов, компания смогла увеличить его в несколько раз, достигнув длины контекста в 256 000 токенов. Это обеспечивает улучшенный контроль над рабочим процессом и исключает проблемы с производительностью.

На данный момент платформа Strix Halo доступна лишь в ограниченном числе устройств, и их стоимость достаточно высока, порой превышая 2000 долларов.

