Intel представила оптимизацию библиотеки машинного обучения PyTorch

Intel представила оптимизацию библиотеки машинного обучения PyTorch для использования на своих графических процессорах Arc "Alchemist"
27 февраля 2024, вторник 03:05
ddr77 для раздела Блоги

Intel представила оптимизацию библиотеки машинного обучения PyTorch для использования на своих графических процессорах Arc "Alchemist". Новое расширение Intel Extension for PyTorch (IPEX) разработано специально для оборудования Intel и может значительно улучшить производительность.

В блоге Intel также описано, как запустить модель Llama 2 на видеокарте Arc "Alchemist" A770. Рекомендуется использовать 16-гигабайтную версию A770, поскольку модель требует 14 ГБ оперативной памяти GPU. Это является ответом на инструмент NVIDIA Chat with RTX, который позволяет пользователям GeForce с графическими процессорами RTX запускать модели PyTorch-LLM на своих видеокартах.

Отличие заключается в том, что NVIDIA использует INT4-квантованные версии моделей, чтобы сэкономить VRAM, в то время как Intel использует более точную FP16-версию. В блоге Intel представлены инструкции по настройке Llama 2 inference с PyTorch (IPEX) на A770.


Теги