Nvidia представила новые ИИ-инструменты и цифровых помощников на конференции Microsoft Ignite 2024

В ближайшем будущем стоит ожидать появления более реалистичных и полезных цифровых помощников, способных выполнять широкий спектр задач.
20 ноября 2024, среда 19:13
Fantoci для раздела Блоги

На ежегодной конференции Microsoft Ignite, стартовавшей на этой неделе в Чикаго, основное внимание снова было сосредоточено на искусственном интеллекте. Одним из первых громких анонсов стала презентация новых инструментов для разработчиков, которые помогут реализовать концепцию «GeForce RTX AI PC». Эти инновационные продукты, разработанные при активном участии Nvidia, позволяют создавать реалистичных цифровых ассистентов и аватаров.

Речь идет не просто о чат-ботах, а о полноценных цифровых аватарах, способных воспринимать и анализировать окружающий мир подобно человеку. Основой для этого служит модель Nvidia Nemovision-4B-Instruct, использующая технологии Nvidia Vila и NeMo для обработки изображений и взаимодействия с пользователем. С ее помощью цифровые помощники смогут интерпретировать визуальную информацию на экранах и в реальном мире так же, как это делает человек.

Данная разработка открывает новые горизонты для использования цифровых аватаров в различных областях — от клиентской поддержки до образования и развлечений. Благодаря мультимодальному подходу такие агенты смогут не только реагировать на запросы пользователей, но и принимать самостоятельные решения с минимальным вмешательством.

Nvidia также презентовала семейство компактных языковых моделей Mistral NeMo Minitron 128k Instruct. Они доступны в версиях с 2, 4 и 8 миллиардами параметров, что делает их совместимыми даже с маломощными устройствами. Это значит, что технологии взаимодействия с цифровыми ассистентами теперь доступны не только для высокопроизводительных ПК, но и для бюджетных решений.

Компактные модели оптимизированы для работы в разных сценариях, обеспечивая плавное взаимодействие пользователей с виртуальными агентами. Они подходят для использования как в домашних условиях, так и в корпоративной среде.

Еще одним важным обновлением стала модернизация инструмента TensorRT Model Optimizer, который теперь поддерживает формат ONNX. Он позволяет значительно ускорить разворачивание моделей в средах, работающих на видеокартах с поддержкой CUDA, TensorRT и DirectML.

Среди главных улучшений — снижение потребляемой памяти при разворачивании до 2,6 раза по сравнению с форматом FP16. Это особенно полезно для оптимизации сложных моделей на базе видеокарт RTX.

Пока конкуренты ищут свои ниши в быстрорастущем сегменте искусственного интеллекта, Nvidia продолжает лидировать благодаря выдающимся характеристикам своих графических процессоров и ускорителей. Intel, например, предпочитает акцентировать внимание на цене и общей выгоде своих решений, таких как ускорители Gaudi 3, вместо конкуренции в премиум-сегменте. В то же время AMD активно развивает производительные процессоры Epyc пятого поколения и ИИ-ускорители, включая MI325X.

Конференция Microsoft Ignite продлится до конца недели, и организаторы обещают еще больше интересных анонсов, связанных с развитием технологий искусственного интеллекта. Учитывая стремительное развитие отрасли, можно ожидать интересные новости, которые зададут направление для ИИ на ближайшие годы.