Подобные нейросети способны обрабатывать текст и изображения, позволяя транспортным средствам «видеть» окружение и принимать решения на основе полученной информации.

На конференции NeurIPS в Сан-Диего Nvidia представила Nvidia Drive Alpamayo-R1 — первую в мире открытую ИИ-модель с возможностями логического мышления для автономного вождения.

Модель основана на архитектуре Nvidia Cosmos Reason и разработана, чтобы помочь автомобилям ориентироваться в сложных дорожных ситуациях, руководствуясь «здравым смыслом». Alpamayo-R1 уже доступна на GitHub и Hugging Face и предназначена для исследователей, работающих над некоммерческими приложениями в области беспилотных автомобилей.

Отличительной особенностью Alpamayo-R1 считается интеграция цепочек рассуждений в планирование пути. Предыдущие системы беспилотного вождения достигали предела своих возможностей в сложных ситуациях, таких как оживлённый перекрёсток или предстоящее сужение полосы движения. Новая модель разбивает сценарии на отдельные этапы.

Вместе с Alpamayo-R1 компания Nvidia выпустила Cosmos Cookbook — подробное руководство для разработчиков ИИ, охватывающее все аспекты: от сбора и генерации синтетических данных до оценки моделей. Cookbook включает пошаговые инструкции и примеры быстрого старта по использованию и постобучению моделей на базе Cosmos.

Запуски Nvidia подчёркивают стратегическую переориентацию на так называемый физический ИИ. Генеральный директор Дженсен Хуанг неоднократно подчёркивал, что следующий этап развития ИИ — это физический ИИ (Physical AI). То есть искусственный интеллект не просто обрабатывает данные, но и взаимодействует с физическим миром через робототехнику.

Благодаря своим открытым моделям, наборам данных и инструментам Nvidia позиционирует себя как поставщик инфраструктуры для следующего поколения приложений ИИ — от автономных транспортных средств до роботов.