Компания Figure, занимающаяся разработкой робототехники на основе искусственного интеллекта, представила «Helix» — новую модель класса «зрение-язык-действие» (VLA), которая объединяет восприятие, понимание языка и управление в одной системе. Инновация заключается, в частности, в точном управлении всей верхней частью тела робота-гуманоида, включая запястья, туловище, голову и пальцы. Известно, что Figure отказалась от моделей искусственного интеллекта OpenAI, поскольку хочет полагаться на собственные разработки.
Робот с ИИ второго поколения. Фото: FigureAI
Система состоит из двух основных компонентов: модели языка визуального восприятия (VLM) с 7 миллиардами параметров для понимания окружающей среды и языка и модели трансформатора с 80 миллионами параметров для управления двигателем. В то время как VLM работает на частоте 7–9 Гц, управление движением происходит на частоте 200 Гц.
Робот с Helix может:
- Удерживать и манипулировать практически любым небольшим бытовым предметом
- Работать совместно с двумя роботами одновременно
- Выполнять инструкций на естественном языке в режиме реального времени
- Работать на коммерчески доступном встроенном оборудовании
Ограничения распространяются на:
- Размер манипулируемых объектов
- Более длинные последовательности действий
- Надежность в самых разных условиях окружающей среды
Система была разработана с использованием около 500 часов контролируемого обучения — значительно меньше, чем при использовании сопоставимых подходов. Figure подчеркивает, что это только начало, и планирует значительно расширить масштабы обучения.
ИИ Helix знаменует собой важный шаг на пути к созданию гибких роботизированных систем для неструктурированных сред. Сочетание голосового управления и точной моторики может открыть новые возможности применения в домашнем хозяйстве и сфере услуг. Однако пока неизвестно, насколько надежной окажется система в реальных условиях эксплуатации.
Наряду с Boston Dynamics, Tesla, Nvidia и рядом других компаний, Figure является одним из игроков, которые хотят внедрить человекоподобных роботов в промышленность, а также использовать их в повседневной жизни (работы по дому и пр.). Утверждается, что речь идет не о замене человеческого труда, а о заполнении пробелов на рынке труда, где не хватает квалифицированных рабочих.

