Платим блогерам
Блоги
Niko4123
Специалист Microsoft по искусственному интеллекту Адриан де Винтер решил посмотреть, сможет ли GPT-4 запускать DOOM. Ответ: "В основном нет, но вроде как может быть".

Чтобы все заработало, пришлось немало повозиться. По сути он создал систему, при которой компьютер делает снимок экрана с каждым кадром игрового процесса DOOM, а затем пропускает его через GPT-4 с API Vision ("GPT-4V"), который преобразует снимок экрана в текст, объясняющий текущее состояние игры, и затем отправляет эту информацию второму экземпляру GPT-4, который использует описание для генерации игровых входных данных, которые в конечном итоге отправляются обратно в игру.

реклама

Этот процесс работает - языковая модель смогла перемещаться по уровням и участвовать в бою, хотя и довольно неуклюже. Однако как сказал сам де Винтер, "моя бабушка играла в нее намного лучше, чем на эта модель". GPT-4 плохо справляется с игрой: ему трудно прицеливаться и стрелять по врагам, активировать переключатели и двери и даже просто перемещаться по простым пространствам сцены E1M1: Ангар в DOOM. Исследователь говорит, что после долгой работы ему удалось заставить ИИ найти последнюю комнату, но он не смог завершить этап.

Wargames ©1982 Metro Goldwyn Mayer Studios Inc.

Если вы не готовы читать всю научную статью по этой теме, де Винтер создал для статьи страницу, которую вы можете прочитать. На самом деле это довольно интересное чтение, даже если вы не являетесь исследователем искусственного интеллекта, поскольку де Винтер объясняет, что люди действительно переоценивают возможности таких больших языковых моделей, как GPT-4. На самом деле она не способна рассуждать за пределами чрезвычайно ограниченного контекста, и ей не хватает базовых идей, таких как постоянство объектов. Идея о том, что GPT-4 может заменить рабочих-людей, а не просто быть инструментом, помогающим им, довольно смехотворна.

Тем не менее, де Винтер выражает обеспокоенность по поводу того, как легко ему удалось заставить нейронную сеть участвовать в бессмысленном насилии, открывая огонь по человекоподобным целям. Это важная точка зрения. Теоретически ограничения GPT-4 должны были сделать этот конкретный этап процесса весьма сложным.  

2
Показать комментарии (2)

Популярные новости

Сейчас обсуждают