ИИ-модели научились вырабатывать язык и нормы поведения самостоятельно без подсказок людей

Ученые продемонстрировали, что языковые модели могут коллективно формировать общие нормы и язык. Это происходит в децентрализованных условиях — без явных инструкций и без знания структуры группы.
18 мая 2025, воскресенье 19:41
Global_Chronicles для раздела Блоги

Недавно выяснилось, что когда группы больших языковых моделей сталкиваются с задачей договориться о чем-либо, они способны выработать собственные правила взаимодействия — и делают это без участия человека. Такие выводы сделаны учеными на основе эксперимента, имитирующего условия возникновения социальных соглашений в человеческом обществе.

Согласно исследованию, опубликованному в Science Advances, большие языковые модели (LLM), взаимодействующие друг с другом, могут коллективно выработать общие соглашения и элементы языка. Исследование основано на экспериментальной структуре, ранее использовавшейся в социальных науках для изучения формирования соглашений между людьми.

В каждом эксперименте два агента LLM объединялись случайным образом и выбирали имя — набор символов или букву — из общего списка. Совпадение выбора приносило им вознаграждение, расхождение — штраф. После неудачного совпадения каждый агент видел, какое имя выбрал другой.

Популяции агентов варьировались от 24 до 200. У них не было информации о существовании группы в целом и не было доступа ко всей истории взаимодействий. Только к недавнему опыту. Несмотря на это, в результате множества взаимодействий среди агентов начинали проявляться устойчивые нормы — например, они все чаще выбирали одно и то же имя.

Исследователи также обнаружили, что в таких системах могут возникать коллективные предубеждения, которые не происходят из действий отдельных агентов. Это подчеркивает, что поведение группы не всегда можно объяснить через поведение ее участников.

В финальной части эксперимента ученые проверили, могут ли небольшие, но согласованные подгруппы изменить уже сложившиеся соглашения. Оказалось, что да — даже меньшинство способно изменить направление развития нормы, если действует последовательно.

Результаты показывают, что языковые модели могут не только взаимодействовать, но и формировать свои системы соглашений. Это важно учитывать при проектировании ИИ-сред, которые должны учитывать человеческие цели и ценности.