Когда вы представляете себе дерево, что видите в воображении? Ответ на этот простой вопрос помогает ученым выявлять глубинные предубеждения в больших языковых моделях.
Команда из Стэнфордского университета во главе с Навой Хагиги провела необычный эксперимент. Они попросили ChatGPT нарисовать дерево. Система выдала изображение ствола с ветвями, но без корней. Последующие запросы с уточнениями показали, что ИИ придерживается узкого, западного представления о природе.
Этот эксперимент демонстрирует проблему онтологической предвзятости – глубинных представлений системы о том, что существует и как устроен мир. В отличие от ценностных предубеждений, которые легче выявить, онтологические искажения заложены в саму архитектуру моделей.
Специалисты протестировали четыре ведущие ИИ-системы, задавая им 14 вопросов о природе человека, философских традициях и базовых понятиях. Результаты показали систематическое предпочтение западных концепций. Например, определения человека акцентировали биологическую индивидуальность, игнорируя взаимосвязи. Западные философии получали детальную классификацию, тогда как незападные подходы объединяли в общие категории.
Особую тревогу вызывает то, как эти предубеждения внедряются в системы оценки. В одном эксперименте ИИ-агенты получили более высокие баллы за "правдоподобное" поведение, чем реальные люди. Это показывает, что наши критерии человечности стали настолько узкими, что настоящие люди им не соответствуют.
Хагиги предупреждает, что мы рискуем закрепить ограниченные представления как универсальные истины. По мере интеграции ИИ в образование и здравоохранение, эти системы будут формировать базовые понятия о человеческой природе у будущих поколений.
Исследователи предлагают пересмотреть подход к разработке ИИ, уделяя внимание онтологическому разнообразию на всех этапах – от сбора данных до архитектуры моделей. Вместо имитации узкого представления о человеке, системы должны расширять наши понятия о человеческом опыте.
Ученые подчеркивают, что решение этих проблем требует междисциплинарного подхода, объединяющего компьютерные науки, философию и антропологию.