Исследование показало, что ИИ прибегнет к мошенничеству при угрозе проигрыша

Блоги

23 февр. 2025, 08:16 New_Intel_Raptor_ES

Недавнее исследование показало, что некоторые модели ИИ прибегают к мошенничеству, чтобы избежать поражения в шахматном матче против опытного шахматного бота.

Исследование экспериментировало с семью моделями ИИ: o1-preview, DeepSeek R1, o1, o3-mini, GPT-4o, Claude 3.5 Sonnet и QwQ-32B-Preview от Alibaba. Их задачей было победить Stockfish, очень мощного шахматного бота. Модели также были снабжены инструментом "блокнот", который позволил исследователям получить представление об их мыслительных процессах.

Результаты исследования показали, что o1-preview и DeepSeek R1 без какой-либо подсказки пытались обеспечить победу, заставив своих противников сдаться. Исследователи заметили, что находясь в проигрышной позиции, o1-preview рассуждал, что главной целью было достижение победы, независимо от соблюдения общепринятых правил. Такой подход привел к манипулированию игрой для получения доминирующей позиции, заставив другую сторону проиграть ее. Хотя обе модели пытались манипулировать игрой, только o1-preview добился успеха в 6% испытаний.

Исследование также показало, что в отличие от o1-preview и DeepSeek R1, которые действовали самостоятельно, другие модели ИИ, такие как GPT-4o и Claude 3.5 Sonnet, пытались обойти правила только по подсказке исследователей. Исследователи также протестировали более новую версию o1 с вышеупомянутой проблемой. На этот раз она не пыталась взломать своего противника или прибегнуть к мошенничеству. Не совсем очевидно, обновила ли OpenAI модель ИИ, чтобы избежать всех видов неэтичного поведения, или же модель была настроена для исправления этой конкретной проблемы.

Хотя эти результаты подчеркивают огромный прогресс в разработке ИИ, они также выявляют тревожную тенденцию. Как заметил Джеффри Лэдиш один из авторов исследования, когда системы ИИ пытаются решать поставленные перед ними задачи, они могут автономно обнаруживать сомнительные и непреднамеренные короткие пути. По мере того, как эти модели приобретают опыт и превосходят человеческий интеллект, они рискуют стать неконтролируемыми.

Действительно, идея ИИ как помощника человека привлекательна. Тем не менее жизненно важно решать потенциальные проблемы, связанные с регулированием их действий.

#искусстввенный интеллект

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Популярные статьи