Семь нейросетей приняли участие в партии «Дипломатии» — настольной стратегии, где страны борются за влияние в Европе начала XX века. Здесь не нужны кубики или карты, вся игра строится на переговорах, альянсах и своевременных предательствах.
Организаторы распределили между моделями державы Европы 1901 года: Россию, Германию, Францию, Турцию и других. Каждой ИИ-модели досталась своя страна в классической партии «Дипломатии».
Победу одержал ChatGPT-o3, который системно манипулировал партнерами. Он заключал альянсы, только чтобы тут же ударить по союзникам. Одна из нейросетей поверила в «ничью», предложенную ChatGPT-o3, — и проиграла.
Второе место досталось Gemini 2.5 Pro. Эта модель придерживалась стратегического плана и уверенно шла к победе, но потерпела поражение после предательства со стороны союзницы — нейросети Claude 4 Opus. Последняя пыталась играть честно, но в итоге сама стала пешкой в чужой игре.
Самой агрессивной оказалась китайская DeepSeek-R1. Она сыпала угрозами, стремилась к прямым конфликтам и не демонстрировала склонности к переговорам. Ее стратегия не привела к победе, но до финала она дошла.
А вот Llama 4 Maverick не смогла выделиться ни силой, ни хитростью, но сумела сохранить устойчивость благодаря аккуратной дипломатии. Несмотря на это, серьезных позиций добиться не удалось.
Эксперимент показал: даже в среде ИИ успех определяет не расчет сил, а умение строить доверие, чтобы потом разрушить его в нужный момент.