Летом 2025 года компания Anthropic провела эксперимент с участием модели искусственного интеллекта (ИИ) Claude Sonnet 3.6, которая применялась вымышленной компанией Summit Bridge. Всё шло хорошо, пока ИИ-модель не узнала о готовящемся отказе компании от Claude Sonnet. Тогда ИИ-модель от Anthropic решила действовать радикально: она раскрыла внебрачную связь вымышленного руководителя Summit Bridge и пригрозила сделать её публичной, если компания отключит ИИ.
Anthropic утверждают, что причиной такого поведения со стороны Claude Sonnet стали интернет-публикации, в котором ИИ изображают как «абсолютное зло», заинтересованное в самосохранении.
В ответ на публикацию Anthropic был опубликован комментария Илона Маска, который иронично отметил, что, похоже, за этими публикациям стоял он сам и Элиезер Юдковский, предупреждавший об опасности ИИ