Недавно лондонский стартап General Reasoning провёл исследование, в котором тестировал ведущие модели искусственного интеллекта, заставляя предсказывать результаты футбольных матчей. Оказалось, что самые продвинутые продукты Google, OpenAI, Anthropic и xAI от Илона Маска не способны заработать на ставках на результаты матчей Премьер-лиги. Это говорит о том, что даже самые совершенные ИИ-модели продолжают испытывать трудности в динамичных средах, при этом быстро прогрессируя в статических задачах вроде программирования.
Изображение: techspot.com
Был воссоздан футбольный сезон 2023–2024 годов. Восемь моделей ИИ получили подробные исторические данные и статистику футбольных клубов. Каждая система должна была разработать стратегию получения максимальной прибыли на ставках и управление рисками с учётом появления новых результатов матчей и данных об игроках. Системы не имели доступа в интернет и имели три попытки на получение прибыли.
В итоге все модели завершили сезон с убытками, показав результаты хуже, чем ставящие на футбол люди.
Ближе всех к безубыточности подошла модель Claude Opus 4.6, продемонстрировав средний убыток в 11%. Модель Grok 4.20 один раз обанкротилась и не сумела завершить две другие попытки. Система Gemini 1 Pro в одной попытке показала прибыль в 34% и провалилась в другой.
Изображение: General Reasoning
По словам генерального директора General Reasoning Росса Тейлора, многие современные тесты искусственного интеллекта созданы на основе чрезвычайно статичных сред. Эти среды полностью игнорируют непредсказуемость и изменчивость реальных систем.
Тейлор полагает, что использование ИИ для решения реальных задач может не дать результата. Это исследование может напомнить о том, что граница между цифровым интеллектом и живым всё ещё весьма велика.

