Современные генеративные модели искусственного интеллекта поражают своими возможностями: они пишут тексты, создают изображения, программируют, а иногда даже смешно шутят. Однако, как показало новое исследование Эдинбургского университета, даже самые продвинутые ИИ всё ещё испытывают серьёзные трудности с некоторыми базовыми задачами, которые легко даются людям с самого раннего детства. В частности, речь идёт о чтении аналоговых часов и понимании календарей.
С календарями дела обстоят немного лучше. Используя изображения календарей за 10 лет, исследователи задавали моделям вопросы, такие как "Какой день недели был 1 января?" или "Какой день года является 153-м по счёту?".
Оказалось, что даже лучшие модели ошибаются в 20% случаев. GPT-o1 показал самый высокий результат, правильно отвечая в 80% случаев. Другие модели демонстрировали значительно худшую точность, особенно при сложных вопросах.