У OpenAI появились проблемы с поиском новой информации для обучения GPT-5

Компания тратит огромные средства на сессии обучения, но они стремительно теряют эффективность
26 декабря 2024, четверг 18:40
Zelikman для раздела Блоги

 Работа OpenAI над GPT-5 столкнулась с серьёзными трудностями. Проект заметно отстаёт от намеченного графика и требует огромных финансовых вложений. Microsoft, потратив более 18 месяцев на его разработку, изначально планировала запуск к середине 2024 года, но в эти сроки не уложилась.

 Инвестиции составляют колоссальную сумму — каждый сеанс обучения обходится примерно в 500 миллионов долларов только за счёт вычислительных ресурсов, однако, ожидаемых улучшений в производительности по сравнению с GPT-4 не наблюдается. Несмотря на некоторые прогрессы, их недостаточно, чтобы оправдать такие затраты.

 Одной из ключевых проблем является нехватка качественных данных для обучения модели. В открытом доступе в Сети нет достаточного разнообразия высококачественных данных, необходимых для внесения значительных изменений. Чтобы преодолеть эту трудность, OpenAI привлекла специалистов для создания новых учебных материалов, включая программный код и математические задачи. Однако этот процесс проходит медленными темпами. В качестве сравнительного примера, для обучения GPT-4 потребовалось поразительное число — 13 триллионов токенов.

 Кроме того, компания столкнулась с внутренними трудностями. В 2024 году более двух десятков ключевых руководителей покинули свои посты, среди которых главный научный сотрудник Илья Суцкевер и технический директор Мира Мурати. OpenAI также параллельно работает над другими проектами, такими как «o1» и «Sora», в то время как пытается разобраться, как двигаться дальше с разработкой GPT-5.

 Генеральный директор Сэм Альтман уже объявил, что выхода GPT-5 в 2024 году не будет. Это создаст серьёзные преграды для реализации планов компании в сфере искусственного интеллекта.