Создатель ChatGPT разработал модель, которая может создавать одноминутные видеоролики по тексту.
На основе текстового запроса или неподвижного изображения Sora способна создать видео длительностью до минуты с качеством видео 1080p. Подсказки пользователя точно отслеживаются. В создаваемое видео можно включить несколько персонажей и фоновые детали. Модель также способна расширять существующие видеоролики, добавляя недостающие детали.
"Модель глубоко воспринимает язык, благодаря чему может точно понимать подсказки и генерировать интереснейших персонажей, передающих разнообразные эмоции". Кроме того, Sora способна формировать несколько кадров в рамках одного сгенерированного видео, передавая персонажей и их визуальный стиль", - поясняют в OpenAI. На сайте OpenAI также представлены видеоролики, созданные Sora.
OpenAI продолжает развивать модель, которая в конечном итоге может устранить вышеперечисленные ограничения. Sora также опирается на исследования OpenAI в области DALL-E, модели компании, которая может генерировать изображения на основе подсказок.
На данный момент доступность Sora ограничена. Однако, доступ будет предоставлен ограниченному числу профессионалов в области визуального восприятия, дизайнеров и кинематографистов, чтобы они могли оставить свои отзывы о том, как сделать модель более подходящей для творчества.