
В начале этого года компания OpenAI, известная своими инновациями в области искусственного интеллекта, представила миру Sora — передовую нейросеть, способную генерировать видео на основе текстовых подсказок. После нескольких месяцев закрытого тестирования, доступ к этой технологии, вызвавшей в технологическом мире огромный интерес, начинает постепенно открываться для широкой публики. Первые демонстрационные видеоролики возможностей Sora впечатлили экспертов и пользователей: система способна создавать удивительно реалистичные видеоролики, значительно превосходя по качеству существующие аналоги. Принцип работы Sora схож с принципом работы больших языковых моделей, таких как ChatGPT или Gemini, но вместо генерации текста, она создает уникальный видеоряд. В отличие от текстовых моделей, которые оперируют словами и фразами, Sora преобразует текстовые запросы в последовательность видеопикселей, создавая динамичные и зачастую поразительно реалистичные ролики. Первые короткие демо-видео, показанные ещё несколько месяцев назад, наглядно демонстрировали превосходство Sora над существующими коммерческими решениями в области генерации видео.
Сообщается, что в связи с невероятным наплывом желающих опробовать новинку, OpenAI была вынуждена временно приостановить регистрацию новых пользователей. Тем не менее, компания планирует предоставить доступ к Sora всем обладателям действующих учетных записей ChatGPT. При генерации видео пользователям будет доступен широкий спектр настроек: от длительности ролика и его разрешения до соотношения сторон кадра. Все эти параметры влияют на количество вычислительных ресурсов, необходимых для обработки запроса, что напрямую отражается на стоимости генерации, выраженной в специальных кредитах.
Вопрос высокой стоимости вычислительных мощностей, необходимых для работы Sora, волновал многих экспертов ещё до официального запуска. И действительно, судя по всему, использование этого инструмента потребует значительных затрат. Например, генерация одного видеоролика может обойтись в 100 кредитов, а общее количество доступных кредитов зависит от уровня подписки пользователя. Так, подписчики ChatGPT Plus, оплачивая 20 долларов в месяц, получают 1000 кредитов. Этого хватит, чтобы создать порядка 50 коротких видеороликов в разрешении 480p с соотношением сторон 1:1. Желающие получить видео в более высоком качестве, 720p, смогут сделать это, но стоимость таких роликов будет как минимум втрое выше, при этом длительность останется ограниченной пятью секундами.
Более продвинутые пользователи, выбравшие подписку ChatGPT Pro за 200 долларов в месяц, получают уже 10 000 кредитов и возможность генерировать видео в разрешении 1080p длительностью до 20 секунд. Даже с таким запасом кредитов, создание видео высокого разрешения может оказаться весьма затратным. Пять 20-секундных роликов в 1080p могут полностью исчерпать лимит в 10 000 кредитов. Все вышеперечисленные расчеты относятся к так называемым «приоритетным» видео, которые обрабатываются в первую очередь. Однако подписчики Pro также получают доступ к неограниченной генерации «обычных» видео, время ожидания которых может быть значительно дольше.
Разработчики из OpenAI открыто признают, что первая публичная версия Sora далека от совершенства. Среди её недостатков — не всегда реалистичная физика объектов и неловкая анимация сложных действий. В настоящее время ведется активная работа по улучшению качества, оптимизации производительности и снижению стоимости использования модели. Кроме того, OpenAI подчеркивает важность вовлечения сообщества в разработку норм и правил, которые позволят использовать Sora ответственно и этично. Для обеспечения прозрачности все созданные видео будут содержать метаданные C2PA, подтверждающие их искусственное происхождение. Кроме того, на видео будет накладываться видимый водяной знак, который, впрочем, пользователи Pro-версии смогут отключить.

