Команда OpenAI достигла впечатляющего результата в области генеративного искусственного интеллекта. Авторы новой модели sCM, исследователи Ченг Лу и Ян Сонг, опубликовали статью на сервере научных препринтов arXiv, где подробно описали свой инновационный метод. Дополнительные материалы также доступны на сайте OpenAI. Их инновационный метод заключается в модели согласованности непрерывного времени (sCM), которая радикально ускоряет процесс генерации видео по сравнению с существующими технологиями.
Современные диффузионные модели, применяемые в машинном обучении, являются одним из видов генеративных моделей. Они выполняют задачу генерации изображений или видео, но также могут быть использованы для генерации аудио и других типов данных. Эти модели обычно состоят из трех ключевых элементов: прямого процесса (когда данные разбиваются на составляющие), обратного процесса (восстановление данных) и процедуры выборки, которая генерирует конечный продукт.
Слабая сторона традиционных диффузионных моделей — их высокая вычислительная сложность. Для создания качественного изображения или видео требуется выполнить сотни шагов, что приводит к значительным временным затратам. Именно здесь новая модель от Лу и Сонга демонстрирует впечатляющие результаты.
Модель sCM значительно отличается по своему подходу: она использует всего два шага для генерации видео, что позволяет резко сократить время обработки. Разработчики подчеркивают, что при этом качество сгенерированного контента не ухудшается, несмотря на радикальное сокращение числа вычислительных шагов.
sCM включает более 1,5 миллиарда параметров и может создавать короткие видео буквально за доли секунды на компьютере с одним графическим процессором A100. Это делает её примерно в 50 раз быстрее существующих аналогов. Такое ускорение открывает новые перспективы для использования ИИ в реальном времени, что особенно важно для интерактивных приложений и быстрого создания мультимедийного контента.
Помимо высокой скорости, новая модель требует существенно меньше вычислительных ресурсов, что решает одну из ключевых проблем, с которой сталкиваются современные приложения ИИ — их высокая энергозатратность и необходимость в мощных вычислительных системах. В условиях стремительного роста применения ИИ это становится всё более актуальным.
Лу и Сонг уже провели сравнительный анализ своей модели с другими, как с существующими на рынке, так и с теми, что находятся в стадии разработки. Их результаты показывают, что sCM не только превосходит текущие технологии по скорости, но и открывает возможности для новых применений генеративного ИИ, которые ранее считались недостижимыми из-за временных и ресурсных ограничений.
Таким образом, новая модель sCM от OpenAI обещает стать прорывом в области генерации видео и других мультимедийных данных, что, вероятно, изменит рынок технологий ИИ и ускорит развитие приложений, требующих быстрой и качественной генерации контента в режиме реального времени.