Компания OpenAI представила инновационный инструмент под названием Voice Engine, позволяющий клонировать голос человека по короткому аудиосемплу продолжительностью всего 15 секунд. Эта технология способна генерировать естественно звучащий результат, охватывая палитру эмоциональных оттенков и подражая речевым особенностям оригинала.
Система Voice Engine, разработанная на базе предыдущей работы OpenAI в области преобразования текста в речь, внедрена в текущее API для чтения текста вслух. Проект получил широкую обратную связь и находится в стадии активного тестирования со стороны партнёрских организаций для исключения возможного злоупотребления и оценки потенциальных рисков.
Разработчики считают, что Voice Engine найдет своё применение в ряде направлений, например:
Тем не менее, OpenAI учитывает опасения, связанные с потенциальной злоупотреблением технологии клонирования голоса, особенно учитывая повышенный риск использования подобных инноваций для мошенничества и дезинформации. По этой причине компания внедрила строгие правила использования Voice Engine, которые включают обязательное информирование аудитории о том, что голос сгенерирован искусственно, и предупреждают о запрете на использование чужого голоса без согласия.
Как дополнение к проекту Voice Engine, OpenAI заявила о партнёрстве с Microsoft для создания суперкомпьютера, предназначенного для задач, связанных с искусственным интеллектом. Этот проект, получивший название «Звёздные врата», представляет собой значительное инвестиционное вложение обеих компаний.
В отношении стоимости, предварительная информация от OpenAI сигнализирует о том, что Voice Engine может стать доступным решением по сравнению с аналогами, предложив актуальное соотношение цена-качество на рынке синтезированных голосов. Точная дата выхода Voice Engine пока не определена.