
Компания Meta разработала новую нейронную сеть, способную сжимать аудиофайлы до минимальных размеров. По заявлениям сотрудников компании, полученные результаты гиперсжатия файлов подобного формата, оправдали все ожидания, так как являются лучшими в своем роде.
«Представьте, что вы слушаете аудиосообщение друга в зоне с низкой скоростью Интернета, которое не останавливается и не сбивается. Наше исследование показывает, каким образом мы можем достичь этого, используя искусственный интеллект», — отмечают исследователи Meta в своем блоге.
Созданная инженерами система обучена сжимать аудиофайлы до требуемого размера. После чего сжатый файл декодируется с применением новой нейросети. В результате удается получить 10-кратный уровень сжатия, по сравнению с обычным MP3. При этом, качество звука остается практически неизменным.

Кроме того, исследователи компании выпустили научную статью с подробным описанием проекта. В ней описаны все технические составляющие и сама архитектура EnCodec. Также документ содержит информацию о возможном улучшении EnCodec, которое позволит уменьшать файлы еще на 40% без потери качества.
Код проекта находится в свободном доступе, при желании с ним можно ознакомится по ссылке.

