Что такое джиттер и почему USB ЦАП - это норма в современном ПК

Влияние DMA устройств на стабильность аудиопотока. Зачем нужен выделенный тактовый генератор для звуковой карты. Какие есть решения получить качественный звук на ПК аппаратно и при помощи софта. И почему с появлением беспроводных сетей аудио стало хуже.
30 мая 2025, пятница 09:36
ffynjy111 для раздела Блоги

Звук на ПК в 90-х был лучше или это просто ностальгия по давно ушедшему веселому времени?

Почему воспроизведение даже модного качественного Hi-Res трека или DSD оцифровки с винила на среднебюджетном компьютере приводит только к расстройству и поиску каких-то совсем казуистических решений софта, а аппаратная составляющая ускользает от внимания юзеров — неизвестно. Есть, конечно, некоторая часть опытных пользователей, курящих в сторонке с внешним USB-асинхронным ЦАПом и смеющихся над остальными детьми, истерически кидающимися в аудиофильной песочнице звуковыми познаниями друг в дружку.

Да и производители материнских плат не пытаются просвещать обычных людей качественным аудио, видимо, стандартизация, упрощение и дешевизна в кризисных условиях последних лет, как и постковидная экономика, не предполагают инноваций, а джиттер почему-то считается не особо заметным. Джиттер — это случайные (стохастические) отклонения временного интервала между отсчётами (выборками) сигнала при его воспроизведении. То есть одна и та же частота дискретизации (например, 192 кГц) фактически реализуется с микроотклонениями во времени между выборками.

Довольно много обсуждений в интернете, что на XP и Windows 7 звук, несмотря на менее качественные форматы треков, был лучше, чем сейчас на Win 10-11. С чем это связано, до сих пор идут дебаты — есть как сторонники версии ухудшения драйверов аудиодвижка, так и считающие, что современное железо (аппаратная составляющая) каким-то странным образом влияет на качество воспроизводимой музыки. Если у кого-то остались компы из 90-х, почему-то на них и правда звук приятнее.

Что ухудшает звук на ПК и почему?

Да сам звуковой чип Realtek не имеет собственного прецизионного PLL/VCXO тактового генератора и полагается исключительно на материнскую плату, т. к. имеет встроенные PLL-блоки, которые могут работать от входного кварца (обычно 24,576 МГц).

  • Встроенные звуковые карты Realtek (например, ALC892, ALC887, ALC1220) используют общий клок с материнской платой.

  • Зависимы от тактовой частоты шины, могут иметь джиттер до нескольких сотен наносекунд.

  • В некоторых случаях драйверы Realtek применяют сглаживание (интерполяцию), но это не устраняет сам джиттер, а маскирует его.

И это всё приводит бедных аудиофилов к депрессии и попытке исправить ситуацию покупкой на рынке самых дорогих наушников, в которых низкое качество звука ПК становится еще заметнее. И как итог — еще большее разочарование и уход в винил.

Конечно, при незначительных отклонениях человек почти никогда не замечает разницу. Особенно если устройство использует плавную интерполяцию, джиттер-коррекция есть в драйвере/ЦАП, нет частотных пиков в звуке (например, одновременное воспроизведение чистых тонов с фазовой чувствительностью).

Но не радуйтесь рано, у вас, скорее всего, бюджетный чип Realtek на недорогой материнской плате, поэтому написанное абзацем выше к вам не относится. А при отклонении частоты дискретизации более 100 нс будете наслаждаться приятным, слегка «грязным» звуком, ощущением расфокусировки, незаметным напряжением при прослушивании (особенно в высокочувствительных ушах) и снижением четкости атаки звуков.

Порог слышимости:

  • Джиттер менее 10 наносекунд — незаметен для большинства людей.

  • 50–100 наносекунд — может быть ощутим на высококлассной аппаратуре.

  • 1 микросекунды — может создавать слышимые искажения, особенно на транзиентах (щелчки, ударные, атака фортепиано и т. п.).

Но помимо искажений аудиосигнала чипом и посредственным тактовым генератором матплаты, сама операционная система и всё большее количество периферических устройств в современную эру, по сравнению с прошлым веком, вносят свои приятные сюрпризы, еще сильнее ухудшая звук и усиливая джиттер, а иногда и делая дрифт.

Drift (дрейф частоты) — систематическое, медленное отклонение частоты воспроизведения от номинальной (например, 192000 Гц реально воспроизводится как 191995 или 192005 Гц).

  • Непрецизионный клок. Большинство встроенных аудиочипов (вроде Realtek) используют обычные кварцевые генераторы с допуском 50–100 ppm (parts per million), что может давать отклонения в десятки герц на 44,1/48 кГц. 
  • Вмешательство ОС. В режимах WASAPI Shared или DirectSound Windows пересчитывает частоту и делает ресемплинг, подгоняя звук под «системный клок», который может немного плавать. Это и приводит к drift — особенно на длительных треках. 
  • Браузеры и мультимедиа-платформы. При воспроизведении звука через браузер или софт (например, в онлайн-плеерах, YouTube, Spotify) используется shared mode, и ОС подстраивает аудиопоток под текущую частоту устройства — это всегда риск дрейфа. 
  • Разница между «логической» и «физической» частотой. Даже если вы указали 44100 Гц в Foobar2000, ЦАП может фактически работать на 44101.3 Гц, и этого уже достаточно для накопления ошибки при воспроизведении долгого потока. Но даже это не главное, а так более нужно для звукорежиссеров, где рассинхронизация аудиопотока заставит вокалиста просто открывать рот на видео, без какого-то слышимого для зрителя эффекта.

Но даже это не главное, а так более нужно для звукорежиссеров, где рассинхронизация аудиопотока заставит вокалиста просто открывать рот на видео, без какого-то слышимого для зрителя эффекта.

Гораздо более важнее то, что все аудиопотоки используют DMA. Direct Memory Access — это механизм, при котором устройства (например, звуковая карта) напрямую обмениваются данными с оперативной памятью, минуя CPU, для уменьшения задержек и повышения производительности. Он не выделен физически, но постоянно работает в фоновом режиме, передавая данные между RAM и устройствами без участия CPU. DMA — ключевая часть архитектуры современных ПК. Просто, чтобы было понятно, почему на сегодняшнем ПК, в отличие от древних из 90-х, аудиопотоку не так просто жить в системе, напомним устройства, использующие этот механизм.

1. Сетевые карты (Ethernet/Wi-Fi)

  • Постоянно обмениваются данными с памятью при передаче пакетов.

  • При высоком трафике (например, потоковое видео, онлайн-игры) могут занять канал DMA или генерировать прерывания, конкурируя со звуком.

  • Особенно чувствительно при Wi-Fi адаптерах через USB или старые Realtek-чипы.

2. Дисковая подсистема (SSD, HDD)

  • При активной загрузке данных (например, скачивание файлов, фоновые обновления Windows, антивирусное сканирование) SSD активно использует DMA-контроллер.

  • Если используется SATA/AHCI, возможны конфликты с аудио, особенно если устройства подключены к одним и тем же линиям PCIe/чипсета.

3. Графическая карта (GPU)

  • Современные видеокарты используют DMA для текстур, буферов и видеопотока.

  • При работе с видео (YouTube, стриминг, игры) может нагружать системную шину и память, вызывая задержки в аудиотракте.

  • Особенно критично в системах без дискретного ЦАП (когда звук идёт через HDMI на видеокарте).

4. USB-контроллеры и USB-устройства

  • Любые USB-звуковые карты, флешки, камеры и даже клавиатуры могут инициировать DMA.

  • Проблемы чаще всего возникают при:

    • Звуковом устройстве и Wi-Fi адаптере на одном USB-контроллере.

    • Использовании дешевых USB-хабов.

5. ACPI / Таймеры / Управление питанием

  • Системные службы управления питанием могут инициировать прерывания или изменять частоту CPU, что влияет на обработку звука.

  • Непредсказуемые DPC-задержки (Deferred Procedure Call) могут вызвать переполнение или недогруз FIFO в звуковом устройстве.

6. Антивирусные программы и защитники

  • Реального DMA они не используют, но интенсивно читают с диска и сетевых потоков, что может вызвать конкуренцию за ресурсы (и повышенные DPC-задержки).

  • Особенно часто вызывают дропы при сканировании исполняемых файлов в момент запуска приложений.

7. Bluetooth-адаптеры

  • Bluetooth-аудио и устройства управления используют и DMA, и прерывания.

  • Часто работают через тот же USB-контроллер, что и другие устройства, вызывая конфликты при активной передаче.

Всё это приводит к еще большему увеличению джиттера, искажению тайминга. Звук может вообще «отвалиться» (например, при резком скачке трафика), не говоря уже о его очень качественном аудиофильном звучании. И всё это на совсем недешевых системах, когда их по факту уделывают допотопные ПК из 90-х с обычной дискретной PCI звуковой картой. Зато теперь есть Wi-Fi 6 и Bluetooth 7.

 Может, и по этим причинам производители не спешат ставить качественные аудиочипы на бюджетные матплаты. Необходимо же и собственный тактовый генератор нормальный установить, и экранирование звукового тракта от неслабых помех, качественные DMA-контроллеры и системную шину, максимально стабильную. И если при использовании беспроводных устройств незначительные отклонения сигнала легко компенсируются буферизацией (рывки пинга 5–10 мс в Counter-Strike считаются прекрасными, чтобы всех похэдшотить; и никто же не кричит, чтобы они не превышали 5–10 нс), то ставить все эти компоненты, чтобы уменьшить какой-то там джиттер для пары аудиофилов, это какое-то недоразумение в мире жесткой дарвиновской конкуренции. А остальные юзеры своими ПК и так будут пользоваться; главное — пару красивых скинов на медиаплеере установить и не обращать внимания на вечное нытье аудиофилов.

И вот хочется особо упомянуть защитников встроенной передискретизации в Windows Audio Engine. Sample rate mismatch (рассогласование частот) — ситуация, когда файл записан с одной частотой дискретизации, а воспроизводится с другой (например, файл 192 кГц играет через устройство, настроенное на 96 кГц).

Большинство Realtek-карт не поддерживают «истинную» обработку всех частот в железе — пересчёт осуществляется в драйвере (или в Windows — AudioResamplerDMO или Media Foundation Resampler). Поток адаптируется к тактовому генератору звуковой карты — но системный «клок» и аудиоклок не всегда точно синхронизированы.

  1. Тактовые генераторы (клоки) разных устройств — видеокарты, звуковой карты, процессора — независимы.

  2. Windows использует системный таймер (QueryPerformanceCounter или Timer API), который может отличаться от того, по которому работает ЦАП звуковой карты.

  3. В режиме Shared и DirectSound нет строгой привязки к «мастер-клоку» звукового устройства — ОС подгоняет данные в зависимости от загрузки системы, поэтому возможны микросдвиги по времени.

И всё это происходит на не совсем высокоточном тактовом генераторе вашей бюджетной материнской платы.

Поэтому или используйте монопольный режим при прослушивании — WASAPI exclusive mode, Foobar2000 с ASIO4ALL, или наслаждайтесь при передискретизации, помимо дрифта в shared-режиме, небольшими, но субъективно ощущаемыми потерями ритма, тайминга, в придачу еще и к джиттеру.

В Foobar2000 с ASIO4ALL по умолчанию не включен режим WaveRT из-за его нестабильности, что во многом вызвано конкуренцией за DMA-каналы. WaveRT (Wave Real-Time) — это один из режимов работы звукового драйвера в Windows (начиная с Vista), который представляет собой низкоуровневый интерфейс для передачи аудиоданных между приложением и звуковым драйвером с минимальной задержкой и без лишнего копирования данных.

Он был разработан Microsoft как замена устаревшим моделям WaveOut и DirectSound. Уменьшенное вмешательство ОС и API означает, что звук менее подвержен изменению, пересемплированию, «внезапным» пересинхронизациям — это снижает искажения, которые могут субъективно восприниматься как «джиттер». Нестабильная работа WaveRT, как правило, была вызвана или использованием медленных HDD с файлом подкачки, или постоянным изменением размера pagefile, когда пользователь не задает постоянный объем, а устанавливает флажок — по выбору системы или диапазон вручную. Также возможны проблемы, когда файл подкачки установлен на системном или используемом для хранения музыки диске.

В остальных случаях WaveRT позволяет практически максимально улучшить звук на ПК. Активируется event-driven режим — аудио-драйвер будет подавать сигналы о необходимости загрузки новых данных (по событию — event), а не по постоянному опросу (polling). Это может снизить нагрузку на процессор и уменьшить джиттер.

В системе Windows этот режим, кроме ASIO4ALL, также применим к драйверам WASAPI (в режиме exclusive-event). В Foobar2000 x64 нет доступного компонента для установки WASAPI exclusive mode (монопольный режим), придется пользоваться ASIO4ALL. Или ставить Foobar2000 x86 версию и скачать и установить компонент WASAPI.fb2k-component, который доступен только в 32bit.

Если же вы хотите абсолютно низкий джиттер и устранить искажающее влияние современного ПК на музыку (частоту дискретизации), то лучшее решение:

  • Использовать внешний ЦАП (USB или SPDIF) с внутренним независимым тактовым генератором.

  • Примеры:

    • Topping E30/E50 (на XMOS + Crystek)

    • SMSL DO100, SU-9

    • RME ADI-2 DAC FS (профессиональный уровень)

То есть в следующий раз, собирая компьютер за n кол-во рублей, сразу плюсуйте к сумме цену внешнего ЦАПа, как по сути такого же необходимого компонента системы, как SSD, NVMe, или сидите как мамонт с HDD и своим встроенным Realtek.

Можно, конечно, попытаться найти материнскую плату с выделенным аудиоклоком, чтобы не переплачивать за ЦАП, но для этого придется погрузиться в дебри техдокументации, потому что в описании на агрегаторе или даже на сайте производителя материнской платы такие мелкие проблемы, как наличие отдельного тактового генератора для звукового устройства, в большинстве случаев не указаны. Да и DSD далеко не всегда поддерживают даже хорошие чипы Realtek, в отличие от самых бюджетных USB ЦАПов.

Как понять, есть ли хороший генератор на плате?

  1. По документации/маркетингу:

    • Упоминание «dedicated audio clock» или «low-jitter clock generator».

    • Название TXC, SiTime, NDK, Crystek — хорошие производители клоков.

  2. По фото материнской платы:

    • Маленький металлический прямоугольник рядом с аудио-чипом — возможно, генератор.

  3. Реальные тесты (например, на TechPowerUp, AudioScienceReview):

    • Измеряют уровень джиттера, шумов, THD+N.

И если вы собрались записать свой очередной гениальный музыкальный цифровой трек, с которым аналогово-виниловые исполнители никогда не смогут конкурировать, попробуйте субъективно на слух или объективно, с помощью измерительного софта, оценить, насколько ЦАПы микшера, ПК, инструмента соответствуют заявленным производителем паспортным параметрам, или, может, давно стоило уже обновить себе инвентарь.

P.S. Напоследок тем, кто дочитал до конца, всё-таки ностальгия о славных 90-х беспокоит вас не просто так — в те времена, в отличие от нынешнего безумства, те же Creative Labs Sound Blaster AWE32 (CT3900), 16 ASP (CT1740) еще на ISA, или Ensoniq AudioPCI имели собственные тактовые генераторы, как и большинство звуковых дискретных карт того поколения.

 А потом появился RealTek и компы в бухгалтерию...