Звук на ПК в 90-х был лучше или это просто ностальгия по давно ушедшему веселому времени?
Почему воспроизведение даже модного качественного Hi-Res трека или DSD оцифровки с винила на среднебюджетном компьютере приводит только к расстройству и поиску каких-то совсем казуистических решений софта, а аппаратная составляющая ускользает от внимания юзеров — неизвестно. Есть, конечно, некоторая часть опытных пользователей, курящих в сторонке с внешним USB-асинхронным ЦАПом и смеющихся над остальными детьми, истерически кидающимися в аудиофильной песочнице звуковыми познаниями друг в дружку.
Да и производители материнских плат не пытаются просвещать обычных людей качественным аудио, видимо, стандартизация, упрощение и дешевизна в кризисных условиях последних лет, как и постковидная экономика, не предполагают инноваций, а джиттер почему-то считается не особо заметным. Джиттер — это случайные (стохастические) отклонения временного интервала между отсчётами (выборками) сигнала при его воспроизведении. То есть одна и та же частота дискретизации (например, 192 кГц) фактически реализуется с микроотклонениями во времени между выборками.
Довольно много обсуждений в интернете, что на XP и Windows 7 звук, несмотря на менее качественные форматы треков, был лучше, чем сейчас на Win 10-11. С чем это связано, до сих пор идут дебаты — есть как сторонники версии ухудшения драйверов аудиодвижка, так и считающие, что современное железо (аппаратная составляющая) каким-то странным образом влияет на качество воспроизводимой музыки. Если у кого-то остались компы из 90-х, почему-то на них и правда звук приятнее.
Что ухудшает звук на ПК и почему?
Да сам звуковой чип Realtek не имеет собственного прецизионного PLL/VCXO тактового генератора и полагается исключительно на материнскую плату, т. к. имеет встроенные PLL-блоки, которые могут работать от входного кварца (обычно 24,576 МГц).
Встроенные звуковые карты Realtek (например, ALC892, ALC887, ALC1220) используют общий клок с материнской платой.
Зависимы от тактовой частоты шины, могут иметь джиттер до нескольких сотен наносекунд.
В некоторых случаях драйверы Realtek применяют сглаживание (интерполяцию), но это не устраняет сам джиттер, а маскирует его.
И это всё приводит бедных аудиофилов к депрессии и попытке исправить ситуацию покупкой на рынке самых дорогих наушников, в которых низкое качество звука ПК становится еще заметнее. И как итог — еще большее разочарование и уход в винил.
Конечно, при незначительных отклонениях человек почти никогда не замечает разницу. Особенно если устройство использует плавную интерполяцию, джиттер-коррекция есть в драйвере/ЦАП, нет частотных пиков в звуке (например, одновременное воспроизведение чистых тонов с фазовой чувствительностью).
Но не радуйтесь рано, у вас, скорее всего, бюджетный чип Realtek на недорогой материнской плате, поэтому написанное абзацем выше к вам не относится. А при отклонении частоты дискретизации более 100 нс будете наслаждаться приятным, слегка «грязным» звуком, ощущением расфокусировки, незаметным напряжением при прослушивании (особенно в высокочувствительных ушах) и снижением четкости атаки звуков.
Порог слышимости:
Джиттер менее 10 наносекунд — незаметен для большинства людей.
50–100 наносекунд — может быть ощутим на высококлассной аппаратуре.
1 микросекунды — может создавать слышимые искажения, особенно на транзиентах (щелчки, ударные, атака фортепиано и т. п.).
Но помимо искажений аудиосигнала чипом и посредственным тактовым генератором матплаты, сама операционная система и всё большее количество периферических устройств в современную эру, по сравнению с прошлым веком, вносят свои приятные сюрпризы, еще сильнее ухудшая звук и усиливая джиттер, а иногда и делая дрифт.
Drift (дрейф частоты) — систематическое, медленное отклонение частоты воспроизведения от номинальной (например, 192000 Гц реально воспроизводится как 191995 или 192005 Гц).
Но даже это не главное, а так более нужно для звукорежиссеров, где рассинхронизация аудиопотока заставит вокалиста просто открывать рот на видео, без какого-то слышимого для зрителя эффекта.
Гораздо более важнее то, что все аудиопотоки используют DMA. Direct Memory Access — это механизм, при котором устройства (например, звуковая карта) напрямую обмениваются данными с оперативной памятью, минуя CPU, для уменьшения задержек и повышения производительности. Он не выделен физически, но постоянно работает в фоновом режиме, передавая данные между RAM и устройствами без участия CPU. DMA — ключевая часть архитектуры современных ПК. Просто, чтобы было понятно, почему на сегодняшнем ПК, в отличие от древних из 90-х, аудиопотоку не так просто жить в системе, напомним устройства, использующие этот механизм.
1. Сетевые карты (Ethernet/Wi-Fi)
Постоянно обмениваются данными с памятью при передаче пакетов.
При высоком трафике (например, потоковое видео, онлайн-игры) могут занять канал DMA или генерировать прерывания, конкурируя со звуком.
Особенно чувствительно при Wi-Fi адаптерах через USB или старые Realtek-чипы.
2. Дисковая подсистема (SSD, HDD)
При активной загрузке данных (например, скачивание файлов, фоновые обновления Windows, антивирусное сканирование) SSD активно использует DMA-контроллер.
Если используется SATA/AHCI, возможны конфликты с аудио, особенно если устройства подключены к одним и тем же линиям PCIe/чипсета.
3. Графическая карта (GPU)
Современные видеокарты используют DMA для текстур, буферов и видеопотока.
При работе с видео (YouTube, стриминг, игры) может нагружать системную шину и память, вызывая задержки в аудиотракте.
Особенно критично в системах без дискретного ЦАП (когда звук идёт через HDMI на видеокарте).
4. USB-контроллеры и USB-устройства
Любые USB-звуковые карты, флешки, камеры и даже клавиатуры могут инициировать DMA.
Проблемы чаще всего возникают при:
Звуковом устройстве и Wi-Fi адаптере на одном USB-контроллере.
Использовании дешевых USB-хабов.
5. ACPI / Таймеры / Управление питанием
Системные службы управления питанием могут инициировать прерывания или изменять частоту CPU, что влияет на обработку звука.
Непредсказуемые DPC-задержки (Deferred Procedure Call) могут вызвать переполнение или недогруз FIFO в звуковом устройстве.
6. Антивирусные программы и защитники
Реального DMA они не используют, но интенсивно читают с диска и сетевых потоков, что может вызвать конкуренцию за ресурсы (и повышенные DPC-задержки).
Особенно часто вызывают дропы при сканировании исполняемых файлов в момент запуска приложений.
7. Bluetooth-адаптеры
Bluetooth-аудио и устройства управления используют и DMA, и прерывания.
Часто работают через тот же USB-контроллер, что и другие устройства, вызывая конфликты при активной передаче.
Всё это приводит к еще большему увеличению джиттера, искажению тайминга. Звук может вообще «отвалиться» (например, при резком скачке трафика), не говоря уже о его очень качественном аудиофильном звучании. И всё это на совсем недешевых системах, когда их по факту уделывают допотопные ПК из 90-х с обычной дискретной PCI звуковой картой. Зато теперь есть Wi-Fi 6 и Bluetooth 7.
Может, и по этим причинам производители не спешат ставить качественные аудиочипы на бюджетные матплаты. Необходимо же и собственный тактовый генератор нормальный установить, и экранирование звукового тракта от неслабых помех, качественные DMA-контроллеры и системную шину, максимально стабильную. И если при использовании беспроводных устройств незначительные отклонения сигнала легко компенсируются буферизацией (рывки пинга 5–10 мс в Counter-Strike считаются прекрасными, чтобы всех похэдшотить; и никто же не кричит, чтобы они не превышали 5–10 нс), то ставить все эти компоненты, чтобы уменьшить какой-то там джиттер для пары аудиофилов, это какое-то недоразумение в мире жесткой дарвиновской конкуренции. А остальные юзеры своими ПК и так будут пользоваться; главное — пару красивых скинов на медиаплеере установить и не обращать внимания на вечное нытье аудиофилов.
И вот хочется особо упомянуть защитников встроенной передискретизации в Windows Audio Engine. Sample rate mismatch (рассогласование частот) — ситуация, когда файл записан с одной частотой дискретизации, а воспроизводится с другой (например, файл 192 кГц играет через устройство, настроенное на 96 кГц).
Большинство Realtek-карт не поддерживают «истинную» обработку всех частот в железе — пересчёт осуществляется в драйвере (или в Windows — AudioResamplerDMO или Media Foundation Resampler). Поток адаптируется к тактовому генератору звуковой карты — но системный «клок» и аудиоклок не всегда точно синхронизированы.
Тактовые генераторы (клоки) разных устройств — видеокарты, звуковой карты, процессора — независимы.
Windows использует системный таймер (QueryPerformanceCounter или Timer API), который может отличаться от того, по которому работает ЦАП звуковой карты.
В режиме Shared и DirectSound нет строгой привязки к «мастер-клоку» звукового устройства — ОС подгоняет данные в зависимости от загрузки системы, поэтому возможны микросдвиги по времени.
И всё это происходит на не совсем высокоточном тактовом генераторе вашей бюджетной материнской платы.
Поэтому или используйте монопольный режим при прослушивании — WASAPI exclusive mode, Foobar2000 с ASIO4ALL, или наслаждайтесь при передискретизации, помимо дрифта в shared-режиме, небольшими, но субъективно ощущаемыми потерями ритма, тайминга, в придачу еще и к джиттеру.
В Foobar2000 с ASIO4ALL по умолчанию не включен режим WaveRT из-за его нестабильности, что во многом вызвано конкуренцией за DMA-каналы. WaveRT (Wave Real-Time) — это один из режимов работы звукового драйвера в Windows (начиная с Vista), который представляет собой низкоуровневый интерфейс для передачи аудиоданных между приложением и звуковым драйвером с минимальной задержкой и без лишнего копирования данных.
Он был разработан Microsoft как замена устаревшим моделям WaveOut и DirectSound. Уменьшенное вмешательство ОС и API означает, что звук менее подвержен изменению, пересемплированию, «внезапным» пересинхронизациям — это снижает искажения, которые могут субъективно восприниматься как «джиттер». Нестабильная работа WaveRT, как правило, была вызвана или использованием медленных HDD с файлом подкачки, или постоянным изменением размера pagefile, когда пользователь не задает постоянный объем, а устанавливает флажок — по выбору системы или диапазон вручную. Также возможны проблемы, когда файл подкачки установлен на системном или используемом для хранения музыки диске.
В остальных случаях WaveRT позволяет практически максимально улучшить звук на ПК. Активируется event-driven режим — аудио-драйвер будет подавать сигналы о необходимости загрузки новых данных (по событию — event), а не по постоянному опросу (polling). Это может снизить нагрузку на процессор и уменьшить джиттер.
В системе Windows этот режим, кроме ASIO4ALL, также применим к драйверам WASAPI (в режиме exclusive-event). В Foobar2000 x64 нет доступного компонента для установки WASAPI exclusive mode (монопольный режим), придется пользоваться ASIO4ALL. Или ставить Foobar2000 x86 версию и скачать и установить компонент WASAPI.fb2k-component, который доступен только в 32bit.
Если же вы хотите абсолютно низкий джиттер и устранить искажающее влияние современного ПК на музыку (частоту дискретизации), то лучшее решение:
Использовать внешний ЦАП (USB или SPDIF) с внутренним независимым тактовым генератором.
Примеры:
Topping E30/E50 (на XMOS + Crystek)
SMSL DO100, SU-9
RME ADI-2 DAC FS (профессиональный уровень)
То есть в следующий раз, собирая компьютер за n кол-во рублей, сразу плюсуйте к сумме цену внешнего ЦАПа, как по сути такого же необходимого компонента системы, как SSD, NVMe, или сидите как мамонт с HDD и своим встроенным Realtek.
Можно, конечно, попытаться найти материнскую плату с выделенным аудиоклоком, чтобы не переплачивать за ЦАП, но для этого придется погрузиться в дебри техдокументации, потому что в описании на агрегаторе или даже на сайте производителя материнской платы такие мелкие проблемы, как наличие отдельного тактового генератора для звукового устройства, в большинстве случаев не указаны. Да и DSD далеко не всегда поддерживают даже хорошие чипы Realtek, в отличие от самых бюджетных USB ЦАПов.
Как понять, есть ли хороший генератор на плате?
По документации/маркетингу:
Упоминание «dedicated audio clock» или «low-jitter clock generator».
Название TXC, SiTime, NDK, Crystek — хорошие производители клоков.
По фото материнской платы:
Маленький металлический прямоугольник рядом с аудио-чипом — возможно, генератор.
Реальные тесты (например, на TechPowerUp, AudioScienceReview):
Измеряют уровень джиттера, шумов, THD+N.
И если вы собрались записать свой очередной гениальный музыкальный цифровой трек, с которым аналогово-виниловые исполнители никогда не смогут конкурировать, попробуйте субъективно на слух или объективно, с помощью измерительного софта, оценить, насколько ЦАПы микшера, ПК, инструмента соответствуют заявленным производителем паспортным параметрам, или, может, давно стоило уже обновить себе инвентарь.
P.S. Напоследок тем, кто дочитал до конца, всё-таки ностальгия о славных 90-х беспокоит вас не просто так — в те времена, в отличие от нынешнего безумства, те же Creative Labs Sound Blaster AWE32 (CT3900), 16 ASP (CT1740) еще на ISA, или Ensoniq AudioPCI имели собственные тактовые генераторы, как и большинство звуковых дискретных карт того поколения.
А потом появился RealTek и компы в бухгалтерию...