Из Аналога в Цифру и обратно: немного теории …

Сегодня практически 99% звукозаписывающей, звуковоспроизводящей студийной аппаратуры и музыкальных синтезаторов это цифровые устройства. Все знают, что даже обычный домашний проигрыватель компакт дисков использует цифро-аналоговый преобразователь, а музыка на CD записана 16-битными числами. Однако как исходный звуковой и музыкальный материал (голос, классические музыкальные инструменты, электрогитары и т.д.), так и звук на выходе вашего музыкального центра это аналоговые, а не цифровые сигналы. Таким образом, для современной индустрии звукозаписи ключевым моментом является преобразование аналоговых сигналов в цифровые и обратное преобразование цифровых данных в аналоговые звуковые сигналы. Давайте попробуем разобраться, как же осуществляются эти преобразования. Аналоговый сигнал представляет собой непрерывный во времени и по амплитуде процесс, а его цифровое представление есть последовательность или ряд чисел, состоящих из конечного числа бит. Преобразование аналогового сигнала в цифровой состоит из двух этапов: дискретизации по времени и квантовании по амплитуде. Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов, взятых через равные промежутки времени. Например, когда мы говорим, что частота дискретизации 44,1 Кгц, то это значит, что сигнал измеряется 44100 раз в течение секунды. Основной вопрос на первом этапе преобразования аналогового сигнала в цифровой (оцифровки) состоит в выборе частоты дискретизации аналогового процесса. Ответ на него дает известная теорема Найквиста, утверждающая, что для того, чтобы аналоговый (непрерывный по времени) сигнал, занимающий полосу частот от 0 Гц до F Гц, можно было абсолютно точно восстановить по его отсчетам, частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты F. Таким образом, если реальный аналоговый сигнал, который мы собираемся преобразовать в цифровую форму, содержит частотные компоненты от 0 Гц до 20 Кгц, то частота дискретизации такого сигнала должна быть не меньше, чем 40 Кгц. Рассмотрим более подробно, что происходит с аналоговым сигналом и его спектром при его дискретизации.

Дискретизированный аналоговый сигнал показан на Рис. 2.

Рис. 2 Дискретизированный сигнал.

В процессе дискретизации частотный спектр значительно изменяется. Исходный аналоговый сигнал имеет обычно спектр, сосредоточенный в основном в полосе частот от 20 Гц до, примерно, 20 Кгц, так как обычные звукосниматели и микрофоны, с которых он берется, имеют примерно такую частотную характеристику. Кроме того, обычно в сигнале содержатся помехи с частотами до нескольких сот килогерц. Это различные трудно устранимые "наводки" от компьютерной техники, промышленных и электробытовых приборов, трамваев, троллейбусов и т.д. После дискретизации сигнал представляет собой последовательный временной ряд очень узких импульсов с разной амплитудой и с очень широким спектром до нескольких мегагерц (математический факт - чем уже импульс, тем шире его спектр). Поэтому и в целом спектр такой последовательности импульсов расширяется до тех же нескольких мегагерц. Таким образом, спектр дискретизированного сигнала значительно шире спектра исходного аналогового сигнала. Давайте более подробно рассмотрим, как формируется этот новый широкий спектр. Существуют два важных процесса. Во-первых, "свёртка" всего первоначального спектра аналогового сигнала простирающегося от, примерно, 20 Гц до нескольких сот килогерц внутрь полосы частот от 0 Гц до половины частоты дискретизации. Этот процесс показан на Рис. 3.

Рис. 3. Процесс "свертки" спектра внутрь частотного диапазона 0 Гц .. 20 Кгц.

 

 "Свёртка" означает, что все составляющие исходного аналогового сигнала, с частотами выше половины частоты дискретизации (а это в основном неслышимые помехи) попадают в слышимый человеческим ухом диапазон частот от 20 Гц до "Половины частоты дискретизации" Гц, т.е. неслышимые помехи становятся слышимыми и таким образом может резко ухудшится отношение сигнал/шум. Всё это выглядит весьма непривычно, если не сказать, что вообще противоречит здравому смыслу! Получается, что происходит дискретизация высокочастотных сигналов с частотными составляющими, лежащими значительно выше не только половины частоты дискретизации, но и самой частоты дискретизации. На первый взгляд это даже противоречит упомянутой выше Теореме Найквиста. Но давайте посмотрим на Рис. 4. На нём показан процесс дискретизации высокочастотного синусоидального сигнала на более чем в два раза более низкой, чем у него частоте дискретизации.

Рис. 4. Дискретизация высокочастотной синусоидальной помехи.

На Рис. 4 хорошо видно, что период колебаний высокочастотной помехи более чем в два раза меньше чем период дискретизации. А период связан с частотой соотношением Частота = 1 / Период. Следовательно, действительно частота помехи больше частоты дискретизации. Однако хорошо видно, что дискретные отсчёты (толстые чёрные столбики) высокочастотной помехи полностью совпадают с дискретными отсчётами некоторого низкочастотного сигнала (тонкая плавная кривая на Рис. 4). Получается, что, несмотря на то, что мы дискретизировали очень высокочастотный сигнал после дискретизации мы получили низкочастотный сигнал. Это и есть эффект свёртки высокочастотных помех вовнутрь частотного диапазона от 0 Гц до половины частоты дискретизации. Второе изменение спектра заключается в его расширении. Этот факт уже не противоречит здравому смыслу и вполне очевиден. Как было уже сказано, относительно низкочастотный исходный аналоговый сигнал в процессе дискретизации преобразуется в последовательность очень узких импульсов. Узкие импульсы имеют широкий спектр и, естественно, вся последовательность будет иметь широкий спектр. Так как весь исходный спектр свернулся в полосу частот от 0 Гц до половины частоты дискретизации, то логично и естественно, что расширение спектра происходит дублированием спектра из полосы от 0 Гц до половины частоты дискретизации на ширину спектра узкого импульса дискретов. (Напомню, что у очень узких импульсов дискретов спектр широкий, до нескольких мегагерц). То есть окончательно спектр дискретизированного сигнала есть несколько десятков сдвинутых по частоте копий спектров, полученных в результате свёртки спектра исходного аналогового сигнала внутрь полосы частот от 0 Гц до половины частоты дискретизации.

Итак, реальные аналоговые сигналы часто содержат высокочастотные составляющие, "плохо" оцифровывающиеся на стандартных частотах 44,1 Кгц или 48 Кгц. Можно использовать и более высокую частоту дискретизации, но пропорционально увеличению частоты возрастет:

А) интенсивность потока цифровых данных, а возможности каналов S/PDIF, шин IDE или SCSI не безграничны, особенно если записывается или воспроизводится несколько каналов одновременно.

Б) вычислительная нагрузка на цифровые процессоры эффектов, как-то: ревербератор, хорус, флэнжер и т. д. А их вычислительные возможности также не безграничны.

В) объем памяти, необходимой для хранения цифрового сигнала.

Поэтому перед дискретизацией необходима аналоговая фильтрация, представляющая собой довольно сложную задачу. Аналоговые фильтры не могут пропустить, скажем, все частоты от 0 Гц до 24 Кгц и подавить все частоты выше 24 Кгц. Аналоговый фильтр низких частот начинает подавлять высокие частоты, начиная с некоторой частоты, называемой частотой среза. Подавление плавно усиливается с ростом частоты. Поэтому, что бы добиться отсутствия частот выше 24 Кгц необходимо устанавливать частоту среза фильтра примерно на 16..20 Кгц, а это уже плохо, так как будут ослаблены "полезные" частоты в слышимом человеческим ухом диапазоне 16..20 Кгц. Кроме того, еще одна неприятность состоит в том, что чем уже мы пытаемся сделать переходную область между полосой пропускания и полосой подавления, тем сильнее вносимые фазовые искажения, длиннее переходный процесс (фильтр начинает “звенеть”) и тем сложнее и капризнее в настройке такой аналоговый фильтр. В современных АЦП эта проблема решается методом дискретизации на повышенной частоте (oversampling). По этому методу диапазон частот входного аналогового сигнала ограничивается с помощью сравнительно несложного аналогового фильтра. Причем частота среза фильтра выбирается значительно выше полезной высшей частоты, а переходная полоса фильтра делается достаточно широкой. Таким образом, исключаются и завал “полезных” высших частот, и фазовые искажения, характерные для аналоговых фильтров с узкой переходной полосой. Далее, отфильтрованный, с ограниченным по частоте спектром, сигнал дискретизируется на достаточно высокой частоте, исключающей наложение и искажение спектра (алиазинг). Затем дискретные отсчеты сигнала преобразуются в последовательность чисел с помощью АЦП. После этого мы имеем поток цифровых данных, представляющих аналоговый сигнал, включая как полезные, так и нежелательные высокочастотные компоненты и помехи. Эти цифровые данные пропускаются через цифровой фильтр с очень узкой переходной полосой и очень большим подавлением нежелательных высокочастотных компонент.

Сегодня расчет и создание таких цифровых фильтров, к тому же не вносящих никаких фазовых искажений, не представляет больших трудностей. После цифрового фильтра получается цифровое представление сигнала, имеющего спектр, правильно ограниченный по частоте. Применяя к такому сигналу теорему Найквиста, мы можем резко понизить частоту его дискретизации до удвоенной величины наивысшей полезной частотной составляющей, чего мы и хотели добиться. Надо отметить, что часто цифровые фильтры находятся в том же корпусе (микросхеме), что и другие узлы АЦП, так что пользователь может не подозревать, какие сложные процессы происходят в АЦП!

Рис. 6 Дискретизация сигнала с оверсэмплингом.

Применяется дискретизация на повышенной частоте (oversampling) и в цифро-аналоговых преобразователях (ЦАП). В ЦАП также есть проблема сложности аналоговых восстанавливающих (интерполирующих) фильтров. Ведь сразу после простейшего ЦАП сигнал представляет собой серию узких импульсов, имеющих многочисленные алиазинговые спектральные компоненты. На аналоговый фильтр в этом случае возлагается задача полностью пропустить сигнал нужного частотного диапазона (скажем 0..24 Кгц) и, по возможности, наиболее полно подавить ненужные высокочастотные компоненты. И, конечно, чисто аналоговому фильтру выполнить такие противоречивые требования очень сложно. Поэтому сначала цифровой сигнал интерполируют, т.е. вставляют дополнительные отсчеты, вычисленные по специальным алгоритмам и, тем самым, резко увеличивают частоту дискретизации. При этом исходный спектр полезного сигнала не искажается, но сигнал уже дискретизирован на значительно более высокой частоте. Это приводит к тому, что алиазинговые спектральные компоненты на выходе ЦАП далеко отстоят от частотных компонент основного сигнала и, соответственно, чтобы отфильтровать (подавить) их достаточно применить простой аналоговый фильтр.

Рассмотрим процесс реконструкции сигнала более подробно. При цифровом представлении в нашем распоряжении имеется информация о величине сигнала только в определенные моменты времени. Мы не имеем дополнительной информации о форме сигнала между отсчетами. Восстановление формы, (интерполяция) сигнала между отсчетами и является  задачей цифро-аналогового преобразования. Интерполяция в современных ЦАП может выполняться нелинейными и линейными (цифровая фильтрация) методами в сочетании с аналоговыми (антиалиазинговыми) фильтрами высоких частот. Простейшие нелинейные методы интерполяции вполне очевидны. Допустим, мы имеем несколько дискретных отсчетов синусоидального сигнала частотой 100 Гц взятых через 1/350 секунды (с частотой 350 гц), т.е. частота дискретизации в три с половиной раза больше частоты синусоиды. Конечно, такое соотношение частоты сигнала и его частоты дискретизации "лучше", чем теоретический предел 1:2, но будем усложнять задачу постепенно. Построим параболу через три последовательных отсчета. Вы видите на Рис. 7 высокое совпадение формы этой параболы и начальной формы синусоиды (соотношение частоты синусоиды и частоты дискретизации не имеет в данном случае принципиального значения, 1:3,5 или 1:4, или 1:3,75 это существенным образом на вид картинки не повлияет).

Рис. 7 Параболическая интерполяция сигнала

Таким образом, построив параболу через три последовательных дискрета синусоиды и найдя все коэффициенты ее уравнения a*x*x + b*x + c, где a,b,c-коэффициенты, x-время, мы можем вычислить значение сигнала в любой момент времени между дискретами и интерполировать (реконструировать) сигнал между отсчетам с весьма высокой точностью. Оставшиеся небольшие искажения формы восстановленного сигнала (в данном случае синусоиды) по сути, являются нелинейными искажениями. То есть реконструированный сигнал состоит из суммы истинной синусоиды и нескольких ее гармоник. Теперь очевидно, что уменьшить искажения формы восстановленного сигнала можно просто отфильтровав эти высокочастотные (2,3,…и т.д.) гармоники. Цифровые и аналоговые фильтры, применяемые для этих целей даже в дешевых ЦАП, позволяют подавить вторую гармонику на 80 и более децибел. Это обеспечивает окончательный уровень коэффициента нелинейных искажений формы реконструированного сигнала (точное математическое определение нелинейных искажений дано в моей статье о звуковых картах в КТ N 243) в районе 0.01..0.02%. А это уже почти уровень Hi-Fi. Чтобы получить аналогичные результаты для соотношения частоты сигнала и частоты дискретизации 1:3 нужно применять интерполяцию по четырем последовательным отсчетам гиперболой или использовать сплайны третьего порядка. Если задаться целью интерполировать сигналы, содержащие наивысшую частоту 20 Кгц при частоте дискретизации 44.1 Кгц, т.е. для соотношения частоты сигнала и частоты дискретизации примерно один к двум целым двум десятым (1: 2,2) при коэффициенте нелинейных искажений формы реконструированного сигнала не более 0.01%, то необходимо использовать кривые на основе полиномов 15..20 порядка. При современном уровне развития схемотехники цифровых сигнальных процессоров (DSP) это вполне возможно, но несколько дороговато (такие DSP стоят больше $40). Линейные методы восстановления формы сигналов по его дискретным отсчетам основаны на использовании цифровых фильтров с конечной (КИХ) и бесконечной импульсной реакцией. К сожалению, их работу невозможно объяснить столь же наглядно как в случае с нелинейной интерполяцией. Поэтому предлагаю людям, не имеющим высшего технического образования, довериться мне и воспринять все ниже сказанное как аксиому (особенно любознательных отсылаю к книге В. Каппелини "Цифровые фильтры и их применение", 1983г.). В исходную последовательность отсчетов сигнала между дискретами вставляются нулевые отсчеты. Новая полученная последовательность подается на интерполирующий цифровой фильтр. После него нулевые отсчеты "чудесным" образом превращаются в очень точно реконструированные отсчеты исходного сигнала. Далее для окончательного сглаживания и восстановления сигнал подается на простой аналоговый фильтр. Этот метод позволяет получить коэффициент нелинейных искажений формы реконструированного сигнала вплоть до 0.001% при соотношении высшей частотной составляющей сигнала и частоты дискретизации 1: 2,2 (для 20 Кгц и 44.1 Кгц). По методу цифровой фильтрации работают ЦАП, используемые в звуковых картах OPTi-931, Acer S23, AWE32/64, Turtle Beach Pinnacle, Crystal CS4232, Analog Devices AD1848, Monster Sound 3D и многих других.

Джиттер

Цифровые данные передаются посредством сигнала с прямоугольной формы. Джиттер это небольшие случайные изменения местоположения фронтов "прямоугольников" во времени. Это приводит к небольшим случайным изменениям скорости передачи цифровых данных. Например, если фронт имеет малую крутизну или "отстал" по времени, то цифровой сигнал как бы запаздывает. Физически цифровой джиттер по оказываемому влиянию на воспроизведение звука полностью аналогичен детонации, дрожанию скорости магнитной ленты в аналоговом магнитофоне из-за несовершенства механической части. Однако, вносимые цифровым джиттером искажения намного заметнее искажений звука, вносимых детонацией ленты аналогового магнитофона. Видимо, это связано с большей "мягкостью" и "плавностью" детонационных колебаний (можно сказать аналогового джиттера) скорости воспроизведения сигнала магнитофоном благодаря эластичности магнитной ленты.

Иногда джиттер возникает из-за фазовых шумов петли ФАПЧ (фазовой подстройки частоты) синхронизируемого внешним сигналом устройства. Проявляется на слух при прослушивании материала с записывающего устройства, синхронизируемого от воспроизводящего устройства. В современных цифровых системах звукозаписи и воспроизведения основным источником джиттера является АЦП. Современные студийные полностью цифровые синхронизаторы достаточно совершенны и часто вносят джиттер меньший, чем АЦП. Рассмотрим, как образуется джиттер в АЦП. Частота дискретизации АЦП обычно задается кварцевым генератором, а любой кварцевый генератор (особенно дешевый, низкокачественный) имеет ненулевые фазовые шумы. Таким образом, моменты времени получения отсчетов сигнала (дискретов) расположены на оси времени не совсем равномерно. Это приводит к размыванию спектра сигнала и ухудшению отношения сигнал/шум. Кроме того, на высокочастотных компонентах сигнала джиттер может привести к пульсации амплитуд. Для борьбы с этим явлением надо использовать высококачественные кварцевые генераторы с хорошо стабилизированными источниками питания, что на практике обычно означает попросту покупку более дорогого и высококачественного устройства АЦП. Читатели, уже использующие студии звукозаписи типа АЦП—IBM-PC—CD могут вообще не задумываться над этой проблемой. Для таких систем никакого дополнительного джиттера (не связанного с АЦП) вообще не существует. То есть, если вы оцифровываете сигнал с помощью цифровой звуковой платы и сохраняете его на жестком диске, затем делаете его обработку с помощью программных средств типа WaveLab, потом записываете на CD с помощью CD-рекордеров, подключенных по SCSI или IDE интерфейсу к вашему ПК, то никаких проблем с джиттером у вас никогда не будет. 

Квантование амплитуды аналогового сигнала, разрядность АЦП

Напомним, что преобразование аналогового сигнала в цифровой поток данных происходит в два этапа. Первый этап — это дискретизация сигнала на основе теоремы Найквиста с использованием oversampling. Второй этап — это квантование амплитуды дискретных отсчетов, полученных на первом этапе. Представим себе, что дискрет представляет собой некий столбик или полоску, наподобие той, что мы видим на студийном индикаторе уровня сигнала. Длина этой полоски и есть амплитуда сигнала в данном дискрете. Процесс квантования амплитуды тогда можно представить как измерение длины полоски с помощью линейки. Чем чаще идут метки на линейке, тем точнее мы можем измерить длину полоски (амплитуду) и тем меньше будут ошибки измерений (шумы квантования). Однако чем чаще расположены метки на линейке, тем больше бит нам потребуется для записи числа, соответствующего измеренной нами длине полоски (амплитуде сигнала в дискрете). Например, если на линейке 32 метки, то для представления длины полоски (амплитуды) в виде числа понадобится максимум 5 бит (32=25). В данном случае 5 бит и будет разрядностью АЦП. Таким образом, процесс квантования амплитуд дискретов фактически заключается в измерении их величин по отношению к некоторому опорному источнику напряжения (линейка в предыдущих объяснениях), обычно имеющемуся внутри корпуса микросхемы АЦП, и выражении этих величин в виде чисел, состоящих из конечного числа бит. Причем числа могут быть не только целые, например 16-, 18-, 20-, 24-битные, но и 24- или 32-битные с плавающей точкой или другой кодировкой (например, в кодах с исправлением ошибок), зависящей от конкретной реализации устройства АЦП. Довольно часто используется все же кодирование результатов измерения амплитуд дискретов в виде целых чисел. В обычном АЦП число бит на один дискрет (разрядность числа) выходного цифрового потока данных непосредственно с квантователя амплитуд дискретов и на выходе всего АЦП равны, так как числа с квантователя амплитуд поступают непосредственно на выход устройства. В случае входного аналогового сигнала в виде случайного процесса типа белого шума ошибки квантования независимы от него. Отношение сигнал/шум на выходе АЦП в этом случае (если все остальные элементы идеальны) будет 6*N дБ, где N есть число бит на один дискрет или разрядность чисел, сопоставляемых величинам амплитуд дискретов. Например, для 16-битного АЦП с частотой дискретизации 44,1 Кгц в идеальном случае шум квантования будет находиться на уровне -96 дБ и спектр шума квантования будет равномерен (постоянен) в диапазоне 0..22,05 Кгц. Если АЦП будет дискретизировать сигнал с большей частотой, то полная мощность шумов квантования останется неизменной, но его спектр будет шире (он будет простираться от 0 Гц до новой, большей частоты дискретизации, деленной на 2). Например, если частота дискретизации удваивается до 88,2 Кгц, то спектр шумов квантования будет простираться уже до 44,1 Кгц (вместо 22,05 Кгц). А наш полезный сигнал, конечно, будет иметь спектр (как и раньше) простирающийся от 0 Гц до 22,05 Кгц, т. е. спектр шума станет в два раза шире спектра сигнала при прежней мощности шума. Таким образом, мощность шумов квантования “внутри” спектра полезного сигнала упадет в два раза. Другими словами отношение сигнал/шум квантования в полосе 0 Гц - 22,05 Кгц улучшиться в два раза (на 3 дБ)! Теперь можно с помощью цифрового фильтра с большим ослаблением шума в полосе задержания и узкой переходной полосой (а сделать такой цифровой фильтр не представляет большого труда) отфильтровать (подавить) полосу от 22,05 до 44,1 Кгц, содержащую только шумы квантования и получить реально лучшее на 3 дБ отношение сигнал/шумы квантования. Этот процесс можно продолжать. В случае 4-кратного увеличения частоты дискретизации (4-кратный oversampling) произойдет улучшение сигнал/шум на 6 дБ. Судя по технической документации, на рынке можно встретить АЦП и со 128/256-кратным oversampling (+21..24 дБ к исходному отношению сигнал/шум). По этому же принципу, если мы будем использовать 15-битный квантователь на частоте дискретизации 44,1*4 Кгц мы получим такое же отношение сигнал/шум, как и для 16 битного квантователя и частоты дискретизации 44,1 Кгц. Так что в пределе если возьмем 1-битный (!) квантователь на частоте дискретизации 44,1*(4 в степени 15) Кгц, то получим такое же качество АЦП, как и для 16 битного квантователя на частоте дискретизации 44,1 Кгц. Далее, с помощью цифровых фильтров можно подавить все лишние частотные составляющие в полосе от 22,05 Кгц до 44,1*(4 в степени 15)/2 Кгц и далее в полном соответствии с теоремой Найквиста понизить частоту дискретизации до 44,1 Кгц (с одновременным увеличением разрядности данных). Таким образом, квантователь АЦП не обязательно должен иметь высокую разрядность для того, чтобы выходной поток цифровых данных АЦП имел таковую. Увеличение эффективной разрядности АЦП может быть достигнуто использованием метода оверсэмплинга и цифровой фильтрации. Применение метода оверсэмплинга при цифро-аналоговом преобразовании также дает выигрыш. Для каждого 2-х кратного увеличения частоты дискретизации входного потока, поступающего на ЦАП, разрядность чисел, представляющих амплитуду дискретов, может быть уменьшена на 1 бит без потери качества выходного аналогового сигнала, вплоть до получения однобитного ЦАП с качеством сигнала, например, 16-битного ЦАП.

ДИЗЕРИНГ

Реальные музыкальные сигналы далеки от белого шума. Из-за этого шумы квантования оказываются зависимыми от сигнала. Человеческое слуховое восприятие четко реагирует на это возникновением ощущения “грязного” звука. Особенно ярко этот эффект проявляется для 8-битных отсчетов сигнала. Другими словами, если обычный 16-битный сигнал уменьшится по громкости на 48 дБ (на 8 бит) от своего номинального уровня, то он станет “грязным” и непригодным для прослушивания. С этим, я думаю, согласятся все! Кто же сейчас будет слушать 8-битный звук?! То есть вместо отношения сигнал/шум 96 дБ для обычного 16-битного сигнала реальный динамический диапазон из-за эффекта зависимости шумов квантования от сигнала составляет всего 48 дБ! Чтобы запись в виде обычного (без дизеринга и нойс шейпинга) 16-битного сигнала звучала всегда чисто, необходимо, чтобы ее уровень не уменьшался до такой степени, чтобы фактически сигнал становился 8-битным. Ведь 8-битный звук ужасен! Получается, что перед записью на компакт диск исходный музыкальный материал должен быть компрессирован тем или иным способом с целью уменьшения его динамического диапазона и предотвращения “грязного” звучания на слишком маленьких уровнях громкости. Однако, сжатие динамического диапазона исходного музыкального материала, достигающего порой 100 и более дБ (например, для электрогитары), на 48 дБ и более без заметных на слух искажений представляется крайне сложной (если вообще выполнимой) задачей. А иногда и художественное содержание музыкального произведения требует чередования громких и очень тихих звуков и, следовательно, искусственное сжатие динамического диапазона неприемлемо. В таких случаях применяется дизеринг, позволяющий частично “обменять” эффект грязного звучания на незначительное увеличение высокочастотного шума. Метод дизеринга заключается в добавлении небольшого шумового (обычно высокочастотного) сигнала во входной сигнал АЦП или к цифровому сигналу в момент перехода от оцифрованного с разрядностью 20 и более бит исходного музыкального материала к 16-битному, предназначенному для записи на компакт диск. Это приводит к независимости шумов квантования и сигнала, однако общий уровень шумов немного возрастает. С сервера Интернет www.geocities.com/SiliconValley/Pines/7899 вы можете скачать WAV файл с примером звука до дизеринга и после или самостоятельно с помощью программы WaveLab 2.0 определить на слух применимость этого метода для вашего конкретного музыкального материала.

Нойс шейпинг

В результате процесса дискретизации и квантования (оцифровки или аналогово-цифрового преобразования) входного аналогового сигнала с применением дизеринга к сигналу добавляется шум квантования. Его спектр равномерен и простирается от 0 Гц и до половины частоты дискретизации. Равномерность по частоте и некоррелированность шума с сигналом достигается применением дизеринга и правилом квантования, при котором округление амплитуды в дискрете происходит к ближайшей опорной величине. Применение более сложных правил округления позволяет получить другие (неравномерные) спектральные характеристики шумов округления при сохранении полной мощности шумов неизменной. Учитывая, что человеческий слуховой аппарат имеет спад чувствительности на высоких частотах и на очень низких частотах, возможно, используя специальные правила округления при квантовании, получить спектр шумов округления большей частью сосредоточенный в области частот, которые наименее заметны на слух (выше 20 Кгц). Частота дискретизации для ЦАП с 256-кратным оверсэмплингом около 11,2 МГц, и, следовательно, мы имеем возможность “переместить” весь шум квантования в область частот, практически неслышимую человеческим ухом (от 20 Кгц до 5,6 МГц). Таким образом, можно значительно улучшить отношение сигнал/шум в диапазоне слышимых частот в цифровом сигнале, не увеличивая количество бит на один дискрет. Применение нойс шейпинга возможно и без перемещения шумов в полностью неслышимую высокочастотную область. Для этого при переходе от 20..24-битного исходного сигнала к 16-битному формируется спектр шумов квантования имеющий форму обратную кривой чувствительности слухового аппарата человека. То есть там, где наш слух наиболее чувствителен к шумам, будет минимум на кривой спектра мощности шумов и, наоборот, там, где наш слух менее чувствителен к шуму будет сосредоточен максимум шумов. Таким образом, особенно раздражающее слух шипение в области 3..4 Кгц становится более мягким и незаметным, а "грязь" при небольших уровнях сигнала становится менее очевидной.

Вообще же стоит относится критически к рекламным заявлениям фирм о колоссальном и драматическом улучшении звука после дизеринга, нойс шейпинга и т.д. Очевидно, что панацеи не существует и именно поэтому безработица инженерам по звуку пока не грозит.

Применение нойс шейпинга при создании музыкальных компакт дисков

Целесообразно звуковой материал оцифровать 20..24-битным АЦП на повышенной частоте дискретизации (скажем 64..96 Кгц, если ваш АЦП это позволяет). Затем произвести обработку полученного цифрового сигнала с помощью специального программного обеспечения (например, Deutsche Gramaphon's ABI или Sony's Super Bit Mapping, Waves), использующего компрессию, дизеринг и нойс шейпинг (и другие алгоритмы) для преобразования 20..24 битного цифрового потока данных в 16 битный цифровой поток для записи на СD. Таким образом, можно достичь субъективно лучшего отношения сигнал/шум на СD, хотя объективные измерения могут показать незначительное ухудшение этого параметра за счет увеличения мощности высокочастотных шумов.

Симаненков Дмитрий.

С комментариями и пожеланиями можно обращаться к автору по адресу e-mail: digital_sound@bigfoot.com

Хостинг от uCoz