Создание и обработка звука (Павлов)


Министерство образования и науки РФ
Федеральное государственное бюджетное
образовательное учреждение
«Рыбинский государственный авиационный технический университет имени П. А. Соловьева»









Р. В. Павлов
Создание и обработка звука

Пособие














Рыбинск 2015
СОДЕРЖАНИЕ
13 TOC \o "1-3" \h \z \u 1413 LINK \l "_Toc409517736" 14Введение 13 PAGEREF _Toc409517736 \h 1441515
13 LINK \l "_Toc409517737" 141. Основные свойства звука 13 PAGEREF _Toc409517737 \h 1441515
13 LINK \l "_Toc409517738" 142. Единицы измерения 13 PAGEREF _Toc409517738 \h 1461515
13 LINK \l "_Toc409517739" 143. Параметры звукового сигнала 13 PAGEREF _Toc409517739 \h 1481515
13 LINK \l "_Toc409517740" 144. Параметры звукового тракта 13 PAGEREF _Toc409517740 \h 1491515
13 LINK \l "_Toc409517741" 145. Методы синтеза звука 13 PAGEREF _Toc409517741 \h 14111515
13 LINK \l "_Toc409517742" 146. Обработка цифрового звука 13 PAGEREF _Toc409517742 \h 14151515
13 LINK \l "_Toc409517743" 146.1. Методы, используемые для обработки звука 13 PAGEREF _Toc409517743 \h 14161515
13 LINK \l "_Toc409517744" 146.2. Звуковые эффекты 13 PAGEREF _Toc409517744 \h 14171515
13 LINK \l "_Toc409517745" 147. Маскировка звука 13 PAGEREF _Toc409517745 \h 14201515
13 LINK \l "_Toc409517746" 148. Системы шумоподавления 13 PAGEREF _Toc409517746 \h 14211515
13 LINK \l "_Toc409517747" 148.1. Денойзеры 13 PAGEREF _Toc409517747 \h 14221515
13 LINK \l "_Toc409517748" 148.2. Программы-денойзеры 13 PAGEREF _Toc409517748 \h 14261515
13 LINK \l "_Toc409517749" 148.3. Компандерные системы шумопонижения 13 PAGEREF _Toc409517749 \h 14271515
13 LINK \l "_Toc409517750" 148.3.1. Элементарная система шумоподавления 13 PAGEREF _Toc409517750 \h 14281515
13 LINK \l "_Toc409517751" 148.3.2. Модуляция шума 13 PAGEREF _Toc409517751 \h 14301515
13 LINK \l "_Toc409517752" 148.3.3. Идеальная система шумоподавления 13 PAGEREF _Toc409517752 \h 14311515
13 LINK \l "_Toc409517753" 148.3.4. Проблема кратковременных выбросов 13 PAGEREF _Toc409517753 \h 14351515
13 LINK \l "_Toc409517754" 148.4. Компрессия и экспандирование стационарного сигнала 13 PAGEREF _Toc409517754 \h 14391515
13 LINK \l "_Toc409517755" 148.4.1. Передаточные кривые 13 PAGEREF _Toc409517755 \h 14391515
13 LINK \l "_Toc409517756" 148.4.2. Компрессия и экспандирование в условиях резкого изменения входного сигнала 13 PAGEREF _Toc409517756 \h 14461515
13 LINK \l "_Toc409517757" 148.4.3. Билинейные характеристики компрессора 13 PAGEREF _Toc409517757 \h 14501515
13 LINK \l "_Toc409517758" 148.5.Практическая реализация системы шумоподавления 13 PAGEREF _Toc409517758 \h 14521515
13 LINK \l "_Toc409517759" 148.5.1. Приборы с двумя маршрутами прохождения сигнала 13 PAGEREF _Toc409517759 \h 14521515
13 LINK \l "_Toc409517760" 148.5.2. Применение систем шумоподавления с двумя маршрутами прохождения сигнала 13 PAGEREF _Toc409517760 \h 14551515
13 LINK \l "_Toc409517761" 148.6. Конструкция систем шумоподавления Dolby 13 PAGEREF _Toc409517761 \h 14561515
13 LINK \l "_Toc409517762" 148.6.1. Конструкция систем шумоподавления Dolby типа A 13 PAGEREF _Toc409517762 \h 14561515
13 LINK \l "_Toc409517763" 148.6.2. Конструкция систем шумоподавления Dolby типа В 13 PAGEREF _Toc409517763 \h 14591515
13 LINK \l "_Toc409517764" 148.6.3. Дальнейшие разработки систем шумоподавления Dolby 13 PAGEREF _Toc409517764 \h 14641515
13 LINK \l "_Toc409517765" 14Практическая реализация 13 PAGEREF _Toc409517765 \h 14661515
13 LINK \l "_Toc409517766" 14Заключение 13 PAGEREF _Toc409517766 \h 14711515
13 LINK \l "_Toc409517767" 14Список литературы 13 PAGEREF _Toc409517767 \h 14711515
15
УДК 519.2: 621.391
Павлов Р.  В. Создание и обработка звука: Пособие. – Рыбинск: РГАТУ имени П. А. Соловьева, 2015. – 71 с.
В пособии рассматриваются основные методы создания и обработки звука. Рассмотрены характеристики звукового сигнала. Особое внимание уделено системам шумоподавления.
Пособие предназначено для использования при подготовке бакалавров и магистров направления «Информатика и вычислительная техника» и может быть полезно студентам других направлений обучения.


Рецензент: кафедра вычислительных систем Рыбинского государственного авиационного технического университета имени П. А. Соловьева
Введение
Одной из важных составных частей современной вычислительной системы являются мультимедийные средства.
Дословный перевод слова «мультимедиа» означает «многие среды» («multi» – «много», «media» – «среда»). Под этим термином понимается одновременное воздействие на пользователя по нескольким информационным каналам. При этом пользователю, как правило, отводится активная роль.
Мультимедиа – это интерактивные (диалоговые) системы, обеспечивающие одновременную работу со звуком, анимированной компьютерной графикой, видеокадрами, статическими изображениями и текстами.
Важной составной частью мультимедиа является звук или аудио, звуковая информация (аудиоинформация).
В компьютерной технике аудиоинформация представляется в цифровом виде.
По мере развития компьютерных технологий возрастают требования к представлению аудиоинформации. Эти требования охватывают вопросы повышения естественности воспроизведения звука, сокращения объема аудиофайлов при сохранении высокого качества их звучания и т. п.
Некоторым вопросам данной области и посвящено предлагаемое пособие.
Для успешного усвоения материала пособия необходимо свободно владеть вопросами формирования цифрового представления аудиоинформации из аналоговой ее формы, особенностями спектрального анализа на основе преобразования Фурье, знать принципы построения фильтров в различных частотных диапазонах.
1. Основные свойства звука
Чаще всего в звуке рассматривается амплитуда и спектральный состав звукового колебания, а также их изменение во времени [1].
Амплитуда (amplitude) определяет максимальную интенсивность колебаний – громкость (volume) или силу звука. На осциллограмме амплитуда представляется размахом сигнала – наибольшим и наименьшим относительно среднего значения уровнями.
Спектральный состав определяет окраску или тембр звука (timbre). Любое периодическое колебание может быть представлено рядом Фурье – суммой конечного числа синусоидальных колебаний (чистых тонов). Спектр звука представляет собой график интенсивностей (амплитуд) этих частотных составляющих, обозначаемых обычно в виде вертикальных линий соответствующей высоты. Спектр чистого тона имеет только одну линию, соответствующую его частоте; спектр любого другого колебания имеет более одной линии. Если на спектре звука имеется достаточно острый пик, то такой звук воспринимается на слух как тон соответствующей высоты, а остальные составляющие определяют его окраску; в противном случае звук воспринимается как одновременное звучание нескольких тонов или шум. Частотные составляющие, кратные основной частоте тона, называются гармониками (harmonics) или обертонами; гармоники нумеруются, начиная с самого основного тона (первая гармоника), а обертоны – с первой кратной составляющей (первый обертон – вторая гармоника и т. д.).
Из-за особенностей слухового восприятия высота звука определяется больше по его спектральному составу, нежели по самому основному тону.
Например, субъективная высота большинства спектрально богатых низкочастотных звуков практически не меняется даже при полном удалении из них основного тона, который в слуховом аппарате восстанавливается по разностным частотам первых обертонов.
Изменение амплитуды во времени называется амплитудной огибающей (envelope) звука – на амплитудном графике она как бы огибает график колебания, а график получается как бы вписанным в огибающую. Любой природный звук имеет огибающую, примерно такого вида (рис. 1.1):








Рис. 1.1. Фазы звука
Цифрами обозначены фазы развития звука, принятые в акустике:
1 – атака (attack) – начальная фаза, подъем;
2 – остановка (hold) – короткая стабилизация после подъема;
3 – спад (decay) – фаза перехода звука в установившееся состояние;
4 – удержание (sustain) – фаза «поддержки»;
5 – затухание (release) – послезвучание.
Фаза поддержки имеет место лишь в том случае, когда вызвавшее появление звука воздействие остается постоянным в течение какого-то времени (например, движение пилы по металлу или поток воздуха в духовом инструменте).
Аналогично, имеется понятие спектральной огибающей – трехмерный график изменения спектра (и соответственно – тембра) во времени.
Кроме периодических колебаний – тонов – рассматриваются также непериодические колебания – шумы. Для шума характерно более или менее равномерное распределение интенсивности по спектру, без явно выраженных пиков или спадов. В основном различается два вида шума: белый и розовый.
Белый шум имеет равномерную спектральную плотность и в чистом виде в природных звуках не встречается, однако часто встречается в электронных приборах; плотность «розового» шума спадает с ростом частоты (1/f) – это характеристика шума дождя, прибоя, ветра и прочих неярко выраженных природных шумов. Иногда рассматривается также «коричневый» шум с плотностью 1/f 2, быстро спадающей с ростом частоты – характеристика, близкая к звукам ударного происхождения (гром, обвал).
2. Единицы измерения
Для измерения звука используется децибел [1].
Это относительная логарифмическая единица измерения величин, связанных с интенсивностью звука (мощности, амплитуды, напряжения или тока сигнала, усиления/ослабления и т. п.). Чувствительность слуха носит логарифмический характер – нарастание интенсивности в виде степенной функции воспринимается на слух как линейное увеличение громкости, поэтому в ряде случаев удобнее пользоваться логарифмическими, а не линейными единицами. Десятичный логарифм отношения некоторой величины к ее эталонному значению – lg (X/XЭ) – называется белом (Б), а его десятая часть – lg (X/XЭ) / 10 – децибелом (дБ). Измерение в децибелах удобно еще и тем, что человеческое ухо различает относительное изменение интенсивности примерно на 1 дБ.
При измерениях абсолютной интенсивности звука (Вт/м2) за эталонное значение принимается уровень порога слышимости для синусоидального сигнала с частотой 1 кГц – 10 в степени –12 (10–12) Вт/м2. При этом порог слышимости определяется интенсивностью 0 дБ, а интенсивность, при которой начинаются болевые ощущения (болевой порог) – около 140 дБ. Интенсивность тихого шепота – около 35 дБ, громкого голоса – около 95 дБ, forte fortissimo оркестра – около 100 дБ, оркестрового тутти (звучания всех инструментов) – около 120 дБ.
При измерениях величин, с которыми интенсивность связана квадратичной зависимостью – напряжения, тока и звукового давления – в выражении для децибела множитель 10 меняется на 20 (двойка выносится из логарифма отношения квадратов).
При измерениях относительных величин за эталонный уровень принимается какое-либо значение величины. Например, при оценке усиления за него принимается единичное усиление (пропускание сигнала без изменения), равное 0 дБ. При этом 60 дБ соответствует усилению в 1000 раз (60 = 20lg 1000), а –20 дБ – ослаблению в 10 раз. Для описания характеристик усилителей и фильтров применяется также единица «децибел на октаву» (дБ/окт), показывающая изменение усиления при изменении частоты в два раза.
В акустике принято измерять громкость в дБ SPL (Sound Pressure Level). Удвоение интенсивности звука приводит к увеличению уровня интенсивности на 3 дБ.
Выражая уровень звукового давления в децибелах, следует помнить, что при увеличении давления вдвое прибавляется 6 дБ.
Существуют разновидности измерений: dBA, dBB, dBC, dBD – опорные уровни выбраны по частотным характеристикам «весовых фильтров» в соответствии с кривыми равной громкости.
Децибел акустический
Единица измерения уровня шума с наложенным на измеритель фильтром, учитывающим особенность восприятия шума слуховым аппаратом человека (нелинейность частотной характеристики уха). Величина дБА – уровень звукового давления, измеренный в дБ при помощи шумомера, содержащего корректирующую цепочку, снижающую чувствительность устройства на низких и очень высоких частотах для того, чтобы точнее имитировать чувствительность человеческого уха и получать отсчеты, дающие некоторые указания на громкость, неприятное действие или приемлемость звука. Значение дБА обычно на 10 единиц превосходит эквивалентное значение нормировочного индекса шума для данного звука.
В цифровой обработке понятие дБ считается от нуля и вниз, в область отрицательных значений. Ноль – максимальный уровень, представимый цифровой схемой.
В dBFS (Full Scale – «полная шкала») – опорное напряжение соответствует полной шкале прибора; например, «уровень записи составляет
·6 dBFS». Для линейного цифрового кода каждый разряд соответствует 6 дБ, и максимально возможный уровень записи равен 0 dBFS.
3. Параметры звукового сигнала
Звук – это упругое колебание среды, он распространяется в среде с помощью волн давления посредством колебания атомов и молекул. Как и любая волна, звук характеризуется скоростью, амплитудой и частотой [2].
Воздействуя на слух, звук вызывает раздражение, которое создает у человека субъективный эффект – ощущение.
Интенсивность звука I определяется как среднее количество звуковой энергии, проходящей в единицу времени через единицу поверхности:

13 EMBED Equation.3 1415 (3.1)

где P – звуковое давление, Па;
Q0 – удельное сопротивление воздуха, Q0 = 1,23 кг/м3.
При исследовании восприятия изменения интенсивности звука было установлено, что одинаковые относительные изменения интенсивности вызывают одинаковые абсолютные изменения слухового ощущения, т. е. слуховое ощущение E пропорционально логарифму раздражающей силы:

E = algI + C. (3.2)

На пороге слышимости I = IПС слуховое ощущение равно нулю, поэтому

C = – algIПС, (3.3)

откуда
E = alg(I/IПС) (3.4)

Для оценки величины слухового ощущения была предложена единица под название «бел» (a = 1). Эта единица соответствует десятикратному отношению интенсивностей, поэтому была введена более мелкая единица – «децибел» (a = 10).
E = 10lg(I/IПС), дБ (3.5)

Вследствие логарифмического закона восприятия звука и широкого диапазона слышимости звуков было введено понятие уровня интенсивности

N(I) = (I/I0), дБ (3.6)

За нулевой уровень условились принимать интенсивность I0 близкую к порогу слышимости для нормального слуха на частоте 1 кГц (I0 = 10–12 Вт/м2). Нулевой уровень по звуковому давлению P0 равен 2,04
·10–5  Па. Интенсивность и звуковое давление связаны квадратичной зависимостью, поэтому уровень звукового давления N определяется равенством:

N = 20lg(P/P0). (3.7)

Порог слышимости – это минимальное звуковое давление, при котором еще существует слуховое ощущение. На рис. 2.1 показана зависимость порога слышимости от частоты, которая была выявлена опытным путем.













Рис. 2.1. Абсолютный порог слышимости
4. Параметры звукового тракта
Звуковым трактом называют любое устройство, осуществляющее передачу и/или преобразование звука. Звуковой тракт характеризуется следующими параметрами [1].
– Номинальный входной и выходной уровень (Input/Output Level) – величина сигнала на входе и выходе тракта, до которого он сохраняет указанные параметры. Указывается в вольтах и обычно принимается за 0 дБ.
Таким образом, рабочие уровни сигнала имеют отрицательный либо нулевой уровень.
– Максимальный входной и выходной уровень – величина сигнала, до которой тракт сохраняет работоспособность. Уровни сигналов от номинального до максимального всегда имеют ненулевой положительный уровень.
– Коэффициент усиления – отношение величины выходного сигнала ко входному. Указывается в разах, процентах или децибелах.
– Диапазон частот (Frequency Response) – частотный интервал, в котором тракт сохраняет свои основные характеристики. Нуль подразумевает постоянный ток.
– Форма амплитудно-частотной характеристики (АЧХ) – график зависимости амплитуды сигнала на выходе от его частоты при неизменной амплитуде сигнала на входе. Тракты с горизонтальной зависимостью внутри частотного диапазона АЧХ называют частотно-независимыми.
– Неравномерность АЧХ – отклонения графика от заданной формы. Указывается в процентах или децибелах.
– Уровень шума (Noise Level) – величина шума относительно номинального уровня сигнала. Указывается в децибелах и всегда имеет отрицательное значение. Другое название – соотношение сигнал/шум (Signal to Noise Ratio, SNR), которое имеет такое же положительное значение. Иногда указывается уровень шума, приведенный ко входу – в предположении, что весь шум поступает только на вход, а сам тракт собственного шума не имеет.
– Коэффициент гармоник (Total Harmonic Distortion, THD) – величина побочных гармонических составляющих, вносимых нелинейностью тракта. Указывается в процентах от величины сигнала; в ряде случаев указывается для различных гармоник (на слух наибольшие искажения вносят нечетные гармоники высших порядков).
– Уровень интермодуляционных искажений (InterModulation Distortion, IMD) – относительный уровень паразитных частотных компонент, порожденных взаимной модуляцией полезных компонент сигнала. Указывается в процентах от величины сигнала.
– Переходное затухание (Stereo Crosstalk) – степень ослабления сигнала при его проникновении в соседний стереоканал. Указывается в децибелах.
– Динамический диапазон (Dynamic Range) – диапазон наибольшего и наименьшего уровней сигнала, внутри которых сохраняются основные характеристики тракта. Снизу обычно ограничен уровнем шума, сверху – номинальным уровнем, поэтому часто равен соотношению сигнал/шум, однако нелинейность тракта в ряде случаев не позволяет выдержать параметры в этих областях, а это сужает динамический диапазон.
5. Методы синтеза звука
Создание (синтез) звука в основном преследует две цели: имитация различных естественных звуков (шум ветра и дождя, звук шагов, пение птиц и т. п.), а также акустических музыкальных инструментов (имитационный синтез), и получение принципиально новых звуков, не встречающихся в природе (чистый синтез) [1].
Обработка звука обычно направлена на получение новых звуков из уже существующих (например, «голос робота»), либо придание им дополнительных качеств или устранение существующих (например, добавление эффекта хора, удаление шума или щелчков). Каждый из методов синтеза и обработки имеет свою математическую и алгоритмическую модель, что позволяет любой из них реализовать на компьютере; однако, многие методы, будучи реализованы точно, требуют слишком большого объема вычислений, отчего их обычно реализуют с какой-либо степенью допущения.
Существуют следующие основные методы синтеза звука.
1. Аддитивный (additive). Основан на утверждении Фурье о том, что любое периодическое колебание можно представить в виде суммы чистых тонов (синусоидальных колебаний с различными частотами и амплитудами).
Для этого нужен набор из нескольких синусоидальных генераторов с независимым управлением, выходные сигналы которых суммируются для получения результирующего сигнала. На этом методе основан принцип создания звука в духовом органе.
Достоинства метода: позволяет получить любой периодический звук, и процесс синтеза хорошо предсказуем (изменение настройки одного из генераторов не влияет на остальную часть спектра звука). Основной недостаток – для звуков сложной структуры могут потребоваться сотни генераторов, что достаточно сложно и дорого реализовать. Для снижения стоимости реализации вместо набора отдельных генераторов (реальных или математических) применяется обратное преобразование Фурье.
2. Разностный (subtractive). Идеологически противоположен первому. В основу положена генерация звукового сигнала с богатым спектром (множеством частотных составляющих) с последующей фильтрацией (выделением одних составляющих и ослаблением других) – по этому принципу работает речевой аппарат человека. В качестве исходных сигналов обычно используются меандр (прямоугольный, square), с переменной скважностью (отношением всего периода к положительному полупериоду), пилообразный (saw) – прямой и обратный, и треугольный (triangle), а также различные виды шумов (случайных непериодических колебаний). Основным органом синтеза в этом методе служат управляемые фильтры: резонансный (полосовой) – с изменяемым положением и шириной полосы пропускания (band) и фильтр нижних частот (ФНЧ) с изменяемой частотой среза (cutoff). Для каждого фильтра также регулируется добротность (Q) – крутизна подъема или спада на резонансной частоте.
Достоинства метода – относительно простая реализация и довольно широкий диапазон синтезируемых звуков. На этом методе построено множество студийных и концертных синтезаторов.
Недостаток – для синтеза звуков со сложным спектром требуется большое количество управляемых фильтров, которые достаточно сложны и дороги.
3. Частотно-модуляционный (frequency modulation – FM). В основу положена взаимная модуляция по частоте между несколькими синусоидальными генераторами. Каждый из таких генераторов, снабженный собственными формирователем амплитудной огибающей, амплитудным и частотным вибрато, именуется оператором. Различные способы соединения нескольких операторов, когда сигналы с выходов одних управляют работой других, называются алгоритмами синтеза. Алгоритм может включать один или больше операторов, соединенных последовательно, параллельно, последовательно-параллельно, с обратными связями и в прочих сочетаниях – все это дает практически бесконечное множество возможных звуков.
Благодаря простоте цифровой реализации, метод получил широкое распространение в студийной и концертной практике. Однако практическое использование этого метода достаточно сложно из-за того, что большая часть звуков, получаемых с его помощью, представляет собой шумоподобные колебания, и достаточно лишь слегка изменить настройку одного из генераторов, чтобы чистый тембр превратился в шум. Однако метод дает широкие возможности по синтезу разного рода ударных звуков, а также – различных звуковыхэффектов, недостижимых в других методах разумной сложности.
4. Самплерный (sample – выборка). В этом методе записывается реальное звучание (сампл), которое затем в нужный момент воспроизводится. Для получения звуков разной высоты воспроизведение ускоряется или замедляется; при неизменной скорости выборки применяется расчет промежуточных значений отсчетов (интерполяция). Чтобы тембр звука при сдвиге высоты не менялся слишком сильно, используется несколько записей звучания через определенные интервалы (обычно – через одну-две октавы). В ранних самплерных синтезаторах звуки в буквальном смысле записывались на магнитофон, в современных применяется цифровая запись звука.
Метод позволяет получить сколь угодно точное подобие звучания реального инструмента, однако для этого требуются достаточно большие объемы памяти. С другой стороны, запись звучит естественно только при тех же параметрах, при которых она была сделана – при попытке, например, придать ей другую амплитудную огибающую естественность резко падает.
Для уменьшения требуемого объема памяти применяется зацикливание сампла (looping). В этом случае записывается только короткое время звучания инструмента, затем в нем выделяется средняя фаза с установившимся (sustained) звуком, которая при воспроизведении повторяется до тех пор, пока включена нота (нажата клавиша), а после отпускания воспроизводится концевая фаза.
На самом деле этот метод нельзя с полным правом называть синтезом – это скорее метод записи-воспроизведения. Однако в современных синтезаторах на его основе воспроизводимый звук можно подвергать различной обработке – модуляции, фильтрованию, добавлению новых гармоник, звуковых эффектов, в результате чего звук может приобретать совершенно новый тембр, иногда совсем непохожий на первоначальный. По сути, получается комбинация трех основных методов синтеза, где в качестве основного сигнала используется исходное звучание.
5. Таблично-волновой (wave table). Разновидность самплерного метода, когда записывается не все звучание целиком, а его отдельные фазы – атака, начальное затухание, средняя фаза и концевое затухание, что позволяет резко снизить объем памяти, требуемый для хранения самплов.
Эти фазы записываются на различных частотах и при различных условиях (мягкий или резкий удар по клавише рояля, различное положение губ и языка при игре на саксофоне и т. п.), в результате чего получается семейство звучаний одного инструмента. При воспроизведении эти фазы нужным образом составляются, что дает возможность при относительно небольшом объеме самплов получить достаточно широкий спектр различных звучаний инструмента, а главное – заметно усилить выразительность звучания, выбирая, например, в зависимости от силы удара по клавише синтезатора не только нужную амплитудную огибающую, как делает любой синтезатор, но и нужную фазу атаки.
Основная проблема этого метода – в сложности сопряжения различных фаз друг с другом, чтобы переходы не воспринимались на слух, и звучание было цельным и непрерывным. Поэтому синтезаторы этого класса достаточно редки и дороги.
Этот метод также используется в синтезаторах звуковых карт персональных компьютеров, однако его возможности там сильно урезаны. В частности, почти нигде не применяют составление звука из нескольких фаз, сводя метод к простому самплерному, хотя почти везде есть возможность параллельного воспроизведения более одного сампла внутри одной ноты.
6. Метод физического моделирования (physical modelling). Состоит в моделировании физических процессов, определяющих звучание реального инструмента на основе его заданных параметров (например, для скрипки – порода дерева, состав лака, геометрические размеры, материал струн и смычка и т. п.). В связи с крайней сложностью точного моделирования даже простых инструментов и огромным объемом вычислений метод пока развивается медленно, на уровне студийных и экспериментальных образцов синтезаторов. Ожидается, что с момента своего достаточного развития он заменит известные методы синтеза звучаний акустических инструментов, оставив им только задачу синтеза не встречающихся в природе тембров.
7. (Alexander Grigoriev) WaveGuide технология, активно разрабатываемая в Стэнфоpдcком Унивеpcитете и применяемая уже в нескольких промышленных моделях электронных роялей. Представляет собой pазновидноcть физического моделирования, при которой моделиpyетcя pаcпpоcтpанение колебаний, пpедcтавленных диcкpетными отсчетами, по cтpyне (одномерное моделирование) и по pезонанcным повеpхноcтям (двyмеpное моделирование) или в объемном pезонатоpе (тpехмеpное). При этом появляется возможность моделировать также нелинейные эффекты, например удар молоточка и касание струны демпфером, а также взаимную связь струн и связь горизонтальной и вертикальной мод.
6. Обработка цифрового звука
Цифровой звук обрабатывается посредством математических операций, применяемых к отдельным отсчетам сигнала, либо к группам отсчетов различной длины. Выполняемые математические операции могут либо имитировать работу традиционных аналоговых средств обработки (микширование двух сигналов – сложение, усиление/ослабление сигнала – умножение на константу, модуляция – умножение на функцию и т. п.), либо использовать альтернативные методы – например, разложение сигнала в спектр (ряд Фурье), коррекция отдельных частотных составляющих, затем обратная «сборка» сигнала из спектра [3].
Обработка цифровых сигналов подразделяется на линейную (в реальном времени, над «живым» сигналом) и нелинейную – над предварительно записанным сигналом. Линейная обработка требует достаточного быстродействия вычислительной системы (процессора); в ряде случаев невозможно совмещение требуемого быстродействия и качества, и тогда используется упрощенная обработка с пониженным качеством. Нелинейная обработка никак не ограничена во времени, поэтому для нее могут быть использованы вычислительные средства любой мощности, а время обработки, особенно с высоким качеством, может достигать нескольких минут и даже часов.
Для обработки применяются как универсальные процессоры общего назначения – Intel 8035, 8051, 80x86, Motorola 68xxx, SPARC – так и специализированные цифровые сигнальные процессоры (Digital Signal Processor, DSP) Texas Instruments TMS xxx, Motorola 56xxx, Analog Devices ADSP-xxxx и др.
Разница между универсальным процессором и DSP состоит в том, что первый ориентирован на широкий класс задач – научных, экономических, логических, игровых и т. п., и содержит большой набор команд общего назначения, в котором преобладают обычные математические и логические операции. DSP специально ориентированы на обработку сигналов и содержат наборы специфических операций – сложение с ограничением, перемножение векторов, вычисление математического ряда и т. п. Реализация даже несложной обработки звука на универсальном процессоре требует значительного быстродействия и далеко не всегда возможна в реальном времени, в то время как даже простые DSP нередко справляются в реальном времени с относительно сложной обработкой, а мощные DSP способны выполнять качественную спектральную обработку сразу нескольких сигналов.
В силу своей специализации DSP редко применяются самостоятельно – чаще всего устройство обработки имеет универсальный процессор средней мощности для управления всем устройством, приема/передачи информации, взаимодействия с пользователем, и один или несколько DSP – собственно для обработки звукового сигнала. Например, для реализации надежной и быстрой обработки сигналов в компьютерных системах применяют специализированные платы с DSP, через которые пропускается обрабатываемый сигнал, в то время как центральному процессору компьютера остаются лишь функции управления и передачи.
6.1. Методы, используемые для обработки звука
1. Монтаж. Состоит в вырезании из записи одних участков, вставки дpугих, их замены, pазмножении и т. п. Hазывается также pедактиpованием. Все современные звуко- и видеозаписи в той или иной меpе подвеpгаются монтажу.
2. Амплитудные преобразования. Выполняются при помощи различных действий над амплитудой сигнала, котоpые, в конечном счете, сводятся к умножению значений самплов на постоянный коэффициент (усиление/ослабление) или изменяющуюся во вpемени функцию-модулятоp (амплитудная модуляция). Частным случаем амплитудной модуляции является фоpмиpование огибающей для пpидания стационаpному звучанию pазвития во вpемени.
Амплитудные пpеобpазования выполняются последовательно с отдельными самплами, поэтому они пpосты в pеализации и не тpебуют большого объема вычислений.
3. Частотные (спектpальные) пpеобpазования. Выполняются над частотными составляющими звука. Если использовать спектpальное pазложение – фоpму пpедставления звука, в котоpой по гоpизонтали отсчитываются частоты, а по веpтикали – интенсивности составляющих этих частот, то многие частотные пpеобpазования становятся похожими на амплитудные пpеобpазованиям над спектpом. Hапpимеp, фильтpация – усиление или ослабление опpеделенных полос частот – сводится к наложению на спектр соответствующей амплитудной огибающей. Однако частотную модуляцию таким обpазом пpедставить нельзя – она выглядит, как смещение всего спектpа или его отдельных участков во вpемени по опpеделенному закону.
Для pеализации частотных пpеобpазований обычно пpименяется спектpальное pазложение по методу Фуpье, котоpое тpебует значительных pесуpсов. Однако имеется алгоритм быстpого пpеобpазования Фуpье (БПФ, FFT), котоpый делается в целочисленной аpифметике и позволяет уже на слабых процессарах pазвоpачивать в pеальном вpемени спектp сигнала сpеднего качества. Пpи частотных преобpазованиях, кpоме этого, тpебуется обpаботка и последующая свеpтка, поэтому фильтpация в pеальном вpемени пока не pеализуется на пpоцессоpах общего назначения. Вместо этого существует большое количество цифpовых сигнальных пpоцессоpов DSP, котоpые выполняют эти опеpации в pеальном вpемени и по нескольким каналам.
4. Фазовые преобразования. Сводятся в основном к постоянному сдвигу фазы сигнала или ее модуляции некоторой функцией или другим сигналом. Благодаря тому, что слуховой аппарат человека использует фазу для определения напpавления на источник звука, фазовые пpеобpазования стеpеозвука позволяют получить эффект вpащающегося звука, хоpа и ему подобные.
5. Временные пpеобpазования. Заключаются в добавлении к основному сигналу его копий, сдвинутых во вpемени на различные величины. Пpи небольших сдвигах (порядка менее 20 мс) это дает эффект pазмножения источника звука (эффект хоpа), пpи больших – эффект эха.
6. Формантные пpеобpазования. Являются частным случаем частотных и оперируют с формантами – характеpными полосами частот, встpечающимися в звуках, пpоизносимых человеком. Каждому звуку соответствует свое соотношение амплитуд и частот нескольких формант, которое определяет тембр и разборчивость голоса. Изменяя параметры фоpмант, можно подчеркивать или затушевывать отдельные звуки, менять одну гласную на дpугую, сдвигать pегистp голоса и т. п.
6.2. Звуковые эффекты
Вот наиболее распpостpаненные звуковые эффекты.
– Вибрато – амплитудная или частотная модуляция сигнала с небольшой частотой (до 10 Гц). Амплитудное вибpато также носит название тремоло; на слух оно воспринимается, как замирание или дрожание звука, а частотное – как «завывание» или «плавание» звука (типичная неисправность механизма магнитофона).
– Динамическая фильтрация (wah-wah – «вау-вау») – реализуется изменением частоты среза или полосы пропускания фильтра с небольшой частотой. На слух воспринимается, как вращение или заслонение/открывание источника звука – увеличение высокочастотных составляющих ассоциируется с источником, обращенным на слушателя, а их уменьшение – с отклонением от этого направления.
– Фленжер (flange – кайма, гребень). Название происходит от способа pеализации этого эффекта в аналоговых устройствах – пpи помощи так называемых гребенчатых фильтров. Заключается в добавлении к исходному сигналу его копий, сдвинутых во вpемени на небольшие величины (до 20 мс) с возможной частотной модуляцией копий или величин их временных сдвигов и обратной связью (суммарный сигнал снова копируется, сдвигается и т. п.). На слух это ощущается как «дробление», «размазывание» звука, возникновение биений – разностных частот, хаpактеpных для игры в унисон или хорового пения, отчего фленжеpы с определенными паpаметpами применяются для получения хорового эффекта (chorus). Меняя паpаметpы фленжеpа, можно в значительной степени изменять первоначальный тембp звука.
– Pевеpбеpация (reverberation – повторение, отражение). Получается путем добавления к исходному сигналу затухающей серии его сдвинутых во вpемени копий. Это имитирует затухание звука в помещении, когда за счет многократных отражений от стен, потолка и прочих поверхностей звук пpиобpетает полноту и гулкость, а после пpекpащения звучания источника затухает не сразу, а постепенно. Пpи этом время между последовательными отзвуками (пpимеpно до 50 мс) ассоциируется с величиной помещения, а их интенсивность – с его гулкостью. По сути, pевеpбеpатоp представляет собой частный случай фленжеpа с увеличенной задержкой между отзвуками основного сигнала, однако особенности слухового восприятия качественно различают эти два вида обработки.
– Эхо (echo). Ревеpбеpация с еще более увеличенным временем задержки – выше 50 мс. При этом слух перестает субъективно воспринимать отражения, как призвуки основного сигнала, и начинает воспринимать их как повторения. Эхо обычно pеализуется так же, как и естественное – с затуханием повторяющихся копий.
– Дистошн (distortion – искажение) – намеренное искажение формы звука, что придает ему резкий, скрежещущий оттенок. Наибольшее применение получил в качестве гитарного эффекта (классическая гитара heavy metal). Получается пеpеусилением исходного сигнала до появления ограничений в усилителе (среза верхушек импульсов) и даже его самовозбуждения. Благодаpя этому исходный сигнал становится похож на прямоугольный, отчего в нем появляется большое количество новых частотных составляющих, резко pасшиpяющих спектp. Этот эффект пpименяется в pазличных вариациях (fuzz, overdrive и т. п.), различающихся способом ограничения сигнала (обычное или сглаженное, весь спектp или полоса частот, весь амплитудный диапазон или его часть и т. п.), соотношением исходного и искаженного сигналов в выходном, частотными хаpактеpистиками усилителей (наличие/отсутствие фильтров на выходе).
– Компрессия – сжатие динамического диапазона сигнала, когда слабые звуки усиливаются сильнее, а сильные – слабее. Hа слух воспринимается как уменьшение разницы между тихим и громким звучанием исходного сигнала. Используется для последующей обработки методами, чувствительными к изменению амплитуды сигнала. В звукозаписи используется для снижения относительного уровня шума и пpедотвpащения пеpегpузок. В качестве гитарной приставки позволяет значительно (на десятки секунд) продлить звучание струны без затухания громкости.
– Фейзеp (phase – фаза) – смешивание исходного сигнала с его копиями, сдвинутыми по фазе. По сути дела, это частный случай фленжеpа, но с намного более простой аналоговой реализацией (цифровая реализация одинакова). Изменение фазовых сдвигов суммируемых сигналов приводит к подавлению отдельных гармоник или частотных областей, как в многополосном фильтре. Hа слух такой эффект напоминает качание головки в стереомагнитофоне – физические процессы в обоих случаях пpимеpно одинаковы.
– Вокодер (voice coder – кодировщик голоса) – синтез речи на основе произвольного входного сигнала с богатым спектpом. Речевой синтез pеализуется пpи помощи формантных пpеобpазований: выделение из сигнала с достаточным спектpом нужного набора фоpмант с нужными соотношениями придает сигналу свойства соответствующего гласного звука. Изначально вокодеры использовались для передачи кодированной речи: путем анализа исходного речевого сигнала из него выделялась информация об изменении положений фоpмант (переход от звука к звуку), которая кодировалась и передавалась по линии связи, а на приемном конце блок управляемых фильтров и усилителей синтезировал речь заново. Подавая на блок речевого синтеза звучание, напpимеp, электpогитаpы и произнося слова в микрофон блока анализа, можно получить эффект «pазговаpивающей гитары»; пpи подаче звучания с синтезатора получается известный «голос робота», а подача сигнала, близкого по спектру к колебаниям голосовых связок, но отличающегося по частоте, меняет pегистp голоса – мужской на женский или детский, и наоборот.
7. Маскировка звука
Повышение порога слышимости одного тона (или сигнала) при одновременном воздействии другого тона (шума или сигнала) называют маскировкой. Различают частотное и временное маскирование [2].
На рис. 7.1 показаны кривые маскировки тона, когда мешающим звуком является тоже тон. По этим кривым определяют порог слышимости на конкретных частотах маскируемого тона, и рассчитывается коэффициент маскировки.













Рис. 7.1. Кривые порога тона с частотой FT при маскировке тоном с частотой FM = 1 кГц и уровнем NM, дБ
Маскировка максимальна, когда частоты FT и FM близки, величина маскировки увеличивается по мере возрастания уровня мешающего тона NM.
На рис. 7.2 показаны кривые маскировки тона узкополосным шумом.
Они примерно такие же, как при маскировке тоном с некоторыми отличиями: нет биений и провала коэффициента маскировки. Узкополосный шум маскирует не только тоны, но и широкополосные шумы квантования.
На рис. 7.3 показан порог слышимости во временной области, при воздействии сигнала с уровнем интенсивности 60 дБ.

















Рис. 7.2. Кривые порога тона с частотой FT при маскировке узкополосным шумом с центральной частотой FM = 1 кГц и уровнем NM дБ













Рис. 7.3. Порог слышимости при временном маскировании
8. Системы шумоподавления
В определении понятия «шумоподавитель», да и самого шумоподавления существует некоторая неясность. Этими терминами обозначаются два абсолютно разных понятия, одно из которых скорее относится к реставрационным работам, а второе – непосредственно к самой процедуре звукозаписи [4].
В первом случае речь идёт об улучшении звучания уже имеющегося материала, а во втором случае – о более качественном процессе записи нового. И, хотя эти два различных процесса имеют идентичные названия, физическая их сущность абсолютно разная. Даже несмотря на то, что основаны они, в сущности, на использовании одного и того же свойства человеческого слуха – эффекта маскировки.
8.1. Денойзеры
Этот процесс и является именно шумоподавлением в его исходном смысле, т. е. применяется для удаления шумов с уже готовых фонограмм, записанных давно и без специальных приемов удаления шумов.
При этом сигнал обрабатывается как бы «с одной стороны», а именно – при его воспроизведении. По принятой терминологии такие шумоподавители именно так и называются – single-ended, «односторонние».
Самым первым был простейший noise-gate, блокировавший прохождение сигналов в паузах фонограммы. Он действовал как простой выключатель – либо полностью пропускал входной сигнал на выход, либо полностью же его подавлял.
Однако, несмотря на свою полезность во многих случаях, реального подавления шумов он не осуществлял. А иногда даже наоборот, делал их субъективно более заметными – когда после достигнутой его усилиями абсолютной тишины начинало звучать тихое место фонограммы, на котором шумы как раз наиболее заметны.
По мере развития схемотехники конструкции гейтов (ключей) постепенно усложнялись, появилась возможность плавного их открытия и закрытия, но полностью устранить указанное явление тем не менее не удалось, и в настоящее время гейты для целей уменьшения шумов практически не применяются.
Чтобы избавиться от описанного эффекта и получить более приятное на слух уменьшение шумов, многими фирмами были разработаны самые различные системы шумоподавления, в основном для прослушивания записей с магнитофонов, такие как, например, DNL (Dynamic Noise Limiter), и многие другие.
Однако, несмотря на различные названия, все они работали примерно одинаково – происходило ослабление ВЧ-составляющих обрабатываемого сигнала в том случае, если само устройство обработки решало, что их уровень в исходном сигнале достаточно мал, и ими можно пренебречь.
По сути, это был самый обычный ВЧ-регулятор тембра, но работающий только на ослабление, по принципу «если высоких частот много, то их не трогаем, а если мало – то делаем ещё меньше».
Для прослушивания записей это давало приемлемый эффект. Таким образом, описанные выше устройства хоть и обеспечивали в ряде случаев больший комфорт для слушателей, но, тем не менее, проблему реального уменьшения шумов не решали.
Реальный прорыв в этой области был достигнут после изобретения первого настоящего шумоподавителя, в котором для уменьшения шумов применялся скользящий адаптивный фильтр, который изменял полосу своего пропускания в зависимости от спектра обрабатываемого сигнала.
Наиболее известное отечественное устройство такого рода – это динамический фильтр «Маяк», которым оснащались некоторые советские магнитофоны. К сожалению, из-за ряда конструктивных недоработок эти фильтры часто существенно портили звучание обрабатываемого сигнала, хотя при правильной настройке и регулировке они могут прекрасно работать. Это доказали западные производители, начавшие массовый выпуск таких устройств уже лет 20 тому назад, и не прекращающие его даже сейчас, в компьютерную эпоху.
Это связано с громоздкостью компьютеров и тем, что большинство программ просто не работают в реальном времени или не приспособлены для непосредственной обработки входящего сигнала и подачи его на выход без существенной задержки.
Как уже сказано, сердцем денойзера является особый фильтр, изменяющий полосу своего пропускания в зависимости от спектра обрабатываемого сигнала. Управляющая этим фильтром электронная схема постоянно анализирует входной сигнал, и на основе этого анализа перестраивает параметры фильтра таким образом, чтобы обеспечить максимально благоприятные условия для передачи полезных составляющих сигнала, и одновременно – максимально ослабить его мешающие, шумовые компоненты.
Практически все серийно выпускаемые денойзеры в качестве самого фильтра применяют только один фильтр – фильтр низких частот (ФНЧ, или Lo-Pass). Он обрезает все высокочастотные помехи, которые лежат за пределами полосы частот, занимаемой полезным сигналом, и не маскируются им.
Суть процесса маскировки поясняется рис. 8.1. На этом рисунке приведены несколько колоколообразных кривых, показывающих величины маскировки в зависимости от величины тестового сигнала. В качестве него используется синусоидальный тон частотой 1000 Гц, а цифры на кривых – обозначают уровень тестового сигнала.













Рис. 8.1. Процесс маскировки
Рассмотрим для примера одну из кривых – например, ту, которая соответствует уровню тестового сигнала в 80 дБ, это вторая кривая сверху. Она показывает, что в описанных условиях все сигналы, лежащие ниже этой кривой, слухом не воспринимаются. Таким образом, сигнал помехи с частотой около 2 кГц и уровнем порядка 40 дБ, находящийся близко к тестовому, как бы «попадает в его тень» (полосу маскировки), и слухом не воспринимается. Если же сигнал помехи имеет частоту около 8 кГц и уровень всего в 10 дБ, то он уже не попадает в полосу маскировки, и будет вполне отчётливо восприниматься слухом.
Однако при уровне полезного сигнала в 80 дБ приведённый выше сигнал помехи будет меньше него на целых 70 дБ. (Если изложить это в терминах искажений – то величина будет составлять всего 0,03 %)
Вполне очевидно, что столь малой величиной можно достаточно спокойно пренебречь. Таким образом, если в описанных условиях вместе с полезным сигналом будет присутствовать шум с уровнем порядка 10 дБ, и такой суммарный сигнал будет пропущен сквозь обрезной фильтр с граничной частотой около 6 кГц, то, как следует из графика, шумы будут вообще не слышны.
При таком подходе добавление второго перестраиваемого фильтра для удаления НЧ-составляющих шума для повышения эффективности шумоподавителя не имеет смысла.
Во-первых, кривые маскировки для частот, лежащих ниже полезной (на графике – они левее частоты тестового сигнала), имеют гораздо более резкий спад. На практике это означает, что частота среза фильтра, который ограничивал бы полосу пропускания снизу, должна быть гораздо ближе к частоте полезного сигнала, чем в ранее рассмотренном примере. Это влечёт за собой неизбежное увеличение сложности управляющей схемы. Казалось бы, само по себе и не очень страшно, если не считать существенного удорожания прибора.
Но, кроме точности управления фильтром по частоте, необходимо ещё обеспечить и достаточное быстродействие, чтобы при быстро возникающем низкочастотном звуке его начальная часть (атака) не была бы «съедена» прибором. А вот это уже попросту невозможно, т. к. при большой скорости изменения АЧХ фильтра он будет сам вносить искажения в сигнал, поскольку скорость его перестройки становится уже сопоставимой со скоростью изменения низкочастотного сигнала, точнее – с его периодом.
Все вышеизложенные причины и привели к тому, что во всех денойзерах отдельного фильтра для обрезки НЧ-шумов нет.
Таким образом, АЧХ денойзера имеет вид АЧХ НЧ-фильтра, частота среза которого изменяется от некоторого начального значения до полной полосы частот всего звукового диапазона. Она тем шире, чем больше уровень входного сигнала, и чем выше наивысшая частота, присутствующая во входном сигнале. Это иллюстрирует рис. 8.2, на котором сплошной линией изображена АЧХ денойзера в отсутствие сигнала, либо при наличии только слабых низкочастотных сигналов.













Рис. 8.2. АЧХ денойзера
Пунктирными линиями здесь же изображены те АЧХ, которые будут иметь место при более сильных или более широкополосных сигналах, а стрелкой – направление изменения АЧХ при увеличении уровня и/или расширении спектра входного сигнала.
Для обеспечения возможности успешно работать с самыми различными звуковыми сигналами в хороших приборах, помимо автоматики, предусматриваются и некоторые ручные регулировки.
Обычно их три:
1) начальная частота среза фильтра при отсутствии сигнала Cut-off,
2) скорость закрывания фильтра Release;
3) регулятор чувствительности Threshold.
Иногда ещё к ним добавляется возможность изменения жёсткости порога срабатывания – переключатель Soft/Hard.
8.2. Программы-денойзеры
Если можно для ликвидации шумов применять фильтр с изменяемой полосой пропускания, то, очевидно, можно получить то же самое, если набором фиксированных фильтров сначала поделить сигнал на узкие полосы, а потом пропускать или блокировать его отдельные составляющие? Именно на таком принципе основана работа всех компьютерных программ-денойзеров. В них входной сигнал, прошедший сквозь очень большое число очень узкополосных фильтров, подаётся на такое же количество нойз-гейтов, т. е. сигнал каждой отдельной полосы подаётся на свой собственный индивидуальный гейт. Затем выходы всех индивидуальных гейтов суммируются.
Из самого принципа действия сразу же становится очевидной нереальность любой попытки изготовить такой денойзер в аналоговом виде. В самом деле, ведь число индивидуальных полосовых фильтров может составлять несколько десятков тысяч
Основная проблема в таких шумоподавителях – это нереальное количество органов управления из-за того, что гейтов – тысячи. Поэтому используется автоматическая установка параметров. Делается это следующим образом – перед началом работы программы-денойзера на подлежащем обработке материале выбирается маленький его кусочек, не содержащий полезного сигнала. Естественно, что в этом месте будут присутствовать только шумы. Этот образец шума и используется для настройки порогов гейтов.
Перед началом процесса программа анализирует спектр шума, пропуская его сквозь набор фильтров. После этого запоминается значение уровня шума в каждой полосе (его АЧХ), и эта величина становится эталонной при решении программой вопроса – является ли сигнал в данной полосе полезной информацией, или же просто шумом?
Если сигнал меньше значения, определённого на этапе анализа эталонного образца, он считается шумом, гейт этой полосы закрывается, и сигнал на выход не проходит.
Если же входной сигнал превышает эталонную величину, он считается полезным, и беспрепятственно проходит на выход.
Так как все фильтры, входящие в набор, являются фиксированными, то единственный явный параметр управления ими, к которому пользователь имеет доступ, – это простое указание количества полос, на которое будет разделён обрабатываемый сигнал.
Практически всегда есть возможность в графическом виде скорректировать АЧХ шума, используемую для настройки порогов гейтов, и изменить их общую чувствительность. Также возможно и видоизменять амплитудную характеристику процесса открывания/закрывания гейтов, выбирая более мягкий или более резкий характер перехода из одного состояния в другое, и регулировать степень её крутизны. При этом пороговый ограничитель шума может переходить из режима работы гейта в режим работы экспандера.
Однако, несмотря на различные результаты работы программных денойзеров, единый принцип их работы обеспечивает и одинаковые же артефакты, т. е. искажения исходного сигнала. Связано это с самой сущностью процесса – с разделением сигнала на большое количество очень узких полос.
При этом, вследствие поочерёдного исчезновения из звукового сигнала отдельных узких полос его составляющих, сигнал приобретает весьма характерный «фленджерный» призвук. К сожалению, это явление принципиально неустранимо, хотя тщательным подбором параметров работы программы-денойзера оно может быть сделано достаточно малозаметным.
8.3. Компандерные системы шумопонижения
Вторая большая группа устройств шумопонижения предназначена, главным образом, для расширения динамического диапазона трактов записи-воспроизведения, хотя иногда они применяются и в трактах приёма-передачи – например, радиомикрофонов [5].
В отличие от ранее рассмотренных, эти системы абсолютно ничего не изменяют в исходном сигнале. Они только улучшают условия передачи сигнала через тот тракт, в котором установлены. И уменьшить уровень шумов непосредственно в обрабатываемом ими сигнале нельзя.
Так как любой тракт передачи сигналов имеет две стороны – приёмную и передающую, или, иначе говоря, вход и выход – то, очевидно, что для его улучшения необходимо обрабатывать (кодировать) сигнал, как на входе, так и на выходе. Именно так это и производится в реальности.
От объединения частей слов КОМПрессор и экспАНДЕР и родилось общее название таких систем – компандерные системы шумопонижения.
Компандер – это общее название устройств, применяемых для расширения динамического диапазона путём компрессии сигнала на входе и последующего его экспандирования на выходе.
8.3.1. Элементарная система шумоподавления
И грампластинка на 78 оборотов в минуту с плохим отношением «сигнал/шум», и наиболее высококачественные аудиосистемы производят шум, который не зависит от сигнала. Но когда уровень шума в результате внешнего воздействия начинает меняться в пределах одной фонограммы, появляется модуляция шума.
Это явление проще понять, представив себе магнитофон, осуществляющий запись на магнитной ленте и имеющий регулировки уровня записи и уровня воспроизведения.
При записи на подобный аппарат уровень входного сигнала настраивают таким образом, чтобы во время наиболее громких фрагментов фонограммы измеритель уровня находился «в красной зоне». Во время воспроизведения уровень громкости устанавливают так, чтобы эти же наиболее громкие фрагменты проигрывались с оптимальной громкостью. В результате, во время звучания громких частей записи шум пленки, даже когда он слышен, не мешает восприятию музыку. Зато во время звучания наиболее тихих пассажей он становится хорошо заметным и в какой-то момент может полностью перекрыть музыку. Дело в том, что уровень шума все еще остается постоянным на протяжении всей фонограммы.
Компрессия
Чтобы избежать ситуации, когда на фоне шума тихая музыка почти не слышна, следует поднять уровень записи. Однако просто зафиксировать его в таком положении нельзя, т. к. при этом любой громкий музыкальный фрагмент вызовет слишком сильный скачок громкости и, следовательно, значительные искажения сигнала. Конечно, во время воспроизведения можно постоянно повышать уровень записи на тихих фрагментах и уменьшать на громких. Но это приведет к тому, что динамический диапазон музыкального произведения будет сильно сжат. Другими словами, разница между тихими и громкими фрагментами будет минимальной, а это в большинстве случаев противоречит замыслу композитора и исполнителя.
Экспандирование
После компрессированной записи на магнитной ленте имеется возможность восстановления первоначального динамического диапазона во время воспроизведения. Чтобы выполнить расширение динамического диапазона, нужно лишь уменьшить уровень громкости на тихих фрагментах записи (до соответствующего замыслам композитора и исполнителя) и затем поднять его при воспроизведении громких пассажей. При этом понижение уровня громкости на тихих фрагментах создаст эффект снижения шумов от магнитной ленты (ведь тихие фрагменты были записаны при повышенном уровне записи). В то же время при воспроизведении громких музыкальных фрагментов шум по-прежнему не будет мешать прослушиванию – он будет плохо слышен на фоне громкой музыки.
Таким образом, если проделать последовательно описанные операции компрессирования и экспандирования сигнала (т. е. постоянно проводить регулировку уровня во время записи и воспроизведения), получится грубая ручная система шумоподавления. Фактически, она устраняет шум во время звучания тихих фрагментов произведения и оставляет исходный уровень шума, когда звучат громкие пассажи.
Электронное устройство, которое способно проводить такую работу, является наиболее простой системой шумоподавления. Его называют широкополосным компандером (компрессором/экспандером). Схемы работы такого устройства при записи и воспроизведении громких и тихих отрывков фонограммы соответственно показаны на рис. 8.3 и 8.4.
Широкополосный компандер имеет одну важную особенность: при его применении уровень шума начинает зависеть от входного сигнала. Использование этой системы шумоподавления приводит к тому, что уровень шума остается относительно высоким во время звучания громких фрагментов (хотя при этом он значительно тише, чем полезный сигнал) и снижается при воспроизведении тихих частей записи. Именно это явление и называют модуляцией шума.


















Рис. 8.3. Работа широкополосного компандера на громких сигналах
















Рис. 8.4. Работа широкополосного компандера на тихих сигналах
8.3.2. Модуляция шума
Важно понимать, что модуляции шума не происходит в природе. К примеру, шум водопада постоянен. Человек вскоре привыкает к присутствию звука бурлящей воды и замечает его только в случае, когда он значительно изменяется или вообще пропадает. Другими словами, человек чувствителен к переменам в тех случаях, когда их не ожидает.
Поэтому шум с изменяющимся уровнем при прослушивании аудиозаписи больше заметен и сильнее раздражает, чем шум постоянный. Любые слышимые изменения в присутствующем шуме, даже совсем незначительные, моментально воспринимаются человеческим ухом как что-то чужеродное.
В этом как раз и заключается основной недостаток элементарного широкополосного компандера. Когда изначальный уровень шума (постоянного для всей фонограммы) велик и появляется необходимость его понизить, применение широкополосного компандера непременно влечет за собой модуляцию шума, которая, в свою очередь, неприятна для слуха.
Если ограничиться только компандерами, основанными на простом управлении уровнем записи и громкостью при воспроизведении, решения этой проблемы найти не удастся, т. к. все подобные устройства рождают слышимую модуляцию шума. Однако существуют и другие конструкции систем шумоподавления, которые не вызывают это неприятное явление.
8.3.3. Идеальная система шумоподавления
Итак, если шум слышен без использования широкополосного компандера, то после его включения может появиться модуляция шума. При этом на «плотных» фонограммах (например, рок-музыка или звучание симфонического оркестра) данная система работает вполне эффективно, и модуляция шума будет почти не заметна. Однако при воспроизведении менее насыщенных музыкальных фрагментов (к примеру, запись кларнета или фортепиано) модуляция шума станет явной и помешает восприятию музыки. Причина в том, что «плотные» записи имеют более широкий спектр, в то время как сольные партии инструментов звучат в ограниченном диапазоне.
Маскирование
Чтобы лучше понять особенности работы широкополосного компандера и, следовательно, сделать вывод о том, какой должна быть идеальная система шумоподавления, нужно снова рассмотреть такое явление, как маскирование.
Линия а на рис. 8.5 показывает уровень звукового давления, при котором человеку слышны соответствующие частоты. Иными словами, это – порог слышимости. Звуки, уровень которых выше этой кривой, слух воспринимает, ниже – нет. Отчетливо видно, что порог разный для разных частот. На частоте 4 кГц люди могут уловить гораздо более тихий звук, чем на частоте 50 Гц или 15 кГц. На 25 кГц граница вообще за пределами графика, т. е. не важно, насколько громко будет звучать сигнал на этой частоте – человек все равно его не услышит.















Рис. 8.5. Порог слышимости: а) без сигнала, б) с громким сигналом на частоте 500 Гц
Теперь появился относительно громкий сигнал на частоте 500 Гц. Новая граница слышимости изображена на рис. 8.5 в виде линии б. Видно, что на частотах, соседних с указанной, граница поднялась очень сильно, и по мере удаления от 500 Гц порог слышимости изменяется все меньше и меньше. Наконец, на отдаленных частотах он вообще остался прежним – изменение уровня сигнала на частоте 500 Гц на эти области спектра не повлияло.
Изначально уровень шума был выше порога слышимости (т. е. человек мог отчетливо его слышать). Тогда после усиления сигнала на частоте 500 Гц шум на соседних частотах оказывается вне порога слышимости, он пропадает. В таких случаях говорят, что шум маскирован громким сигналом. При этом на удаленных от 500 Гц частотах шум, который был слышен без громкого сигнала, будет слышен и после его появления.
Итак, маскирование зависит не только от присутствия громких сигналов, но и от того, на какой частоте появляются эти сигналы. То есть, чтобы избежать появления модуляции шума, система шумоподавления должна быть чувствительна не только к уровню, но и к частоте возникающих сигналов. Именно поэтому широкополосный компандер (который реагирует только на уровень сигнала) эффективно работает лишь при воспроизведении плотных фонограмм. Ведь в них уровень сигнала повышается сразу во всем спектре, вследствие чего, порог слышимости изменяется также по всему диапазону, и применения компандера достаточно, чтобы ликвидировать шум.
Но при воспроизведении сольных инструментальных партий ситуация будет совсем иной. Такие записи содержат относительно громкие звуки, сосредоточенные в узкой полосе спектра. Это делает кривую маскирования похожей на линию б на рис.8.5. Устройство при этом работает, как при воспроизведении плотной фонограммы (т. е. поднимает уровень сигнала во всем спектре), и, следовательно, в некоторых частях диапазона шум не только не маскируется, но даже наоборот – усиливается.
Итак, чтобы эффективно ликвидировать шум (без появления эффекта модуляции), идеальная система должна обеспечить шумоподавление на всех частотах, где нет громких сигналов и, следовательно, не происходит маскирования. Уровень шума может расти только на тех частотах, на которых он остается под порогом маскирования.
При отсутствии сигнала во время записи идеальная система шумоподавления будет работать с фиксированным усилением входного сигнала и соответствующим понижением уровня во время воспроизведения. Благодаря этому в выходном сигнале шум будет отсутствовать. Когда звук будет усиливаться на определенной частоте, понижение его уровня при записи произойдет также на этой частоте и на соседних с ней (рис. 8.6). Соответственно, во время воспроизведения уровень сигнала будет уменьшен в нужной области частотного диапазона. Это создаст эффект подавления шума в определенной части спектра, где не происходит маскирования, а на остальных частотах сигнал останется без изменения (рис. 8.7). В результате, шум будет устранен без появления эффекта модуляции.
В американской компании Dolby Laboratories (которая является известным разработчиком систем шумоподавления) такой алгоритм работы системы называют «принципом наименьшего вмешательства».
В общем случае маскирование шума во время присутствия громкого сигнала является одной из форм модуляции шума. Но т. к. этот процесс естественный, он не раздражает слух человека.



















Рис. 8.6. Подъем в кодере: а) без сигнала; б) с сигналом на частоте 500 Гц

















Рис. 8.7. Спад в декодере: а) без сигнала; б) с сигналом на частоте 500 Гц
8.3.4. Проблема кратковременных выбросов
Основная задача компрессора состоит в том, чтобы усиливать тихие сигналы больше, чем громкие. Это означает, что, если уровень сигнала внезапно повысился, компрессор должен отреагировать и уменьшить усиление. Однако из-за того, что он заранее «не знает», когда именно сигнал станет громче, обычный компрессор допустит выброс сигнала. То есть прежде, чем прибор отреагирует на скачок, и уровень будет понижен, в течение очень короткого времени сигнал будет слишком громким – произойдет выброс.
Простейший случай такого выброса проиллюстрирован на рис. 8.8. В верхней части изображения (рис. 8.8, а) показана ситуация, когда уровень синусоидального входного сигнала внезапно повысился на 10 дБ, т. е. примерно в 3 раза относительно нормального уровня (на рисунке схематично изображена только огибающая сигнала). Предположим, что компрессор при этом должен ликвидировать этот скачок, понизив уровень до 6 дБ (на 4 дБ). На рис. 8.8, б изображена схема сигнала, который в идеале должен получиться после работы компрессора. Однако в действительности компрессор естественно запаздывает, в результате чего и происходит кратковременный выброс в 4 дБ по модулю (рис. 8.8, в).






а) б) в)
Рис. 8.8. «Выброс» компрессора: а) огибающая входного сигнала; б) желаемый результат работы компрессора; в) реальный результат работы компрессора
Очевидно, выбросы на высокоуровневых сигналах могут привести к перегрузкам и заметным искажениям звука. Их длительность зависит от того, сколько времени нужно компрессору, чтобы среагировать (т. е. от, так называемого, времени атаки).
На первый взгляд, проблема выбросов сигнала может быть решена путем уменьшения времени атаки до минимума, когда выбросы станут незаметными. Чтобы понять, будет ли такая схема работать, необходимо рассмотреть компрессор как амплитудный модулятор.
Когда единичная синусоида каким-то образом подвергается воздействию (например, изменяется ее амплитуда), она перестает быть единичной. Появляется спектрально более сложный сигнал, содержащий несколько частот. Чем сильнее воздействие на синусоиду, тем больше появляется дополнительных частот – боковых полос. Кроме того, чем выше скорость возмущения, тем дальше от изначальной частоты будут располагаться эти боковые полосы. Это – принцип амплитудной модуляции (АМ) в радиовещании, и он полностью применим к работе компрессора. Компрессирование повышает уровень входного сигнала, эквивалентного несущей частоте в АМ-вещании. Из-за того, что амплитуда каждого частотного компонента изменяется, к сигналу добавляются боковые полосы.
На рис. 8.9 схематически показан результат влияния управляющего напряжения на вид сигнала после изменения его уровня (спектр сигнала управляющего напряжения показан в нижней левой части рисунка). Если входной сигнал имеет частоту 10 кГц, выходной сигнал помимо той же частоты 10 кГц будет содержать боковые полосы, имеющие такую же форму, как и спектр управляющего напряжения. Каждый другой компонент входного сигнала будет иметь добавленные таким же образом боковые полосы. Если необходимо произвести уменьшение уровня до 6 дБ, сумма энергий сигналов высокочастотных боковых полос будет равна примерно 25 % от уровня энергии всего выходного сигнала. Такой же будет и сумма энергий дополнительных низкочастотных колебаний. Таким образом, изменяя уровень сигнала, компрессор вносит 50 % модуляционных искажений.
Выше было упомянуто, что чем больше скорость возмущения сигнала (и, соответственно, меньше время атаки компрессора), тем дальше от начальной частоты будут располагаться боковые полосы. Если время атаки слишком продолжительно – например десятки миллисекунд – сигнал управления усилением будет состоять только из низких частот. Таким образом, каждая пара боковых полос близка к соответствующей компоненте входной частоты (рис. 8.9). Как отмечалось выше, низкоуровневые нежелательные составляющие, близко расположенные к нужным компонентам, маскируются. Получается, что из-за медленной атаки компрессора происходит заметный выброс, но работа самого прибора при этом почти не слышна.
Если атака быстрая, сигнал контроля уровня содержит высокие частоты (рис. 8.10). Боковые полосы распространяются на большое расстояние от частот входного сигнала и вполне могут быть не маскированы. Действительно, из-за того, что кратковременные искажения происходят во время уменьшения уровня и состоят из компонентов частот, широко распределенных по всему спектру, к сигналу при его изменении по уровню обычно добавляется слышимый щелчок. Таким образом, при малом времени атаки выброс почти не заметен, но отчетливо слышна работа компрессора (появляются хорошо заметные щелчки).


















Рис. 8.9. Большое время атаки
Таким образом, для обычного компрессора/лимитера выбор времени атаки является компромиссом между искажениями, вызванными выбросами, и щелчками, возникающими от работы самого прибора.
Можно предположить, что с дополнительной системой шумоподавления щелчки, вызванные стремительной атакой, можно устранить – все помехи от первой системы будет подавлять вторая. Однако для реализации этой идеи потребуется экспандер, который может генерировать одинаковые боковые полосы со строго противоположной полярностью. Щелчки будут устранены только в том случае, если в экспандер поступят именно те боковые полосы, которые сгенерирует компрессор. К сожалению, в реальности среда всегда вносит искажения в сигнал (например, изменение полосы пропускания и/или фазовые сдвиги). В результате, экспандер получает немного измененный сигнал и, следовательно, будет генерировать «неправильные» боковые полосы, которые не смогут компенсировать боковые полосы, образовавшиеся при компрессировании. Таким образом, используя две системы шумоподавления, решить проблему описанных выше искажений не получится.


















Рис. 8.10. Малое время атаки
Искажений можно избежать путем комбинации нескольких приемов.
Первое. Выбросы низко- и среднеуровневых сигналов не перегрузят ни один из компонентов тракта, идущих после компрессора. Иными словами, такие выбросы вполне допустимы в сигнале, а значит, можно устанавливать продолжительное время атаки (десятки миллисекунд) и, соответственно, избежать модуляционных искажений.
Однако для высокоуровневых сигналов необходимо устанавливать время атаки, точно соответствующее характеру сигнала. Поэтому вторая мера, направленная на устранение искажений, состоит в том, чтобы минимизировать выбросы на высокоуровневых сигналах. Как известно, выбросы возникают только когда компрессор уменьшает уровень звука. Это означает, что для громких сигналов уровень усиления компрессора можно зафиксировать и вообще избежать выбросов.
В-третьих, можно ограничить скорость атаки только для тех случаев, когда результирующие модуляционные искажения будут маскированы. Для этого нужно выбрать время атаки, соответствующее спектру сигнала.
Еще одним методом является переключение уровня при переходе через ноль (Zero-crossing). Метод не предотвращает полностью появления щелчков при малом времени атаки. Такое переключение позволило бы устранить возможную отсечку кривой. Однако эта отсечка может все еще присутствовать при спаде. Получающаяся при этом помеха будет меньшей по уровню, но по-прежнему широкополосной.
Это явление легко обнаружить с помощью генератора импульсов, который позволяет менять точку переключения. Если послушать импульс на частоте, к примеру, 100 Гц, он останавливается и начинается с ясно слышимого щелчка, даже если начало и конец импульса находятся в точке Zero-crossing. Щелчок может быть устранен только путем растягивания начала и конца импульса на несколько периодов колебаний (т. е. имитированием медленной атаки).
8.4. Компрессия и экспандирование стационарного сигнала
Как было сказано выше, чтобы система шумоподавления эффективно устраняла шум без слышимых побочных эффектов, она должна работать только в тех областях частотного диапазона, где нет громких сигналов и, следовательно, не происходит маскирования (другими словами, она должна быть частотно зависимой).
8.4.1. Передаточные кривые
Перед тем, как продолжить изучение устройства и принципа работы систем шумоподавления, следует рассмотреть графики, которые описывают работу приборов, производящих компрессию и экспандирование сигнала. Иллюстрируют эти процессы так называемые «передаточные кривые». Далее будет показано, что изучение поведения этих кривых при рассмотрении вопросов данной темы имеет очень большое значение [5].
Особенности графиков.
1. Во всех графиках по горизонтальной оси откладываются значения уровня входного сигнала, а по вертикальной – величина уровня выходного сигнала прибора. Единицей измерения в обоих случаях является децибел. Отсчет ведется относительно точки 0 дБ, находящейся в верхнем правом углу графика. Эта точка выбрана в качестве начала отсчета, т. к. для систем шумоподавления 0 дБ – максимальный уровень сигнала, при котором характер шума не изменяется;
2. Линии на графиках – передаточные кривые – отображают взаимосвязь между уровнями входного и выходного сигналов для различных приборов. Чтобы сделать объяснения более прозрачными, на всех графиках передаточные кривые изображены как прямые и ломаные. Однако в реальных условиях они более плавные, а изменения их наклона происходят не так резко;
3. Все передаточные кривые иллюстрируют соотношение уровней стационарных сигналов.
Итак, любая точка на каждом графике имеет две координаты: уровень выходного и входного сигналов. Например, есть прибор, который с уровнем входного сигнала в –15 дБ дает на выходе –10 дБ. На рис. 8.11 такое соотношение сигналов показано в точке 1 (уровень входного сигнала –15, выходного –10). Разница между ними составляет 5 дБ. Таким образом, в этой точке прибор ведет себя как усилитель, повышая уровень сигнала на 5 дБ.


















Рис. 8.11. Линии с наклоном, равным 1, иллюстрируют разные режимы работы
Далее прибор, получая сигнал уровня –30 дБ, на выходе дает –25 дБ. Этому случаю соответствует точка 2 на рис. 8.11. В этой точке прибор также работает как усилитель, поднимая уровень входящего сигнала на те же 5 дБ.
Предположим, что устройство продолжает вести себя таким образом для всех входных сигналов, находящихся в динамическом диапазоне –30–15 дБ. На рис. 8.11 геометрическим местом точек, отображающих соотношение входных и выходных сигналов во время работы этого усилителя, будет отрезок между точками 1 и 2. Именно он и называется передаточной кривой данного аппарата для сигналов определенного уровня. Если для конкретного прибора внутри какой-то части динамического диапазона за изменением уровня входного сигнала следуют некоторые, фиксированные для этой части диапазона, изменения уровня выходного сигнала, говорят, что передаточная кривая имеет наклон, равный 1.
Пусть прибор для входных сигналов любого уровня ведет себя как усилитель с постоянным коэффициентом усиления (в нашем случае это 5 дБ), тогда линию между точками 1 и 2 на графике можно неограниченно продлить в обоих направлениях (линия А на рис. 8.11). При этом пока игнорируется тот факт, что продление в одном направлении вызовет неизбежную перегрузку, а в другом – усиление шума.
Усилитель с коэффициентом усиления 1. Для него уровни выходного и входного сигналов будут равны, поэтому все точки на соответствующей передаточной кривой будут иметь равные координаты по обеим осям. На рисунке 1 работа этого усилителя представлена прямой В. Она, как и прямая А, имеет наклон, равный 1, но в отличие от нее проходит через точку (0, 0).
Справедлив ряд обобщений.
1. Прибор, передаточная кривая которого является прямой с наклоном, равным 1, является усилителем с постоянным коэффициентом усиления, усилителем с коэффициентом усиления 1 (передается прямой сигнал) либо работает как аттенюатор с постоянным коэффициентом ослабления сигнала.
2. То, какие функции выполняет устройство (усиление, ослабление или прямая передача сигнала), зависит от положения его передаточной кривой относительно прямой В на рис. 8.11. Если соответствующая данному прибору передаточная кривая лежит выше линии В, это означает, что он работает как усилитель с постоянным коэффициентом (линия А). Если передаточная кривая устройства находится на прямой В, прибор не усиливает и не ослабляет сигнал, а передает его без изменений. Наконец, если передаточная кривая устройства расположена под кривой В, процессор работает как аттенюатор (линия С).
3. Любая точка над линией В соответствует усилению сигнала, а под этой линией – ослаблению. Причем, чем выше/ниже находится точка над/под линией В, тем сильнее усиление/ослабление.
Разумеется, не все приборы работают только как усилители или аттенюаторы для входных сигналов во всем динамическом диапазоне. Часто передаточная кривая одного прибора меняет свой наклон и положение относительно линии передачи прямого сигнала, что влечет за собой изменение типа устройства: в одних областях динамического диапазона аппарат работает как усилитель, в других – как аттенюатор. Однако и в этом случае некоторые части кривой все-таки остаются прямыми линиями с наклоном, равным 1. Это означает, что прибор для входных сигналов в определенной области динамического диапазона будет усиливать или ослаблять сигнал с постоянным коэффициентом. Например, на рис. 8.12 показана передаточная кривая устройства, которое при уровне входного сигнала меньше –20 дБ ведет себя как усилитель с постоянным коэффициентом усиления входного сигнала (происходит усиление сигнала на 20 дБ). При этом на входных сигналах с более высоким уровнем прибор выполняет уже функции лимитера: независимо от того, насколько сильно увеличивается уровень входного сигнала, на выходе аппарат дает сигнал фиксированного уровня (наклон линии равен 0).

















Рис. 8.12. Передаточная кривая для усилителя-лимитера
Если устройство осуществляет усиление с постоянным коэффициентом или передает прямой сигнал, после изменения уровня входного сигнала он меняет уровень выходного сигнала ровно на строго определенное, фиксированное для всего диапазона, значение. Во время работы компрессора ситуация несколько меняется. Действительно, суть работы этого прибора динамической обработки заключается в том, что, чем выше уровень входного сигнала, тем меньше аппарат его усиливает. На самом деле, компрессор усиливает сигнал не «на» несколько децибел, а «в» несколько раз. В результате получается, что его передаточная кривая имеет наклон меньше, чем 1 (т. е. она проходит под углом, меньшим, чем 45° к горизонтальной оси). Во время работы экспандера наблюдается обратная ситуация: чем выше уровень входного сигнала, тем меньше он ослабляется. Из-за этого наклон передаточной кривой экспандера становится больше, чем 1. Оба случая проиллюстрированы на рис. 8.13.


















Рис. 8.13. Передаточные кривые компрессора A и экспандера B
На рис. 8.14 хорошо видна разница между передаточными кривыми компрессора с рис. 8.13 (на рис. 8.14 этому компрессору соответствует кривая D) и усилителя с постоянным коэффициентом усиления (на рис. 8.14 ему соответствует кривая Е). Заметим, что в случае с усилителем при изменении уровня входного сигнала на 1 дБ, уровень выходного сигнала также увеличивается на 1 дБ.
А чтобы сигнал на выходе компрессора увеличился на 1 дБ, надо, чтобы на его входе уровень сигнала возрос на 2 дБ. То есть передаточная кривая этого компрессора имеет наклон 1/2 (степень компрессора 2:1).



















Рис. 8.14. Передаточные кривые компрессора D и усилителя с постоянным коэффициентом усиления E
На рис. 8.15 изображены передаточные кривые для экспандера (линия F на графике) и аттенюатора с постоянным ослаблением сигнала (линия G). Так же как и в случае с усилителем, когда уровень входного сигнала для аттенюатора изменяется на 1 дБ, уровень выходного сигнала также изменяется на 1 дБ. Но чтобы уровень выходного сигнала экспандера возрос на 2 дБ, надо, чтобы уровень его входного сигнала увеличился на 1 дБ. Выходит, что передаточная кривая экспандера имеет наклон 2 (степень экспандирования 2:1).
























Рис. 8.15. Передаточные кривые экспандера F и аттенюатора G
При рассмотрении работы приборов динамической обработки сигнала обычно говорят о соответствующих им степенях компрессии или экспандирования (Ratio). Во время расширения динамического диапазона сигнала степень экспандирования в каждой отдельной точке соответствует величине наклона передаточной кривой в этой точке (степень показывает, насколько изменяется уровень выходного сигнала при изменении уровня входного сигнала на 1 дБ). Таким образом, для экспандера, передаточная кривая которого лежит на линии F (рис. 8.15), степень экспандирования составляет 2:1.
Степень компрессии является обратной величиной для значения наклона передаточной кривой. Получается, что компрессор, передаточная кривая которого лежит на кривой D (рис. 8.14), имеет степень компрессии 2:1 (а не 1:2 как можно было бы подумать по аналогии с экспандером).
Примеры передаточных кривых сложной формы изображены на рис. 8.16. Компрессор, передаточной кривой которого является ломаная H, в динамическом диапазоне –200 дБ имеет степень компрессии 2:1. Начиная с –20 дБ он усиливает сигнал с постоянным коэффициентом (повышает уровень всех входящих сигналов на 10 дБ). Кривая I является передаточной кривой экспандера, выполняющего действия, прямо противоположные компрессору H. Наконец, кривая J соответствует прибору, котрый экспандирует (со степенью 2:1) входящий сигнал с уровнем меньше чем –40 дБ, обеспечивает постоянное усиление на 20 дБ сигнала в динамическом диапазоне –40–35 дБ, ограничивает входящий сигнал уровня –35–25 дБ и инвертирует выходной уровень относительно входного для сигналов, уровень которых выше, чем –25 дБ.


















Рис. 8.16. Передаточные кривые сложной формы
8.4.2. Компрессия и экспандирование в условиях резкого изменения входного сигнала
До этого момента рассматривались передаточные кривые для стационарных сигналов. Далее речь пойдет о поведении компрессора и экспандера в ситуации, когда уровень входного сигнала резко повышается, а также о том, как при этих скачках можно прогнозировать поведение передаточных кривых.
Как уже говорилось выше, компрессоры порождают так называемые выбросы при резких скачках уровня входного сигнала. Устранить эти выбросы путем одного лишь уменьшения времени атаки не удается, т. к. быстрая реакция компрессора приводит к появлению слышимых щелчков. Возникает вопрос: как еще можно избежать выбросов сигнала, не получив при этом дополнительных призвуков? Чтобы ответить на него, сначала необходимо определить величину выбросов.
На рис. 8.17 изображены передаточные кривые компрессора (имеющего степень компрессии 2:1 во всем динамическом диапазоне и единичное усиление в точке 0 дБ), а также усилителя с коэффициентом, равным 1. Для этого компрессора, при фиксированных уровнях входного сигнала в –20 дБ и –10 дБ, выходной сигнал будет составлять соответственно –10 дБ и –5 дБ (на графике это точки А и В).


















Рис. 8.17. Выброс на 5 дБ при внезапном повышении сигнала с -20 до -10 дБ (при степени компрессии 2:1)
Теперь уровень входного сигнала внезапно повышается с –20 до –10 дБ. Известно, что после появления этого скачка, компрессор должен уменьшить разницу между первоначальным и повышенным уровнями сигнала с 10 до 5 дБ (т. е. в два раза, ведь степень компрессии равна 2:1). Прибор не может мгновенно подавить повысившийся сигнал, для этого ему нужно какое-то время (так называемое время атаки). Получается, что перед тем, как подавить сигнал, компрессор будет усиливать его с определенным коэффициентом. Эту ситуацию иллюстрирует пунктирная линия на рис. 8.17: уровень входного сигнала резко повысился до –10 дБ, но прибор все еще продолжает усиливать его на 10 дБ. В результате выходной сигнал достигает уровня 0 дБ (точка С). Как уже говорилось, это превышение уровня относительно желаемого на 5 дБ (желаемый уровень выходного сигнала – точка В на графике) будет устранено только через какое-то время, когда компрессор вернется к «нормальной» передаточной кривой. В результате, произойдет выброс сигнала величиной в 5 дБ. То есть величина выброса будет равна величине, на которую нужно уменьшить сигнал.
Из рис. 8.17 понятно, что оценивать размер выброса следует путем сравнения исходной и измененной передаточных кривых. Проведем эту оценку для случая, когда уровень входного сигнала изменился с –15 до –6 дБ, как показано на рис. 8.18. Судя по первоначальной передаточной кривой, уровень на выходе, соответствующий входному сигналу –15 дБ, составляет –7,5 дБ (точка D на графике). Как и на рис. 8.17, через эту точку следует провести пунктирную линию под углом 45°. Разница между уровнями выходного сигнала в точках E и F (F находится строго над Е) составляет 4,5 дБ. Именно таким будет выброс сигнала.


















Рис. 8.18. Выброс на 4,5 дБ при увеличении сигнала с -15 до -6 дБ (при степени компрессии 2:1)
Здесь при выбросе уровень выходного сигнала стал выше отметки 0 дБ. Если у элементов звукового тракта, идущих за компрессором, произойдет перегрузка, это вызовет искажения звука на выходе из системы. То есть, если компрессор находится вначале цепи дополнительной обработки (например, шумоподавления), этот выброс вызовет ошибки и искажения в работе других устройств. Получается, что для такого компрессора (с постоянной степенью 2:1) размер выброса не играет роли – любой выброс, не зависимо от величины, будет опасен. Поэтому каждое резкое увеличение сигнала требует уменьшения его уровня в два раза.
Определение величины выброса будет полезным при работе с компрессором, который имеет более сложную передаточную кривую. Примером может послужить прибор, передаточная кривая которого изображена на рис. 8.19. При входном сигнале с уровнем выше –20 дБ наклон его передаточной кривой равен 1. В этой области динамического диапазона компрессор не осуществляет усиления, а передает прямой сигнал. Ниже –20 дБ наклон его передаточной кривой равен 1/2 и, следовательно, степень компрессии составляет 2:1. Кстати, несмотря на то, что сигнал, уровень которого выше –20 дБ, не компрессируется, этот прибор, тем не менее, остается компрессором, ведь, в среднем, уклон его передаточной кривой меньше, чем 1.



















Рис. 8.19.. Выбросы происходят только для сигналов с уровнем меньше -20 дБ. При уровне входного сигнала больше, чем -20 дБ, выбросов не будет
Итак, при изменении входного сигнала с –30 до –20 дБ или с –10 до 0 дБ (т. е. на 10 дБ в обоих случаях) выбросы сигнала будут составлять соответственно –10 дБ и 0 дБ. Получается, что при усилении высокоуровневых сигналов выбросов не происходит. Повышение уровня тихих сигналов вызывает выброс, однако он не влечет за собой перегрузку следующих аппаратов тракта, т. к. не достигает слишком высокого значения. Таким образом, после обработки сигнала таким компрессором, остается возможность для последующего экспандирования без искажения и появления ошибок.
8.4.3. Билинейные характеристики компрессора
На рис. 8.19 изображена передаточная кривая компрессора, которая на сигналах высокого уровня является прямой линией с наклоном, равным 1. Когда сигнал находится в данной области динамического диапазона, характеристики прибора линейны. Это означает, что в его выходном сигнале нет никаких новых составляющих (лишних гармоник, интермодуляции и т. д.), которых не было во входном. Кроме того, при резком повышении уровня сигналов в этой области динамического диапазона компрессор с такой передаточной кривой не создает выбросов сигнала.
Как известно, одно из свойств идеальной системы шумоподавления заключается в том, что компрессор должен усиливать низкоуровневый сигнал (который почти не оказывают маскирующего действия на шум) с постоянной степенью. Задача экспандера, находящегося в тракте после компрессора, – расширить динамический диапазон записи, понизив уровень тихих сигналов (чем тише сигнал, тем сильнее ослабление). Последовательное проведение операций компрессии и экспандирования обеспечит подавление шума. Передаточная кривая компрессора, повышающего уровень тихих сигналов, показана на рис. 8.20. На низкоуровневых сигналах она имеет наклон, равный 1 (усиление с фиксированным коэффициентом), но при переходе определенного порогового уровня (к примеру –40 дБ) она превращается в передаточную кривую, соответствующую работе обычного компрессора. Прибор, имеющий такую передаточную кривую, ниже порогового уровня также является линейным.
На рис. 8.19 и 8.20 показана идеальная обработка сигналов соответственно высокого и низкого уровней. Результат объединения этих алгоритмов изображен на рис. 8.21. Прибор с такой передаточной кривой имеет так называемые билинейные характеристики, т. е. в динамическом диапазоне есть две области, в которых он линеен. Он реально компрессирует сигнал (т. е. изменяет его усиление) только в среднем участке динамического диапазона. В результате, этот аппарат производит необходимую компрессию сигнала, но при этом не вызывает выбросов.

















Рис. 8.20. Выбросы происходят только для сигналов с уровнем больше –40 дБ, но меньше –20 дБ. При уровне входного сигнала меньше –40 дБ выбросов не будет
















Рис. 8.21. Передаточная кривая компрессора с билинейными характеристиками
На использовании приборов динамической обработки, которые имеют билинейные характеристики, основаны все системы шумоподавления Dolby. При проведении шумоподавления с использованием аппаратов, работающих по другому принципу, неизбежно появится слышимая модуляция шума или выбросы сигналов.
Итак, стремление минимизировать выбросы сигнала, возникающие при работе компрессора, приводит к необходимости вообще предотвратить их появление. Для этого нужно, чтобы компрессор не усиливал и не ослаблял высокоуровневые сигналы, а в нижней части динамического диапазона осуществлял фиксированное усиление. Это позволит предотвратить выбросы на громких сигналах и при этом повысит уровень звука при воспроизведении тихих фрагментов записи.
Выше говорилось о том, что идеальная система шумоподавления должна быть частотно зависимой, т. е. должна работать только в тех областях частотного диапазона, где не происходит маскирования. Отсюда компрессоры с характеристиками, описанными выше, также будут частотно зависимыми. Например, в системах шумоподавления Dolby типа B компрессия с билинейными характеристиками применяется в полной мере в высокочастотной области диапазона, до некоторой степени на средних частотах и не используется вовсе в нижней части спектра.
8.5.Практическая реализация системы шумоподавления
Выше был сделан вывод, что для построения эффективной системы шумоподавления компрессор должен иметь билинейные характеристики. (см. рис. 8.21). Рассмотрим возможности реализации этого принципа на практике [5].
8.5.1. Приборы с двумя маршрутами прохождения сигнала
При компрессии с билинейными характеристиками высокоуровневые сигналы передаются напрямую. Из этого следует, что система шумоподавления должна иметь тракт, по которому звук во всем динамическом диапазоне будет проходить без изменений. Этот так называемый «главный маршрут» показан на схеме, изображенной на рис. 8.22, а. Но чтобы необходимая компрессия сигнала в других частях динамического диапазона была проведена, параллельно с главным маршрутом должен проходить обходной маршрут. Именно в нем будут присутствовать компрессор или лимитер. Причем конструкция должна быть такой, чтобы для громких сигналов на выходе системы шумоподавления сигнал с обходного маршрута был значительно слабее по сравнению с сигналом главного маршрута и, следовательно, доминирующим оказывался сигнал, не подверженный динамической обработке.






















Рис. 8.22.Система шумоподавления с билинейными характеристиками: а) компрессор, б) экспандер
Если максимальное значение усиления, производимое компрессором, во всем динамическом диапазоне определено, то известно и наибольшее значение усиления при работе связки главного и обходного маршрутов. Например, на рис. 8.23 показана ситуация, когда для сигналов, уровень которых ниже определенной границы («начальной точки»), звук, передающийся по обходному маршруту, усиливается на 6 дБ. Это соответствует усилению по напряжению на две относительные единицы (другими словами, повышению напряжения в два раза). То есть при усилении уровня входного сигнала на одну относительную единицу уровень сигнала, проходящего по обходному маршруту, усиливается на две единицы, а по главному маршруту – на одну единицу. В сумме общее усиление составляет три единицы. Таким образом, если уровень входного сигнала ниже известного порога, общее усиление по напряжению составит три относительные единицы (или 9,5 дБ). Линия, соответствующая этому усилению, показана на рис. 8.23: она проходит под углом 45о на 9,5 дБ выше линии передачи прямого сигнала.




















Рис. 8.23. Общее усиление входного сигнала компрессором
Как только уровень сигнала достигает начальной точки, усиление в обходном тракте падает по мере возрастания уровня входного сигнала. Положим, в точке А усиление в обходном тракте уменьшилось с 2 до 1, тогда общее усиление в этой точке составит две единицы (единица в главном тракте плюс единица во вторичном тракте) или, другими словами, 6 дБ. Пусть в точке В усиление во вторичном тракте опустилось до 1/10, тогда общее усиление в этой точке составит 1 + 1/10 = 1,1 (или 0,8 дБ). То есть высокоуровневые сигналы будут передаваться почти без усиления, что и требовалось.
Легко понять, как будет работать экспандер, соответствующий компрессору с двумя маршрутами прохождения сигнала. Схема работы этого экспандера показана на рис. 8.22, б. На этот раз сигнал во вторичный тракт поступает с выхода, и вместо того, чтобы добавляться к выходному сигналу, он вычитается из входного. При эффективной работе системы шумоподавления условия прохождения сигнала по обходному маршруту компрессора и экспандера должны быть одинаковыми.
8.5.2. Применение систем шумоподавления с двумя маршрутами прохождения сигнала
Если для любого входного сигнала во всем динамическом диапазоне известен уровень его усиления в обходном тракте, можно вычислить результирующие характеристики компрессии. И обратно, если известно, какие характеристики компрессора нужно получить, несложно понять, как на сигнал должен воздействовать обходной маршрут. При этом точная форма кривой компрессии во всех областях динамического диапазона не важна. Главное, чтобы необходимый уровень усиления имел место ниже стартовой точки и после конечной точки.
Возьмем, к примеру, систему шумоподавления Dolby типа А. Схема ее работы показана на рис. 8.24. В той области динамического диапазона, которая расположена над самой границей низкоуровневых сигналов, компрессор в обходном маршруте этой системы работает скорее как лимитер. А для более громких звуков он начинает инвертировать сигнал по уровню (любое усиление входного сигнала вызывает такое же по значению ослабление выходного сигнала). Результирующая характеристика компрессора имеет точно определенную стартовую точку, но конечной пороговой точки у него нет. Главное, что, начиная примерно с 20 дБ, усиления не происходит (оно единичное), и на рисунке хорошо видно, что в результате компрессор имеет билинейные характеристики.
Одно из достоинств системы шумоподавления с двумя маршрутами прохождения сигнала состоит в том, что максимальный вольтаж на выходе обходного маршрута компрессора может лишь незначительно превосходить максимальный вольтаж на выходе или входе всего прибора. Это позволяет использовать при создании аппарата простые и соответственно недорогие компоненты. Такое достоинство было особенно актуально в 1965 году, когда появились первые шумоподавители типа А. Применяя современные интегральные схемы, можно получить передаточные кривые любых требуемых форм.
























Рис. 8.24. Передаточные кривые компрессора в системе Dolby A
8.6. Конструкция систем шумоподавления Dolby
8.6.1. Конструкция систем шумоподавления Dolby типа A
Чтобы избежать появления эффекта модуляции шума, система шумоподавления должна работать только в тех областях частотного диапазона, где не происходит маскирования. Dolby A была первой системой, построенной по этому принципу (1965 год) [5].
В системе шумоподавления типа А весь спектр частот разделен на четыре полосы. В каждой из них прибор проводит независимую билинейную динамическую обработку сигнала. При этом используется система с двумя маршрутами прохождения сигнала. На рис. 8.25 показана схема работы компрессора, входящего в состав системы типа A. Соответствующий этому компрессору экспандер может быть легко получен путем инвертирования работы обходного маршрута, как это было описано выше.





















Рис. 8.25. Схема работы компрессора в системе Dolby A
Для этой системы общее усиление/ослабление низкоуровневых сигналов в каждой полосе фиксировано и равно 10 дБ. Другими словами, уровень шумоподавления составляет 10 дБ. Если уровень сигнала в какой-либо полосе находится выше определенной границы (стартовой точки), прибор производит подавление шума в этой полосе. При этом сигнал и усиливающийся шум находятся примерно на одной частоте, поэтому шум маскируется громким сигналом. Очень важно, что шумоподавление в одной полосе независимо от сигнала в других полосах, а это фактически является определением системы шумоподавления, не вызывающей слышимый эффект модуляции шума. Наконец, из-за того, что компрессия билинейна, сигналы в пределах верхних 20 дБ динамического диапазона почти не усиливаются, а значит, могут произойти лишь незначительные выбросы громких сигналов.
Калибровка
Сложность, связанная с использованием устройств с билинейными характеристиками компрессии, заключается в том, что такие приборы требуют проведения настройки устройства таким образом, чтобы кривые компрессии и экспандирования были согласованы между собой. Чтобы облегчить процедуру калибровки, надо определить так называемый уровень Dolby – контрольную точку на передаточной кривой. В компрессоре, который входит в состав системы шумоподавления типа А, специальный тон-генератор на референсном уровне выдает частотно модулируемый тон (так называемый тон Dolby). После этого уровень входного сигнала для экспандера настраивается так, чтобы индикатор уровня показал, что сгенерированный тон Dolby находится точно на нужном уровне.
Контрольная точка может быть в любой области кривой компрессии. К примеру, можно выбрать уровень, на котором компрессор осуществляет усиление на 6 дБ (а экспандер, соответственно, ослабляет сигнал на 6 дБ). Однако это относительно низкий уровень, и измеритель будет плохо его распознавать. Поэтому обычно в качестве контрольного выбирают уровень, который находится рядом с местом, начиная с которого усиление/ослабление сигнала становится совсем небольшим, т. е. в районе конечной точки. При производстве систем шумоподавления проверка кривых компрессии производится на основе именно этого уровня.
Так как общее (суммарное) усиление высокоуровневых сигналов является единичным, при использовании систем шумоподавления типа А усиление высоких частот и проведение дополнительной эквализации в контрольном тракте не требуется. Кроме того, в отличие от систем, имеющих передаточную кривую с постоянным наклоном, для систем типа А степень шумоподавления (10 дБ) определяется формой билинейных характеристик компрессии (т. е. насколько далеко начальная и конечная точки расположены друг от друга), а не уровнем сигнала, поступающим на вход системы шумоподавления, и не положением референсного уровня Dolby в соответствии с уровнем сигнала. Это означает, что эффект шумоподавления у систем типа А не зависит от уровня звука в целом.
Но почему для системы шумоподавления было выбрано фиксированное значение 10 дБ, а не 15 или 20 дБ? Дело в том, что значение 10 дБ позволяет осуществлять шумоподавления без слышимых побочных эффектов и при этом не слишком усложнять конструкцию прибора, сохраняя доступную цену. Кроме того, этого значения достаточно, чтобы значительно понизить уровень шума на стереозаписи со скоростью 38 см/с. Чтобы система такого типа осуществляла более качественное шумоподавление и была так же хорошо защищена от нежелательных побочных эффектов, она должна иметь значительно больше полос и, как результат, намного выше цену.
8.6.2. Конструкция систем шумоподавления Dolby типа В
Использование систем шумоподавления типа А давало очень серьезное улучшение качества звука на кассете, однако применение этой системы делало записи более дорогими. Простой подсчет показывал, что созданный на основе применявшихся тогда активных элементов прибор должен иметь только одну полосу, любое увеличение полос повлекло бы за собой значительное повышение стоимости аппарата.
Шум на кассете особенно хорошо различим в области высоких частот. Поэтому, в первую очередь, был сделан эксперимент, состоявший в том, чтобы из всех полос шумоподавителя использовать только высокочастотную. В результате система, имеющая полосу частот почти как у системы типа А (выше 3,3 кГц), работала без слышимых побочных эффектов, но степень шумоподавления была очень низкой. Если полосу делали шире (например, от 1 кГц и выше), процесс шумоподавления был эффективнее, но появлялась модуляция шума: сигнал в такой широкой полосе не всегда маскировал изменения шума. Фактически, при расширении полосы система начинала вести себя как широкополосный компандер.
При использовании системы шумоподавления, имеющей одну фиксированную полосу, к примеру, от 3 кГц и выше, сигналы ниже 3 кГц не модулируют шум на более высокой частоте. Кроме того, когда сигналы с частотой более 3 кГц по уровню находятся выше низкоуровневого порога (стартовой точки), влияют на шум в полосе выше 3 кГц, они при этом маскируют шум. В результате происходит эффективное шумоподавление на высоких частотах без появления побочных эффектов (модуляции шума). Однако при отсутствии звука на записи и во время воспроизведения тихих сигналов шум хорошо слышен в области от 1 до 3 кГц.
Попытка расширить полосу до 1 кГц приведет к значительному повышению степени шумоподавления при наличии низкоуровневых сигналов. Однако полоса станет слишком широкой, а это приведет к тому, что сигналы в районе частоты 1 кГц, находящейся при этом по уровню выше верхней границы (конечной точки), маскируют не весь высокочастотный шум. Получается, что в области высоких частот вновь появляется модуляция шума. Особенно хорошо эффект модуляции заметен в интервале от 6 до 8 кГц.
Рис. 8.26 иллюстрирует поведение экспандера, осуществляющего шумоподавление величиной 10 дБ при полосе от 1 кГц и выше. На входе подается синусоидальный сигнал в широком динамическом диапазоне. Очевидно, что ослабление сигнала, которое производит экспандер на частоте 10 кГц, зависит от уровня синусоидального сигнала. Если синусоидальный сигнал находится на частоте 1 кГц, он почти не маскирует сигнал на 10 кГц, что приводит к появлению модуляции шума. Таким образом, вопрос состоит в том, чтобы понять, как можно обеспечить подавление шума в полосе от 1 кГц и выше и избежать при этом ситуации, когда сигналы нижней части этой полосы модулируют шум в верхней части диапазона.













Рис. 8.26. Частотные характеристики экспандера с фиксированной полосой при усилении входного сигнала
Ответ на поставленный вопрос таится в тех экспериментах, которые были описаны выше. Действительно, полоса частот, начинавшаяся с 1 кГц, была вполне подходящей до тех пор, пока сигналы выше определенной границы не присутствовали в области частот вокруг 1 кГц. При появлении в этой области громких сигналов, прибор работал более эффективно с полосой от 3 кГц и выше (аппарат больше не осуществлял шумоподавление на частоте 1 кГц, но этого больше и не требовалось, т. к. шум в этой области полностью маскировался громким сигналом).
Получается, что система шумоподавления с одной полосой может работать эффективно, но только в том случае, если ширина этой полосы может меняться в зависимости от изменений спектра сигнала. С тихими сигналами эта полоса будет осуществлять эффективное шумоподавление при ширине от 1 кГц и выше. Но при появлении в районе частоты 1 кГц сигналов, уровень которых находится выше порогового значения, специальный фильтр должен сдвинуть полосу так, чтобы громкие сигналы оказались за ее пределами.
На рис. 8.27 изображено семейство частотных характеристик для так называемой скользящей полосы экспандера. Это семейство состоит из кривых (имеющих, по сути, одинаковую форму и высоту, в данном случае 10 дБ), которые могут двигаться (скользить) вдоль частотной оси. Очевидно, прибор с такими характеристиками обеспечит высокочастотное шумоподавление: расширяя или сужая в зависимости от сигнала полосу частот, он автоматически определяет в разные моменты времени, какую кривую из семейства следует использовать. При наличии высокоуровневых сигналов управляющая схема перемещает фильтр таким образом, чтобы эти сигналы оказались в зоне передачи прямого сигнала, где не производится ослабление сигнала (или происходит минимальное его ослабление). Конечно, в этой области не происходит шумоподавления, но оно там и не нужно, ведь высокоуровневые сигналы маскируют шум. Чтобы обеспечить прохождение громкого сигнала с частотой 1 кГц, полоса должна передвинуться таким образом, чтобы этот сигнал не попал в нее (третья кривая на рис. 8.27). Это позволит избежать появления эффекта модуляции шума, а величина шумоподавления на частоте 10 кГц при этом изменится незначительно.













Рис. 8.27. Частотные характеристики экспандера со скользящей полосой при усилении входного сигнала
Компрессор в системе шумоподавления имеет обратные характеристики: происходит повышение сигнала на 10 дБ и соответствующее смещение полосы (рис. 8.28). Громкий сигнал, поступающий на вход компрессора, вызывает смещение полосы в такое положение, при котором усиление этого громкого сигнала минимально или вообще отсутствует. Это предотвращает чрезмерное усиление сигнала и, следовательно, защищает последующие аппараты тракта от перегрузки.













Рис. 8.28. Частотные характеристики компрессора со скользящей полосой
Рассмотрим поведение компрессора при усилении сигнала на частоте 5 кГц. Не будем при этом обращать внимание на усиление других частот. Частота 5 кГц изображена на рис. 8.28 в виде пунктирной линии. Входной сигнал, уровень которого находится ниже порогового значения, повышается на 10 дБ. При появлении сигналов выше определенной границы фильтр смещается вправо по частотной оси и величина усиления сигнала на частоте 5 кГц постепенно уменьшается. Когда фильтр сместился довольно сильно, усиление на частоте 5 кГц уменьшается до единичного, и аппарат начинает передавать прямой сигнал. Передаточная кривая, иллюстрирующая работу такого устройства, показана на рис. 8.29. Она показывает, что прибор имеет билинейные характеристики.
По принципу, описанному выше, работают системы шумоподавления Dolby типа В. Такие приборы имеют скользящую полосу и обеспечивают шумоподавление на 10 дБ в диапазоне от 1 кГц и выше. Кроме того, эти приборы, как и прочие системы шумоподавления Dolby, имеют двухтрактовую структуру.
























Рис. 8.29. Передаточная кривая компрессора на частоте 5 кГц

















Рис. 8.30. Схема работы компрессора а) и экспандера б) системы Dolby B
8.6.3. Дальнейшие разработки систем шумоподавления Dolby
Итак, на смену системам шумоподавления с несколькими фиксированными полосами Dolby типа А пришли системы типа В (и позже типа С), имеющие одну скользящую полосу. Все эти системы эффективно устраняли шум в высокочастотной области на записях, сделанных на аудиокассете. В начале 80-х, взвесив все «за» и «против» для каждого типа систем, Рэй Долби разработал способ объединения всех достоинств каждой системы в новом типе шумоподавителей, который получил название Dolby SR (Spectral Recording – спектральная запись). Системы этого типа появились в 1986 году и были рассчитаны на работу с профессиональными аналоговыми записями.
При описании систем шумоподавления типа SR будет рассмотрена работа устройств только для высокочастотной области диапазона, однако по такому же принципу эта система может работать на низких и средних частотах. Так как речь идет о системах Dolby, подразумевается, что все аппараты имеют два маршрута прохождения сигнала и билинейные характеристики.
Фиксированная полоса
На рис. 8.31, а сплошная линия соответствует частотной характеристике системы шумоподавления с фиксированной полосой в области высоких частот. Для проведения шумоподавления прибор на 10 дБ повышает уровень тех сигналов, которые тише определенного значения (ниже сплошной линии на рисунке). Когда внутри полосы появляется сильный по уровню сигнал, устройство снижает усиление на 2 дБ. Новую, изменившуюся частотную характеристику изображает пунктирная линия. На рисунке показано, что усиление уменьшается на 2 дБ не только на частоте громкого сигнала, но внутри всей полосы. Следовательно, после экспандирования эффект шумоподавления в высокочастотном диапазоне составляет уже не 10 дБ, а 8 дБ.
Система шумоподавления Dolby типа В на рис. 8.31, б имеет скользящую полосу в области высоких частот. При обработке сигналов, уровень которых находится ниже граничного значения (сплошная линия на рисунке), прибор усиливает звук, как в случае с фиксированной полосой. А при появлении громкого сигнала усиление на частоте этого сигнала уменьшается на 2 дБ. Частотная характеристика, которая при этом получается, изображена в виде пунктирной линии. Из рисунка видно, что усиление на остальных частотах внутри полосы уменьшается с различной степенью. На более низких частотах относительно частоты громкого сигнала усиление уменьшается больше, чем на 2 дБ, в то время как на частотах выше частоты громкого сигнала усиление ослабляется менее чем на 2 дБ. Отсюда экспандер, следующий в тракте после компрессора, обеспечивает шумоподавление со значением меньше 8 дБ ниже частоты громкого сигнала и больше 8 дБ на частотах выше громкого сигнала.








а) Характеристики компрессора с фиксированной полосой







б) Характеристики компрессора со скользящей полосой







в) Характеристики компрессора с фиксированной и скользящей полосой
Рис. 8.31. Типы характеристик компрессоров
Скользящая полоса
Таким образом, на частотах выше громкого сигнала прибор, имеющий скользящую полосу, работает эффективнее, чем аппарат с фиксированной полосой. А в области частотного диапазона, находящейся ниже высокоуровневого сигнала, наоборот, предпочтительнее прибор с фиксированной полосой.
Чередование работающих полос
Рэй Долби решил объединить фиксированную и скользящую полосы, покрывающие одну и ту же область частотного диапазона, и обеспечить то, что теперь называется «чередование работающих частот».
Схема работы прибора, имеющего оба типа полос, показана на рис. 8.31, в. На частоте доминирующего сигнала подавление усиления будет все еще составлять 2 дБ (при этом осуществляется шумоподавление со значением 8 дБ). Ниже этой частоты шумоподавление будет равно тем же 8 дБ (как при работе с фиксированной полосой). А вот выше этой частоты степень шумоподавления будет расти до 10 дБ, как в случае со скользящей полосой. Получается, что каждая из полос выполняет свою работу, но в определенных областях частотного диапазона одна из полос как бы «прячется» под другой.
Когда скользящая полоса передвигается выше и уменьшает усиление на частоте с доминирующим сигналом на 2 дБ, работу прибора начинает определять фиксированная полоса. Фактически, она замещает скользящую полосу, чтобы эффект шумоподавления не уменьшался. Скользящая полоса начинает работать на частотах, которые находятся выше частоты доминирующего сигнала. Поэтому уменьшение усиления на 2 дБ происходит не по всей полосе (как случае, когда прибор имеет только фиксированную полосу), а лишь в той области частотного диапазона, где появился громкий сигнал. Получается, что в этой части спектра скользящая полоса фактически заменяет фиксированную полосу.
Другими словами, на каждой частоте теперь работают два механизма, которые обеспечивают усиление, замещая друг друга. Это позволяет не допустить ослабления усиления в областях, где этого не требуется. Как известно, идеальная система шумоподавления должна усиливать сигнал при компрессии (и, соответственно, ослаблять при экспандировании) только на тех частотах, где не происходит маскирования. Это свойство систем шумоподавления Рэй Долби называет «принципом наименьшего вмешательства». Очевидно, что такие приборы, в которых по описанному выше алгоритму работают одновременно фиксированная и скользящая полосы, гораздо лучше соответствуют «принципу наименьшего вмешательства», чем другие типы систем.
Практическая реализация
Первый способ реализации системы, имеющей фиксированную и скользящую полосы, состоит в том, чтобы сначала провести компрессию с фиксированной полосой, а затем подвергнуть полученный сигнал воздействию скользящего фильтра. На рис. 8.32 показана схема компрессора с двумя маршрутами прохождения сигнала, в котором реализована эта идея. К сигналу главного тракта добавляется сигнал обходного тракта, в котором происходит изменение усиления или, соответственно, ослабления сигнала, а также работает скользящий низкочастотный фильтр. Для упрощения рисунка схема управления на нем не изображена.
Чтобы определить ширину высокочастотной полосы, вторичный тракт начинается с фиксированного НЧ-фильтра (1). Далее аттенюатор (2), если необходимо (т. е. если присутствует громкий сигнал), управляет сигналом в фиксированной полосе. Для этого сигнал, находящийся внутри полосы, вычитается (3) из входного сигнала аттенюатора. Когда ослабления звука не происходит, после этого вычитания сигнал не идет. Однако в случае, если уровень звука ослабляется (т. е. сигнал внутри полосы находится выше определенного порога), выходной сигнал после вычитания является как раз тем сигналом, который был «устранен» аттенюатором. Именно этот «устраненный» сигнал затем следует на переменный фильтр (4), осуществляющий вторую часть действия. Результат работы этого фильтра добавляется к выходному сигналу фиксированной полосы (5), и в итоге формируется общий выходной сигнал обходного тракта.












Рис. 8.32. Схема работы компрессора с фиксированной и скользящей полосами
Аттенюатор и скользящий фильтр, изменяющие сигнал, можно поменять местами, что приведет к абсолютно таким же результатам. Но порядок их следования, который изображен на рисунке, предпочтительнее, т. к. он меньше зависит от применения усилителей управляемых напряжением или полевых транзисторов.
Итак, принцип объединения работы двух полос является одной из главных идей, находящихся в основе систем Dolby типа SR (для профессионального использования) и типа S (для бытовых пользователей).
Спектральное представление системы Dolby SR
В этой системе сигналы записываются не «впрямую», а с учётом не только их уровня, но и спектрального состава. Необходимо проанализировать кривые равной громкости на рис. 8.33,особенно только две, соответствующие максимальному и минимальному уровням слышимости.
Очевидно, что все реально воспринимаемые звуки будут находиться в области, ограниченной этими двумя кривыми. Более громкие находятся за пределами болевого порога, а более тихие нам попросту не слышны.
Вот в соответствии с этим «окном слышимости» и построена работа системы Dolby SR. При её разработке было учтено, что самые низкочастотные и самые высокочастотные звуки, которые находятся по краям звукового диапазона, даже при довольно значительных их абсолютных уровнях, тем не менее, не будут слышны, или, если и будут слышны, то крайне незначительно.















Рис. 8.33. Кривые равной громкости
При обработке входного сигнала, помимо особого компрессирования, Dolby SR ещё и изменяет его АЧХ – так, чтобы она в максимально возможной мере совпадала с соответствующей кривой равной громкости.
Например, что будет, если для сигнала малого уровня преобразовать его АЧХ таким образом, чтобы она совпала с низшей из кривых равной громкости, т. е. поднять среднечастотную область?
На рис. 8.34 приведены две АЧХ – исходного сигнала (прямая пунктирная линия), и его же – после указанной обработки (верхняя пунктирная кривая).
Затем к полученному рисунку АЧХ обработанного сигнала добавлен ровный широкополосный шум, т. е. имитируется прохождение сигнала через тракт записи-воспроизведения, где этот шум неизбежно появится.















Рис. 8.34. Две АЧХ
На рис. 8.35 двумя пунктирными линиями изображены два сигнала. Верхняя кривая – это спектр входного сигнала, преобразованный кодером системы Dolby SR, а нижняя прямая – спектр шумов передающего тракта.
Что получится с нашими сигналами после восстановления на приёмной стороне (на выходе Dolby SR) исходной линейной АЧХ?
На рис. 8.36 верхняя пунктирная прямая изображает спектр записанного сигнала после его восстановления декодером Dolby SR, а нижняя пунктирная кривая – это спектр шума тракта, получающийся после декодера.


















Рис. 8.35. АЧХ + шум














Рис. 8.36. Линейная АЧХ +шум по минимальной из кривых
Для наглядности здесь же приведена низшая из кривых равной громкости, соответствующая порогу слышимости (сплошная кривая).
Видно, что, помимо восстановления исходного сигнала, при этом произошло и перераспределение спектра шумов. В области НЧ и ВЧ – уровень сигнала шума даже повысился. Однако из-за малой чувствительности слуха человека на краях диапазона эти шумы будут неслышимы, и увеличение их абсолютного уровня никакого влияния на собственно звук не окажет. А вот в области средних частот, где чувствительность уха максимальна, шум стал значительно меньше, и благодаря этому общий уровень воспринимаемых ухом шумов значительно ослабится.
Таков основной принцип работы системы Dolby SR в той его части, которая касается изменения ею АЧХ тракта передачи в паре кодер-декодер.
Конечно, кроме изменения АЧХ в системе Dolby SR, также производится и компрессирование сигнала в кодере с последущим его экспандированием в декодере. Однако невозможно выделить в аппаратной реализации Dolby SR отдельные корректоры АЧХ и отдельные компрессоры и экспандеры. Все эти функции выполняются одними и теми же узлами – частотнозависимыми компрессорами. Для этого фирма Dolby разработала особую конструкцию такого компрессора, который совмещен со скользящим фильтром, аналогичным применяемым в денойзерах. При его работе одновременно изменяется и АЧХ сигнала, и осуществляется его компрессия и экспандирование.
Заключение
В пособии были рассмотрены некоторые вопросы, связанные с формированием и обработкой важной части мультимедийной информации – аудио (звуковой) информации.
Методы формирования и обработки звука постоянно развиваются и совершенствуются. Поэтому автор ни в коей степени не претендует на окончательную полноту представленного материала, однако он считает полезным изучение материалов пособия.
Список литературы
1. fdstar.com/2008/04/10.htm
2. Тропченко А. Ю., Тропченко А.А. Санкт-Петербургский государственный университет информационных технологий, механики и оптики Методы сжатия изображений, аудиосигналов и видео Учебное пособие по дисциплине «Теоретическая информатика» / Санкт-Петербург. 2009.
3. http://websound.ru/theory/digitalsound.htm
4. Чернецкий М. Системы шумоподавления / Звукорежиссер: электрон. журн. 2001. № 9. URL: [ Cкачайте файл, чтобы посмотреть ссылку ].
5. Гендри К. Системы шумоподавления / Звукорежиссер: электрон. журн. 2004. № 6,7,8. URL: [ Cкачайте файл, чтобы посмотреть ссылку ]; [ Cкачайте файл, чтобы посмотреть ссылку ]; [ Cкачайте файл, чтобы посмотреть ссылку ]








13PAGE 15


13PAGE 147115



F

31

63

125

250

16 кГц

8

4

2

1

500 Гц

0

40

80

120

N, дБ

20

60

100



31

63

125

250

16 кГц

8

4

2

1

500 Гц

0

40

120

NПС, дБ

NМ, дБ

20

40

60

80

100

80

60

20



31

63

125

250

16 кГц

8

4

2

1

500 Гц

0

40

80

120

NПС, дБ

NМ, дБ

20

40

60

100

80

20

60

100

20

30

40

60

0

10

20

50

100

200

500

–10

–20

–50

–100

–200

N, дБ

Т, мс



31

63

125

250

16 кГц

8

4

2

1

500 Гц

0

40

80

120

NПС, дБ

NМ, дБ

20

40

60

100

80

20

60

100

0

20

40

60

80

100

120

L, дБ

p, Па

Частота

Уровень сигнала

–10

0

+10

+20

+30

+40

+50

+60

+70

+80

+90

50

100

200

500

1

2

5

10

20

а

б

б

Частота

Уровень сигнала

0

+25

50

100

200

500

1

2

5

10

20

+30

+5

+10

+15

+20

а

Частота

Уровень сигнала

–30

–5

50

100

200

500

1

2

5

10

20

0

–25

–20

–15

–10

а

б

5

4

3

2

1

t

А


Выброс
в 4 дБ

+

Увеличение
на 10 дБ

+

Уменьшение
на 6 дБ

Понижение уровня громких сигналов не происходит

Экспандер

Громкий сигнал

Источник

Выход

Запись
на пленке

Громкость

Компрессор

Повышения уровня громких сигналов не происходит

Уровень шума

Уровень шума при громких сигналах не понижается

Первоначальный уровень шума

Экспандер понижает уровень
тихих
сигналов и шума

Компрессор поднимает уровень
тихих
сигналов

Тихий сигнал

Уровень шума

Экспандер

Источник

Выход

Запись
на пленке

Громкость

Компрессор

Уменьшенный уровень шума

Уровень сигнала, дБ

Частота, Гц

15

10

5

0

несущая

спектр
боковых
полос

спектр
управляющего
напряжения

0,2

1,2

1,0

0,8

0,6

0,4

Уровень сигнала, дБ

Частота, Гц

15

10

5

0

несущая

спектр
боковых
полос

спектр
управляющего
напряжения

0,2

1,2

1,0

0,8

0,6

0,4

–20

–30

–40

–50

–60

–10

–10

–20

–30

–40

–50

–60

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

A

B

C

1

2

Наклон = 1

–20

–30

–40

–50

–60

–10

–10

–20

–30

–40

–50

–60

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

Наклон = 1

Наклон = 0

–20

–30

–40

–50

–60

–10

–10

–20

–30

–40

–50

–60

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

Наклон < 1

Наклон > 1

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

Наклон = 1/2

Наклон = 1

E

D

2

1

1

1

1

2

1

1

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

Наклон = 2

Наклон = 1

–60

–20

–30

–40

–50

–10

–10

–20

–30

–40

–50

–60

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

J

I

H

–10

–15

–20

–5

–5

–10

–15

–20

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

Выброс
сигнала

A

B

C

–10

–15

–20

–5

–5

–10

–15

–20

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

Выброс
сигнала

D

E

F

Постоянное
усиление
(0 дБ)

–20

–40

–20

–40

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

Выброс
сигнала

Компрессия 2:1

Постоянное
усиление
(10 дБ)

–20

–60

–20

–40

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

Компрессия 2:1

–60

–40

Постоянное
усиление

Постоянное
усиление

–20

–60

–20

–40

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

Компрессия

–60

–40

б)

Главный маршрут

Выход

Обходной маршрут

+

Экспандер
или
лимитер



Вход

а)

Главный маршрут

Выход

Вход

Обходной маршрут

Компрессор
или
лимитер

+

Общее
усиление
сигнала

–20

–60

–20

–40

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

–60

–40

0,8 дБ

6 дБ

6 дБ

9,5 дБ

A

B

Начальная точка

Усиление сигнала в главном
маршруте (единичное усиление)

Усиление сигнала в
обходном маршруте

Общее
усиление
сигнала

–20

–60

–20

–40

0

Уровень выходного сигнала, дБ

Уровень входного сигнала, дБ

–60

–40

Усиление сигнала в
обходном маршруте

Компрессоры

Фильтры

+

1

80 Гц

2

80 Гц..3 кГц

3

3 кГц

4

9 кГц

Главный маршрут

+

Обходной маршрут

Выход

Вход

Частота

100К

10К



10

0

–10

–8

–6

–4

–2

Гц

дБ

Уровень сигнала

Частота

100К

10К



10

0

–10

–8

–6

–4

–2

Гц

дБ

Уровень сигнала



Частота

100К

10К



10

0

–10

–8

–6

–4

–2

Гц

дБ

Уровень сигнала

–20

–60

–20

–40

0

Уровень выходного сигнала (на частоте 5 кГц), дБ

Уровень входного сигнала (на частоте 5 кГц), дБ

–60

–40

Усиление сигнала в
обходном маршруте

Общее
усиление
сигнала

+



б) Экспандер со скользящей полосой

Переменный фильтр

+

+

а) Компрессор со скользящей полосой

Переменный фильтр


дБ

10

Уровень

Частота

Частота громкого сигнала



дБ

10

Уровень

Частота

Частота громкого сигнала

2 дБ

5 дБ

2 дБ

дБ

10

Уровень

Частота

Частота громкого сигнала

+

+

+

+

Главный маршрут

2



+

+

+

5

Переменный НЧ-фильтр

4

3

1

Переменный аттенюатор

Фиксированный НЧ-фильтр

p, Па

L, дБ

10000

5000

1000

500

120

100

100

20

0

20

40

60

80

p, Па

L, дБ

10000

5000

1000

500

120

100

100

20

0

20

40

60

80

p, Па

L, дБ

10000

5000

1000

500

120

100

100

20

0

20

40

60

80

p, Па

L, дБ

10000

5000

1000

500

120

100

100

20

0

20

40

60

80













+

F

B

A

G



Root Entry

Приложенные файлы

  • doc 306101
    Размер файла: 666 kB Загрузок: 1

Добавить комментарий