Основные средства и методы обработки звука. Фундаментальные исследования

1

Модуляционная теория имеет широкий спектр применения, основанный на обработке сигналов во временной области, в частности, ее можно применить как основу для решения проблем обработки широкополосных звуковых сигналов при передаче их по узкополосному радиоканалу, в т.ч. по каналу телефонной связи. В модуляционной теории сигнал описывается как сложномодулированный (одновременно по амплитуде и частоте) процесс в виде произведения огибающей (амплитудно-модулирующей функции сигнала) и косинуса фазы (частотно-модулированной функции сигнала). Характерной особенностью данной теории является выделение информационных параметров сигнала, число которых возрастает после каждой последующей ступени его разложения по модулирующим функциям (многоступенное разложение). Это открывает возможность воздействовать на выделенные информационные параметры разного уровня и добиваться желаемого вида обработки сигнала. Применение модуляционной теории с осуществлением многоступенного разложения позволит провести новые исследования по изучению природных модуляций звуковых сигналов с целью совершенствования технических средств радиосвязи, использующих речевые сигналы как основную передаваемую информацию. Проведенный обзор позволил сделать вывод об актуальности перспективы применения модулирующих функций для обработки звуковых сигналов. Раскрыты перспективы применения в целях шумопонижения операции деления-умножения мгновенной частоты сигнала без выделения модулирующих функций. Даны предпосылки ее использования, разработаны методики проведения исследования возможности применения операции деления мгновенной частоты для шумопонижения при передаче частотно-компрессированных сигналов в двух вариантах: следящее частотное шумопонижение и динамическая фильтрация.

модуляционный анализ-синтез

мгновенная частота

шумопонижение

1. Аблазов В.И., Гупал В.И., Згурский А.И. Преобразование, запись и воспроизведение речевых сигналов. – Киев: Лыбидь, 1991. – 207 с.

2. Агеев Д.В. Активная полоса частотного спектра функции времени // Труды ГПИ. – 1955. – Т. 11. – № 1.

3. Гиппернрейтер Ю.Б. Восприятие высоты звука: Автореф. дис. канд. психол.наук. – М.: 1960. – 22 с.

4. Ишуткин Ю.М. Разработка теории модуляционного анализа-синтеза звуковых сигналов и её практическое применение в технике записи звука кинофильмов: Автореф. дис.на соискание уч. ст. д. т. н. – М.: НИКФИ, 1985. – 48 с.

5. Ишуткин Ю.М., Уваров В.К. Основы модуляционных преобразований звуковых сигналов / Под ред. Уварова В.К. – СПб.: СПбГУКиТ, 2004. – 102 с.

6. Ишуткин В.М. Перспективы обработки звуковых сигналов по их модулирующим функциям / В сб.: Проблемы звукотехники // Труды ЛИКИ, Вып. XXXI. – Л.: ЛИКИ, 1977. – С. 102–115.

7. Корсунский С.Г. Влияние спектра воспринимаемого звука на его высоту // Пробл.физиол.акуст. – 1950. – Т. 2. – С. 161–165.

8. Маркел Дж.Д., Грэй А.Х. Линейное предсказание речи: Пер. с англ. / Под ред. Ю.Н. Прохорова, В.С. 3вездина. – М.: Связь, 1980. – 308 с.

9. Маркин Д.Н., Уваров В.К. Результаты практических исследований соотношений между спектрами сигнала, его огибающей, косинуса фазы и мгновенной частоты. Деп. рук. № 181кт-Д07, ОНТИ НИКФИ, 2007. – 32 с.

10. Маркин Д.Н. Разработка метода и технических средств компандирования спектров речевых сигналов. Автореф. дис. на соискание уч. ст. к.т. н. – СПб.: СПбГУКиТ, 2008. – 40 с.

11. Муравьев В.Е. О современном состоянии и проблемах вокодерной техники // Современные речевые технологии сборник трудов IX сессии Российского акустического общества, посвящённой 90-летито М.А. Сапожкова. – М.: ГЕОС,1999. – 166 с.

12. Орлов Ю.М. Динамический фильтр-шумоподавитель // ТКиТ. – 1974. – № 10. – С. 13–15.

13. Сапожков М.А. Речевой сигнал в кибернетике и связи. Преобразование речи применительно к задачам техники связи и кибернетики. – М.: Связьиздат, 1963. – 452 с.

14. Уваров В.К., Плющёв В.М., Чесноков М.А. Применение модуляционных преобразований звуковых сигналов / Под ред. В.К. Уварова. – СПб.: СПбГУКиТ, 2004. – 131 с.

15. Уваров В.К. Сжатие частотного диапазона звуковых сигналов для улучшения качества звука при кинопоказе: Автореф.дис. канд.тех. наук. – Л.: ЛИКИ,1985. – 22 с.

16. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации: Пер. с нем. – М.: Связь, 1971. – 255 с.

17. Gаbor D. Theory of communications. – The Journal of the institute of Electrical Engineers, Part III (Radio and Communication Engineering), Vol. 93, № 26, November 1946. – Р. 429–457.

18. Ville J.A. Theorie et application de la notion de signal analytique. – Cables a Transmissions, 2A, № 1, January, 1948. – Р. 61–74; translated from the French in I. Selin, «Theory and applications of the notion of complex signal». – Tech. Rept. T-92, The RAND Corporation, Santa Monica, CA, August 1958.

Модуляционная теория имеет широкий спектр применения, основанный на обработке сигналов во временной области, в частности, ее можно применить как основу для решения проблем обработки широкополосных звуковых сигналов при передаче их по узкополосному радиоканалу, в т.ч. по каналу телефонной связи.

Проведенный обзор методов обработки звуковых сигналов выявил перспективность модуляционного анализа-синтеза, разработанного Ю.М. Ишуткиным в 70-х годах прошлого столетия для обработки и измерения искажений . В дальнейшем модуляционная теория получила свое развитие в работах его учеников и последователей .

Модулирующие функции колебания сложной формы

В середине ХХ века независимо двумя учеными Д. Габором и Дж. Вие была создана теория аналитического сигнала, дающая возможность описывать в виде явной функции времени любой случайный процесс. Именно эта теория стала математической основой, на базе которой впоследствии была сформирована модуляционная теория звуковых сигналов.

При некоторых нежестких ограничениях любые колебания сложной формы могут быть представлены в виде произведения двух явных функций времени

где s(t) - исходный звуковой сигнал,

S(t) - неотрицательная огибающая сигнала, амплитудно-модулирующая функция;

cos φ(t) - косинус фазы сигнала, частотно-модулированная функция;

φ(t) - текущая фаза сигнала, фазо-модулирующая функция сигнала.

Мгновенная частота сигнала, частотно-модулирующая функция сигнала.

Модулирующие функции S(t), φ(t) и ω(t) сигналов являются действительными функциями действительного аргумента t. В общих случаях модулирующие функции нельзя определить, исходя из самого исходного сигнала s(t): его необходимо дополнить вторым сигналом, называемым опорным s1(t) и уже для пары этих сигналов {, } можно определить модулирующие функции. Вид этих функций в равной степени зависит от обоих сигналов.

Дж. Габор впервые в 1946 году показал необходимость опорного сигнала при определении модулирующих функций и применил для этого прямое преобразование Гильберта к исходному сигналу s(t) . В теоретической радиотехнике это привело к понятию аналитического сигнала. Однако теория аналитического сигнала была разработана для узкополосных колебаний.

Модулирующие функции широкополосного сигнала

Впоследствии строгие математические представления о модулирующих функциях были распространены и на широкополосные звуковые сигналы. Однако выбор опорного сигнала предполагается произвольным, и выдвигаются лишь требования к ортогональности основного и опорного сигналов . Тем не менее на сегодняшний момент именно преобразование Гильберта рассматривается как удобный в техническом отношении способ построения пары ортогональных сигналов.

Так как в общем случае звуковые сигналы являются непериодическими и их можно считать квазипериодическими лишь на отдельных достаточно коротких интервалах времени, в модуляционной теории для определения опорного сигнала используется прямое преобразование Гильберта с ядром Коши

, (2)

где Н - оператор преобразования Гильберта, интеграл (2) является сингулярным, т.е. не существует в обычном смысле в точке t = τ, его следует понимать как интеграл Лебега, а его значение в точке t = τ как главное значение по Коши.

Две функции, связанные между собой преобразованием (2), называются сопряженными по Гильберту. Из теории преобразования Гильберта известно, что эти функции удовлетворяют условию ортогональности, то есть их скалярное произведение равно нулю на всей области определения

. (3)

Выражение (3) представляет собой определенный интеграл, понимаемый в смысле Лебега. Т - означает область значений переменной t, по которой ведется интегрирование.

В геометрическом представлении амплитудно-модулирующая функция S(t) это сигнальный вектор, вращающийся вокруг начала координат с угловой частотой ω(t), при этом сигнал может развиваться быстро или медленно, но только в прямом, а не в обратном направлении. Это означает, что обе модулирующие функции могут принимать любые положительные и отрицательные значения (причем ничем не ограниченные) и каждая имеет в общем случае постоянную и переменную составляющие:

где S0 - постоянная составляющая (среднее значение) огибающей сигнала;

SS(t) - огибающая переменной составляющей огибающей сигнала;

cos ωS(t) - косинус фазы переменной составляющей огибающей сигнала;

ω0 - среднее значение мгновенной частоты сигнала (несущая частота);

ωd(t) - девиация мгновенной частоты сигнала;

ωm(t) - модулирующая частота сигнала.

Многоступенное модуляционное преобразование

Из изложенного выше следует, что процесс разложения сигнала по его модулирующим функциям можно продолжить - провести многоступенное модуляционное разложение .

Первая ступень разложения дает пару модулирующих функций первого порядка (см. формулу 4)

Вторая ступень разложения дает дополнительно две пары модулирующих функций второго порядка. При этом огибающая первого порядка S1(t) дает огибающую огибающей и мгновенную частоту огибающей: S21(t) и ω21(t).

Вторая ступень разложения мгновенной частоты первого порядка ω1(t) дает огибающую мгновенной частоты и частоту мгновенной частоты: S22(t) и ω22(t).

После третьего разложения получаются еще четыре пары модулирующих функций третьего порядка и т.д.

Перечисленные после формулы (4) параметры модулирующих функций различных порядков являются важными информационными признаками звукового сигнала, воздействие на значения и частотное расположение которых открывает широкие возможности для обработки звукового сигнала: сжатие спектра, изменение тембра, преобразование динамического диапазона и шумопонижение, транспонирование сигналов и т.д.

Технические задачи обработки звуковых сигналов путем воздействия на их модулирующие функции состоят в следующем:

● создать многоступенный демодулятор (преобразователь), при подаче на вход которого напряжения u(t) = s(t) на выходах обеспечивались бы напряжения, пропорциональные модуляционным функциям первого, второго и т.д. порядков;

● воздействовать на значения и спектры этих напряжений;

● восстановить звуковой сигнал по обработанным модуляционным функциям, т.е. осуществить амплитудную и частотную модуляцию колебаний генераторов.

Например, использование нелинейного корректирующего воздействия на параметры амплитудно-модулирующей функции позволит провести компрессирование и шумопонижение восстановленного звукового сигнала . Воздействием на сигнал канала частотно-модулирующей функции с помощью нелинейной цепи, обладающей уменьшением дифференциального коэффициента передачи с увеличением мгновенных значений выходного напряжения, можно достичь сжатия частотного диапазона обрабатываемого звукового сигнала . Делением частоты ωm(t) и устранением высокочастотной части ее спектра можно существенно сжать спектр звукового сигнала с сохранением высокой помехоустойчивости .

Перспективы применения деления-умножения мгновенной частоты сигнала без выделения модулирующих функций в целях шумопонижения

Постановка задачи

При передаче звуковых сигналов по узкополосным каналам связи частотное компрессирование приводит к заметному ограничению ширины спектра мгновенной частоты. Исследуем возможность подмены в спектре фонем таких сигналов компонент, обусловленных высокими частотами частотной модуляции, на другие компоненты - расположенные на близких частотах, но обусловленные увеличением девиации мгновенной частоты фонемы при восстановлении частотно-компрессированных сигналов. Такая замена должна обеспечить повышение качества звукопередачи за счет более полного субъективного восприятия.

Предпосылками к такой постановке задачи может служить следующее:

1. Гласные звуки на большей части их длительности можно рассматривать как периодический сигнал. При увеличении девиации частоты число гармоник основного тона будет увеличиваться. Следовательно, есть возможность при передаче сигнала уменьшить количество гармоник основного тона, а на приемной стороне канала восстановить их количество путем увеличения девиации частоты.

2. Спектры глухих согласных звуков являются сплошными. Спектры их мгновенных частот также сплошные, в полосе примерно равной половине полосы частот спектра сигнала. Поэтому при увеличении девиации частоты спектр мгновенной частоты останется сплошным, но спектр фонемы расширится.

3. Известно влияние спектрального состава сложных сигналов на восприятие высоты их тона. Звуки, богатые высокочастотными спектральными составляющими, воспринимаются на слух как более высокие по сравнению со звуками, имеющими ту же частоту основного тона, но со слабыми гармониками высокого порядка или с меньшим их количеством.

4. Поскольку подмена спектральных составляющих будет происходить на высоких частотах, то можно предположить, что для слуха такая подмена будет незаметной или почти незаметной. В основе этого лежит пониженная чувствительность слуха к изменению высоты тона в области высоких частот .

Разработка методики проведения исследования

Следящее частотное шумопонижение

Возможность использования операции деления мгновенной частоты с целью шумопонижения будет количественно обоснована после предварительных исследований допустимых пределов сокращения спектров модулирующих функций звуковых сигналов для разных каналов передачи.

При использовании деления мгновенной частоты для целей передачи звуковых сигналов в частотно-компрессированном виде, очевидно, что передаваемый сигнал концентрируется в низкочастотной области. Причем ширина полосы частот, которая необходима для неискаженной передачи сигнала, будет постоянно меняться, вместе с изменением звукового сигнала. Поэтому в качестве одной из основных задач этого исследования можно назвать определение возможности создания следящего фильтра низких частот (СФНЧ), верхняя граничная частота которого изменялась бы во времени, принимая значения в соответствии с определенными допустимыми ограничениями полосы частот мгновенной частоты и огибающей, которые будут известны после проведения предварительных исследований. Представляется, что сокращение полосы для узкополосных сигналов, которые практически не маскируют шумы канала передачи, будет очень значительным. Поэтому для таких сигналов будет значительным и выигрыш в отношении «сигнал/шум».

Второй задачей этого исследования следует назвать определение сигнала управления для СФНЧ. В качестве первых претендентов на роль сигнала управления можно предложить сигналы, пропорциональные или ωн(t), или производной мгновенной частоты сигнала в соответствии с . Поскольку шумопонижение при этом достигается за счет различения частотных диапазонов сигнала и шума, то такое шумопонижение можно называть частотным.

При использовании огибающей для порогового амплитудного шумопонижения или для динамической фильтрации, получим комбинированный шумоподавитель для частотно-компрессированных сигналов.

Динамическая фильтрация

Как известно , в существующих вариантах динамических фильтров весь частотный диапазон звуковых сигналов делится на полосы, в каждой из которых шумопонижение осуществляется с помощью порогового шумоподавителя (обычно - это инерционные устройства). К недостаткам динамических фильтров обычно относят аппаратурную сложность, так как динамический фильтр представляет собой совокупность нескольких пороговых шумоподавителей (обычно четыре и более). Кроме этого, возникают трудности с обеспечением линейных частотных характеристик.

Теперь появилась возможность исследовать вариант динамической фильтрации в одной низкочастотной полосе при передаче частотно-компрессированных сигналов, управляя шириной полосы сигналом огибающей. Как известно, при уменьшении уровня звукового сигнала вначале в шумах канала звукопередачи тонут верхние гармоники звука, а в последнюю очередь - колебание основного тона. Это позволяет предположить, что возможно, уменьшая полосу фильтра пропорционально уменьшению огибающей, обеспечить эффект шумопонижения без обычных для динамических фильтров недостатков.

Заключение

В модуляционной теории сигнал описывается как сложно модулированный (одновременно по амплитуде и частоте) процесс в виде произведения огибающей (амплитудно-модулирующей функции сигнала) и косинуса фазы (частотно-модулированной функции сигнала). Характерной особенностью данной теории является выделение информационных параметров сигнала, число которых возрастает после каждой последующей ступени его разложения по модулирующим функциям (многоступенное разложение). Это открывает возможность воздействовать на выделенные информационные параметры разного уровня и добиваться желаемого вида обработки сигнала.

Применение модуляционной теории с осуществлением многоступенного разложения позволит провести новые исследования по изучению природных модуляций звуковых сигналов с целью совершенствования технических средств радиосвязи, использующих речевые сигналы как основную передаваемую информацию.

Проведенный обзор позволил сделать вывод об актуальности перспективы применения модулирующих функций для обработки звуковых сигналов. Раскрыты перспективы применения в целях шумопонижения операции деления-умножения мгновенной частоты сигнала без выделения модулирующих функций. Даны предпосылки ее использования, разработаны методики проведения исследования возможности применения операции деления мгновенной частоты для шумопонижения при передаче частотно-компрессированных сигналов в двух вариантах: следящее частотное шумопонижение и динамическая фильтрация.

Рецензенты:

Смирнов Н.В., д.ф.-м.н., доцент, профессор кафедры моделирования экономических систем прикладной математики процессов управления Санкт-Петербургского государственного университета, г. Санкт-Петербург;

Стариченков А.Л., д.т.н., доцент института проблем транспорта им. Н.С. Соломенко Российской Академии Наук, г. Санкт-Петербург.

Библиографическая ссылка

Уваров В.К., Редько А.Ю. МОДУЛЯЦИОННЫЙ АНАЛИЗ-СИНТЕЗ ЗВУКОВЫХ СИГНАЛОВ И ПЕРСПЕКТИВЫ ЕГО ИСПОЛЬЗОВАНИЯ В ЦЕЛЯХ ШУМОПОНИЖЕНИЯ // Фундаментальные исследования. – 2015. – № 6-3. – С. 518-522;
URL: http://fundamental-research.ru/ru/article/view?id=38652 (дата обращения: 26.04.2019). Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»

Адаптер

Поскольку линейный вход звукового адаптера является основным приемником внешнего сигнала при записи, каждый производитель стремится обеспечить на этом входе достаточное качество усиления сигнала. Чувствительность линейных входов большинства звуковых адаптеров примерно одинакова, а параметры качества пропорциональны общему качеству плат. Совершенно иначе обстоит дело с микрофонными входами: плата стоимостью 100 долл. может иметь гораздо худший по чувствительности и качеству вход, нежели ширпотребовская за 8 долл. Причина здесь в том, что микрофонный вход для звукового адаптера является второстепенным и его функциональность чаще всего ограничивается подключением простейшего дешевого микрофона для подачи голосовых команд, где уровень шума и АЧХ не столь критичны.

Микрофонные входы современных адаптеров рассчитаны, как правило, на подключение электретных микрофонов со встроенным усилителем, получающим питание от адаптера. Такой микрофон имеет высокое выходное сопротивление и развивает на выходе до 50-100 мВ, поэтому для усиления сигнала до уровня линейного входа (около 500 мВ) достаточно простейшего предусилителя . Некоторые адаптеры, согласно документации, позволяют подключать и динамические микрофоны, не нуждающиеся в питании, однако такой микрофон развивает на выходе всего 1-3 мВ и требует достаточно чувствительного и малошумящего усилителя, который на звуковых платах встречается довольно редко. Поэтому типовая плата в лучшем случае позволяет получить с такого микрофона недостаточно громкий, глуховатый звук, изобилующий шумами и наводками, а в худшем случае от динамического микрофона вы вообще не добьетесь звука. Предпочтение электретным микрофонам отдается вследствие того, что компьютер является источником множества электромагнитных излучений, создающих на чувствительном микрофонном входе ощутимые помехи, справиться с которыми довольно сложно. Создание малошумящего усилителя потребовало бы специальной компоновки платы, тщательной фильтрации питающих напряжений, экранирования области входных цепей и прочих сложных и дорогих ухищрений.

Разъем микрофонного входа большинства адаптеров - монофонический; в нем для передачи сигнала используется только концевой контакт (TIP) штекера, который в стереофоническом разъеме отвечает за сигнал левого канала. Средний контакт (RING), который в стереофоническом разъеме отвечает за правый канал, в микрофонном разъеме либо вообще не используется, либо служит для передачи питающего напряжения +5 В для электретного микрофона. Когда отдельный контакт для питания микрофона отсутствует, питающее напряжение подается прямо на сигнальный вход, а усилители в этом случае должны иметь емкостную развязку входа и выхода.

Микрофон

Как мы выяснили, для непосредственного подключения к адаптеру лучше всего подойдут электретные микрофоны, которые обычно выпускаются в достаточно миниатюрном исполнении: в виде «карандашей» с подставками либо «клипс», прикрепляемых к одежде или к корпусу монитора. Они недороги и продаются в магазинах компьютерных аксессуаров; если не требуется высокого качества записи, близкого к профессиональному, - таким микрофоном вполне можно обойтись. В противном случае необходим качественный профессиональный микрофон, за которым придется идти в магазин музыкальной аппаратуры, и цена его будет примерно на порядок выше.

С подключением профессионального микрофона обязательно возникнет некоторое количество проблем. Такие микрофоны чаще всего являются динамическими и выдают сигнал амплитудой в единицы милливольт, а микрофонный вход большинства звуковых адаптеров, как уже говорилось, не способен нормально воспринимать столь слабые сигналы. Выходов может быть два: либо купить в том же музыкальном магазине микрофонный предусилитель (который может оказаться довольно дорогой игрушкой) и подключить его выход уже не к микрофонному, а к линейному входу адаптера; либо использовать микрофон со встроенными предусилителем и питанием (батарейкой). При наличии радиотехнических навыков можно собрать несложный усилитель самостоятельно - варианты схем довольно часто встречаются в книгах и в Интернете.

Кроме того, профессиональные микрофоны обычно имеют разъемы типа XLR, а компьютерные звуковые адаптеры - mini-DIN, так что потребуется переходник; иногда такие переходники продаются в музыкальных магазинах, однако может статься, что придется паять его самостоятельно.

И наконец, вполне может так случиться, что любой профессиональный микрофон будет намного превосходить ваш звуковой адаптер по качественным параметрам и звук, который вы получите с помощью такого микрофона, в итоге будет не лучше того, что может обеспечить простой электретный. Поэтому если у вас есть сомнения в высоком качестве своего адаптера (а простые адаптеры ценой порядка 10 долл., тем более встроенные, имеют весьма посредственные параметры), то вам имеет смысл договориться в магазине о возможном возврате купленного микрофона, если не удастся получить с его помощью достаточно качественный звук.

Технология записи

В отличие от источников фиксированного сигнала, микрофон имеет ряд особенностей, которые необходимо учитывать при работе с ним. Прежде всего, он любит «фонить»: если усиленный сигнал с микрофона поступает на колонки, то микрофон воспринимает его, сигнал вновь усиливается и т.д., то есть образуется так называемая положительная обратная связь, которая «раскачивает» звуковой тракт, вводит его в режим самовозбуждения, что проявляется посредством громкого свиста, звона или рокота. Даже если тракт не войдет в режим самовозбуждения, положительная связь может давать звенящий или свистящий призвук, который заметно портит сигнал. При этом чувствительный микрофон может успешно ловить сигнал даже с наушников, если звук в них достаточно громкий, а наружная звукоизоляция слаба. Поэтому необходимо экспериментальным путем определить такое положение/направление микрофона и громкость усиленного звука, при котором положительная связь проявляется меньше всего. Окончательную запись рекомендуется производить при отключенных или хотя бы максимально приглушенных колонках.

Чувствительные микрофоны, особенно простые и дешевые, отлично воспринимают посторонние звуки вроде шороха пальцев по корпусу микрофона или легкого поскрипывания самого корпуса даже от незначительного сжатия (наверняка вам приходилось слышать подобные звуки при телефонных разговорах). Чтобы избежать таких помех, микрофон лучше установить на удобной подставке либо держать его свободно, не сдавливая пальцами.

Еще один неприятный момент в использовании микрофона - так называемое заплевывание потоком воздуха, которое особенно ярко проявляется на взрывных согласных, таких как «п», «б», «т» и им подобных. В результате попадания на мембрану интенсивного звукового импульса образуется резкий бросок амплитуды сигнала, перегружающий усилитель и/или АЦП. Профессиональные микрофоны имеют против этого ветрозащиту - сетку или мягкую прокладку, расположенную на некотором расстоянии от капсюля, но даже она не всегда спасает, поэтому к каждому микрофону приходится приноравливаться, привыкая держать его либо под правильным углом, чтобы прямые воздушные потоки проходили мимо, либо на достаточном расстоянии, чтобы они достигали микрофона в уже ослабленном состоянии.

Экспериментируя с микрофоном, вы обнаружите, что тембр записанного голоса довольно сильно зависит от расстояния ото рта до микрофона и от угла наклона микрофона относительно лица. Это вызвано тем, что низкочастотные составляющие голоса больше всего рассеиваются и ослабляются с расстоянием, тогда как высокочастотные ослабляются меньше, зато имеют более выраженную направленность. Наиболее сочный и бархатистый тембр голоса можно получить, расположив микрофон непосредственно у рта, но тогда придется изрядно повозиться с углом наклона и немало потренироваться, чтобы избежать «заплевывания».

Запись посредством внешних устройств

Последнее время появились весьма экзотические способы записи звука с микрофона и переноса его в компьютер. Так, Creative выпускает цифровой проигрыватель Jukebox, содержащий миниатюрный накопитель на жестком диске, автономный контроллер и интерфейс USB. Основная функция проигрывателя - воспроизведение звуковых файлов, которые перекачиваются в него из компьютера, однако встроенный микрофон позволяет использовать его в качестве автономного диктофона: звук записывается на жесткий диск, что обеспечивает непрерывную запись в течение нескольких часов, а впоследствии фонограмма может быть перенесена в компьютер. Другое изделие Creative - PC Cam представляет собой гибрид цифрового фотоаппарата, видеокамеры и диктофона и позволяет записывать звук во встроенную Flash-память, откуда он извлекается с помощью того же интерфейса USB.

Удаление шумов и помех

оскольку голосовой сигнал имеет достаточно узкий спектр (сотни герц - единицы килогерц), к нему можно применять операцию удаления шума с большей глубиной, чем в случае произвольного музыкального сигнала. При записи может также оказаться, что в наиболее удачно записанном фрагменте (с художественной точки зрения) микрофон все-таки оказался «заплеванным» в одном или в нескольких местах и попытки повторить фразу или куплет песни со столь же удачной расстановкой акцентов не дают желаемого результата. В таких случаях можно попробовать скруглить импульсы перегрузки, сохранив или уменьшив их амплитуду. При незначительном количестве импульсов это удобно делать вручную, укрупнив изображение до появления узловых точек, которые можно цеплять мышью.

Методы обработки голоса

ак мы уже говорили, сложный музыкальный сигнал содержит множество разнородных составляющих, на которые большинство методов обработки звука воздействует с различным эффектом, поэтому спектр универсальных методов обработки сигнала весьма узок. Наиболее популярен метод реверберации, имитирующий множественное отражение звуковых волн и создающий эффект пространства - комнаты, зала, стадиона, горного каньона и т.п.; реверберация позволяет придать «сухому» звуку сочность и объем. Остальные универсальные методы обработки сводятся к манипуляции АЧХ (эквалайзер), чистке фонограммы от шумов и помех.

В отношении же первичного, простого звукового сигнала может быть достаточно успешно применен весь спектр существующих методов обработки - амплитудных, частотных, фазовых, временных, формантных и т.п. Те методы, что на сложном сигнале рождают неблагозвучную какофонию, на простых сигналах нередко способны привести к созданию очень интересных и ярких эффектов, широко используемых в звуковой индустрии.

Монтаж

Компьютерный монтаж речевых фонограмм - типичное занятие журналиста после записи интервью - одновременно и прост, и сложен. Поначалу он кажется простым, благодаря удобной для визуального анализа структуре речи, наличию заметных пауз между словами, всплескам амплитуды в местах акцентов и т.п. Однако при попытке, например, переставить местами две фразы, разделенные буквально секундами, выясняется, что они не желают стыковаться - успели измениться интонация, фаза дыхания, фоновый шум, и на стыке отчетливо прослушивается сбивка. Такие сбивки легко различимы практически в любом радиоинтервью, когда записывается речь человека, не являющегося профессиональным радиожурналистом и, следовательно, не умеющего говорить только то, что должно пойти в эфир. Из речи вырезают лишнее, некоторые фрагменты переставляют местами для большего соответствия смыслу, в результате чего слух постоянно «удивляется», поскольку в потоке естественной человеческой речи таких интонационных и динамических переходов не бывает.

Для сглаживания эффектов перехода можно воспользоваться методом взаимоперекрытия (crossfade), хотя он позволит состыковать фрагменты речи лишь по амплитуде, но не по интонации и фоновым шумам. Поэтому считаем нужным предостеречь тех, кому компьютерный монтаж покажется удобным способом фальсификации записи, например, переговоров: экспертиза способна без труда выявить даже неразличимые ухом места склейки, как и в случае с подделкой документов при помощи сканера и принтера.

Амплитудная обработка

Простейший вид динамической амплитудной обработки голоса - модуляция его периодическим сигналом, когда амплитуды сигналов перемножаются и голос приобретает амплитудные характеристики модулирующего сигнала. Модулируя низкочастотным (единицы герц) синусоидальным сигналом, получаем «булькающий» голос, повышая частоту сигнала - вибрирующий. Используя вместо синусоидальной формы прямоугольную, треугольную или пилообразную, можно придать голосу металлические, искаженные, «роботизированные» интонации.

Амплитудная модуляция выделенного фрагмента фонограммы выполняется как часть операции генерации периодических сигналов Generate g Tones. В поле Base Frequency задается основная частота сигнала в герцах, в поле Flavor - вид импульса, в поле Duration - длительность в секундах. Регуляторы Volume задают уровень сигнала.

Группа движков Frequency Components определяет уровни гармоник основного сигнала с указанными при движках номерами. Частотную модуляцию сигнала можно получить, используя поля Modulate By - смещение от основной частоты в герцах - и Modulation Frequency - частота модуляции. При помеченном поле Lock... все эти параметры, включая основную частоту, стационарны; при снятии пометки можно задать их начальные/конечные значения в закладках Initial/Final Settings - они будут линейно изменяться в течение генерируемого отрезка.

Группа полей Source Modulation определяет, как будет использоваться сгенерированный сигнал. По умолчанию, когда ни одно из этих полей не отмечено, сигнал вставляется в фонограмму или заменяет собой выделенный фрагмент; в противном случае он используется для выполнения заданной операции с выделенным фрагментом: Modulate - обычная модуляция (перемножение), Demodulate - демодуляция (деление), Overlap (mix) - простое смешивание сигналов. Последовательные модуляция и демодуляция с одним и тем же сигналом восстанавливают исходный сигнал (возможно, с измененным общим уровнем). Эксперименты с различными сочетаниями параметров порой дают весьма забавные и неожиданные результаты.

Временная обработка

Этот вид обработки основан на сдвиге исходного сигнала во времени и смешивании результата с исходным сигналом, после чего снова могут применяться сдвиг и смешивание. При сдвигах на малые промежутки времени, сравнимые с длительностью периода исходного сигнала, возникают фазовые эффекты типа интерференции, отчего звук приобретает специфическую окраску; этот эффект получил название фленжера (flanger) и используется как с фиксированной величиной сдвига, так и с периодически изменяющейся или даже вовсе со случайной. При сдвигах на интервалы, превышающие длительность периода, но не более 20 мс, возникает хоровой эффект (chorus). Благодаря общности технологии, эти два эффекта нередко реализуются одним программным блоком с различными параметрами.

При множественных сдвигах с интервалами 20...50 мс возникает эффект реверберации (reverb) - гулкости, объема, оттого что слуховой аппарат трактует задержанные копии сигнала как отражения от окружающих предметов. При интервалах свыше 50 мс ухо перестает четко связывать отдельные копии между собой, вследствие чего возникает эффект эха (echo).

В Cool Edit 2000 эффекты, основанные на временных задержках, объединены в группу Transform g Delay Effects. Эффекты flanger и chorus создаются операцией flanger:

Движок Original/Delayed управляет соотношением исходного и задержанного сигналов (интенсивность, или глубина эффекта). Initial/Final Mix Delay - начальная и конечная задержка копии - изменяется в этих пределах циклически. Stereo Phasing - угол фазового сдвига между каналами - позволяет создать любопытный эффект «скручивания» звука, особенно в наушниках. Feedback - глубина обратной связи (количество результирующего сигнала, подмешиваемого к исходному перед применением операции) - позволяет управлять выраженностью, резкостью эффекта.

Группа Rate задает параметры цикличности эффекта. Period - интервал времени, за который фленжер проходит от начальной задержки до конечной и обратно; Frequency - обратная величина, частота проходов туда-обратно; Total Cycles - количество полных проходов по выделенному фрагменту. Задание любого параметра вызывает автоматический пересчет остальных.

Группа Mode управляет особенностями эффекта: Inverted - инверсия задержанного сигнала, Special EFX - дополнительная инверсия исходного и задержанного сигналов, Sinusoidal - синусоидальный закон изменения задержки от начальной до конечной (если он отключен - задержка изменяется линейно).

Набор пресетов позволяет наглядно изучить особенности операции. Попробуйте выбрать несколько пресетов, меняя в каждом из них предустановленные параметры и не забывая всякий раз «откатываться» (Undo), чтобы сравнить влияние на звук различных комбинаций параметров.

Эффект реверберации в Cool Edit 2000 может быть реализован двумя способами: с помощью Echo Chamber - имитатора комнаты с заданными размерами и акустическими свойствами, и Reverb - генератора эффекта объема на основе встроенного в редактор алгоритма имитации множественных отражений в пространстве. Поскольку данный вид обработки является универсальным и применяется к любому звуковому материалу, опишем кратко второй способ как наиболее популярный.

Поле/движок Total Reverb Length определяет время реверберации, в течение которого отраженные сигналы полностью затухают; оно косвенно связано с объемом пространства, в котором распространяется звук. Attack Time - время нарастания глубины реверберации до номинального уровня; служит для плавного проявления эффекта на протяжении обрабатываемого фрагмента. High Frequency Absorbtion Time - время поглощения объемом высокочастотных составляющих, пропорционально «мягкости» и «заглушенности» объема. Perception - степень разборчивости: меньшие значения (smooth) - слабые и мягкие отражения, не перебивающие основного сигнала, большие значения (echoey) - четкие и сильные, отчетливо слышимые отражения, способные ухудшить разборчивость речи.

Движки/поля Mixing определяют соотношение исходного (dry) и обработанного (wet) сигналов в результирующем.

Эффект эха реализуется операцией Echo и добавляет к сигналу его постепенно затухающие копии, сдвинутые на равные промежутки времени. Регулятор Decay задает величину затухания - уровень каждой очередной копии в процентах от уровня предыдущей. Initial Echo Volume - уровень первой копии в процентах от уровня исходного сигнала. Delay - задержка между копиями в миллисекундах. Группа регуляторов Successive Echo Equalization управляет эквалайзером, через который пропускается каждая очередная копия, что позволяет задавать различные акустические характеристики имитируемого пространства.

Поскольку эффект является «продолжающимся» во времени, он может создать звуковой фрагмент, по длительности превышающий исходный. Для этого предусмотрен пункт Continue echo beyond selection - разрешение подмешивать эхо-сигнал к участку фонограммы, продолжающемуся за границей выделенного фрагмента. При этом в качестве исходного сигнала будет взят только выделенный фрагмент, а оставшаяся часть фонограммы будет использована исключительно для размещения «хвоста». Если в фонограмме не хватает места для «хвоста» - будет выдано сообщение об ошибке и придется добавить в конец фонограммы участок тишины операцией Generate g Silence.

Эффект лучше всего воспринимается на относительно коротких звуках. На длинных словах или фразах, чтобы исключить возникновение «тарабарщины» - множественных повторений различных слогов или слов, перебивающих друг друга, эффект лучше делать «концевым», выбирая для повторения только короткий завершающий фрагмент фразы или даже последний ударный слог слова. Попробуйте поэкспериментировать с различными словами и фразами, чтобы почувствовать, какую завершающую часть лучше использовать для «размножения» в каждом конкретном случае.

Спектральная обработка

Наиболее ярким и интересным эффектом из этого класса, реализованным в Cool Edit 2000, является изменение высоты и скорости. Всем известен эффект повышения или понижения высоты сигнала при изменении скорости протяжки ленты в магнитофоне или вращения пластинки. С развитием цифровых методов обработки сигналов стало возможным правдоподобно реализовать каждый из этих эффектов по отдельности - изменение высоты при сохранении временных характеристик либо наоборот.

Обработку этого типа в Cool Edit 2000 осуществляет операция Transform g Time/Pitch g Stretch . Возможно два варианта - с постоянным (constant) либо со скользящим (gliding) коэффициентом. Коэффициенты задаются полями Initial/Final Ratio, которые связаны также с движками для удобства изменения. Коэффициент может, кроме того, задаваться косвенно полем Transpose в виде количества музыкальных хроматических полутонов вверх (диез) или вниз (бемоль). В режиме изменения длительности наряду с этим доступно поле Length, в котором можно задать требуемую длину результирующего фрагмента.

Переключатель Precision задает точность обработки: низкую (Low), среднюю (Medium) и высокую (High) - это необходимо потому, что операция спектральной обработки требует множества вычислений и снижение точности позволяет добиться ускорения обработки - хотя бы на этапе экспериментов. Переключатель Stretching Mode задает вид обработки: Time Stretch - ускорение/замедление во времени, Pitch Shift - сдвиг по высоте, Resample - простая передискретизация, аналогичная изменению скорости ленты/пластинки.

Группа параметров Pitch and Time Settings управляет особенностями операции. Обработка выполняется путем разбиения фрагмента на маленькие звуковые блоки; параметр Splicing Frequency задает количество таких блоков в одной секунде фрагмента. Увеличение этой «частоты дискретизации» делает блоки более мелкими, повышая натуральность обработки, но одновременно усиливается и эффект дробления, порождая неприятные призвуки. Параметр Overlapping задает степень перекрытия соседних блоков при сборке результирующего сигнала - небольшое взаимное перекрытие позволяет сгладить призвуки от их стыковки. Пункт Choose appropriate defaults служит для автоматической установки этих параметров в наиболее подходящие, с точки зрения редактора, значения.

Эта статья завершает краткий цикл, посвященный записи и обработке звука на домашнем компьютере.

КомпьютерПресс 12"2002

Преобразователи динамического диапазона звуковых сигналов на осн о ве модул и рующих функций

Харитонов Владимир Борисович,

кандидат технических наук, профессор

Зирова Юлия Константиновна,

аспирант кафедры з вукотехники

Санкт-Петербургский государственный уни верситет кино и телевидения.

Преобразование динамического диапазона звуковых сигналов на основе модулирующих функций в теории модуляционного анализа-синтеза является безынерционным. Причем речь идет не о нелинейной обработке мгновенных значений сигнала, которая обладает безынерционностью, но вносит в обработанный сигнал нелинейные искажения. Обработка сигналов по их модулирующим функциям теоретически в ряде случаев решает проблему преобразования динамического диапазона сигналов без внесения в них искажений. На практике, как отмечают авторы , выполнившие аналоговую реализацию устройств обработки модулирующих функций, невозможно добиться теоретических результатов из-за ограниченной точности и нестабильности параметров аналоговых устройств выделения и обработки модулирующих функций. В данной статье изложены результаты исследования цифровой реализация устройства преобразования динамического диапазона на теоретической основе модуляционного анализа-синтеза, позволившей выяснить потенциал метода средствами точной цифровой обработки сигналов.

Изначально преобразователи динамического диапазона (ПДД) звуковых сигналов применялись в радиовещании для защиты звуковых трактов от перегрузок, согласования диапазона уровней сигналов с динамическим диапазоном каналов, по которым они передаются, и ослабления влияния шума носителей записи. По схожим причинам компрессировали звук для кинематографического канала звукопередачи, поскольку динамический диапазон аналоговых фотофонограмм, как правило, составляет 35–45 дБ, а диапазон уровней звуковой программы (воспринимаемый слухом) может достигать почти 110 дБ. Часто прибегают к компрессированию как речи, так и музыки для сглаживания динамики звука и повышения разборчивости речи на «живых» выступлениях, когда, например, выступающий по каким-то причинам значительно удаляется от микрофона или приближается к последнему. Можно привести еще много примеров применения только амплитудных компрессоров. Но преобразование динамического диапазона не ограничивается его сжатием, а включает еще лимитирование, шумоподавление и экспандирование звуковых сигналов. Все эти виды обработки звука сейчас широко применяются и предположительно еще долгое время будут помогать звукорежиссерам воплощать их творческие идеи и решать технические задачи.

Некоторые причины включения ПДД в звуковые тракты с переходом к цифровым способам записи потеряли свою актуальность: динамический диапазон цифровых носителей записи и звуковых трактов сопоставим с динамическим диапазоном человеческого слуха. Но в кинотеатре, если не сжимать динамический диапазон звукового сопровождения кинофильма при его прослушивании, то тихие фрагменты просто потонут в шумах зрительного зала. Также, если не ограничивать верхнюю границу уровня сигнала, можно оглушить зрителей или перегрузить усилители мощности и кинотеатральные громкоговорители. Таким образом, преобразованиединамического диапазона кинематографического звука необходимо для обеспечения комфортного прослушивания в зале кинотеатра. В формате цифрового звука Dolby Digital , применяемом для записи фонограмм большинства современных фильмов, предусмотрено формирование специального сигнала управления динамическим диапазоном. В аппаратуре воспроизведения предусмотрено использование этого сигнала для регулирования динамического диапазона, причем имеется возможность изменения степени компрессирования в зависимости от условий конкретного зрительного зала. В связи с этим сохраняет актуальность разработки преобразователей динамического диапазона, обеспечивающих высокое качество обработки звуковых сигналов при минимальном вмешательстве звукооператора.

По критерию быстродействия ПДД делятся на две группы: инерционные (с динамически изменяющимся коэффициентом передачи) и безынерционные (мгновенного действия).

Инерционные преобразователи используются в звукотехнике уже в течение многих десятилетий, принцип их работы, достоинства и недостатки достаточно подробно описаны в литературе . Их работа основана на выделении из сигнала огибающей, формировании на основе огибающей управляющего сигнала и последующем перемножении этих двух сигналов: входного звукового и управляющего:

где – входной сигнал, – управляющий сигнал, – выходной сигнал.

Перемножению во временной области соответствует свертка спектров названных сигналов в частотной области.

где – частотный спектр входного сигнала, – частотный спектр управляющего сигнала, – частотный спектр выходного сигнала.

Для формирования сигнала управления применяется низкочастотная фильтрация максимальных или среднеквадратичных значений входного сигнала. В результате такой фильтрации сигнал управления изменяется инерционно, по отношению к изменениям амплитудного или среднеквадратичного значения сигнала. Из-за противоречивости требований, предъявляемых к фильтрации функции коэффициента передачи, возникают недостатки инерционных преобразователей:

· плавное нарастание сигнала управления приводит к выбросам выходного сигнала при резком увеличении сигнала на входе. Эти выбросы могут выйти за пределы линейного участка характеристики передачи звукового тракта. При этом появятся нелинейные искажения;

· резкое нарастание сигнала управления избавит от выбросов, но в то же время сигнал управления приобретет крутой фронт – это обогатит его спектр, а значит, после свертки спектров входного сигнала и сигнала управления значительно обогатится спектр выходного сигнала. Это обусловит появление слышимых эффектов работы ПДД;

· замедленный процесс восстановления коэффициента передачи при резком уменьшении сигнала приводит к появлению эффекта «дыхания шума паузы». Этот эффект выражается в заметном на слух снижении громкости тихого фрагмента сигнала с постепенным последующим ее увеличением;

· резкое восстановление коэффициента передачи обусловит появление пульсаций в управляющем сигнале при обработке звукового сигнала с интенсивными низкочастотными составляющими. Эти пульсации вызывают амплитудную модуляцию обрабатываемого сигнала и приводят к появлению нелинейных искажений.

Для того чтобы перечисленные искажения не были заметны на слух, необходимо подбирать оптимальные параметры фильтра для определенного вида звукового материала: речи или музыки.

Известны безынерционные ограничители уровня сигнала, в них ограничению подвергаются мгновенные значения сигнала, превышающие некоторое заданное пороговое значение сигнала. При этом изменяется форма сигнала и появляются большие нелинейные искажения, поэтому такие устройства практически не используются. Их применяют, в основном, как средство защиты от перегрузки тракта передачи сигнала.

Безынерционное преобразование динамического диапазона звуковых сигналов на основе модулирующих функций в теории модуляционного анализа-синтеза свободно от перечисленных недостатков инерционных устройств и вышеупомянутых безынерционных ограничителей уровня сигнала. В теории модуляционного анализа-синтеза все преобразования, в том числе преобразование динамического диапазона, основываются на выделении из сигнала и последующей обработки модулирующих функций: амплитудной и/или частотной. Кроме преобразования динамического диапазона сигнала, на основе модуляционных преобразований возможно осуществить: безынерционное управление тембром звуковых сигналов , сжатие частотного диапазона звуковых сигналов на основе выделения и нелинейной обработки их мгновенной частоты и другие виды преобразований .

Аналоговый безынерционный компрессор на основе модулирующих функций оказался довольно сложным в реализации. Результаты его работы, представленные в , показывают, что все недостатки инерционных компрессоров в данном случае отсутствуют. Но из-за ограниченной точности и нестабильности параметров аналоговых устройств выделения и обработки модулирующих функций результаты далеки от теоретически возможных. В связи со сложностью аналоговой реализации, безусловно, огромный интерес представляет создание цифрового безынерционного ПДД на основе модулирующих функций. Во-первых, это позволит улучшить качество обработки звука за счет использования алгоритмов преобразования динамического диапазона, недоступных или труднореализуемых с необходимой точностью в аналоговой форме. Во-вторых, в связи с повсеместным использованием цифровых способов записи, обработки и воспроизведения звука наиболее естественно выполнять преобразование динамического диапазона также в цифровой форме. Точная цифровая реализация ПДД на основе модуляционного анализа-синтеза позволит в полной мере выяснить потенциальные возможности метода, чему до сих пор препятствовали принципиально неустранимые погрешности аналоговой реализации.

Перед изложением результатов работы цифрового безынерционного компрессора имеет смысл рассмотреть подробнее модулирующие функции и основы модуляционных преобразований сигналов.

Согласно теории модуляционного анализа-синтеза, произвольный сигнал можно представить как результат совместного применения амплитудной и частотной модуляции:

,

если удачно выбрать пару модулирующих функций – амплитудную модулирующую функцию и – частотную модулирующую функцию. В теории доказано, что для однозначного выбора этой пары функций необходимо исходный сигнал дополнить опорным с помощью преобразования Гильберта. Понятия о модулирующих функциях сигнала были введены еще в 1945 г. Д. Габором .

Огибающей (амплитудной модулирующей функцией) пары сигналов, сопряженных по Гильберту , называют неотрицательную функцию времени

.(1)

Мгновенной частотой (частотной модулирующей функцией) пары сигналов называют производную от текущей фазы:

Введенные Д. Габором понятия нашли широкое применение при описании преобразований узкополосных сигналов.

Ю. М. Ишуткин в предложил обобщить введенные Д. Габором определения модулирующих функций, не накладывая ограничений на ширину частотного спектра сигналов.

Идея обработки звукового сигнала путем воздействия на его модулирующие функции, предложенная Ю. М. Ишуткиным, состоит в том, чтобы:

1. По известному вещественному сигналу с помощью преобразования Гильберта создать комплексный сигнал

,

где – Гильбертово отображение сигнала .

2. Для этой пары сигналов вычислить модулирующие функции: амплитудную модулирующую функцию и частотную модулирующую функцию сигнала.

3. Преобразовать модулирующие функции в целях обработки с помощью линейных и нелинейных цепей.

4. По измененным модулирующим функциям синтезировать новый звуковой сигнал.

Совокупность первых двух операций, в результате которых становятся известными модулирующие функции сигнала, называют модуляционным анализом. Последняя операция носит название модуляционного синтеза. Структура канала полного модуляционного анализа-синтеза представлена на рис.1 .

.

Для построения цифровой системы необходимо произвести требуемые преобразования цифрового представления звукового сигнала. Цифровой безынерционный ПДД может быть построен по схеме с прямым регулированием. С учетом дискретизации аналоговых сигналов его структурная схема изображена на рис.2.


Рис.2. Структурная схема цифрового безынерционного компрессора с прямым регулированием.

Исходный сигнал представлен как

,

где - дискретная мгновенная амплитудная модулирующая функция, а - дискретная мгновенная фаза сигнала. В демодуляторе огибающей выполняется преобразование Гильберта и вычисление амплитудной модулирующей функции. Частотный спектр исходного сигнала, в соответствии со свойством спектра произведения образов, будет равен

,(2)

где - частотный спектр амплитудной модулирующей функции, - символ прямого преобразование Фурье, его выполнение в данном выражении формирует в качестве второго операнда свертки частотный спектр косинуса мгновенной фазы сигнала, а - частотный спектр сигнала.

В результате нелинейного преобразования мгновенной амплитудной модулирующей функции, выполняемого в блоке возведения в степень, получаем новую дискретную амплитудную модулирующую функцию , где - некоторая нелинейная функция, в данном случае - степенная, реализующая амплитудную характеристику ПДД требуемого вида. Новой амплитудной модулирующей функции будет соответствовать новый частотный спектр . Частотный спектр синтезированного по измененной амплитудной модулирующей функции сигнала будет иметь вид

Введение линии задержки необходимо для синхронизации исходного сигнала с сигналом огибающей, вычисление которой неизбежно сопровождается временной задержкой.

Добавление к новой огибающей постоянного сигнала необходимо для того, чтобы преобразование начиналось со значения огибающей, превышающих пороговый уровень, задаваемый постоянным слагаемым.

Для частного случая реализации амплитудной характеристики компрессора со сжатием динамического диапазона в два раза сигнал на выходе безынерционного ПДД можно представить следующим соотношением:

.

Выполнение большинства требуемых математических операций цифровой системой осуществляется с высокой точностью. Пожалуй, наиболее сложным элементом цифрового ПДД является широкополосный цифровой преобразователь Гильберта (ЦПГ), входящий в состав блока демодуляции огибающей. От него во многом зависит качество ПДД. Для достижения высокого качества преобразования ЦПГ должен в широкой полосе частот, от 32 Гц до 16000 кГц, обеспечивать частотно-независимый фазовый сдвиг сигнала на с погрешностью порядка . Величина фазовой погрешности выбирается такой, чтобы возникающие из-за нее пульсации мгновенной амплитуды тонального сигнала не были заметны на слух. При такой фазовой погрешности их уровень не превысит -80 дБ. Реализация такого преобразователя рассмотрена в [ 10 ].

Компьютерная модель цифрового безынерционного компрессора на основе модулирующих функций, построенная по схеме рис.2, при проверке работоспособности на тестовых однотональных сигналах дала положительные результаты, показав тем самым правильность найденных алгоритмических решений, а также успешное решение проблем, неизбежно возникающих при переходе от аналогового представления сигналов к цифровому. Амплитудная модулирующая функция исходного однотонального сигнала представляет собой постоянную функцию времени. В результате нелинейного преобразования амплитудной модулирующей функции получается новая временная амплитудная модулирующая функция, но в случае с однотональным сигналом это будет снова постоянная функция времени. Спектр исходной амплитудной модулирующей функции и нелинейно преобразованной для однотонального сигнала состоит из одной гармоники на частоте сигнала. Результат свертки синтезированного по измененной амплитудной модулирующей функции однотонального сигнала заведомо будет подобен по форме исходному сигналу.

Проверка работы безынерционного ПДД на реальном звуковом сигнале дала неожиданные результаты, а именно временами очень плохое качество звука прошедшего нелинейную обработку. Для поиска причины, вызывающей заметные на слух артефакты при прослушивании обработанного сложного звукового сигнала, был выполнен анализ форм модулирующих функций (сравнение значений на выходе цифровой модели с расчетными значениями), а также сопоставление форм их частотных спектров. В качестве тестового сигнала для такой проверки был выбран сигнал, состоящий из двух гармонических компонентов с частотами Гц и Гц:

где, - частота дискретизации сигнала, равная 44 100Гц.

Ниже приведена расчетная временная диаграмма тестового сигнала и его частотный спектр (рис. 3а), а также временные диаграммы и частотные спектры его амплитудной модулирующей функции (рис. 3б) и косинуса фазы (рис. 3в). Спектры амплитудной модулирующей функции и косинуса фазы состоят из множества компонент, но в результате свертки таких спектров остаются всего две составляющие.

Рис.3. Временные функции (справа) и частотные спектры (слева): а) сигнала биений с частотами 1000 и 1500Гц; б) амплитудной модулирующей функции сигнала биений; в) косинуса фазы сигнала биений.

Аналитическое выражение для временной амплитудной модулирующей функции имеет вид:


Для вычисления ее спектра удобно воспользоваться табличным косинус-преобразованием Фурье функции при

(3)

Табличные значения гамма-функции для аргументов в диапазоне от 0 до 2, а также формулы для вычисления гамма-функции для больших и отрицательных значений аргументов представлены в . В таблице 1 сведены результаты аналитического расчета спектральных составляющих амплитудной модулирующей функции на угловых частотах от 0 до с периодом равным . В дискретной области частоте соответствует частота , равная отношению частоты дискретизации к количеству отсчетов на периоде сигнала. Практически полное совпадение значений, обозначенных на диаграммах рис. 3, с результатом аналитического расчета подтверждает правильность построений рис. 3.

Таблица 1.

Аналитические значения спектра амплитудной модулирующей функции.

Дискретная частота

–3,93

–13,47

1000

–27,45

1500

–34,82

2000

–39,94

2500

–43,88

3000

–47,1

Сжатию динамического диапазона в два раза соответствует степенная обработка амплитудной модулирующей функции с показателем степени равным 1/2. Для этого случая на рис. 4 показаны различия временных функций и частотных спектров исходного (штриховая линия) и обработанного (сплошная линия) сигналов (рис. 4а), а также их амплитудных модулирующих функций (рис. 4в). Спектры исходных и обработанных сигналов сдвинуты на диаграмме относительно друг друга на 30 отсчетов для более наглядного представления их различий.

В табл. 2 представлены результаты аналитического расчета спектра нелинейно преобразованной огибающей, вычисленные по формуле (3) для . Они практически точно совпадают со значениями, обозначенными на диаграммах рис. 4, что подтверждает точность последних.


Рис.4. Временные функции (справа) и частотные спектры (слева): а) сигналов на входе и выходе безынерционного преобразователя; б) амплитудной модулирующей функции входного сигнала и результата ее степенной обработки.

Таблица 2.

Аналитические значения спектра нелинейно преобразованной амплитудной модулирующей функции (степень 1/2).

Дискретная частота

2,35

16,33

1000

25,87

1500

31,25

2000

35,03

2500

37,95

3000

40,33

Нелинейное преобразование амплитудной модулирующей функции видоизменило ее спектр (рис. 3б). В результате свертки такой нелинейно преобразованной огибающей и входного сигнала выходной сигнал будет иметь существенно обогащенный спектр по сравнению со входным (рис. 3а). В синтезированном по измененной огибающей сигнале биений появятся дополнительные составляющие, которые можно рассматривать как интермодуляционные искажения. Они меняют субъективное восприятие преобразованного сигнала. Очевидно, что в любом другом случае, кроме обработки однотонального сигнала, из-за изменения только одного из операндов в выражении (2) будет получен спектр преобразованного сигнала, отличающийся от исходного. Степень обогащения спектра выходного сигнала зависит от широкополосности огибающей: чем шире спектр нелинейно преобразованной огибающей, тем сильнее обогащается частотный спектр преобразованного сигнала.

Таким образом, в чистом виде безынерционное преобразование динамического диапазона звуковых сигналов на основе модулирующих функций непригодно из-за изменений частотного спектра преобразованного сигнала, в ряде случаев, отчетливо заметных на слух. Можно, конечно, отфильтровать спектр нелинейно преобразованной огибающей, примерно до ширины критической полосы слуха в низкочастотной части звукового диапазона. Тогда дополнительные составляющие окажутся впределах одной критической полосы с составляющими спектра исходного сигнала и окажутся замаскированными. Но ПДД при этом потеряет свойство безынерционности из-за ограниченной длительности переходной функции фильтра мгновенной огибающей.

Выводы:

· Цифровая модель ПДД позволила избавиться от неустранимых погрешностей аналоговой реализации и выяснить потенциальные возможности метода ПДД на основе нелинейной обработки модулирующих функций.

· Прослушивание фонограмм после обработки цифровым ПДД на основе модулирующих функций обнаружило возникновение в некоторые моменты слышимых грубых искажений звукового сигнала.

· Анализ временных функций и частотных спектров сигналов, возникающих при ПДД с использованием модулирующих функций, позволил объяснить возникновение слышимых искажений обогащением частотного спектра обработанного сигнала вследствие изменения спектра амплитудной модулирующей функции. Для уменьшения заметности искажений необходимо фильтровать преобразованную амплитудную модулирующую функцию. При этом ее спектр сужается, и при условии, что дополнительные составляющие оказываются в одних критических полосах слуха с основными составляющими, первые эффективно маскируются вторыми. Правда при этом ПДД теряет свойство безынерционности.

· В связи с наличием у безынерционных ПДД на основе модулирующих функций принципиальных недостатков, представляется, что создание более совершенных ПДД должно идти по пути улучшения инерционных преобразователей.

Литература.

1. Основы модуляционных преобразований звуковых сигналов: Монография/ Ишуткин Ю. М., Уваров В. К.; Под ред. В. К. Уварова. – СПб.: СПбГУКиТ, 2004.

2. Радиовещание и электроакустика: Учебник для вузов/ А. В. Выходец, М. В. Гитлиц, Ю. А. Ковалгин и др.; Под ред. М. В. Гитлица. – М.: Радио и связь, 1989.

3. Udo Zoelzer. Digital Audio Signal Processing. John Willey & Sons. Chichester , New York , Weinheim, Brisbane , Singapore , Toronto , 1997.

4. Осташевский Е. Н. Разработка метода и аппаратуры управления нестационарными фазами сигналов для преобразования тембра при создании звуковых эффектов: Автореф. дис. канд. тех. наук. – Л.: ЛИКИ, 1987.

5. Уваров В. К. Точное компандирование частотного и динамического диапазонов звуковых сигналов. – СПб.:СПбГУКиТ, 2002.

6. Плющев В. М. Разработка метода и устройств безынерционного преобразования динамического диапазона звуковых сигналов: Автореф. дис. канд.тех.наук. –Л.: ЛИКИ, 1986.

7. Применение модуляционных преобразований звуковых сигналов: Монография/ В. К. Уваров, В. М. Плющев, М. А. Чесноков; Под ред. В. К. Уварова – СПб.:СПбГУКиТ, 2004.

8. Перспективы обработки звуковых сигналов по их модулирующим функциям. Ишуткин Ю. М. Труды Ленинградского института киноинженеров, 1977 г., вып. . –с. 102-115.

9. D.Gabor, J.IEE 93, (pt3), (1946).

10. Журнал научных публикаций аспирантов и докторантов, ISSN 1991-3087, 2008 г., № 9. – с. 213-218.

11. Интегральные преобразования и операционное исчисление, В. А. Диткин, А. П. Прудников, Главная редакция физико-математической литературы изд-ва «Наука», М., 1974 г.

12. Справочник по математике (для научных работников и инженеров). Г. Корн, Т. Корн. – М., 1977.

02.03.2015 в 10:15

Итак, в данном цикле статей мы с вами поговорим о том что же такое компрессия и как ее использовать. К сожалению зачастую люди пользуются ей не понимания ее основ и в результат получается далеко не самого лучшего качества. Именно это и натолкнуло меня на написания цикла статей, где мы с вами детально разберем работу устройства под названием компрессор, и я покажу его применение на практике.

Одним из главных параметров звука является его динамика. С помощью динамики можно акцентировать ноты и музыкальные фразы добавляя новые краски в произведение, но, как показывает практика, мало кому из музыкантов(здесь не берутся во внимание профессионалы своего дела) удается это сделать. Да и ударные не подверженные динамической обработке звучат сухо и невыразительно. А ответ здесь прост - наш слух более чувствителен к высоким звукам и менее к низким. В качестве примера мы можем сравнить звук тарелки и саб-бочки, нормализовать их в 0db и послушать: тарелку люди будут воспринимать более ярко, ясно и насыщено. Конечно, можно поднять и уровень саб-бочки, но при этом (учитывая наличие других инструментов в миксе) мы рискуем получить режущую ухо кашу из звуков, где бочка будет зашкаливать, а тарелка звенеть где-то позади. Именно для предотвращения «динамических конфликтов» и служит компрессор. Так же через него могут пропускать готовые миксы в целях выравнивания общего звучания, добавления ему плотности и создания эффекта накачки.

Подводя небольшой итог вышесказанному: Компрессор - устройство, используемое для понижения динамического диапазона - промежутка между самым тихим и более громким уровнем звукового сигнала.

Принцип работы компрессора не так уж сложен, как кажется - он захватывает все, что превышает заданное значение в db и уменьшает его в соответствии с настройками. Рассмотрим на примере компрессора из пакета T-Racks Plugin Bundle

Threshold - данный параметр отвечает за порог срабатывания компрессора. Именно им устанавливается порог, при котором компрессор начинает свою работу. Измеряется он в db. К примеру, если мы выставим значение данного параметра -11.1, то это говорит о том, что все что находится ниже данного диапазона не будет подвергаться обработке, а все, что выше компрессор захватит и обработает.

Сразу хочу предостеречь - работать данным параметром нужно крайне аккуратно и постоянно смотреть на показание информационной панели(справа сверху). При обработке им звукового сигнала есть риск захватить более тихие звуки, которые в компрессии не нуждаются.

Ratio - соотношение. Зачастую данный параметр многие не понимают, или понимают неправильно. На самом деле все очень просто - он отвечает за величину ослабления сигнала. Измеряется так же в db. Допустим, у нас стоит значение 2(в некоторых компрессорах может использоваться обозначение 2:1), это означает, что сигнал превысивший порог Threshold будет ослаблен до 1 db выше значения порога, 8 db будет ослаблен до 4х и так далее. Значение Ratio в районе 3 будет считаться умеренным сжатием, 5 - средним, 8 -сильное, а значения свыше 20 будут уже считаться ограничивающими. В этом случае наш компрессор по работе начинает напоминать Limiter , но данный компрессор не позволяет выставлять такие экстремальные значения.

Attack Time - время срабатывания компрессора, которое требуется сигналу чтобы стать максимально компресированным после прохождения порога заданного параметром Threshold . Измеряется в миллисекундах.

На некоторых компрессорах значение времени атаки представляется в Дб/сек.

Release - время восстановления.Данный параметр является полностью противоположным параметру Attack Time . Если говорить конкретно, то это время, которое потребуется сигналу, чтобы вернуться в первоначальное состояние. Время восстановления, как правило, значительно больше времени атаки.

На компрессоре от T- Racks это особо заметно, т.к. значение времени Release представлено в секундах против миллисекунд значения Attack Time .

Make Up - в связи с тем, что компрессор является прибором понижающим динамическую характеристику сигнала, то на выходе звук будет тише, чем был до обработки. Именно для компенсации этого процесса служит данный параметр. Иными словами - им мы увеличиваем громкость сигнала после обработки.

В некоторых компрессорах он так же может обозначаться как Output Gain , Output , Gain и т.д.

Knee - данный параметр показывает плавность перехода между сжатым и несжатым сигналом. Имеет 2 типа - Hard Knee и Soft Knee . При использовании Soft Knee данный переходпроисходит более плавно и естественно, компрессор работает мягче и незаметней. Его работу очень хорошо иллюстрирует следующий график

Типы компрессии(по принципу использования):

1. Последовательная компрессия - самый распространенный тип динамической обработки звука. В Insert канала добавляем тот компрессор, который нам нужен и настраиваем. Все просто.

2.Параллельная компрессия — данный тип компрессии так же имеет достаточное широкое распространение, но есть одно существенное отличие от последовательной компрессии — при нем мы добавляем компрессор на Send -канал и уже примешиваем его к чистому и не обработанному звуку.

На некоторых компрессорах имеется параметр Mix , который позволяет настроить соотношение чистого сигнала к обработанному не прибегая к созданию отдельной дорожки Send.

3.Многополосная компрессия — компрессия, при которой отдельные диапазоны частот обрабатываются различным образом. Давайте взглянем на многополосный компрессор от Waves

Принцип работы данного компрессора не так уж сложен, каким он может показаться на первый взгляд: в его основе находится устройство под названием Crossover , который разделяет частоты звукового сигнала на различные диапазоны. А далее идет работа, как с обычным компрессором, но каждый частотный диапазон может быть обработан со своими настройками, что очень полезно при обработке отдельных инструментов микса.

На этом все. Во второй части я расскажу об особенностях применения различных компрессоров.

Методы, используемые для обработки звука:

1. Монтаж. Состоит в вырезании из записи одних участков, вставки других, их замены, размножении и т.п. Называется также редактированием. Все современные звуко- и видеозаписи в той или иной мере подвергаются монтажу.

2. Амплитудные преобразования. Выполняются при помощи различных действий над амплитудой сигнала, которые в конечном счете сводятся к умножению значений сэмплов на постоянный коэффициент (усиление/ослабление) или изменяющуюся во времени функцию-модулятор (амплитудная модуляция). Частным случаем амплитудной модуляции является формирование огибающей для придания стационарному звучанию развития во времени.

Амплитудные преобразования выполняются последовательно с отдельными сэмплами, поэтому они просты в реализации и не требуют большого объема вычислений.

3. Частотные (спектральные) преобразования. Выполняются над частотными составляющими звука. Если использовать спектральное разложение - форму представления звука, в которой по горизонтали отсчитываются частоты, а по вертикали - интенсивности составляющих этих частот, то многие частотные преобразования становятся похожими на амплитудные преобразованиям над спектром. Hапример, фильтрация - усиление или ослабление определенных полос частот - сводится к наложению на спектр соответствующей амплитудной огибающей. Однако частотную модуляцию таким образом представить нельзя - она выглядит, как смещение всего спектра или его отдельных участков во времени по определенному закону.

Для реализации частотных преобразований обычно применяется спектральное разложение по методу Фурье, которое требует значительных ресурсов. Однако имеется алгоритм быстрого преобразования Фурье (БПФ, FFT), который делается в целочисленной арифметике и позволяет уже на младших моделях 486 разворачивать в реальном времени спектр сигнала среднего качества. При частотных преобразованиях, кроме этого, требуется обработка и последующая свертка, поэтому фильтрация в реальном времени пока не реализуется на пpоцессоpах общего назначения. Вместо этого существует большое количество цифpовых сигнальных пpоцессоpов (Digital Signal Processor - DSP), котоpые выполняют эти опеpации в pеальном вpемени и по нескольким каналам.

4. Фазовые пpеобpазования. Сводятся в основном к постоянному сдвигу фазы сигнала или ее модуляции некотоpой функцией или дpугим сигналом. Благодаpя тому, что слуховой аппаpат человека использует фазу для опpеделения напpавления на источник звука, фазовые пpеобpазования стеpеозвука позволяют получить эффект вpащающегося звука, хоpа и ему подобные.

5. Вpеменные пpеобpазования. Заключаются в добавлении к основному сигналу его копий, сдвинутых во вpемени на pазличные величины. Пpи небольших сдвигах (поpядка менее 20 мс) это дает эффект pазмножения источника звука (эффект хоpа), пpи больших - эффект эха.

6. Фоpмантные пpеобpазования. Являются частным случаем частотных и опеpиpуют с фоpмантами - хаpактеpными полосами частот, встpечающимися в звуках, пpоизносимых человеком. Каждому звуку соот- ветствует свое соотношение амплитуд и частот нескольких фоpмант, котоpое опpеделяет тембp и pазбоpчивость голоса. Изменяя паpаметpы фоpмант, можно подчеpкивать или затушевывать отдельные звуки, менять одну гласную на дpугую, сдвигать pегистp голоса и т.п.

На основе этих методов реализовано множество аппаратных и программных средств обработки звука. Ниже приведено описание некоторых из них.

1. Компрессор (от англ. «compress» - сжимать, сдавливать) - это электронное устройство или компьютерная программа, используемая для уменьшения динамического диапазона звукового сигнала. Понижающая компрессия уменьшает амплитуду громких звуков, которые находятся выше определённого порога, а звуки находящиеся ниже этого порога остаются неизменными. Повышающая компрессия наоборот увеличивает громкость звуков находящихся ниже определённого порога, в то время как звуки, превышающие этот порог остаются неизменными. Эти действия уменьшают разницу между тихими и громкими звуками, сужая динамический диапазон.

Параметры компрессора:

Threshold (порог) - это уровень, выше которого сигнал начинает подавляться. Обычно устанавливается в дБ.

Ratio (соотношение) - определяет соотношение входящего/выходящего сигналов, превышающих порог (Threshold). Например, соотношение 4:1 означает, что сигнал превышающий порог на 4 дБ, сожмётся до уровня 1 дБ выше порога. Самое высокое соотношение ∞:1 обычно достигается с помощью соотношения 60:1, и фактически означает, что любой сигнал, превышающий порог будет снижен до порогового уровня (за исключением коротких резких изменений громкости, называемых "атакой").

Attack и Release (атака и восстановление, рис. 1.3). Компрессор может обеспечить определенную степень контроля над тем, как быстро он действует. "Фаза атаки" это период, когда компрессор снижает громкость до уровня, который определяется соотношением. "Фаза восстановления" это период, когда компрессор увеличивает громкость до уровня определённого соотношением, или к нулю дБ, когда уровень падает ниже порогового значения. Продолжительность каждого периода определяется скоростью изменения уровня сигнала.

Рис. 1.3. Атака и восстановление компрессора.

Во многих компрессорах атака и восстановление регулируются пользователем. Однако в некоторых компрессорах они определяются разработанной схемой и не могут быть изменены пользователем. Иногда параметры атаки и восстановления являются "автоматическими" или "программно-зависимыми", это означает, что их время изменяется в зависимости от входящего сигнала.

Колено компрессии (Knee) управляет изгибом компрессии на пороговом значении, оно может быть острым или округлым (рис. 1.4). Мягкое колено медленно увеличивает соотношение сжатия, и в конечном итоге достигает сжатия заданного пользователем. При жёстком колене компрессия начинается и прекращается резко, что делает её более заметной.

Рис. 1.4. Мягкое и жёсткое колено.

2. Экспандер. Если компрессор подавляет звук после того как его уровень превышает определённое значение, - то экспандер подавляет звук после того как его уровень станет меньше определённого значения. Во всём остальном экспандер схож с компрессором (параметры обработки звука).

3. Дисторшн (англ. «distortion» - искажение) - это искусственное грубое сужение динамического диапазона с целью обогащения звука гармониками. При компрессии волны всё больше принимают не синусоидальные, а квадратные формы за счёт искусственного ограничения уровня звука, которые обладают самым большим количеством гармоник.

4. Дилэй (англ. delay) или эхо (англ. echo) - звуковой эффект или соответствующее устройство, имитирующее чёткие затухающие повторы исходного сигнала. Эффект реализуется добавлением к исходному сигналу его копии или нескольких копий, задержанных по времени. Под дилэем обычно подразумевается однократная задержка сигнала, в то время как эффект «эхо» - многократные повторы.

5. Реверберация - это процесс постепенного уменьшения интенсивности звука при его многократных отражениях. В виртуальных ревербераторах существует множество параметров, позволяющих получить нужное звучание, характерное для какого-либо помещения.

6. Эквалайзер (англ. «equalize» - «выравнивать», общее сокращение - «EQ») - устройство или компьютерная программа, позволяющая изменять амплитудно-частотную характеристику звукового сигнала, то есть корректировать его (сигнала) амплитуду избирательно, в зависимости от частоты. Прежде всего эквалайзеры характеризуются количеством регулируемых по уровню частотных фильтров (полос).

Существует два основных типа многополосных эквалайзеров: графический и параметрический. Графический эквалайзер имеет определённое количество регулируемых по уровню частотных полос, каждая из которых характеризуется постоянной рабочей частотой, фиксированной шириной полосы вокруг рабочей частоты, а также диапазоном регулировки уровня (одинаковый для всех полос). Как правило, крайние полосы (самая низкая и высокая) представляют собой фильтры «полочного» типа, а все остальные имеют «колоколообразную» характеристику. Графические эквалайзеры, применяемые в профессиональных областях, обычно имеют 15 или 31 полосу на канал, и нередко оснащаются анализаторами спектра для удобства корректировки.

Параметрический эквалайзер дает гораздо большие возможности корректировки частотной характеристики сигнала. Каждая его полоса имеет три основных регулируемых параметра:

Центральная (или рабочая) частота в герцах (Гц);

Добротность (ширина рабочей полосы вокруг центральной частоты, обозначается буквой «Q») - безразмерная величина;

Уровень усиления или ослабления выбранной полосы в децибелах (дБ).

7. Хорус (англ. chorus) - звуковой эффект, имитирующий хоровое звучание музыкальных инструментов. Эффект реализуется путём добавления к исходному сигналу его собственной копии или копий, сдвинутых по времени на величины порядка 20-30 миллисекунд, причём время сдвига непрерывно изменяется.

Сначала входной сигнал разделяется на два независимых сигнала, один из которых остаётся без изменений, в то время как другой поступает на линию задержки. В линии задержки осуществляется задержка сигнала на 20-30 мс, причём время задержки изменяется в соответствии с сигналом генератора низких частот. На выходе задержанный сигнал смешивается с исходным. Генератор низких частот осуществляет модуляцию времени задержки сигнала. Он вырабатывает колебания определённой формы, лежащие в пределах от 3 Гц и ниже. Изменяя частоту, форму и амплитуду колебаний низкочастотного генератора, можно получать различный выходной сигнал.

Параметры эффекта:

Глубина (depth) - характеризует диапазон изменения времени задержки.

Скорость (speed, rate) - быстрота изменения «плавания» звука, регулируется частотой низкочастотного генератора.

Форма волны генератора низкой частоты (LFO waveform) - бывает синусоидальной (sin), треугольной (triangle) и логарифмической (log).

Баланс (balance, mix, dry/wet) - соотношение необработанного и обработанного сигналов.

8. Фэйзер (англ. phaser), также часто называемый фазовым вибрато - звуковой эффект, который достигается фильтрацией звукового сигнала с созданием серии максимумов и минимумов в его спектре. Положение этих максимумов и минимумов варьируется на протяжении звучания, что создает специфический круговой (англ. sweeping) эффект. Также фэйзером называют соответствующее устройство. По принципу работы схож с хорусом и отличается от него временем задержки (1-5 мс). Помимо этого задержка сигнала у фэйзера на разных частотах неодинакова и меняется по определённому закону.

Электронный эффект фэйзер создается путем разделения звукового сигнала на два потока. Один поток обрабатывается фазовым фильтром, который изменяет фазу звукового сигнала, сохраняя его частоту. Величина изменения фазы зависит от частоты. После микширования обработанного и необработанного сигналов, частоты, находящиеся в противофазе, погашают друг друга, создавая характерные провалы в спектре звука. Изменение отношения оригинального и обработанного сигнала позволяет изменить глубину эффекта, причем максимальная глубина достигается при отношении 50%.

Эффект фэйзера подобен эффектам фланжера и хоруса, которые также используют добавление к звуковому сигналу его копий, подаваемых с определенной задержкой (т. н. линию задержки). Однако в отличие от фланжера и хоруса, где величина задержки может принимать произвольное значение (обычно от 0 до 20 мс), величина задержки в фэйзере зависит от частоты сигнала и лежит в пределах одной фазы колебания. Таким образом, фэйзер можно рассматривать как частный случай фланжера.

9. Фланжер (англ. flange - фланец, гребень) - звуковой эффект, напоминающий «летящее» звучание. По принципу работы схож с хорусом, и отличается от него временем задержки (5-15 мс) и наличием обратной связи (feedback). Часть выходного сигнала подается обратно на вход и в линию задержки. В результате резонанса сигналов получается фланжер-эффект. При этом в спектре сигнала некоторые частоты усиливаются, а некоторые - ослабляются. В результате частотная характеристика представляет ряд максимумов и минимумов, напоминая гребень, откуда и происходит название. Фаза сигнала обратной связи иногда инвертируется, тем самым достигается дополнительная вариация звукового сигнала.

10. Вокодер (англ. «voice coder» - кодировщик голоса) - устройство синтеза речи на основе произвольного сигнала с богатым спектром. Изначально вокодеры были разработаны в целях экономии частотных ресурсов радиолинии системы связи при передаче речевых сообщений. Экономия достигается за счёт того, что вместо собственно речевого сигнала передают только значения его определённых параметров, которые на приемной стороне управляют синтезатором речи.

Основу синтезатора речи составляют три элемента: генератор тонального сигнала для формирования гласных звуков, генератор шума для формирования согласных и система формантных фильтров для воссоздания индивидуальных особенностей голоса. После всех преобразований голос человека становится похожим на голос робота, что вполне терпимо для средств связи и интересно для музыкальной сферы. Так было лишь в самых примитивных вокодерах первой половины прошлого столетия. Современные связные вокодеры обеспечивают высочайшее качество голоса при существенно более сильной степени сжатия в сравнении с упомянутыми выше.

Вокодер как музыкальный эффект позволяет перенести свойства одного (модулирующего) сигнала на другой сигнал, который называют носителем. В качестве сигнала-модулятора используется голос человека, а в качестве носителя - сигнал, формируемый музыкальным синтезатором или другим музыкальным инструментом. Так достигается эффект «говорящего» или «поющего» музыкального инструмента. Помимо голоса модулирующий сигнал может быть и гитарой, клавишными, барабанами и вообще любым звуком синтетического и «живого» происхождения. Так же нет ограничений и на несущий сигнал. Экспериментируя с моделирующим и несущим сигналом можно получать совершенно разные эффекты - говорящая гитара, барабаны со звуком фортепиано, гитара, звучащая как ксилофон.