Základné prostriedky a metódy spracovania zvuku. Základný výskum

1

Modulačná teória má široké spektrum aplikácií založených na spracovaní signálov v časovej oblasti, najmä ju možno použiť ako základ pre riešenie problémov spracovania širokopásmových zvukových signálov pri ich prenose cez úzkopásmový rádiový kanál, vrátane. cez kanál telefonickú komunikáciu. V teórii modulácie je signál opísaný ako komplexne modulovaný (súčasne amplitúdovo a frekvenčne) proces vo forme súčinu obálky (amplitúdovo modulačná funkcia signálu) a kosínusu fázy (frekvenčne modulačná funkcia signálu). signál). Charakteristickým znakom tejto teórie je výber informačných parametrov signálu, ktorých počet sa zvyšuje po každom ďalšom stupni jeho rozkladu na modulačné funkcie (viacstupňový rozklad). Otvára sa tak možnosť ovplyvniť vybrané parametre informácií rôzne úrovne a dosiahnuť požadovaný typ spracovania signálu. Aplikácia teórie modulácie s implementáciou viacstupňového rozkladu umožní uskutočniť nový výskum v oblasti štúdia prirodzených modulácií zvukových signálov s cieľom zlepšiť technické prostriedky rádiové komunikácie využívajúce rečové signály ako hlavnú prenášanú informáciu. Preskúmanie umožnilo vyvodiť záver o relevantnosti perspektívy použitia modulačných funkcií na spracovanie zvukových signálov. Odhalili sa perspektívy využitia operácie delenia a násobenia okamžitej frekvencie signálu bez izolačných modulačných funkcií na účely redukcie šumu. Sú dané predpoklady na jeho použitie a sú vyvinuté metódy na štúdium možnosti využitia operácie okamžitého frekvenčného delenia na redukciu šumu pri prenose frekvenčne komprimovaných signálov v dvoch verziách: redukcia šumu sledovacej frekvencie a dynamická filtrácia.

modulačná analýza-syntéza

okamžitá frekvencia

redukcia hluku

1. Ablazov V.I., Gupal V.I., Zgursky A.I. Konverzia, nahrávanie a prehrávanie rečových signálov. – Kyjev: Lybid, 1991. – 207 s.

2. Ageev D.V. Aktívne pásmo frekvenčného spektra časovej funkcie // Zborník GPI. – 1955. – T. 11. – Č.1.

3. Gippernreiter Yu.B. Vnímanie výšky zvuku: Autorský abstrakt. dis. Ph.D. Psychol.Sc. – M.: 1960. – 22 s.

4. Ishutkin Yu.M. Rozvoj teórie modulačnej analýzy-syntézy zvukových signálov a jej praktické využitie v technológii filmového záznamu zvuku: Abstrakt dizertačnej práce. pre akademické kvalifikácie čl. Doktor technických vied – M.: NIKFI, 1985. – 48 s.

5. Ishutkin Yu.M., Uvarov V.K. Základy modulačných transformácií zvukových signálov / Ed. Uvarová V.K. – Petrohrad: SPbGUKiT, 2004. – 102 s.

6. Ishutkin V.M. Perspektívy spracovania zvukových signálov na základe ich modulačných funkcií / V zborníku: Problematika zvukovej techniky // Proceedings of LIKI, Vol. XXXI. – L.: LIKI, 1977. – S. 102–115.

7. Korsunsky S.G. Vplyv spektra vnímaného zvuku na jeho výšku // Problematika Physiol.Acoust. – 1950. – T. 2. – S. 161–165.

8. Markel J.D., Grey A.H. Lineárna predikcia reči: Trans. z angličtiny / Ed. Yu.N. Prochorová, V.S. 3 hviezdička. – M.: Komunikácia, 1980. – 308 s.

9. Markin D.N., Uvarov V.K. Výsledky praktických štúdií vzťahov medzi spektrami signálu, jeho obalom, fázovým kosínusom a okamžitou frekvenciou. Odd. ruky č. 181kt-D07, ONTI NIKFI, 2007. – 32 s.

10. Markin D.N. Vývoj metódy a technických prostriedkov na kompenzovanie spektier rečových signálov. Autorský abstrakt. dis. pre akademickú súťaž čl. k.t. n. – Petrohrad: SPbGUKiT, 2008. – 40 s.

11. Muravyov V.E. O súčasnom stave a problémoch technológie vokodéra // Moderné rečové technológie, zbierka prác IX zasadnutia Ruskej akustickej spoločnosti, venovaného 90. výročiu M.A. Sapozhková. – M.: GEOS, 1999. – 166 s.

12. Orlov Yu.M. Dynamický filter-potláčač hluku // TKiT. – 1974. – Číslo 10. – S. 13–15.

13. Sapozhkov M.A. Rečový signál v kybernetike a komunikáciách. Konverzia reči vo vzťahu k problémom komunikačných technológií a kybernetiky. – M.: Svyazizdat, 1963. – 452 s.

14. Uvarov V.K., Plyushchev V.M., Chesnokov M.A. Aplikácia modulačných transformácií audio signálov / Ed. VC. Uvarov. – Petrohrad: SPbGUKiT, 2004. – 131 s.

15. Uvarov V.K. Kompresia frekvenčného rozsahu zvukových signálov na zlepšenie kvality zvuku počas premietania filmu: Abstrakt dizertačnej práce. Ph.D.Tech. Sci. – L.: LIKI, 1985. – 22 s.

16. Zwicker E., Feldkeller R. Ucho ako príjemca informácií: Trans. s ním. – M.: Komunikácia, 1971. – 255 s.

17. Gabor D. Teória komunikácií. – The Journal of the Institute of Electrical Engineers, Part III (Radio and Communication Engineering), Vol. 93, č. 26, november 1946. – R. 429–457.

18. Ville J.A. Teória a aplikácia koncepcie analýzy signálu. – Cables a Transmissions, 2A, č. 1, január 1948. – R. 61–74; preložené z francúzštiny v I. Selin, "Teória a aplikácie pojmu komplexný signál." – Tech. Rept. T-92, The RAND Corporation, Santa Monica, CA, august 1958.

Modulačná teória má široké spektrum aplikácií založených na spracovaní signálov v časovej oblasti, najmä ju možno použiť ako základ pre riešenie problémov spracovania širokopásmových zvukových signálov pri ich prenose cez úzkopásmový rádiový kanál, vrátane. cez telefónny kanál.

Prehľad metód spracovania audio signálov odhalil prísľub modulačnej analýzy-syntézy vyvinutej Yu.M. Ishutkin v 70. rokoch minulého storočia na spracovanie a meranie skreslení. Následne bola teória modulácie rozvinutá v prácach jeho študentov a nasledovníkov.

Modulačné funkcie kmitov zložitého tvaru

V polovici 20. storočia dvaja vedci, D. Gabor a J. Wie, nezávisle vytvorili teóriu analytického signálu, ktorá umožňuje opísať akýkoľvek náhodný proces ako explicitnú funkciu času. Práve táto teória sa stala matematickým základom, na ktorom sa následne sformovala modulačná teória zvukových signálov.

Pri niektorých nerigidných obmedzeniach môžu byť akékoľvek oscilácie zložitého tvaru reprezentované ako produkt dvoch explicitných funkcií času

kde s(t) je pôvodný zvukový signál,

S(t) - nezáporná obálka signálu, funkcia amplitúdovej modulácie;

cos φ(t) - kosínus fázy signálu, frekvenčne modulovaná funkcia;

φ(t) - aktuálna fáza signálu, fázovo modulačná funkcia signálu.

Okamžitá frekvencia signálu, funkcia frekvenčnej modulácie signálu.

Modulačné funkcie S(t), φ(t) a ω(t) signálov sú reálnymi funkciami reálneho argumentu t. Vo všeobecných prípadoch sa modulačné funkcie nedajú určiť na základe pôvodného signálu s(t): treba ho doplniť druhým signálom, ktorý sa nazýva referenčný s1(t) a pre dvojicu týchto signálov (, ) možno určiť modulačné funkcie . Vzhľad týchto funkcií závisí rovnako od oboch signálov.

J. Gabor ako prvý ukázal v roku 1946 potrebu referenčného signálu pri určovaní modulačných funkcií a na tento účel aplikoval priamu Hilbertovu transformáciu na pôvodný signál s(t). V teoretickej rádiotechnike to viedlo ku koncepcii analytického signálu. Avšak teória analytického signálu bola vyvinutá pre úzkopásmové oscilácie.

Modulačné funkcie širokopásmového signálu

Následne boli prísne matematické koncepty modulačných funkcií rozšírené na širokopásmové zvukové signály. Predpokladá sa však, že výber referenčného signálu je ľubovoľný a predkladajú sa len požiadavky na ortogonalitu hlavného a referenčného signálu. V súčasnosti je to však Hilbertova transformácia, ktorá sa považuje za technicky pohodlný spôsob konštrukcie dvojice ortogonálnych signálov.

Keďže zvukové signály sú vo všeobecnosti neperiodické a možno ich považovať za kváziperiodické iba v určitých pomerne krátkych časových intervaloch, v teórii modulácie sa na určenie referenčného signálu používa priama Hilbertova transformácia s Cauchyho jadrom.

, (2)

kde H je operátor Hilbertovej transformácie, integrál (2) je singulárny, t.j. neexistuje v obvyklom zmysle v bode t = τ, treba ho chápať ako Lebesgueov integrál a jeho hodnotu v bode t = τ ako Cauchyho principiálnu hodnotu.

Dve funkcie, ktoré spolu súvisia transformáciou (2), sa nazývajú Hilbertov konjugát. Z teórie Hilbertovej transformácie je známe, že tieto funkcie spĺňajú podmienku ortogonality, to znamená, že ich skalárny súčin je rovný nule v celej oblasti definície.

. (3)

Výraz (3) je určitý integrál chápaný v Lebesgueovom zmysle. T - znamená rozsah hodnôt premennej t, v ktorom sa vykonáva integrácia.

V geometrickom znázornení je amplitúdovo modulujúca funkcia S(t) signálový vektor rotujúci okolo počiatku s uhlovou frekvenciou ω(t) a signál sa môže vyvíjať rýchlo alebo pomaly, ale iba v doprednom smere a nie v smere dopredu. opačný smer. To znamená, že obe modulačné funkcie môžu nadobúdať akékoľvek kladné aj záporné hodnoty (a nie sú ničím obmedzené) a každá z nich má vo všeobecnosti konštantné a variabilné zložky:

kde SO je konštantná zložka (priemerná hodnota) obálky signálu;

SS(t) - obálka premennej zložky obálky signálu;

cos ωS(t) - kosínus fázy premennej zložky obálky signálu;

ω0 - priemerná hodnota okamžitej frekvencie signálu (nosná frekvencia);

ωd(t) - odchýlka okamžitej frekvencie signálu;

ωm(t) - modulačná frekvencia signálu.

Viacstupňová modulačná konverzia

Z uvedeného vyplýva, že v procese rozkladu signálu na jeho modulačné funkcie možno pokračovať - ​​vykonať viacstupňový modulačný rozklad.

Prvý stupeň rozšírenia poskytuje pár modulačných funkcií prvého rádu (pozri vzorec 4)

Druhý stupeň rozšírenia poskytuje ďalšie dva páry modulačných funkcií druhého rádu. V tomto prípade obálka prvého rádu S1(t) udáva obálku obálky a okamžitú frekvenciu obálky: S21(t) a ω21(t).

Druhý stupeň rozšírenia okamžitej frekvencie ω1(t) prvého rádu dáva obálku okamžitej frekvencie a okamžitú frekvenciu: S22(t) a ω22(t).

Po treťom rozšírení sa získajú ďalšie štyri páry modulačných funkcií tretieho rádu atď.

Parametre modulačných funkcií rôznych rádov uvedené za vzorcom (4) sú dôležitými informačnými vlastnosťami zvukového signálu, ktorých vplyv na hodnoty a frekvenčné umiestnenie otvára široké možnosti spracovania zvukového signálu: kompresia spektra, zmena zafarbenia. , konverzia dynamického rozsahu a redukcia šumu, transpozícia signálu atď. d.

Technické úlohy spracovania zvukových signálov ovplyvňovaním ich modulačných funkcií sú nasledovné:

● vytvoriť viacstupňový demodulátor (konvertor), keď na vstupe je privedené napätie u(t) = s(t), na výstupoch budú napätia úmerné modulačným funkciám prvého, druhého atď. objednávky;

● ovplyvňovať hodnoty a spektrá týchto napätí;

● obnoviť zvukový signál pomocou spracovaných modulačných funkcií, t.j. vykonávať amplitúdovú a frekvenčnú moduláciu kmitov generátora.

Napríklad použitie nelineárneho korekčného efektu na parametre funkcie amplitúdovej modulácie umožní kompresiu a redukciu šumu rekonštruovaného audio signálu. Ovplyvnením kanálového signálu frekvenčne modulačnou funkciou pomocou nelineárneho obvodu, ktorý má pokles koeficientu diferenciálneho prenosu so zvýšením okamžitých hodnôt výstupného napätia, je možné dosiahnuť kompresiu frekvenčného rozsahu spracovaný zvukový signál. Rozdelením frekvencie ωm(t) a odstránením vysokofrekvenčnej časti jej spektra možno výrazne stlačiť spektrum zvukového signálu pri zachovaní vysokej odolnosti voči šumu.

Vyhliadky na použitie delenia-násobenia okamžitej frekvencie signálu bez oddeľovania modulačných funkcií na účely redukcie šumu

Formulácia problému

Pri prenose audio signálov cez úzkopásmové komunikačné kanály vedie frekvenčná kompresia k výraznému obmedzeniu šírky okamžitého frekvenčného spektra. Skúmame možnosť nahradenia komponentov v spektre foném takýchto signálov, spôsobených vysokými frekvenciami frekvenčnej modulácie, inými komponentmi - umiestnenými na blízkych frekvenciách, ale spôsobených zvýšením odchýlky okamžitej frekvencie foném, keď obnovenie frekvenčne komprimovaných signálov. Takáto náhrada by mala zlepšiť kvalitu prenosu zvuku vďaka úplnejšiemu subjektívnemu vnímaniu.

Predpoklady pre takúto formuláciu problému môžu byť nasledovné:

1. Samohlásky po väčšinu ich trvania možno považovať za periodický signál. So zvyšujúcou sa frekvenčnou odchýlkou ​​sa bude zvyšovať počet harmonických základného tónu. V dôsledku toho je možné znížiť počet harmonických základných tónov pri prenose signálu a obnoviť ich počet na prijímacej strane kanála zvýšením frekvenčnej odchýlky.

2. Spektrá neznělých spoluhlások sú spojité. Spektrá ich okamžitých frekvencií sú tiež spojité, v pásme približne rovnajúcom sa polovici frekvenčného pásma spektra signálu. Preto pri zvyšovaní frekvenčnej odchýlky zostane spektrum okamžitej frekvencie spojité, ale spektrum foném sa bude rozširovať.

3. Vplyv spektrálneho zloženia komplexných signálov na vnímanie ich výšky je známy. Zvuky bohaté na vysokofrekvenčné spektrálne zložky sú vnímané ako vyššie v porovnaní so zvukmi, ktoré majú rovnakú základnú frekvenciu, ale so slabými harmonickými vysokými rádmi alebo menej.

4. Keďže k substitúcii spektrálnych zložiek dôjde pri vysokých frekvenciách, možno predpokladať, že takáto substitúcia bude uchom nepostrehnuteľná alebo takmer nepostrehnuteľná. Základom je znížená citlivosť sluchu na zmeny výšky tónu vo vysokofrekvenčnej oblasti.

Vývoj metodológie výskumu

Zníženie šumu pri sledovaní frekvencie

Možnosť využitia operácie okamžitého frekvenčného delenia za účelom redukcie šumu bude kvantitatívne opodstatnená po predbežných štúdiách prípustných limitov pre redukciu spektier modulačných funkcií audio signálov pre rôzne prenosové kanály.

Pri použití okamžitého frekvenčného delenia na účely prenosu zvukových signálov vo frekvenčne komprimovanej forme je zrejmé, že prenášaný signál je sústredený v nízkofrekvenčnej oblasti. Šírka frekvenčného pásma, ktorá je potrebná na prenos neskresleného signálu, sa navyše bude neustále meniť spolu so zmenou zvukového signálu. Jednou z hlavných úloh tohto výskumu je preto určenie možnosti vytvorenia sledovacieho dolnopriepustného filtra (LPSF), ktorého horná medzná frekvencia by sa časom menila a nadobúdala hodnoty v súlade s určitými prípustnými limitmi. na frekvenčnom pásme okamžitej frekvencie a obálky, ktoré budú známe po vykonaní predbežného výskumu. Zdá sa, že zníženie šírky pásma pre úzkopásmové signály, ktoré majú malé alebo žiadne maskovanie šumu prenosového kanála, bude veľmi významné. Preto pre takéto signály bude zisk v pomere signálu k šumu významný.

Druhou úlohou tejto štúdie by malo byť určenie riadiaceho signálu pre dolnopriepustný filter. Ako prvých kandidátov na úlohu riadiaceho signálu môžeme navrhnúť signály úmerné buď ωн(t), alebo deriváciu okamžitej frekvencie signálu podľa . Keďže redukcia šumu sa dosahuje rozlišovaním frekvenčných rozsahov signálu a šumu, takéto zníženie šumu možno nazvať redukciou frekvencie.

Pri použití obálky na redukciu prahového amplitúdového šumu alebo na dynamické filtrovanie získame kombinovaný potlačovač šumu pre frekvenčne komprimované signály.

Dynamické filtrovanie

Ako je známe, v existujúcich verziách dynamických filtrov sú všetky frekvenčný rozsah zvukové signály sú rozdelené do pásiem, v každom z nich sa redukcia hluku vykonáva pomocou prahového potlačenia hluku (zvyčajne ide o inerciálne zariadenia). Nevýhody dynamických filtrov zvyčajne zahŕňajú hardvérovú zložitosť, pretože dynamický filter je kombináciou niekoľkých potlačovačov prahového šumu (zvyčajne štyroch alebo viacerých). Okrem toho vznikajú ťažkosti pri zabezpečovaní lineárnych frekvenčných charakteristík.

Teraz je možné preskúmať možnosť dynamického filtrovania v jednom nízkofrekvenčnom pásme pri prenose frekvenčne komprimovaných signálov, ovládajúcich šírku pásma obálkového signálu. Ako je známe, keď hladina zvukového signálu klesá, najprv sa v hluku kanála na prenos zvuku utopia horné harmonické a nakoniec vibrácie základného tónu. To naznačuje, že je možné, znížením šírky pásma filtra v pomere k zníženiu obálky, poskytnúť efekt redukcie šumu bez obvyklých nevýhod dynamických filtrov.

Záver

V teórii modulácie je signál opísaný ako komplexne modulovaný (súčasne amplitúdovo a frekvenčne) proces vo forme súčinu obálky (amplitúdovo modulačná funkcia signálu) a kosínusu fázy (frekvenčne modulačná funkcia signálu). signál). Charakteristickým znakom tejto teórie je výber informačných parametrov signálu, ktorých počet sa zvyšuje po každom ďalšom stupni jeho rozkladu na modulačné funkcie (viacstupňový rozklad). Otvára sa tak možnosť ovplyvniť vybrané parametre informácií rôznych úrovní a dosiahnuť požadovaný typ spracovania signálu.

Aplikácia modulačnej teórie s implementáciou viacstupňového rozkladu umožní uskutočniť nový výskum v oblasti štúdia prirodzených modulácií zvukových signálov s cieľom zdokonaliť technické prostriedky rádiovej komunikácie, ktoré využívajú rečové signály ako hlavnú prenášanú informáciu.

Preskúmanie umožnilo vyvodiť záver o relevantnosti perspektívy použitia modulačných funkcií na spracovanie zvukových signálov. Odhalili sa perspektívy využitia operácie delenia a násobenia okamžitej frekvencie signálu bez izolačných modulačných funkcií na účely redukcie šumu. Sú dané predpoklady na jeho použitie a sú vyvinuté metódy na štúdium možnosti využitia operácie okamžitého frekvenčného delenia na redukciu šumu pri prenose frekvenčne komprimovaných signálov v dvoch verziách: redukcia šumu sledovacej frekvencie a dynamická filtrácia.

Recenzenti:

Smirnov N.V., doktor fyzikálnych a matematických vied, docent, profesor Katedry modelovania ekonomických systémov, Aplikovaná matematika riadiacich procesov, Štátna univerzita v Petrohrade, Petrohrad;

Starichenkov A.L., doktor technických vied, docent Inštitútu dopravných problémov pomenovaný po. N.S. Solomenko Ruská akadémia vied, Petrohrad.

Bibliografický odkaz

Uvarov V.K., Redko A.Yu. MODULAČNÁ ANALÝZA-SYNTÉZA ZVUKOVÝCH SIGNÁLOV A VYHĽADÁVANIE JEJ VYUŽITIA NA ÚČELY REDUKCIE HLUKU // Základný výskum. – 2015. – č.6-3. – S. 518-522;
URL: http://fundamental-research.ru/ru/article/view?id=38652 (dátum prístupu: 04/26/2019). Dávame do pozornosti časopisy vydávané vydavateľstvom „Akadémia prírodných vied“

Adaptér

Keďže linkový vstup audio adaptéra je hlavným prijímačom externého signálu pri nahrávaní, každý výrobca sa snaží na tomto vstupe poskytnúť dostatočnú kvalitu zosilnenia signálu. Citlivosť linkových vstupov väčšiny zvukových adaptérov je približne rovnaká a kvalitatívne parametre sú úmerné celkovej kvalite kariet. Úplne iná je situácia s mikrofónovými vstupmi: doska za 100 dolárov môže mať oveľa horší vstup z hľadiska citlivosti a kvality ako spotrebiteľská za 8 dolárov. Dôvodom je, že mikrofónový vstup pre zvukový adaptér je sekundárny a jeho funkčnosť je najčastejšie obmedzená na pripojenie najjednoduchšieho lacného mikrofónu na zadávanie hlasových príkazov, kde úroveň hluku a frekvenčná odozva nie sú také kritické.

Mikrofónové vstupy moderných adaptérov sú spravidla určené na pripojenie elektretových mikrofónov so vstavaným zosilňovačom prijímajúcim energiu z adaptéra. Takýto mikrofón má vysokú výstupnú impedanciu a na výstupe vyvinie až 50-100 mV, takže na zosilnenie signálu na lineárnu vstupnú úroveň (asi 500 mV) postačí jednoduchý predzosilňovač. Niektoré adaptéry podľa dokumentácie umožňujú pripojiť dynamické mikrofóny, ktoré nevyžadujú napájanie, ale takýto mikrofón vyvíja na výstupe iba 1-3 mV a vyžaduje pomerne citlivý a nízkošumový zosilňovač, čo je pri zvuku pomerne zriedkavé. karty. Preto typická doska v najlepšom prípade umožňuje z takéhoto mikrofónu dostať nedostatočne hlasný, tlmený zvuk, preplnený hlukom a rušením, a v najhoršom prípade z dynamického mikrofónu nedostanete vôbec žiadny zvuk. Uprednostňujú sa elektretové mikrofóny vzhľadom na skutočnosť, že počítač je zdrojom mnohých elektromagnetická radiácia, vytvárajúce citeľné rušenie na citlivom mikrofónnom vstupe, s ktorým je dosť ťažké sa vyrovnať. Vytvorenie nízkošumového zosilňovača by si vyžadovalo špeciálne usporiadanie dosky, starostlivé filtrovanie napájacích napätí, tienenie oblasti vstupného obvodu a ďalšie zložité a drahé triky.

Vstupný konektor mikrofónu väčšiny adaptérov je monofónny; na prenos signálu používa iba koncový kontakt (TIP) zástrčky, ktorý je v stereo konektore zodpovedný za signál ľavého kanála. Stredný kontakt (RING), ktorý je zodpovedný za pravý kanál v stereo konektore, sa v konektore mikrofónu buď nepoužíva vôbec, alebo slúži na prenos +5 V napájacieho napätia pre elektretový mikrofón. Ak nie je k dispozícii samostatný kontakt na napájanie mikrofónu, napájacie napätie sa privádza priamo na vstup signálu a zosilňovače v tomto prípade musia mať kapacitnú izoláciu vstupu a výstupu.

Mikrofón

Ako sme zistili, na priame pripojenie k adaptéru sú najvhodnejšie elektretové mikrofóny, ktoré sú väčšinou dostupné v pomerne miniatúrnych verziách: vo forme „ceruziek“ so stojanmi alebo „sponiek“ pripevnených na odev alebo na telo monitora. Sú lacné a predávajú sa v obchodoch s počítačovým príslušenstvom; Ak nepožadujete vysokú kvalitu záznamu blízku profesionálom, vystačíte si s takýmto mikrofónom. V opačnom prípade potrebujete kvalitný profesionálny mikrofón, pre ktorý si budete musieť zájsť do predajne hudobnej techniky a jeho cena bude asi rádovo vyššia.

S pripojením profesionálneho mikrofónu sa určite vyskytne množstvo problémov. Takéto mikrofóny sú najčastejšie dynamické a produkujú signál s amplitúdou niekoľkých milivoltov a mikrofónový vstup väčšiny zvukových adaptérov, ako už bolo spomenuté, nie je schopný bežne vnímať takéto slabé signály. Výstupy môžu byť dva: buď si kúpite mikrofónový predzosilňovač v rovnakom obchode s hudbou (čo sa môže ukázať ako dosť drahá hračka) a jeho výstup pripojte nie k mikrofónu, ale k riadkový vstup adaptér; alebo použite mikrofón so vstavaným predzosilňovačom a napájaním (batériou). Ak máte zručnosti v oblasti rádiového inžinierstva, môžete si sami zostaviť jednoduchý zosilňovač - možnosti obvodov sa pomerne často nachádzajú v knihách a na internete.

Navyše, profesionálne mikrofóny majú zvyčajne konektory XLR, zatiaľ čo počítačové zvukové adaptéry majú zvyčajne konektory mini-DIN, takže bude potrebný adaptér; Niekedy sa takéto adaptéry predávajú v hudobných obchodoch, ale možno ich budete musieť spájkovať sami.

A napokon, pokojne sa môže stať, že akýkoľvek profesionálny mikrofón bude z hľadiska kvalitatívnych parametrov oveľa prevyšovať váš zvukový adaptér a zvuk, ktorý s takýmto mikrofónom získate, nebude v konečnom dôsledku o nič lepší, než aký dokáže poskytnúť obyčajný elektret. Preto, ak máte pochybnosti o vysokej kvalite vášho adaptéra (a jednoduché adaptéry v cene okolo 10 dolárov, najmä tie vstavané, majú veľmi priemerné parametre), má zmysel rokovať s obchodom o možnom vrátení zakúpený mikrofón, ak ho nemôžete získať pomocou pomerne kvalitného zvuku.

Technológia nahrávania

Na rozdiel od pevných zdrojov signálu má mikrofón množstvo funkcií, ktoré treba pri práci s ním brať do úvahy. V prvom rade rád „fonónuje“: ak do reproduktorov príde zosilnený signál z mikrofónu, mikrofón ho zaznamená, signál sa opäť zosilní atď., To znamená, že sa vytvorí takzvaná pozitívna spätná väzba, ktorý „hojdá“ zvukovú dráhu, uvádza ju do režimu samobudenia, čo sa prejavuje hlasným pískaním, zvonením alebo dunením. Aj keď dráha neprejde do režimu samobudenia, kladné spojenie môže produkovať zvonivý alebo pískavý zvuk, ktorý výrazne kazí signál. Citlivý mikrofón zároveň dokáže úspešne zachytiť signál aj zo slúchadiel, ak je zvuk v nich dostatočne hlasný a vonkajšia zvuková izolácia slabá. Preto je potrebné experimentálne určiť polohu/smer mikrofónu a hlasitosť zosilneného zvuku, pri ktorej je pozitívny vzťah najmenej viditeľný. Finálny záznam sa odporúča robiť s vypnutými reproduktormi alebo aspoň pokiaľ možno stlmenými.

Citlivé mikrofóny, najmä tie jednoduché a lacné, dokonale vnímajú cudzie zvuky, ako je šušťanie prstov na tele mikrofónu alebo jemné vŕzganie samotného tela, a to aj z mierneho stlačenia (podobné zvuky ste už určite počuli pri telefonických rozhovoroch). Aby ste predišli takémuto rušeniu, je lepšie nainštalovať mikrofón na pohodlný stojan alebo ho voľne držať bez toho, aby ste ho stlačili prstami.

Ďalším nepríjemným momentom pri používaní mikrofónu je takzvané pľuvanie vzduchu, ktoré sa prejavuje najmä pri plosívnych spoluhláskach ako „p“, „b“, „t“ a podobne. V dôsledku nárazu intenzívneho zvukového impulzu na membránu sa vytvorí prudký nárast amplitúdy signálu, ktorý preťaží zosilňovač a/alebo ADC. Profesionálne mikrofóny proti tomu majú ochranu proti vetru - sieťovinu alebo mäkkú podložku umiestnenú v určitej vzdialenosti od kapsuly, no ani to nie vždy zachráni, takže si na každý mikrofón treba zvyknúť, zvyknúť si ho držať buď v správnom uhle, takže že prechádzajú priame prúdy vzduchu, alebo dostatočná vzdialenosť, aby sa k mikrofónu dostali v už oslabenom stave.

Keď budete experimentovať s mikrofónom, zistíte, že zafarbenie nahraného hlasu dosť závisí od vzdialenosti od úst k mikrofónu a od uhla mikrofónu vzhľadom k tvári. Je to spôsobené tým, že nízkofrekvenčné zložky hlasu sú najviac rozptýlené a utlmené so vzdialenosťou, kým vysokofrekvenčné zložky sú utlmené menej, ale majú výraznejšiu smerovosť. Najšťavnatejšie a najzamatovejšie zafarbenie hlasu môžete získať umiestnením mikrofónu priamo k ústam, ale potom budete musieť veľa pohrávať s uhlom sklonu a veľa cvičiť, aby ste sa vyhli „pľuvaniu“.

Nahrávanie cez externé zariadenia

V poslednej dobe sa objavujú veľmi exotické spôsoby nahrávania zvuku z mikrofónu a jeho prenosu do počítača. Spoločnosť Creative tak uvádza na trh digitálny prehrávač Jukebox, ktorý obsahuje miniatúrny pevný disk, samostatný ovládač A USB rozhranie. Hlavnou funkciou prehrávača je prehrávanie zvukových súborov, ktoré sú doň prenesené z počítača, ale vstavaný mikrofón vám umožňuje používať ho aj ako samostatný diktafón: zvuk sa nahráva na pevný disk, čo zaisťuje nepretržité nahrávanie niekoľko hodín a následne je možné preniesť zvukovú stopu do počítača. Ďalší produkt spoločnosti Creative, PC Cam, je hybridom digitálneho fotoaparátu, videokamery a hlasového záznamníka a umožňuje nahrávať zvuk do vstavanej pamäte Flash, odkiaľ sa získava pomocou rovnakého rozhrania USB.

Odstránenie šumu a rušenia

Keďže hlasový signál má dosť úzke spektrum (stovky hertzov - niekoľko kilohertzov), možno naň operáciu odstraňovania šumu aplikovať s väčšou hĺbkou ako v prípade ľubovoľného hudobného signálu. Pri nahrávaní sa môže tiež ukázať, že v najúspešnejšom zaznamenanom fragmente (z umeleckého hľadiska) sa mikrofón stále „napľul“ na jednom alebo viacerých miestach a pokúša sa zopakovať frázu alebo verš pieseň s rovnako úspešným umiestnením akcentov nedávajú požadovaný výsledok. V takýchto prípadoch sa môžete pokúsiť zaokrúhliť impulzy preťaženia a zachovať alebo znížiť ich amplitúdu. Pri malom počte impulzov je vhodné to urobiť ručne a zväčšiť obrázok, kým sa neobjavia uzlové body, na ktoré sa dá kliknúť myšou.

Metódy spracovania hlasu

Ako sme už povedali, komplexný hudobný signál obsahuje veľa heterogénnych komponentov, na ktoré má vplyv väčšina metód spracovania zvuku s rôznymi efektmi, takže rozsah univerzálnych metód spracovania signálu je veľmi úzky. Najpopulárnejšia metóda dozvuku imituje viacnásobné odrazy zvukových vĺn a vytvára efekt priestoru - miestnosti, haly, štadióna, horského kaňonu atď.; Dozvuk vám umožňuje dodať „suchému“ zvuku bohatosť a hlasitosť. Ďalšie univerzálne metódy spracovania sa týkajú manipulácie s frekvenčnou odozvou (ekvalizér), čistenia zvukového záznamu od šumu a rušenia.

Vo vzťahu k primárnemu, jednoduchému zvukovému signálu sa dá celkom úspešne uplatniť celá škála existujúcich metód spracovania - amplitúda, frekvencia, fáza, čas, formant atď. Tieto metódy, ktoré vedú ku kakofónii na komplexnom signále, môžu často viesť k vytvoreniu veľmi zaujímavých a nápadných efektov na jednoduchých signáloch, ktoré sa široko používajú v audio priemysle.

Inštalácia

Počítačová úprava zvukových záznamov reči – typická novinárska činnosť po nahratí rozhovoru – je jednoduchá aj zložitá. Spočiatku sa to zdá jednoduché vďaka štruktúre reči, ktorá je vhodná na vizuálnu analýzu, prítomnosti viditeľných prestávok medzi slovami, výbuchov amplitúdy v miestach dôrazu atď. Keď sa však pokúsite napríklad preusporiadať dve frázy oddelené doslova sekundami, ukáže sa, že sa nechcú spojiť – zmenila sa intonácia, fáza dýchania, hluk v pozadí a zreteľne je počuť výplň. križovatka. Takéto prerušenia sú ľahko rozpoznateľné takmer v každom rozhlasovom rozhovore, keď je zaznamenaný prejav človeka, ktorý nie je profesionálnym rozhlasovým novinárom, a teda nevie povedať len to, čo by sa malo vysielať. Nepotrebné je z reči vystrihnuté, niektoré fragmenty sú preskupené tak, aby lepšie vyhovovali významu, v dôsledku čoho je ucho neustále „prekvapené“, pretože v toku prirodzenej ľudskej reči sa takéto intonačné a dynamické prechody nevyskytujú.

Na vyhladenie prechodových efektov môžete použiť metódu prelínania, ktorá vám však umožní porovnať fragmenty reči iba podľa amplitúdy, ale nie podľa intonácie a hluku v pozadí. Preto považujeme za potrebné upozorniť tých, ktorí považujú počítačové úpravy za pohodlný spôsob falšovania záznamov, napríklad vyjednávanie: vyšetrením sa dajú ľahko identifikovať aj pre ucho nerozoznateľné body lepenia, ako je to v prípade falšovania dokumentov pomocou skenera a tlačiareň.

Spracovanie amplitúdy

Najjednoduchším typom dynamického amplitúdového spracovania hlasu je jeho modulácia periodickým signálom, kedy sa amplitúdy signálov znásobujú a hlas nadobúda amplitúdovú charakteristiku modulačného signálu. Moduláciou nízkofrekvenčným (jednotky hertzov) sínusovým signálom získame „bublavý“ hlas, zvyšujúci frekvenciu signálu – vibrovanie. Použitím pravouhlého, trojuholníkového alebo pílovitého tvaru namiesto sínusovej vlny môžete svojmu hlasu dodať kovovú, skreslenú, „robotickú“ intonáciu.

Amplitúdová modulácia vybraného fragmentu fonogramu sa vykonáva ako súčasť operácie Generate g Tones na generovanie periodických signálov. V poli Base Frequency sa nastavuje hlavná frekvencia signálu v hertzoch, v poli Flavour - typ impulzu, v poli Duration - trvanie v sekundách. Ovládače hlasitosti nastavujú úroveň signálu.

Skupina posuvníkov Frequency Components určuje harmonické úrovne hlavného signálu s číslami uvedenými v posuvných lištách. Frekvenčnú moduláciu signálu je možné získať pomocou polí Modulate By - posun od základnej frekvencie v hertzoch - a Modulation Frequency - frekvencia modulácie. Keď je zaškrtnuté pole Lock..., všetky tieto parametre, vrátane základnej frekvencie, sú nehybné; Keď nie je začiarknuté, môžete nastaviť ich počiatočné/konečné hodnoty na záložkách Počiatočné/Konečné nastavenia – budú sa meniť lineárne počas generovaného segmentu.

Skupina polí Zdrojová modulácia určuje, ako sa bude generovaný signál používať. Štandardne, keď nie je začiarknuté žiadne z týchto polí, signál sa vloží do zvukovej stopy alebo nahradí vybraný fragment; inak slúži na vykonanie danej operácie s vybraným fragmentom: Modulate - normálna modulácia (násobenie), Demodulate - demodulácia (delenie), Overlap (mix) - jednoduché zmiešanie signálov. Postupná modulácia a demodulácia toho istého signálu obnoví pôvodný signál (prípadne s upravenou celkovou úrovňou). Experimentovanie s rôznymi kombináciami parametrov dáva niekedy veľmi vtipné a neočakávané výsledky.

Dočasné spracovanie

Tento typ spracovania je založený na posune pôvodného signálu v čase a zmiešaní výsledku s pôvodným signálom, po ktorom je možné posun a miešanie opäť aplikovať. Keď sa posuny vyskytnú počas krátkych časových úsekov, porovnateľných s trvaním periódy pôvodného signálu, dochádza k fázovým efektom, ako je rušenie, čo spôsobí, že zvuk získa špecifickú farbu; Tento efekt sa nazýva flanger a používa sa ako s pevnou hodnotou posunu, tak aj s periodicky sa meniacou alebo dokonca úplne náhodnou hodnotou. Pri posunoch v intervaloch presahujúcich trvanie periódy, ale nie viac ako 20 ms, nastáva zborový efekt (refrén). Vzhľadom na zhodnosť technológie sú tieto dva efekty často implementované jedným softvérovým blokom s rôznymi parametrami.

Pri viacnásobnom posune v intervaloch 20...50 ms nastáva efekt dozvuku - dunenie, hlasitosť, pretože načúvací prístroj interpretuje oneskorené kópie signálu ako odrazy od okolitých predmetov. V intervaloch väčších ako 50 ms už ucho navzájom jasne nespája jednotlivé kópie, čo má za následok ozvenový efekt.

V Cool Edit 2000 sú efekty založené na časových oneskoreniach zoskupené v skupine Transform g Delay Effects. Efekty flanger a chorus sú vytvorené operáciou flanger:

Pôvodný/oneskorený engine riadi pomer pôvodných a oneskorených signálov (intenzitu alebo hĺbku efektu). Initial/Final Mix Delay – počiatočné a konečné oneskorenie kópie – sa v rámci týchto limitov cyklicky mení. Stereo Phasing - uhol fázového posunu medzi kanálmi - vám umožňuje vytvoriť zvláštny efekt „skrúcania“ zvuku, najmä v slúchadlách. Spätná väzba – hĺbka spätnej väzby (množstvo výsledného signálu primiešaného do pôvodného pred aplikáciou operácie) – umožňuje kontrolovať závažnosť a ostrosť efektu.

Skupina Rate špecifikuje cyklické parametre efektu. Obdobie - časový interval, počas ktorého flanger prechádza od počiatočného oneskorenia po konečné oneskorenie a späť; Frekvencia - recipročná hodnota, frekvencia spiatočných jázd; Total Cycles - počet úplných prechodov cez vybraný fragment. Nastavenie ľubovoľného parametra spôsobí automatické prepočítanie zvyšku.

Skupina Mode ovláda vlastnosti efektu: Inverted - inverzia oneskoreného signálu, Special EFX - dodatočná inverzia pôvodných a oneskorených signálov, Sinusoidal - sínusový zákon oneskorenia zmeny z počiatočného na konečný (ak je vypnutý, oneskorenie sa zmení lineárne).

Sada predvolieb vám umožňuje vizuálne študovať vlastnosti operácie. Skúste vybrať niekoľko predvolieb, zmeniť parametre predvolieb v každej z nich a nezabudnite zakaždým vrátiť späť, aby ste porovnali vplyv rôznych kombinácií parametrov na zvuk.

Efekt reverb v Cool Edit 2000 možno implementovať dvoma spôsobmi: pomocou Echo Chamber, simulátora miestnosti s dané rozmery a akustické vlastnosti a Reverb - generátor efektov hlasitosti založený na algoritme zabudovanom v editore na simuláciu viacerých odrazov v priestore. Pretože tento typ spracovanie je univerzálne a vzťahuje sa na akýkoľvek zvukový materiál, druhý spôsob stručne popíšeme ako najobľúbenejší.

Pole/posuvník Total Reverb Length určuje dobu dozvuku, počas ktorej sú odrazené signály úplne zoslabené; nepriamo súvisí s objemom priestoru, v ktorom sa zvuk šíri. Attack Time - čas, kedy hĺbka dozvuku stúpne na nominálnu úroveň; slúži na plynulý prejav účinku v celom spracovávanom fragmente. High Frequency Absorption Time - čas absorpcie vysokofrekvenčných zložiek objemom, úmerný „mäkkosti“ a „tlmeniu“ objemu. Vnímanie - stupeň zrozumiteľnosti: nižšie hodnoty (hladké) - slabé a jemné odrazy, ktoré nerušia hlavný signál, väčšie hodnoty (echoey) - jasné a silné, zreteľne počuteľné odrazy, ktoré môžu zhoršiť zrozumiteľnosť reči.

Miešacie posuvníky/polia určujú pomer pôvodného (suchého) a spracovaného (mokrého) signálu vo výsledku.

Efekt ozveny je implementovaný operáciou Echo a pridáva k signálu postupne miznúce kópie posúvané o rovnaké časové úseky. Regulátor Decay nastavuje mieru útlmu - úroveň každej nasledujúcej kópie ako percento úrovne predchádzajúcej. Počiatočná hlasitosť ozveny - úroveň prvej kópie ako percento úrovne pôvodného signálu. Oneskorenie – oneskorenie medzi kópiami v milisekundách. Skupina ovládacích prvkov Sequence Echo Equalization ovláda ekvalizér, cez ktorý prechádza každá nasledujúca kópia, čo umožňuje nastaviť rôzne akustické charakteristiky simulovaného priestoru.

Keďže efekt „prebieha“ v čase, môže vytvoriť zvukový fragment, ktorý je dlhší ako pôvodný. Na tento účel je k dispozícii položka Pokračovať v ozvene za hranicou výberu - povolenie primiešať signál ozveny do časti zvukového záznamu, ktorá pokračuje za hranicou vybraného fragmentu. V tomto prípade sa ako zdrojový signál použije iba vybraný fragment a zvyšná časť zvukového záznamu sa použije výlučne na umiestnenie „chvosta“. Ak na zvukovom zázname nie je dostatok miesta pre „chvost“, zobrazí sa chybové hlásenie a na koniec zvukového záznamu budete musieť pridať časť ticha pomocou operácie Generate g Silence.

Efekt je najlepšie vnímať na relatívne krátkych zvukoch. Pri dlhých slovách alebo frázach, aby sa vylúčil výskyt „blbnutia“ - viacnásobného opakovania rôznych slabík alebo slov, ktoré sa navzájom prerušujú, je lepšie urobiť efekt „koniec“ a zvoliť na opakovanie iba krátky posledný fragment frázy. alebo aj posledná prízvučná slabika slova. Skúste experimentovať s rôznymi slovami a frázami, aby ste získali pocit, ktorú záverečnú časť je najlepšie použiť na „rozmnožovanie“ v každom konkrétnom prípade.

Spektrálne spracovanie

Najvýraznejším a najzaujímavejším efektom z tejto triedy, implementovaným v Cool Edit 2000, je zmena výšky a rýchlosti. Každý pozná efekt zvyšovania alebo znižovania výšky signálu pri zmene rýchlosti pásky v magnetofore alebo rotácii platne. S rozvojom metód digitálneho spracovania signálu sa stalo možné hodnoverne implementovať každý z týchto efektov oddelene - meniť výšku tónu pri zachovaní časovacích charakteristík alebo naopak.

Tento typ spracovania v Cool Edit 2000 sa vykonáva pomocou operácie Transform g Time/Pitch g Stretch. Existujú dve možnosti - s konštantným alebo s kĺzavým koeficientom. Koeficienty sa nastavujú v poliach Počiatočný/Konečný pomer, ktoré sú tiež spojené s motormi kvôli jednoduchšej zmene. Koeficient môže byť navyše nepriamo nastavený poľom Transpose vo forme počtu hudobných chromatických poltónov nahor (ostrý) alebo nadol (plochý). V režime zmeny dĺžky trvania je dostupné aj pole Dĺžka, v ktorom si nastavíte požadovanú dĺžku výsledného fragmentu.

Prepínač Precision nastavuje presnosť spracovania: nízka (nízka), stredná (stredná) a vysoká (vysoká) - je to potrebné, pretože operácia spektrálneho spracovania vyžaduje veľa výpočtov a zníženie presnosti umožňuje rýchlejšie spracovanie - aspoň pri experimente etapa. Prepínač Stretching Mode nastavuje typ spracovania: Time Stretch – zrýchlenie/spomalenie v čase, Pitch Shift – posun výšky tónu, Resample – jednoduché prevzorkovanie, podobne ako pri zmene rýchlosti pásky/nahrávky.

Skupina parametrov Pitch and Time Settings riadi špecifiká operácie. Spracovanie sa vykonáva rozbitím fragmentu na malé zvukové bloky; Parameter Splicing Frequency určuje počet takýchto blokov za jednu sekundu fragmentu. Zvýšením tejto „frekvencie vzorkovania“ sa bloky zmenšia, čím sa zvýši prirodzenosť spracovania, ale zároveň sa zvýši drviaci efekt, čo vedie k nepríjemným podtónom. Parameter Overlapping nastavuje mieru prekrytia susedných blokov pri zostavovaní výsledného signálu - malé vzájomné prekrytie umožňuje vyhladiť prekrývajúce sa zvuky z ich spájania. Používa sa položka Vybrať vhodné predvolené nastavenia automatická inštalácia tieto parametre na najvhodnejšie, z pohľadu redaktora, hodnoty.

Tento článok dopĺňa krátku sériu o nahrávaní a spracovaní zvuku na domácom počítači.

ComputerPress 12"2002

Prevodníky dynamického rozsahu audio signálov založené na O v module A funkcie

Kharitonov Vladimir Borisovič,

kandidát technických vied, profesor

Žirova Julia Konstantinovna,

absolventka katedry h audiotechnikov

Petrohradská štátna univerzita Univerzita filmu a televízie.

Konverzia dynamického rozsahu audio signálov založená na modulačných funkciách v teórii modulačnej analýzy-syntézy je bez zotrvačnosti. Navyše tu nehovoríme o nelineárnom spracovaní okamžitých hodnôt signálu, ktoré je bez zotrvačnosti, ale vnáša do spracovávaného signálu nelineárne skreslenia. Spracovanie signálov podľa ich modulačných funkcií teoreticky v mnohých prípadoch rieši problém konverzie dynamického rozsahu signálov bez toho, aby do nich vnieslo skreslenie. V praxi, ako uviedli autori, ktorí vykonali analógovú implementáciu zariadení na spracovanie modulačných funkcií, nie je možné dosiahnuť teoretické výsledky z dôvodu obmedzenej presnosti a nestability parametrov analógových zariadení na izoláciu a spracovanie modulačných funkcií. Tento článok prezentuje výsledky štúdie digitálnej implementácie zariadenia na konverziu dynamického rozsahu na teoretických základoch modulačnej analýzy-syntézy, ktoré umožnili objasniť potenciál metódy pomocou presného digitálneho spracovania signálu.

Spočiatku sa v rozhlasovom vysielaní používali konvertory dynamického rozsahu (DRC) zvukových signálov na ochranu zvukových ciest pred preťažením, prispôsobenie rozsahu úrovní signálov dynamickému rozsahu kanálov, cez ktoré sa prenášajú, a zníženie vplyvu šumu z nahrávania. médiá. Z podobných dôvodov bol komprimovaný aj zvuk pre prenosový kanál kinematografie, keďže dynamický rozsah analógových fotofonogramov je zvyčajne 35–45 dB a rozsah úrovní zvukového programu (vnímaného sluchom) môže dosiahnuť takmer 110 dB. Často sa uchyľujú ku kompresii reči aj hudby, aby vyhladili dynamiku zvuku a zvýšili zrozumiteľnosť reči pri živých vystúpeniach, keď sa napríklad rečník z nejakého dôvodu výrazne vzdiali od mikrofónu alebo sa k nemu priblíži. Existuje mnoho ďalších príkladov použitia iba amplitúdových kompresorov. Konverzia dynamického rozsahu sa však neobmedzuje len na jeho kompresiu, ale zahŕňa aj obmedzenie, redukciu šumu a rozšírenie audio signálov. Všetky tieto typy spracovania zvuku sú teraz široko používané a pravdepodobne pomôžu zvukovým inžinierom realizovať ich kreatívne nápady a riešiť technické problémy na dlhú dobu.

Niektoré dôvody na zahrnutie pravidiel cestnej premávky do zvukových ciest s prechodom na metódy digitálneho záznamu stratili svoj význam: dynamický rozsah digitálnych záznamových médií a zvukových ciest je porovnateľný s dynamickým rozsahom ľudského sluchu. Ale ak v kine pri počúvaní filmu nekomprimujete dynamický rozsah zvukovej stopy, tak sa tiché fragmenty jednoducho utopia v hluku hľadiska. Ponechanie hornej hranice úrovne signálu môže tiež ohlušiť publikum alebo preťažiť výkonové zosilňovače a reproduktory kina. Transformácia dynamického rozsahu kinematografického zvuku je teda nevyhnutná na zabezpečenie pohodlného počúvania v kinosále. V digitálnom audio formáte Dolby Digital , ktorý sa používa na nahrávanie zvukových stôp väčšiny moderných filmov, zabezpečuje vytvorenie špeciálneho riadiaceho signálu dynamického rozsahu. Prehrávacie zariadenie umožňuje použitie tohto signálu na reguláciu dynamického rozsahu a je možné meniť stupeň kompresie v závislosti od podmienok konkrétnej posluchárne. V tomto ohľade zostáva relevantné vyvinúť prevodníky dynamického rozsahu, ktoré poskytujú vysoko kvalitné spracovanie zvukového signálu s minimálnym zásahom zvukára.

Podľa výkonnostného kritéria sú dopravné pravidlá rozdelené do dvoch skupín: zotrvačné (s dynamicky sa meniacim koeficientom prenosu) a bezzotrvačné (okamžité pôsobenie).

Inerciálne meniče sa v audiotechnike používajú už mnoho desaťročí, princíp ich činnosti, výhody a nevýhody sú dostatočne podrobne popísané v literatúre. Ich práca je založená na izolácii obálky od signálu, vygenerovaní riadiaceho signálu na základe obálky a následnom vynásobení týchto dvoch signálov: vstupného zvukového signálu a riadiaceho signálu:

kde je vstupný signál, je riadiaci signál, je výstupný signál.

Násobenie v časovej oblasti zodpovedá konvolúcii spektier menovaných signálov vo frekvenčnej oblasti.

kde je frekvenčné spektrum vstupného signálu, je frekvenčné spektrum riadiaceho signálu, je frekvenčné spektrum výstupného signálu.

Na generovanie riadiaceho signálu sa používa nízkofrekvenčné filtrovanie maximálnych alebo stredných hodnôt vstupného signálu. Výsledkom takéhoto filtrovania je, že riadiaci signál mení zotrvačnosť vzhľadom na zmeny amplitúdy alebo efektívnej hodnoty signálu. V dôsledku protichodných požiadaviek na filtrovanie funkcie koeficientu prenosu vznikajú nevýhody inerciálnych meničov:

· Hladký nárast riadiaceho signálu vedie k skokom vo výstupnom signáli, keď sa vstupný signál prudko zvyšuje. Tieto emisie môžu presahovať lineárnu časť prenosových charakteristík zvukovej cesty. V tomto prípade sa objavia nelineárne skreslenia;

· prudký nárast riadiaceho signálu vylúči emisie, ale zároveň riadiaci signál nadobudne strmú hranu - tým sa obohatí jeho spektrum, čo znamená, že po konvolúcii spektier vstupného signálu a riadiaceho signálu sa spektrum výstupného signálu sa výrazne obohatí. To spôsobí výskyt počuteľných účinkov dopravných pravidiel;

· pomalý proces obnovy prenosového koeficientu s prudkým poklesom signálu vedie k objaveniu sa efektu „hluku dýchacej pauzy“. Tento efekt je vyjadrený počuteľne viditeľným znížením hlasitosti tichého fragmentu signálu s postupným následným zvyšovaním;

· prudké obnovenie koeficientu prenosu spôsobí výskyt vlnenia v riadiacom signáli pri spracovaní zvukového signálu s intenzívnymi nízkofrekvenčnými zložkami. Tieto pulzácie spôsobujú amplitúdovú moduláciu spracovávaného signálu a vedú k vzniku nelineárnych skreslení.

Aby uvedené skreslenia neboli pre ucho viditeľné, je potrebné zvoliť optimálne parametre filtra pre určitý typ zvukového materiálu: reč alebo hudbu.

Sú známe obmedzovače úrovne signálu bez zotrvačnosti, v ktorých sú obmedzené hodnoty okamžitého signálu, ktoré presahujú určitú špecifikovanú prahovú hodnotu signálu. V tomto prípade sa mení tvar signálu a objavujú sa veľké nelineárne skreslenia, takže takéto zariadenia sa prakticky nepoužívajú. Používajú sa najmä ako prostriedok ochrany pred preťažením prenosovej cesty signálu.

Konverzia dynamického rozsahu audio signálov bez zotrvačnosti založená na modulačných funkciách v teórii modulačnej analýzy-syntézy je zbavená uvedených nevýhod inerciálnych zariadení a vyššie uvedených obmedzovačov úrovne signálu bez zotrvačnosti. V teórii modulačnej analýzy-syntézy sú všetky transformácie, vrátane transformácie dynamického rozsahu, založené na izolácii od signálu a následnom spracovaní modulačných funkcií: amplitúdy a/alebo frekvencie. Okrem transformácie dynamického rozsahu signálu je na základe modulačných transformácií možné vykonávať: bez zotrvačnosti riadenie zafarbenia zvukových signálov, kompresiu frekvenčného rozsahu zvukových signálov na základe výberu a nelineárneho spracovania ich signálu. okamžitá frekvencia a iné typy transformácií.

Analógový spin-off kompresor založený na modulačných funkciách sa ukázal byť pomerne náročný na implementáciu. Výsledky jeho práce, prezentované v, ukazujú, že všetky nevýhody inerciálnych kompresorov v v tomto prípade chýbajú. Ale kvôli obmedzenej presnosti a nestabilite parametrov analógových zariadení na izoláciu a spracovanie modulačných funkcií nie sú výsledky ani zďaleka teoreticky možné. Vzhľadom na zložitosť analógovej implementácie je samozrejme veľmi zaujímavé vytvorenie digitálneho systému riadenia dopravy bez zotrvačnosti založeného na modulačných funkciách. Po prvé, zlepší sa kvalita spracovania zvuku pomocou algoritmov konverzie dynamického rozsahu, ktoré sú neprístupné alebo ťažko implementovateľné s požadovanou presnosťou v analógovej forme. Po druhé, kvôli širokému použitiu digitálnymi spôsobmi Pre záznam, spracovanie a prehrávanie zvuku je najprirodzenejšie vykonávať konverziu dynamického rozsahu aj v digitálnej forme. Presná digitálna implementácia PDD založená na modulačnej analýze-syntéze umožní plne objasniť potenciálne možnosti metódy, ktorá bola doteraz brzdená zásadne neodstrániteľnými chybami v analógovej implementácii.

Pred prezentáciou výsledkov činnosti digitálneho kompresora bez zotrvačnosti má zmysel podrobnejšie zvážiť modulačné funkcie a základy prevodu modulačného signálu.

Podľa teórie modulačnej analýzy-syntézy môže byť ľubovoľný signál reprezentovaný ako výsledok kombinovanej aplikácie amplitúdovej a frekvenčnej modulácie:

,

ak úspešne vyberiete dvojicu modulačných funkcií - amplitúdová modulačná funkcia a - frekvenčná modulačná funkcia. Teoreticky je dokázané, že pre jednoznačný výber tejto dvojice funkcií je potrebné doplniť pôvodný signál o referenčný signál pomocou Hilbertovej transformácie. Koncept modulačných funkcií signálu zaviedol už v roku 1945 D. Gabor.

Obálka (funkcia modulácie amplitúdy) dvojice signálov konjugovaných podľa Hilberta sa nazýva nezáporná funkcia času

.(1)

Okamžitá frekvencia (funkcia modulácie frekvencie) páru signálov je deriváciou aktuálnej fázy:

Koncepcie zavedené D. Gaborom našli široké uplatnenie pri popise transformácií úzkopásmových signálov.

Yu M. Ishutkin navrhol zovšeobecniť definície modulačných funkcií, ktoré zaviedol D. Gabor, bez obmedzenia šírky frekvenčného spektra signálov.

Myšlienka spracovania zvukového signálu ovplyvňovaním jeho modulačných funkcií, ktorú navrhol Yu. M. Ishutkin, je:

1. Na základe známeho skutočného signálu použite Hilbertovu transformáciu na vytvorenie komplexného signálu

,

Kde – Hilbertovo mapovanie signálu.

2. Pre tento pár signálov vypočítajte modulačné funkcie: amplitúdovú modulačnú funkciu a frekvenčnú modulačnú funkciu signálu.

3. Prevod modulačných funkcií na účely spracovania pomocou lineárnych a nelineárnych obvodov.

4. Pomocou upravených modulačných funkcií syntetizujte nový zvukový signál.

Kombinácia prvých dvoch operácií, v dôsledku ktorej sa modulačné funkcie signálu stanú známymi, sa nazýva modulačná analýza. Posledná operácia sa nazýva modulačná syntéza. Štruktúra kanála úplnej modulačnej analýzy a syntézy je znázornená na obr.

.

Na vybudovanie digitálneho systému je potrebné vykonať požadované transformácie digitálnej reprezentácie zvukového signálu. Digitálny systém riadenia dopravy bez zotrvačnosti možno vybudovať pomocou schémy priameho riadenia. S prihliadnutím na vzorkovanie analógových signálov je jeho bloková schéma znázornená na obr.


Obr.2. Štrukturálna schéma digitálny kompresor bez zotrvačnosti s priamou reguláciou.

Pôvodný signál je reprezentovaný ako

,

kde je diskrétna okamžitá amplitúdová modulačná funkcia a je diskrétna okamžitá fáza signálu. Obálkový demodulátor vykonáva Hilbertovu transformáciu a vypočítava funkciu amplitúdovej modulácie. Frekvenčné spektrum pôvodného signálu sa v súlade s vlastnosťou spektra produktu obrazov bude rovnať

,(2)

kde je frekvenčné spektrum amplitúdovej modulačnej funkcie, je symbolom priamej Fourierovej transformácie, jej implementácia v tomto výraze tvorí frekvenčné spektrum kosínusu okamžitej fázy signálu ako druhého konvolučného operandu a je frekvenčné spektrum signálu.

V dôsledku nelineárnej transformácie okamžitej amplitúdovej modulačnej funkcie, vykonanej v exponenciačnom bloku, získame novú diskrétnu amplitúdovú modulačnú funkciu , Kde - nejaká nelineárna funkcia, v tomto prípade výkonová funkcia, realizujúca amplitúdovú charakteristiku dopravného prúdu požadovaného typu. Nová funkcia amplitúdovej modulácie bude zodpovedať novému frekvenčnému spektru. Frekvenčné spektrum signálu syntetizovaného pomocou modifikovanej funkcie amplitúdovej modulácie bude mať tvar

Zavedenie oneskorovacej linky je nevyhnutné na synchronizáciu zdrojového signálu s obálkovým signálom, ktorého výpočet je nevyhnutne sprevádzaný časovým oneskorením.

Pridanie konštantného signálu k novej obálke je nevyhnutné, aby konverzia začala s hodnotou obálky väčšou ako je prahová úroveň špecifikovaná konštantným členom.

Pre špeciálny prípad implementácie amplitúdovej charakteristiky kompresora s kompresiou dynamického rozsahu na polovicu možno signál na výstupe SPD bez zotrvačnosti reprezentovať nasledujúcim vzťahom:

.

Väčšinu požadovaných matematických operácií vykonáva digitálny systém s vysokou presnosťou. Azda najkomplexnejším prvkom digitálneho PDA je širokopásmový digitálny Hilbertov prevodník (DHC), ktorý je súčasťou jednotky demodulácie obálky. Od toho do značnej miery závisí kvalita pravidiel cestnej premávky. Na dosiahnutie vysokej kvality prevodu musí CPG v širokom frekvenčnom pásme, od 32 Hz do 16000 kHz, poskytovať frekvenčne nezávislý fázový posun signálu s chybou rádovo . Veľkosť fázovej chyby sa volí tak, že pulzácie okamžitej amplitúdy tónového signálu, ktoré z nej vyplývajú, nie sú sluchom postrehnuteľné. Pri takejto chybe fázy ich úroveň nepresiahne -80 dB. Implementácia takéhoto prevodníka je popísaná v [ 10 ].

Počítačový model digitálneho kompresora bez zotrvačnosti založený na modulačných funkciách, zostavený podľa schémy na obr. 2, pri testovaní jeho výkonu na testovacích jednotónových signáloch priniesol pozitívne výsledky, čím preukázal správnosť nájdených algoritmických riešení, ako aj úspešné riešenie problémov, ktoré nevyhnutne vznikajú pri prechode z analógovej reprezentácie signálov na digitálnu. Funkcia amplitúdovej modulácie pôvodného jednotónového signálu je konštantnou funkciou času. V dôsledku nelineárnej transformácie funkcie amplitúdovej modulácie sa získa nová funkcia časovej amplitúdovej modulácie, ale v prípade jednotónového signálu pôjde opäť o konštantnú funkciu času. Spektrum pôvodnej amplitúdovej modulačnej funkcie a nelineárne transformovaného pre jednotónový signál pozostáva z jednej harmonickej na frekvencii signálu. Výsledok konvolúcie jednotónového signálu syntetizovaného pomocou modifikovanej funkcie amplitúdovej modulácie bude určite tvarovo podobný pôvodnému signálu.

Testovanie činnosti motorčeka riadenia dopravy bez zotrvačnosti na skutočnom zvukovom signáli prinieslo neočakávané výsledky, konkrétne niekedy veľmi zlú kvalitu zvuku, ktorý prešiel nelineárnym spracovaním. Na nájdenie príčiny, ktorá spôsobuje počuteľne viditeľné artefakty pri počúvaní spracovaného komplexného zvukového signálu, bola vykonaná analýza tvarov modulačných funkcií (porovnanie hodnôt na výstupe digitálneho modelu s vypočítanými hodnotami). ako porovnanie tvarov ich frekvenčných spektier. Ako testovací signál pre takýto test bol vybraný signál pozostávajúci z dvoch harmonických zložiek s frekvenciami Hz a Hz:

kde je vzorkovacia frekvencia signálu rovná 44 100 Hz.

Nižšie je vypočítaný časový diagram testovacieho signálu a jeho frekvenčné spektrum (obr. 3a), ako aj časové diagramy a frekvenčné spektrá jeho amplitúdovej modulačnej funkcie (obr. 3b) a fázového kosínusu (obr. 3c). Spektrá amplitúdovej modulačnej funkcie a fázového kosínusu pozostávajú z mnohých zložiek, ale v dôsledku konvolúcie takýchto spektier zostanú iba dve zložky.

Obr.3. Časové funkcie (vpravo) a frekvenčné spektrá (vľavo): a) úderový signál s frekvenciami 1000 a 1500 Hz; b) funkcia amplitúdovej modulácie signálu úderu; c) kosínus fázy úderového signálu.

Analytický výraz pre funkciu modulácie časovej amplitúdy má tvar:


Na výpočet jeho spektra je vhodné použiť tabuľkovú kosínusovú transformáciu Fourierovej funkcie at

(3)

Tabuľkové hodnoty funkcie gama pre argumenty v rozsahu od 0 do 2, ako aj vzorce na výpočet funkcie gama pre veľké a záporné hodnoty argumentov sú uvedené v. Tabuľka 1 sumarizuje výsledky analytického výpočtu spektrálnych zložiek funkcie amplitúdovej modulácie pri uhlových frekvenciách od 0 do s periódou rovnou . V diskrétnej doméne frekvencia zodpovedá frekvencii rovnajúcej sa pomeru vzorkovacej frekvencie k počtu vzoriek v perióde signálu. Takmer úplná zhoda hodnôt uvedených v diagramoch na obr. 3, s výsledkom analytického výpočtu, potvrdzuje správnosť konštrukcií na obr. 3.

Stôl 1.

Analytické hodnoty spektra funkcie amplitúdovej modulácie.

Diskrétna frekvencia

–3,93

–13,47

1000

–27,45

1500

–34,82

2000

–39,94

2500

–43,88

3000

–47,1

Stlačenie dynamického rozsahu na polovicu zodpovedá mocninovému spracovaniu funkcie amplitúdovej modulácie s exponentom rovným 1/2. Pre tento prípad na obr. Obrázok 4 ukazuje rozdiely v časových funkciách a frekvenčných spektrách pôvodných (prerušovaná čiara) a spracovaných (plná čiara) signálov (obr. 4a), ako aj ich funkcie amplitúdovej modulácie (obr. 4c). Spektrá pôvodných a spracovaných signálov sú v diagrame voči sebe posunuté o 30 impulzov pre lepšie vizuálne znázornenie ich rozdielov.

V tabuľke Obrázok 2 predstavuje výsledky analytického výpočtu spektra nelineárne transformovanej obálky, vypočítaného pomocou vzorca (3) pre . Takmer presne sa zhodujú s hodnotami uvedenými v diagramoch na obr. 4, ktorý potvrdzuje správnosť posledného uvedeného.


Obr.4. Časové funkcie (vpravo) a frekvenčné spektrá (vľavo): a) signály na vstupe a výstupe bezzotrvačného meniča; b) amplitúdová modulačná funkcia vstupného signálu a výsledok jeho mocninového spracovania.

Tabuľka 2

Analytické hodnoty spektra nelineárne transformovanej amplitúdovej modulačnej funkcie (výkon 1/2).

Diskrétna frekvencia

2,35

16,33

1000

25,87

1500

31,25

2000

35,03

2500

37,95

3000

40,33

Nelineárna transformácia amplitúdovej modulačnej funkcie modifikovala jej spektrum (obr. 3b). V dôsledku konvolúcie takejto nelineárne transformovanej obálky a vstupného signálu bude mať výstupný signál výrazne obohatené spektrum v porovnaní so vstupným (obr. 3a). V taktovom signáli syntetizovanom pomocou modifikovanej obálky sa objavia ďalšie zložky, ktoré možno považovať za intermodulačné skreslenia. Menia subjektívne vnímanie konvertovaného signálu. Je zrejmé, že v každom inom prípade, okrem spracovania jednotónového signálu, sa v dôsledku zmeny len jedného z operandov vo výraze (2) získa spektrum konvertovaného signálu, ktoré sa líši od pôvodného. Stupeň obohatenia spektra výstupného signálu závisí od šírky pásma obálky: čím širšie je spektrum nelineárne transformovanej obálky, tým je frekvenčné spektrum konvertovaného signálu obohatenejšie.

Vo svojej čistej forme je teda prevod dynamického rozsahu audio signálov bez zotrvačnosti na základe modulačných funkcií nevhodný z dôvodu zmien vo frekvenčnom spektre konvertovaného signálu, v niektorých prípadoch jasne postrehnuteľných sluchom. Samozrejme je možné filtrovať spektrum nelineárne transformovanej obálky približne na šírku kritického sluchového pásma v nízkofrekvenčnej časti zvukového rozsahu. Potom budú ďalšie zložky v rovnakom kritickom pásme ako zložky spektra pôvodného signálu a budú maskované. Ale PDD stratí svoju vlastnosť bez zotrvačnosti v dôsledku obmedzeného trvania prechodovej funkcie okamžitého obálkového filtra.

Závery:

· Digitálny model SDA umožnil zbaviť sa fatálnych chýb analógovej implementácie a objasniť potenciálne možnosti metódy SDA založenej na nelineárnom spracovaní modulačných funkcií.

· Počúvanie zvukových záznamov po spracovaní digitálnymi prevádzkovými údajmi založenými na modulačných funkciách odhalilo výskyt v niektorých momentoch počuteľného hrubého skreslenia zvukového signálu.

· Analýza časových funkcií a frekvenčných spektier signálov vznikajúcich pri riadení dopravy pomocou modulačných funkcií umožnila vysvetliť vznik počuteľných skreslení obohatením frekvenčného spektra spracovávaného signálu v dôsledku zmeny spektra amplitúdovej modulačnej funkcie. Na zníženie viditeľnosti skreslenia je potrebné filtrovať prevedenú funkciu amplitúdovej modulácie. Zároveň sa jeho spektrum zužuje a za predpokladu, že ďalšie komponenty sú v rovnakých kritických sluchových pásmach ako hlavné komponenty, prvé komponenty sú efektívne maskované druhými. Je pravda, že v tomto prípade pravidlá premávky strácajú svoju vlastnosť zotrvačnosti.

· Vzhľadom na prítomnosť zásadných nedostatkov v bezinerciálnych riadiacich jednotkách založených na modulačných funkciách sa zdá, že vytvorenie pokročilejších riadiacich jednotiek by malo ísť cestou zdokonaľovania inerciálnych meničov.

Literatúra.

1. Základy modulačných transformácií zvukových signálov: Monografia / Ishutkin Yu. M., Uvarov V. K.; Ed. V. K. Uvarová. – Petrohrad: SPbGUKiT, 2004.

2. Rozhlasové vysielanie a elektroakustika: Učebnica pre vysoké školy / A. V. Vykhodets, M. V. Gitlits, Yu. A. Kovalgin a ďalší; Ed. M. V. Gitlitsa. – M.: Rádio a spoje, 1989.

3. Udo Zoelzer. Digitálne spracovanie audio signálu. John Willey & Sons. Chichester, New York, Weinheim, Brisbane, Singapur, Toronto, 1997.

4. Ostashevsky E. N. Vývoj metódy a zariadenia na riadenie nestacionárnych fáz signálov na konverziu zafarbenia pri vytváraní zvukových efektov: Abstrakt práce. dis. Ph.D. tie. Sci. – L.: LIKI, 1987.

5. Uvarov V.K. Presné porovnávanie frekvenčných a dynamických rozsahov zvukových signálov. – Petrohrad: SPbGUKiT, 2002.

6. Plyushchev V. M. Vývoj metódy a zariadení na konverziu dynamického rozsahu zvukových signálov bez zotrvačnosti: Abstrakt práce. dis. Kandidát technických vied –L.: LIKI, 1986.

7. Aplikácia modulačných transformácií zvukových signálov: Monografia / V. K. Uvarov, V. M. Plyushchev, M.A. Česnokov; Ed. IN.K. Uvarová - Petrohrad: SPbGUKiT, 2004.

8. Perspektívy spracovania audio signálov na základe ich modulačných funkcií. Ishutkin Yu.M. Proceedings of the Leningrad Institute of Film Engineers, 1977, roč. . - S. 102-115.

9. D.Gabor, J.IEE 93, (pt3), (1946).

10. Časopis vedeckých publikácií postgraduálnych študentov a doktorandov, ISSN 1991-3087, 2008, č. 9. – s. 213-218.

11. Integrálne transformácie a operačný počet, V. A. Ditkin, A. P. Prudnikov, Hlavná redakcia fyzikálnej a matematickej literatúry vydavateľstva Nauka, M., 1974.

12. Príručka matematiky (pre vedcov a inžinierov). G. Korn, T. Korn. – M., 1977.

3.2.2015 o 10:15

Takže v tento cyklus V tomto článku si povieme, čo je kompresia a ako ju používať. Žiaľ, ľudia ho často používajú bez pochopenia jeho základov a výsledok nie je ani zďaleka najlepší. najlepšia kvalita. Práve to ma podnietilo napísať sériu článkov, kde si podrobne rozoberieme fungovanie zariadenia zvaného kompresor a ukážem jeho využitie v praxi.

Jedným z hlavných parametrov zvuku je jeho dynamika. Pomocou dynamiky môžete zdôrazniť noty a hudobné frázy pridaním nových farieb do diela, ale ako ukazuje prax, len málo hudobníkov (profesionálov vo svojom odbore sa tu neberie do úvahy) to dokáže. A bicie, ktoré nepodliehajú dynamickému spracovaniu, znejú sucho a nevýrazne. A odpoveď je jednoduchá – náš sluch je citlivejší na vysoké zvuky a menej na nízke. Ako príklad môžeme porovnať zvuk činelu a podkopu, normalizovať ich na 0db a počúvať: ľudia budú činel vnímať jasnejšie, zreteľnejšie a bohatšie. Samozrejme, môžeme zvýšiť úroveň sub-kopu, no zároveň (vzhľadom na prítomnosť iných nástrojov v mixe) riskujeme, že dostaneme do uší prenikavú spleť zvukov, kde sa kopák stratí z rozsahu a niekde vzadu zazvoní činel. Kompresor slúži na zabránenie „dynamickým konfliktom“. Taktiež sa cez ňu dajú prechádzať hotové mixy, aby sa vyrovnal celkový zvuk, dodal mu hutnosť a vytvoril pumpujúci efekt.

Aby som zhrnul vyššie uvedené:Kompresor - zariadenie používané na zníženie dynamického rozsahu - medzery medzi najtichšou a najhlasnejšou úrovňou zvukového signálu.

Princíp činnosti kompresora nie je taký zložitý, ako sa zdá – zachytí všetko, čo prekročí nastavenú hodnotu v db a podľa nastavenia ju zníži. Pozrime sa na príklad kompresora z T-Racks Plugin Bundle

Prah - tento parameter je zodpovedný za prah odozvy kompresora. Sú to oni, ktorí nastavujú prah, pri ktorom kompresor začne pracovať. Meria sa v db. Napríklad, ak nastavíme hodnotu tohto parametra na -11,1, znamená to, že všetko pod týmto rozsahom nebude spracované a všetko nad kompresorom bude zachytené a spracované.

Chcel by som vás hneď varovať - ​​s týmto parametrom musíte pracovať mimoriadne opatrne a neustále sa pozerať na informačný panel (vpravo hore). Keď spracováva zvukový signál, existuje riziko zachytenia tichších zvukov, ktoré nepotrebujú kompresiu.

pomer - pomer. Mnoho ľudí často nerozumie tomuto parametru alebo ho chápe nesprávne. V skutočnosti je všetko veľmi jednoduché - je zodpovedné za množstvo útlmu signálu. Tiež sa meria v db. Povedzme, že máme hodnotu 2 (v niektorých kompresoroch sa môže použiť označenie 2:1), to znamená, že signál prekročil prahovú hodnotu Prah bude utlmený na 1 db nad prahovú hodnotu, 8 db bude utlmený na 4x atď. Význam pomer v oblasti 3 sa bude považovať za strednú kompresiu, 5 - stredná, 8 - silná a hodnoty nad 20 sa už budú považovať za obmedzujúce. V tomto prípade sa náš kompresor začína podobať Obmedzovač, ale tento kompresor neumožňuje nastaviť také extrémne hodnoty.

ÚtokČas - čas odozvy kompresora, ktorý je potrebný na to, aby sa signál maximálne stlačil po prekročení prahovej hodnoty špecifikovanej parametrom Prah. Merané v milisekúnd.

Na niektorých kompresoroch je čas nábehu vyjadrený v dB/s.

Uvoľnite - čas obnovy Tento parameter je úplne opačný ako parameter ÚtokČas. Konkrétne ide o čas, za ktorý sa signál vráti do pôvodného stavu. Doba zotavenia je zvyčajne výrazne dlhšia ako doba útoku.

Na kompresore z T - Regály je to obzvlášť viditeľné, pretože časová hodnotaUvoľnite vyjadrené v sekundách oproti hodnote milisekúndÚtok Čas .

UrobiťHore - Vzhľadom na to, že kompresor je zariadenie, ktoré znižuje dynamické charakteristiky signálu, výstupný zvuk bude tichší ako bol pred spracovaním. Tento parameter sa používa na kompenzáciu tohto procesu. Inými slovami, používame ho na zvýšenie hlasitosti signálu po spracovaní.

V niektorých kompresoroch je to rovnakémožno označiť akoVýkon Získať , Výkon , Získať atď.

koleno - tento parameter ukazuje plynulosť prechodu medzi komprimovaným a nekomprimovaným signálom. Má 2 typy - Ťažkokoleno A Mäkkýkoleno. Použitím Mäkkýkoleno tento prechod prebieha hladšie a prirodzenejšie, kompresor pracuje mäkšie a nenápadnejšie. Jeho prácu veľmi dobre ilustruje nasledujúci graf

Typy kompresie (podľa princípu použitia):

1. Sekvenčná kompresia - najbežnejší typ dynamické spracovanie zvuk. IN Vložiť kanál pridáme kompresor, ktorý potrebujeme a nakonfigurujeme ho. Je to jednoduché.

2. Paralelná kompresia - tento typ kompresie je tiež pomerne rozšírený, no je tu jeden podstatný rozdiel oproti sekvenčnej kompresii – s ňou pridávame kompresor do Odoslať-kanál a už ho zmiešať s čistým a nespracovaným zvukom.

Niektoré kompresory majú parameter Zmiešať, ktorý vám umožňuje upraviť pomer čistého signálu k spracovanému bez toho, aby ste museli vytvárať samostatnú stopu Odoslať.

3. Viacpásmová kompresia - kompresia, pri ktorej sú jednotlivé frekvenčné rozsahy spracované rôznymi spôsobmi. Poďme sa pozrieť na Multiband Compressor od Waves

Princíp činnosti tohto kompresora nie je taký zložitý, ako by sa na prvý pohľad mohlo zdať: je založený na zariadení tzv Crossover, ktorý rozdeľuje frekvencie zvukového signálu do rôznych rozsahov. A potom už práca pokračuje ako s bežným kompresorom, ale každý frekvenčný rozsah je možné spracovať s vlastným nastavením, čo je veľmi užitočné pri spracovaní jednotlivých nástrojov v mixe.

To je všetko. V druhej časti budem hovoriť o vlastnostiach použitia rôznych kompresorov.

Metódy používané na spracovanie zvuku:

1. Inštalácia. Pozostáva z vystrihnutia niektorých úsekov z nahrávky, vloženia iných, ich nahradenia, duplikovania atď. Tiež sa nazýva úprava. Všetky moderné zvukové a obrazové záznamy sú do tej či onej miery upravované.

2. Amplitúdové transformácie. Vykonávajú sa pomocou rôznych akcií na amplitúde signálu, ktoré v konečnom dôsledku klesajú na násobenie hodnôt vzorky konštantným faktorom (zosilnenie/útlm) alebo časovo premenlivou funkciou modulátora (amplitúdová modulácia). Špeciálnym prípadom amplitúdovej modulácie je vytvorenie obálky, ktorá poskytuje stacionárny vývoj zvuku v priebehu času.

Amplitúdové transformácie sa vykonávajú postupne na jednotlivých vzorkách, takže sa ľahko implementujú a nevyžadujú veľa výpočtov.

3. Frekvenčné (spektrálne) transformácie. Vykonávané na frekvenčných zložkách zvuku. Ak použijeme spektrálny rozklad - formu zvukovej reprezentácie, v ktorej sa frekvencie merajú horizontálne a intenzity zložiek týchto frekvencií sa merajú vertikálne, potom sa mnohé frekvenčné transformácie podobajú amplitúdovým transformáciám v spektre. Napríklad filtrovanie - zosilnenie alebo zoslabenie určitých frekvenčných pásiem - vedie k vloženiu zodpovedajúcej amplitúdovej obálky na spektrum. Takto si však frekvenčnú moduláciu predstaviť nemožno – vyzerá to ako posun celého spektra alebo jeho jednotlivých úsekov v čase podľa určitého zákona.

Na realizáciu frekvenčných transformácií sa zvyčajne používa spektrálny rozklad pomocou Fourierovej metódy, čo si vyžaduje značné zdroje. Existuje však algoritmus pre rýchlu Fourierovu transformáciu (FFT), ktorá sa vykonáva v celočíselnej aritmetike a umožňuje aj na nižších modeloch 486 rozvinúť spektrum signálu priemernej kvality v reálnom čase. Frekvenčné konverzie tiež vyžadujú spracovanie a následnú konvolúciu, takže filtrovanie v reálnom čase ešte nebolo implementované na univerzálnych procesoroch. Namiesto toho existuje veľké množstvo procesory digitálnych signálov (Digital Signal Processor - DSP), ktoré vykonávajú tieto operácie v reálnom čase a na viacerých kanáloch.

4. Fázové premeny. Ide najmä o konštantný fázový posun signálu alebo jeho moduláciu nejakou funkciou alebo iným signálom. Vzhľadom na to, že ľudský sluch používa fázu na určenie smeru zdroja zvuku, fázové transformácie stereo zvuku umožňujú získať efekt rotujúceho zvuku, chorusu a pod.

5. Dočasné premeny. Zahŕňajú pridávanie jeho kópií k hlavnému signálu, posunuté v čase o rôzne množstvá. Pri malých posunoch (rádovo menej ako 20 ms) to dáva efekt znásobenia zdroja zvuku (efekt chorus), pri veľkých posunoch - efekt ozveny.

6. Formantové transformácie. Sú špeciálnym prípadom frekvenčných a pracujú s formantmi - charakteristickými frekvenčnými pásmami nachádzajúcimi sa v zvukoch vyslovovaných ľuďmi. Každý zvuk má svoj vlastný pomer amplitúd a frekvencií niekoľkých formantov, ktorý určuje zafarbenie a zrozumiteľnosť hlasu. Zmenou parametrov formantov môžete zvýrazniť alebo odtieniť jednotlivé zvuky, zmeniť jednu samohlásku na druhú, posunúť hlasový register atď.

Na základe týchto metód, veľa hardvéru a softvér spracovanie zvuku. Nižšie je uvedený popis niektorých z nich.

1. Kompresor (z anglického „compress“ - stlačiť, stlačiť) je elektronické zariadenie alebo počítačový program, ktorý sa používa na zníženie dynamického rozsahu zvukového signálu. Downkompresia znižuje amplitúdu hlasných zvukov, ktoré sú nad určitou hranicou, zatiaľ čo zvuky pod touto hranicou zostávajú nezmenené. Upkompresia na druhej strane zvyšuje hlasitosť zvukov pod určitým prahom, zatiaľ čo zvuky nad týmto prahom zostávajú nezmenené. Tieto akcie znižujú rozdiel medzi jemnými a hlasnými zvukmi a zužujú dynamický rozsah.

Parametre kompresora:

Prah je úroveň, nad ktorou začne byť signál potláčaný. Zvyčajne sa nastavuje v dB.

Pomer – určuje pomer vstupných/výstupných signálov prekračujúcich prah. Napríklad pomer 4:1 znamená, že signál 4 dB nad prahovou hodnotou bude stlačený na úroveň 1 dB nad prahovou hodnotou. Najvyšší pomer ∞:1 sa zvyčajne dosiahne použitím pomeru 60:1 a v skutočnosti znamená, že každý signál nad prahovou hodnotou bude znížený na prahovú úroveň (okrem krátkych prudkých zmien hlasitosti, nazývaných „útok“).

Attack and Release (útok a zotavenie, obr. 1.3). Kompresor môže poskytnúť určitý stupeň kontroly nad tým, ako rýchlo pracuje. „Fáza útoku“ je obdobie, keď kompresor zníži hlasitosť na úroveň, ktorá je určená pomerom. „Fáza uvoľnenia“ je obdobie, keď kompresor zvýši hlasitosť na úroveň určenú pomerom alebo na nulu dB, keď úroveň klesne pod prahovú hodnotu. Trvanie každej periódy je určené rýchlosťou zmeny úrovne signálu.

Ryža. 1.3. Útok a zotavenie kompresora.

Pri mnohých kompresoroch je nábeh a uvoľnenie nastaviteľné užívateľom. V niektorých kompresoroch sú však určené navrhnutým okruhom a používateľ ich nemôže zmeniť. Niekedy sú parametre útoku a uvoľnenia „automatické“ alebo „závislé od softvéru“, čo znamená, že ich načasovanie sa mení v závislosti od prichádzajúceho signálu.

Kompresné koleno (Knee) riadi kompresný ohyb na prahovej hodnote, môže byť ostré alebo zaoblené (obr. 1.4). Mäkké koleno pomaly zvyšuje kompresný pomer a nakoniec dosiahne kompresiu nastavenú používateľom. Pri stuhnutom kolene sa stláčanie začína a zastavuje náhle, čím sa stáva zreteľnejším.

Ryža. 1.4. Mäkké a tvrdé koleno.

2. Expander. Ak kompresor potláča zvuk po tom, čo jeho úroveň prekročí určitú hodnotu, potom expandér potláča zvuk, keď jeho úroveň klesne pod určitú hodnotu. Vo všetkých ostatných ohľadoch je expandér podobný kompresoru (parametre spracovania zvuku).

3. Skreslenie (anglicky „distortion“ - skreslenie) je umelé hrubé zúženie dynamického rozsahu s cieľom obohatiť zvuk o harmonické. Počas kompresie vlny čoraz viac nadobúdajú skôr štvorcový ako sínusový tvar v dôsledku umelého obmedzenia hladiny zvuku, ktorý má najväčší počet harmonických.

4. Delay (anglicky delay) alebo echo (anglicky echo) - zvukový efekt alebo zodpovedajúce zariadenie, ktoré simuluje zreteľné doznievajúce opakovania pôvodného signálu. Efekt sa realizuje pridaním kópie alebo niekoľkých jej kópií, oneskorených v čase, k pôvodnému signálu. Oneskorenie zvyčajne znamená jedno oneskorenie signálu, zatiaľ čo efekt ozveny znamená viacnásobné opakovanie.

5. Dozvuk je proces postupného znižovania intenzity zvuku pri jeho viacnásobných odrazoch. Vo virtuálnych reverboch je veľa parametrov, ktoré vám umožňujú získať požadovaný zvuk špecifický pre každú miestnosť.

6. Ekvalizér (anglicky „equalize“ - „level“, všeobecná skratka – „EQ“) – zariadenie alebo počítačový program, ktorý vám umožňuje zmeniť amplitúdovo-frekvenčnú charakteristiku zvukového signálu, to znamená upraviť jeho amplitúdu (signálu). selektívne, v závislosti od frekvencie. V prvom rade sa ekvalizéry vyznačujú počtom frekvenčných filtrov (pásiem) nastaviteľných v úrovni.

Existujú dva hlavné typy viacpásmových ekvalizérov: grafický a parametrický. Grafický ekvalizér má určitý počet frekvenčných pásiem s nastaviteľnou úrovňou, z ktorých každé sa vyznačuje konštantnou prevádzkovou frekvenciou, pevnou šírkou pásma okolo prevádzkovej frekvencie, ako aj rozsahom nastavenia úrovne (rovnakým pre všetky pásma). Najvzdialenejšie pásy (najnižšie a najvyššie) sú zvyčajne „policové“ filtre a všetky ostatné majú charakteristiku „zvončeka“. Grafické ekvalizéry používané v profesionálnych aplikáciách majú zvyčajne 15 alebo 31 pásiem na kanál a často sú vybavené spektrálnymi analyzátormi pre jednoduché nastavenie.

Oveľa väčšie možnosti nastavenia frekvenčnej odozvy signálu poskytuje parametrický ekvalizér. Každé jeho pásmo má tri hlavné nastaviteľné parametre:

Centrálna (alebo prevádzková) frekvencia v hertzoch (Hz);

Faktor kvality (šírka pracovného pásma okolo centrálnej frekvencie, označený písmenom „Q“) je bezrozmerná veličina;

Úroveň zosilnenia alebo zoslabenia zvoleného pásma v decibeloch (dB).

7. Chorus (anglicky: chorus) - zvukový efekt, ktorý napodobňuje zborový zvuk hudobných nástrojov. Efekt sa realizuje pridaním vlastnej kópie alebo kópií k pôvodnému signálu, časovo posunutých o hodnoty rádovo 20-30 milisekúnd a čas posunu sa plynule mení.

Najprv sa vstupný signál rozdelí na dva nezávislé signály, z ktorých jeden zostáva nezmenený, zatiaľ čo druhý sa privádza do oneskorovacej linky. V oneskorovacej linke je signál oneskorený o 20-30 ms a doba oneskorenia sa mení v súlade so signálom z nízkofrekvenčného generátora. Na výstupe je oneskorený signál zmiešaný s pôvodným. Nízkofrekvenčný generátor moduluje čas oneskorenia signálu. Vytvára vibrácie určitého tvaru v rozsahu od 3 Hz a nižšie. Zmenou frekvencie, tvaru a amplitúdy kmitov nízkofrekvenčného generátora môžete získať iný výstupný signál.

Parametre efektu:

Hĺbka - charakterizuje rozsah variácie času oneskorenia.

Rýchlosť (rýchlosť, rýchlosť) - rýchlosť zmeny „plávania“ zvuku, regulovaná frekvenciou nízkofrekvenčného generátora.

Tvar vlny nízkofrekvenčného generátora (LFO) môže byť sínusový (sin), trojuholníkový (trojuholník) a logaritmický (log).

Balance (balance, mix, dry/wet) - pomer nespracovaných a spracovaných signálov.

8. Phaser, tiež často nazývaný fázové vibrato, je zvukový efekt, ktorý sa dosahuje filtrovaním zvukového signálu, aby sa v jeho spektre vytvorila séria vysokých a nízkych úrovní. Pozícia týchto výšok a basov sa mení v priebehu zvuku, čo vytvára špecifický efekt zametania. Zodpovedajúce zariadenie sa tiež nazýva phaser. Princíp činnosti je podobný chorusu a líši sa od neho časom oneskorenia (1-5 ms). Okrem toho oneskorenie signálu fázovača pri rôznych frekvenciách nie je rovnaké a mení sa podľa určitého zákona.

Elektronický efekt Rozdelením zvukového signálu do dvoch prúdov vzniká fázovač. Jeden stream je spracovaný fázovým filtrom, ktorý mení fázu audio signálu pri zachovaní jeho frekvencie. Veľkosť zmeny fázy závisí od frekvencie. Po zmiešaní spracovaných a nespracovaných signálov sa frekvencie, ktoré sú mimo fázy, navzájom rušia a vytvárajú charakteristické poklesy zvukového spektra. Zmena pomeru pôvodného a spracovaného signálu umožňuje zmeniť hĺbku efektu, pričom maximálna hĺbka sa dosiahne pri pomere 50 %.

Fázový efekt je podobný ako pri efektoch flanger a chorus, ktoré tiež využívajú sčítanie zvukový signál jeho kópie dodávané s určitým oneskorením (tzv. oneskorovacia linka). Avšak na rozdiel od flanger a chorus, kde môže mať hodnota oneskorenia ľubovoľnú hodnotu (zvyčajne od 0 do 20 ms), hodnota oneskorenia vo phaseri závisí od frekvencie signálu a leží v rámci jednej fázy oscilácie. Za špeciálny prípad flangeru teda možno považovať phaser.

9. Flange (angl. flange - príruba, hrebeň) - zvukový efekt pripomínajúci zvuk „lietania“. Princíp činnosti je podobný chorusu, ale líši sa od neho časom oneskorenia (5-15 ms) a prítomnosťou spätnej väzby. Časť výstupného signálu sa privádza späť na vstup a do oneskorovacej linky. V dôsledku rezonancie signálov sa získa flanger efekt. Súčasne v spektre signálu sú niektoré frekvencie zosilnené a niektoré sú zoslabené. Výsledná frekvenčná odozva predstavuje sériu maxím a miním, pripomínajúcich hrebeň, odtiaľ názov. Fáza spätnoväzbového signálu je niekedy invertovaná, čím sa dosiahne dodatočná variácia zvukového signálu.

10. Vocoder (anglicky: „voice coder“ - kodér hlasu) - zariadenie na syntézu reči založené na ľubovoľnom signáli s bohatým spektrom. Spočiatku boli vokodéry vyvinuté s cieľom ušetriť frekvenčné zdroje rádiového spojenia komunikačného systému pri prenose hlasových správ. Úspory sa dosahujú vďaka tomu, že namiesto samotného rečového signálu sa prenášajú iba hodnoty jeho určitých parametrov, ktoré riadia syntetizátor reči na prijímacej strane.

Základ rečového syntetizátora tvoria tri prvky: tónový generátor na tvorbu samohlások, generátor šumu na tvorbu spoluhlások a systém formantových filtrov na obnovenie individuálnych charakteristík hlasu. Po všetkých premenách sa ľudský hlas stáva podobným hlasu robota, čo je celkom znesiteľné pre komunikáciu a zaujímavé pre hudobnú oblasť. Tak to bolo len v najprimitívnejších vokodéroch prvej polovice minulého storočia. Moderné komunikačné vokodéry poskytujú najvyššia kvalita hlasy pri výrazne vyššom stupni kompresie v porovnaní s vyššie uvedenými.

Vokodér ako hudobný efekt umožňuje preniesť vlastnosti jedného (modulačného) signálu na iný signál, ktorý sa nazýva nosič. Ako modulačný signál sa používa ľudský hlas a ako nosič signál generovaný hudobným syntetizátorom alebo iným hudobným nástrojom. Tým sa dosiahne efekt „hovoriaceho“ alebo „spievajúceho“ hudobného nástroja. Modulačným signálom môže byť okrem hlasu aj gitara, klávesy, bicie a vo všeobecnosti akýkoľvek zvuk syntetického a „živého“ pôvodu. Neexistujú žiadne obmedzenia týkajúce sa nosného signálu. Experimentovaním s modelovaním a nosnými signálmi môžete získať úplne iné efekty - hovoriacu gitaru, bicie so zvukom klavíra, gitaru, ktorá znie ako xylofón.