Novo aac napredno audio kodiranje. HE-AAC format, njegove inačice i njihove razlike

Nedavno sam dobio sljedeće pismo:

Pozdrav web mjestu, MP3 je najpopularniji audio format, ali ima toliko drugih kao što su AAC, FLAC, OGG i WMA da nisam siguran koji bih trebao koristiti. Koja je razlika između njih i koji bih trebao koristiti za pohranu svoje glazbe?

Pitanje je dosta popularno, pokušat ću na njega odgovoriti jednostavno, ali jasno.

Već smo govorili o razlici između bez gubitaka i gubitka, ali ukratko, postoje dvije vrste kvalitete zvuka:

  • bez gubitaka: FLAC, ALAC, WAV;
  • s gubitkom: MP3, AAC, OGG, WMA.

Format bez gubitaka čuva punu kvalitetu zvuka, u većini slučajeva na razini CD-a, dok format sa gubitkom komprimira datoteke radi uštede prostora (naravno, kvaliteta zvuka je degradirana).

Nekomprimirani formati za pohranu podataka: FLAC, ALAC, WAV i drugi

  • WAV i AIFF: I WAV i AIFF pohranjuju zvuk nekomprimiran, što znači da su točne kopije izvornog zvuka. Dva su formata u biti iste kvalitete; Samo pohranjuju podatke malo drugačije. AIFF je napravio Apple, tako da ćete ga možda češće vidjeti u Appleovim proizvodima, dok je WAV prilično univerzalan. Međutim, budući da nisu komprimirani, zauzimaju puno nepotrebnog prostora. Ako ne uređujete zvuk, ne morate pohranjivati ​​zvuk u ovim formatima.
  • FLAC: Free Lossless Audio Codec (FLAC) najpopularniji je format za pohranu zvuka bez gubitaka, što ga čini dobrim izborom. Za razliku od WAV-a i AIFF-a, malo komprimira podatke pa zauzima manje prostora. Međutim, smatra se formatom koji pohranjuje zvuk bez gubitaka, kvaliteta glazbe ostaje ista kao i izvorni izvor, tako da je učinkovitiji za upotrebu od WAV i AIFF. Besplatan je i otvorenog koda.
  • Apple bez gubitaka: Također poznat kao ALAC, Apple Lossless sličan je FLAC-u. Ovo je lagano komprimirani format, međutim, glazba će biti sačuvana bez gubitka kvalitete. Njegova kompresija nije tako učinkovita kao FLAC, pa su vaše datoteke možda malo veće, ali iTunes i iOS ga u potpunosti podržavaju (dok FLAC nije). Dakle, ako koristite iTunes i iOS kao glavni softver da biste slušali glazbu, morat ćete koristiti ovaj format.
  • OPONAŠATI.: APE - ima najagresivniji algoritam kompresije za pohranu glazbe bez gubitaka, to jest, dobit ćete maksimalnu uštedu prostora. Kvaliteta zvuka mu je ista kao FLAC, ALAC, ali često postoje problemi s kompatibilnošću. Osim toga, reprodukcija ovog formata puno više opterećuje procesor da ga dekodira, jer su podaci visoko komprimirani. Općenito, ne bih preporučio korištenje ovog formata osim ako ste ograničeni dostupnom memorijom i imate problema s kompatibilnošću softvera.

Komprimirani audio formati za pohranu: MP3, AAC, OGG i drugi


Ako samo želite slušati glazbu ovdje i sada, velike su šanse da ćete koristiti format s gubitkom. Štede gomilu memorije, ostavljajući vam više prostora za pjesme na vašem prijenosnom playeru, a ako su dovoljno visoke, neće se moći razlikovati od izvornog izvora. Ovo su formati s kojima ćete se vjerojatno susresti:

  • MP3: MPEG Audio Layer III, ili MP3, najčešći je format za pohranu zvuka s gubitkom. Toliko da je postao sinonim za glazbu koju je moguće preuzeti. MP3 nije najučinkovitiji format od svih, ali je svakako najbolje podržan, što ga čini najbolji izbor za pohranu komprimiranog zvuka.
  • A.A.C.: Napredno audio kodiranje, također poznato kao AAC, slično je MP3-u, iako je malo učinkovitije. To znači da možete imati datoteke koje zauzimaju manje prostora, ali imaju istu kvalitetu zvuka kao MP3. Najbolji evangelizator formata danas je Appleov iTunes, koji je učinio AAC toliko popularnim da je postao gotovo jednako poznat kao MP3. Dugo sam imao samo jedan uređaj koji nije mogao reproducirati AAC, a to je bilo prije nekoliko godina, tako da možete sigurno koristiti ovaj format za pohranjivanje svoje glazbe.
  • Ogg Vorbis: Vorbis format, poznat kao Ogg Vorbis zbog upotrebe Ogg spremnika, besplatna je alternativa MP3 i AAC. Njegova glavna značajka je da nije ograničen patentima, ali na vas kao krajnjeg korisnika to uopće ne utječe. Zapravo, unatoč svojoj otvorenosti i sličnoj kvaliteti, mnogo je manje popularan od MP3 i AAC, što znači da ga manje programa podržava. Stoga ne preporučamo njegovu upotrebu kako biste izbjegli probleme s kompatibilnošću softvera.
  • WMA: Windows Media Audio je Microsoftov vlastiti vlasnički format, sličan MP3 ili AAC. Ne nudi nikakve prednosti u odnosu na druge formate, a također nije dobro podržan izvan Windows platforme. Ne preporučujemo kopiranje CD-ova u ovaj format osim ako niste sigurni da će se sva glazba reproducirati na Windows platformi ili na playerima kompatibilnim s ovim formatom.

Dakle, što biste trebali koristiti?

Sada kada razumijete razliku između svakog formata, koji biste trebali koristiti za kopiranje ili preuzimanje glazbe? Općenito, preporučujemo korištenje MP3 ili AAC. Kompatibilni su s gotovo svim igračima i oba se ne mogu razlikovati od originala ako . Osim ako nemate posebne potrebe koje diktiraju drugačije, MP3 i AAC su vaš najbolji izbor.

Međutim, ima nešto za reći o pohranjivanju vaše glazbe u formatu bez gubitaka kao što je FLAC. Iako vjerojatno nećete primijetiti višu kvalitetu, bez gubitaka je odličan za pohranjivanje glazbe ako je kasnije planirate pretvoriti u druge formate, budući da će pretvaranje formata s gubitkom u drugi format s gubitkom (kao što je AAC u MP3) rezultirati kada se datoteke pojave, čini se da su osjetno niže kvalitete. Stoga, za potrebe arhiviranja preporučujemo FLAC. Međutim, možete koristiti bilo koji format bez gubitaka jer možete pretvarati između formata bez gubitaka bez promjene kvalitete datoteke.

U ovom članku predlažem razmotriti učinkovitu metodu za komprimiranje audio datoteka. Ovo je drugi dio u serijalu o optimizaciji sadržaja za mobilne telefone, prvi je, da vas podsjetim, bio posvećen .

Audio datoteke u pravilu zauzimaju najviše, ponekad veličina svake skladbe u prosjeku doseže 3-5 megabajta. Takve količine pohrane u memoriji mobilnog telefona su rasipne.

Najpopularniji format je još uvijek mp3, ali u smislu "učinkovitosti" kodiranja daleko je od idealnog. Jedna alternativa je A.A.C., u usporedbi s mp3, sposoban je proizvesti veću kvalitetu sa sličnom veličinom datoteke.

U praksi vam to omogućuje komprimiranje audio datoteka na prosječnu veličinu od 1,5-2 Mb, koje zvuče malo drugačije od izvornika. Ovaj članak pruža vodič za pretvaranje audio datoteka u AAC pomoću foobar2000.

Napredno audio kodiranje (AAC)

Ovo je širokopojasni algoritam za kodiranje zvuka koji pruža podršku od 1 do 48 kanala pri brzinama uzorkovanja od 8 do 96 kHz. AAC radi pri brzinama prijenosa u rasponu od 8 kbps za mono glas do nevjerojatnih 160 kbps po kanalu za visokokvalitetno kodiranje korištenjem više ciklusa kodiranja/dekodiranja.

Format je zajednički razvilo nekoliko tvrtki: AT&T Bell Laboratories, Fraunhofer IIS, Dolby Laboratories, Sony Corporation i Nokia. Nositelji patenata aktivno promoviraju AAC format. Prije svega zahvaljujući Mobilni uredaji, koji imaju hardversku podršku za ovaj format. Možete zapamtiti položaj telefona Sony Ericsson Serija Walkman, kao modeli stvoreni za ljude koji veliku važnost pridaju kvaliteti zvuka uređaja. Ovaj se format također koristi u internetskoj trgovini iTunes iu mnogim drugim područjima povezanim s medijima.

Ključne prednosti AAC-a

  • Do 48 audio kanala;
  • B O veća učinkovitost kodiranja pri konstantnim i promjenjivim brzinama prijenosa;
  • Brzine uzorkovanja 8 Hz do 96 kHz (MP3: 8 Hz do 48 kHz);
    Fleksibilniji zajednički stereo način.

AAC kodiranje

Za to ćemo koristiti program


Foobar2000 ima minimalističko, proširivo sučelje i uključuje mnoge značajke za podršku metapodacima i reprodukcija visoke kvalitete audio. Postoje i službene komponente i
komponente trećih strana sa širokim rasponom dodatnih funkcija.

Ključne značajke foobara 2000

  • Podržani audio formati: MP3, MP4, AAC, Vorbis, FLAC, WAV, Audio CD itd.;
  • Potpuna podrška za Unicode;
  • Izjednačavanje glasnoće (ReplayGain);
  • Lako prilagodljiv dizajn sučelja;
  • Napredne mogućnosti za rad s oznakama;
  • Podrška za kopiranje audio CD-a, kao i transkodiranje svih podržanih audio formata pomoću pretvarača komponenti;
  • Puna podrška za ReplayGain;
  • Otvorena arhitektura dopušta programeri treće strane proširiti funkcionalnost playera.
operacijski sustav
Windows XP - SP2 ili noviji, Vista, Seven.

Za rad morate preuzeti najnoviju stabilnu verziju foobara 2000 iz ureda. mjesto. Tamo također možete preuzeti dodatne komponente i dodatke. Kako bi foobar2000 kodirao audio datoteke u AAC format, morate preuzeti ovaj besplatni kodek i smjestiti ga u mapu u kojoj se nalaze programske datoteke.

Kodek možete preuzeti sa. razvojne stranice. Postoje dvije popularne alternative - AAC kodek tvrtke Nero ili QuickTime AAC tvrtke Apple.

Na profesionalnim forumima već se dugo vode žestoke rasprave o tome koji je AAC kodek bolji; često se slažu da su psihoakustički algoritmi u zvuku Nero bolje implementirani. Za ovaj članak, odabrani kodek je Nero (neroAacEnc.exe), nakon svladavanja tehnologije kodiranja, moći ćete isprobati QT AAC (qaac.exe).

Pokrenite foobar2000, otvorite datoteku koju treba konvertirati (File - Open...). Odaberite liniju i odaberite pretvoriti s padajućeg popisa.


Zanima nas stavka Izlazni format.


Otvorit će se sljedeći prozor


Pretvori izbornik postavki


Idite na stavku AAC (Nero) i kliknite Uredi za pokretanje poluautomatskog načina rada postavki.


U ovom izborniku možete postaviti parametre za AAC koder (Encoder) - način kodiranja (Mode) i bitrate (Quality). Najviše učinkovit način rada s promjenjivim bitrateom - VBR, što nam foobar2000 preporučuje. Kvaliteta nam omogućuje određivanje kvalitete izlazne datoteke - što je veća vrijednost brzine prijenosa, mjerena u kilobitima/s, veća je kvaliteta konačne audio datoteke i njezina veličina.
Ovdje morate pronaći kompromis između kvalitete i veličine. To se može utvrditi samo eksperimentalno. Iz vlastitog iskustva to mogu reći
za mobilni telefon za mnoge glazbene datoteke sasvim je dovoljan q u rasponu od 23 do 30. Sve ovisi o složenosti glazbene kompozicije.

Izađite iz postavki – kliknite OK, zatim Back i na kraju Convert. Pojavit će se prozor s upozorenjem da kodirate u format s gubitkom.


Budući da se u budućnosti planira reproducirati ova aac datoteka mobitel, onda je određeno smanjenje kvalitete neizbježan proces. Slažemo se da počnemo kodirati.


Nakon nekoliko minuta, ako je sve učinjeno ispravno, u spremniku će se stvoriti datoteka s nastavkom m4a - aac. Ova bi se datoteka trebala reproducirati na vašem telefonu bez ikakvih problema, ali ako vaš model odbija reproducirati datoteku, možete pokušati jednostavno promijeniti ekstenziju iz .m4a na .aac.

Postoje i dodatne naredbe, takozvani prekidači, koji vam omogućuju da proizvedete više fino podešavanje kodek.

Pogledajmo najvažnije kod kodiranja u VBR modu

-ignorelength- zanemariti trajanje datoteke, po mogućnosti koristiti.

-q- postavlja kvalitetu zvuka, 0 - minimalna kvaliteta, 1 - maksimalna. Odgovarajuću vrijednost brzine prijenosa možete odrediti pomoću već razmatranog AAC profila.

Preostale naredbe mogu se kopirati iz donjeg primjera.

Da biste mogli unositi ključeve, morate napraviti novi profil u foobar2000. Da biste to učinili, u izborniku Convert Setup kliknite Dodaj novi i postavite svoje vrijednosti.


Ključevi moraju ići u određenom nizu.

Primjer valjane linije:-ignorelength -q 0,52 -if - -od %d

Postoje varijacije formata kao što su HE-AAC i HE-AACv2 - ovi formati znače da AAC kodek koristi posebne algoritme za ultra niske brzine prijenosa. Činjenica je da AAC kodek sam odabire optimalni način kodiranja, tako da nema potrebe za korištenjem prekidača -lc, -he i -hev2.

Dobivene karakteristike audio datoteke možete pogledati u programu

Format AAC danas još uvijek nije zadobio masovnu distribuciju na audio medijima, ali po nizu parametara nadmašuje sve danas postojeće vrste kompresije zvuka, što znači da je vrijedan naše pažnje.

Što je?

Počnimo s definicijom: AAC je vlasnička (vlasnička) opcija kompresije audio datoteka. U isto vrijeme, ima manji gubitak kvalitete tijekom kodiranja u usporedbi s MP3 u uvjetima iste brzine prijenosa. Osim toga, AAC format je širokopojasni algoritam za kodiranje zvuka koji koristi dva glavna principa kodiranja za značajno smanjenje količine podataka potrebnih za prijenos kvalitetnog digitalnog zvuka. Ovo rješenje je prepoznato kao jedno od najkvalitetnijih, implementirano korištenjem tehnologije kompresije s gubitkom. Format podržava većinu moderne opreme, čak i one prijenosne. Valja napomenuti da se melodije zvona u AAC formatu mogu kupiti kod iTunes Store, a ova trgovina predstavlja glazbu komprimiranu isključivo korištenjem rečena odluka. Također treba reći da je AAC format izvorno nastao kao nasljednik MP3-a, koji je mogao omogućiti poboljšanu kvalitetu kodiranja. Rješenje je objavljeno davne 1997. godine kao novi, sedmi, dio MPEG-2 obitelji.

Princip rada

Prilikom kodiranja u ovaj format provode se sljedeći procesi: iz signala se uklanjaju neprimjetne komponente, kodirani audio signal se čisti od redundancije. Nakon toga podaci se prema složenosti obrađuju prema MDCT metodi. U sljedećoj fazi dodaju se kodovi za ispravljanje raznih interne greške. Konačno, signal se prenosi ili pohranjuje.

Svi detalji

Zanimljivo je da AAC format ima frekvenciju uzorkovanja u rasponu od 8-96 kHz, kao i niz kanala u rasponu od 1-48. MP3 koristi hibridni skup filtara. Zauzvrat, AAC pribjegava modificiranoj diskretnoj kosinusnoj transformaciji s povećanom veličinom prozora, koja doseže 2048 točaka.

Stoga je AAC puno prikladniji za kodiranje zvuka koji ima tok složenih impulsa kao i kvadratnih valova, u usporedbi s MP3. Format ima mogućnost dinamičke izmjene duljina MDCT blokova unutar raspona od 2048-256 točaka. U slučaju da se dogodi kratkoročna ili jednokratna promjena, primjenjuje se mali „prozor“ od 256 bodova kako bi se postigla bolja rezolucija. Ovo je prema zadanim postavkama veliki prozor od 2048 točaka kako bi se povećala učinkovitost kodiranja. AAC ima brojne prednosti u odnosu na konvencionalni MP3. Među njima treba istaknuti: provedbu veliki broj audio kanala (do 48), značajna učinkovitost kodiranja u uvjetima konstantne i promjenjive brzine prijenosa, kao i brzine uzorkovanja u rasponu od 8 Hz do 96 kHz (za MP3 ova brojka je u rasponu od 8 Hz do 48 kHz) i fleksibilniji posebni način rada pod nazivom Joint stereo. Što se tiče AAC+ rješenja, radi se o kodeku koji je fokusiran na rad s niskim bitrateom. Riječ je o kombinaciji SBR-a i AAC LC-a, zahvaljujući kojoj se dobar zvuk postiže već u rasponu od 32-48 kbps.

2009-09-30T20:52

2009-09-30T20:52

Audiofilski softver

Prve ideje o korištenju psihoakustičkog maskiranja za komprimiranje audio podataka datiraju iz 1979. godine. Međutim, odgovarajući audio koderi počeli su se širiti tek sredinom 90-ih, kada je računalna snaga osobnih računala Postalo je dovoljno reproducirati komprimirani zvuk u stvarnom vremenu i pojavio se MPEG-1 Audio Layer 3 standard, poznatiji kao MP3. Komprimirani audio formati postali su nezamjenjivi za prijenos zvuka preko Interneta, pružajući "gotovo prozirnu" kvalitetu stereo zvuka (to jest, kodirani signal se većini slušatelja ne može razlikovati od izvornika) pri bitnim brzinama iznad 128 kbps. Temeljna načela MP3 formata mogu se pronaći u člancima K. Glasmana (2...8/2005)

Razvoj metoda kompresije podataka i psihoakustike postupno je doveo do činjenice da je MP3 standard postao "tijesan" za implementaciju novih ideja u audio kodiranju. Kao rezultat toga, do 1997. Fraunhofer Institut (Fraunhofer IIS), koji je stvorio MP3 u ranim 90-ima, kao i Dolby, AT&T, Sony i Nokia, razvili su nova metoda kompresija zvuka - Napredno audio kodiranje (AAC), uključeno u standarde MPEG-2 i MPEG-4. Glavne razlike u odnosu na MP3 standard su:

  • podrška za širi raspon formata (do 48 kanala) i frekvencija uzorkovanja zvuka (od 8 kHz do 96 kHz);
  • učinkovitija i jednostavnija banka filtara: hibridna banka MP3 filtara zamijenjena je konvencionalnim MDCT (modificirana diskretna kosinusna transformacija);
  • šire granice za variranje frekvencijsko-vremenske rezolucije u banci filtara - osam puta (u MP3 - tri puta) - dovelo je do poboljšanog kodiranja prijelaznih pojava (prijelaznih procesa) i stacionarnih dijelova audio signala;
  • bolje kodiranje frekvencija iznad 16 kHz;
  • fleksibilniji način stereo kodiranja, koji vam omogućuje da se neovisno prebacite na M/S ("zajednički stereo") način rada u različitim frekvencijskim pojasima;
  • dodatne značajke standarda koje povećavaju učinkovitost kompresije: tehnologija generiranja buke u vremenskoj domeni (TNS), dugoročno predviđanje MDCT koeficijenata, način parametarskog stereo kodiranja, zamjena perceptivne buke, frekvencije tehnologije brze obnove (SBR).

Zahvaljujući ovim značajkama, AAC standard može postići fleksibilnije i učinkovitije, a time i kvalitetnije audio kodiranje. Kao rezultat raširene upotrebe MP3 formata, AAC standard još nije stekao popularnost usporedivu s MP3. Ipak, AAC je glavni format u popularnoj internetskoj trgovini iTunes Store, iPod playerima, iTunesu, iPhone telefon, PlayStation 3, Nintendo Wii i DAB+/DRM digitalno emitiranje.

Pogledajmo pobliže glavne značajke AAC-a.

Banka filtara

Kao i drugi psihoakustički audio koderi, AAC radi prema sljedećoj shemi. Ulazni signal prolazi kroz banku filtara - transformacija koja prenosi signal iz vremenske domene u vremensko-frekvencijsku domenu (slično konstruiranju spektrograma). Paralelno, psihoakustički model analizira signal i određuje pragove psihoakustičkog maskiranja. Zatim se kvantiziraju spektralni koeficijenti signala na izlazu banke filtara tako da je spektar šuma, ako je moguće (ako brzina prijenosa dopušta), ispod pragova maskiranja i nije čujan. Kvantizirani koeficijenti komprimirani su bez gubitaka u AAC izlaznu datoteku. Dakle, sama banka filtera ne komprimira signal, samo ga pretvara u oblik pogodniji za kompresiju.

Značajka svake banke filtera je njena frekvencijska rezolucija, odnosno broj frekvencijskih pojaseva na koje dijeli spektar signala. Većina banaka filtara koje se koriste za audio kompresiju ima nekoliko stotina pojaseva. To znači da, zbog odnosa nesigurnosti, takve banke filtara imaju vremensku rezoluciju reda veličine nekoliko desetaka milisekundi. Kada su spektralni koeficijenti signala kvantizirani, uvedena pogreška kvantizacije pri dekodiranju signala raspoređuje se u vremenu po cijeloj duljini prozora banke filtera. U nekim slučajevima to rezultira neželjenim učinkom koji se naziva predeho. Ona se očituje kada se pogreška kvantizacije iz prijelazne pojave (oštar nalet energije u signalu) propagira u vremenu do vremenskog segmenta koji prethodi prijelaznoj pojavi i postane čujna (slika 1). Kako bi se smanjio ovaj učinak, koriste se banke filtara s promjenjivom vremensko-frekvencijskom rezolucijom. Na primjer, MP3 koristi razlučivost banke filtara između 26 i 9 ms. Za stacionarne signale koriste se prozori od 26 ms da bi se dobila dobra frekvencijska rezolucija, a za prijelazne pojave koriste se prozori od 9 ms da se smanji učinak prije odjeka (vidi sliku 1).

AAC algoritam također koristi promjenu veličine prozora MDCT. Istodobno, razlika u veličini prozora je osmerostruka: 6 i 48 ms (256 i 2048 uzoraka). Zahvaljujući tome, algoritam se može prilagoditi širem rasponu signala i postići bolji stupanj kompresije.

TNS tehnologija - formiranje ovojnice šuma amplitude

Jedan od problema suvremenih psihoakustičkih audio enkodera je rad s tranzijentima (prolaznim procesima u audio signalu). Da bi se postiglo transparentno kodiranje, šum kvantizacije mora pasti unutar praga maskiranja ovisnog o vremenu. Međutim, u praksi, ovaj zahtjev je teško zadovoljiti blizu prijelaznih procesa, jer Šum kvantizacije generiran tijekom kodiranja širi se u vremenu tijekom dekodiranja preko cijele duljine MDCT prozora. To može rezultirati šumom kvantizacije koji značajno premašuje pragove vremenskog maskiranja.

Tehnologija TNS (temporal noise shaping) u standardu AAC omogućuje kontrolu širenja šuma kvantizacije vremena unutar svakog MDCT prozora. TNS tehnologija temelji se na sličnosti (vremensko-frekvencijska dualnost) ovojnice amplitude signala i ovojnice njegovog spektra, kao i korištenju linearnog predviđanja (LPC) u frekvenciji pri kvantiziranju spektra.

Dobro je poznato da za signale sa spektrom koji se jako razlikuje od bijelog (na primjer, tonovi), upotreba linearnog predviđanja (LPC) u vremenskoj domeni može učinkovito "izbijeliti" spektar i kodirati takve signale razlaganjem na koeficijenti predviđanja i relativno mala pogreška predviđanja amplitude (rezidual). Tijekom dekodiranja, filtar linearnog predviđanja generira spektar pogrešaka prema spektru originalnog signala.

AAC koder koristi linearno predviđanje na suprotan način: za predviđanje spektralnih uzoraka u frekvencijskoj domeni. Razlika između izvornog i predviđenog MDCT koeficijenta kvantizirana je prema pragovima maskiranja (u tradicionalnim koderima, izvorni MDCT koeficijenti su kvantizirani). Koeficijenti linearnog predviđanja također se zapisuju u izlaznu datoteku. Prilikom dekodiranja signala, filtar linearnog predviđanja primijenjen na signal razlike u frekvencijskoj domeni (uključujući pogrešku kvantizacije) proizvodi omotnicu amplitude originalnog signala (i pogrešku kvantizacije) u vremenskoj domeni. Dakle, ovojnica amplitude kvantizacijskih pogrešaka postaje blizu ovojnice amplitude izvornog signala (slika 2).

TNS tehnologija smanjuje učinak predeha i uočljivost kvantizacijskih pogrešaka na nekim harmonijskim signalima s pulsnom prirodom proizvodnje zvuka (govor, neka puhačka i gudalačka glazbala). Na sl. Slika 2 uspoređuje pogreške kvantizacije unesene u vokalni signal pomoću algoritama AAC i MP3 s istim brzinama prijenosa. Uz opće smanjenje pogreške kvantizacije (zbog veće učinkovitosti AAC-a), uočava se formiranje amplitudne ovojnice vremenske pogreške kvantizacije prema ovojnici izvornog signala.

U standardu AAC, TNS tehnologija se može samostalno primijeniti na pojedinačne frekvencijske pojaseve spektra ili potpuno onemogućiti.

SBR tehnologija - visokofrekventna restauracija

Pouzdan prijenos širokog frekvencijskog raspona važan je uvjet za visokokvalitetno kodiranje. Međutim, prijenos svake sljedeće oktave audio raspona povećava zahtjeve za bitrate za tradicionalni audio koder za jedan i pol do dva puta. Da smanjite bitrate i dalje održavate visoke frekvencije u kodiranom materijalu stvorena je tehnologija umjetne sinteze visokih frekvencija SBR (spectral band replication).

Tehnologija se temelji na činjenici da naš sluh analizira visoke frekvencije s manjom preciznošću nego srednje i niske frekvencije. Za stvaranje efekta prisutnosti visokih frekvencija nije potrebno matematički precizno rekonstruirati valni oblik, već samo vratiti neke bitne psihoakustičke parametre signala na visokim frekvencijama. Ovi bitni parametri uključuju vremensko-frekvencijsku distribuciju (omotnicu) energije signala i stupanj njegovog tonaliteta/šuma.

Ideja algoritma je sljedeća. Tijekom kodiranja analiziraju se visoke frekvencije u izvornom audio signalu i ekstrahiraju se njihovi parametri: prije svega, omotnica amplitude u nekoliko (obično osam) frekvencijskih pojasa. Zatim se visoke frekvencije uklanjaju iz snimke i kodiraju se samo preostale niske i srednje frekvencije. U isto vrijeme, relativno mali tok informacija o parametrima izgubljenih visokih frekvencija također se dodaje u izlaznu datoteku.

Tijekom reprodukcije najprije se dekodira signal niske i srednje frekvencije. Zatim (ako postoji u playeru), SBR dekoder počinje raditi. Prvi korak je sintetizirati visokofrekventni signal transponiranjem (točnije, pomakom frekvencije) postojećih srednjih frekvencija. Budući da je stupanj tonaliteta/šuma spektra na srednjim i visokim frekvencijama približno jednak, ovaj korak rezultira visokofrekventnim signalom s prihvatljivom strukturom spektra. U drugom koraku, SBR dekoder koristi dodatne pohranjene informacije o visokoj frekvenciji kako bi mu dao željenu omotnicu amplitude u svakom frekvencijskom pojasu. Rezultat je signal u kojem su visoke frekvencije potpuno sintetizirane iz srednjih frekvencija, ali u isto vrijeme zadržavaju zvuk izvornih visokih frekvencija.

SBR tehnologija može se primijeniti na mnoge postojeće metode audio kodiranja. Na primjer, SBR u kombinaciji s MP3 naziva se MP3 PRO, a SBR u kombinaciji s AAC naziva se HE-AAC (visoka učinkovitost AAC). U osnovi, SBR se koristi kod kodiranja s relativno niskim brzinama prijenosa: 64 kbit/s i nižim. Tehnologija vam omogućuje značajno proširenje frekvencijskog raspona audio signala uz minimalno povećanje brzine prijenosa (nekoliko kbit/s).

Parametarska stereo tehnologija

Prijenos stereo signala obično zahtijeva da koder ima skoro 2 puta veću brzinu prijenosa od mono signala. U ovom slučaju, stereo kanali mogu se kodirati neovisno i nakon M/S pretvorbe. U potonjem slučaju, S-kanal često troši manje bitrate od M-kanala. Ovaj način kodiranja također se naziva zajednički stereo. U AAC standardu ovaj način rada koder može uključiti i isključiti neovisno za svaki frekvencijski pojas.

Za učinkovitije kodiranje stereo signala pri vrlo niskim brzinama prijenosa (16...32 kbit/s), razvijena je tehnologija parametarskog stereo kodiranja. Sastoji se od činjenice da se stereo signal reducira na mono prije kodiranja, ali se izlaznoj datoteci dodaje mali tok (2...3 kbit/s), koji sadrži informacije o stereo panorami izvorne stereo datoteke. Ovaj tok sadrži (u komprimiranom obliku) neku vrstu "panoramske karte" za vremensko-frekvencijsku ravninu.

U fazi dekodiranja, pomicanje ovisno o frekvenciji primjenjuje se na rezultirajući mono signal. To se može učiniti istovremeno s dekodiranjem primjenom odgovarajućih množitelja amplitude na početno jednake MDCT koeficijente lijevog i desnog kanala.

Parametarska stereo tehnologija daje dobar dojam izvornog stereo zvuka po cijenu samo malog povećanja brzine prijenosa u usporedbi s mono kodiranjem. Međutim, ne dopušta vam postizanje potpuno transparentnog zvuka, jer ne može uzeti u obzir sve nijanse stereo panorame, na primjer, fazne pomake između stereo kanala.

Parametarska stereo tehnologija uključena je u HE-AAC v2 standard.

PNS tehnologija - generiranje buke

Kako bi se dodatno povećala učinkovitost kodiranja signala šuma, AAC standard nudi PNS (perceptual noise substitution) tehnologiju za sintezu šuma. Poznato je da je naše uho osjetljivije na amplitudni spektar signala nego na fazni spektar. Stoga, umjesto kodiranja MDCT koeficijenata izvornog signala u područjima šuma, možete prenijeti samo parametre šuma: njegovu snagu ovisno o frekvenciji i vremenu.

Ovako funkcionira PNS tehnologija. Tijekom kodiranja identificiraju se područja spektra koja predstavljaju šum, a odgovarajuće skupine MDCT koeficijenata isključene su iz procesa kodiranja. Frekvencijski pojas je označen kao šum i ukupna energija šuma za njega je pohranjena.

Prilikom dekodiranja, pseudoslučajni MDCT koeficijenti sa potrebnom ukupnom snagom supstituirani su u frekvencijske pojaseve označene kao šum. Kao rezultat toga, u naznačenom frekvencijski rasponi sintetizira se šum koji je zvukom blizak izvornom šumu.

Tehnologija dugoročnog predviđanja - vremensko predviđanje

Psihoakustično kodiranje tonskih signala zahtijeva veći lokalni omjer signala i šuma nego kodiranje šumnih signala (npr. 20 dB odnosno 6 dB). A to zauzvrat zahtijeva povećanu brzinu prijenosa. Međutim, MDCT koeficijenti tonova su predvidljivi tijekom vremena. Ova okolnost omogućuje iskorištavanje njihove vremenske ovisnosti za smanjenje brzine prijenosa.

AAC standard pruža dugoročni način predviđanja, u kojem se MDCT koeficijenti dodatno kodiraju u vremenu pomoću linearnog predviđanja. Izraz "dugotrajno" znači da se predviđanje ne vrši iz susjednih uzoraka, već iz uzoraka odvojenih najvjerojatnijim periodom tona na danoj frekvenciji.

Kvantizacija i kompresija MDCT koeficijenata

Slično MP3 standardu, AAC koristi nelinearnu kvantizaciju MDCT koeficijenata i kompresiju pomoću Huffmanove metode. MDCT koeficijenti se kvantiziraju nakon povećanja na 0,75 snage, dopuštajući da se greška kvantizacije poveća za jake signale i smanji za slabe signale unutar svakog frekvencijskog pojasa. Na taj način se vrši dodatno implicitno formiranje spektra šuma.

Nakon kvantizacije, MDCT koeficijenti su komprimirani korištenjem skupa fiksnih Huffmanovih tablica. U AAC standardu postoji više ovih tablica nego u MP3, a i šire su mogućnosti grupiranja koeficijenata. To rezultira dodatnim povećanjem kompresije.

Kvaliteta zvuka

Pri procjeni kvalitete zvuka audio kodera obično se koriste subjektivni testovi. Slušateljima se prezentiraju fragmenti snimaka komprimirani različitim koderima, a oni ocjenjuju čistoću zvuka svakog fragmenta na ljestvici od 1 do 5. Najboljim kodekom smatra se onaj koji može postići višu kvalitetu zvuka u odnosu na konkurenciju pri određenoj brzini prijenosa.

Prilično mjerodavan internetski izvor koji daje rezultate takvih testova je stranica http://www.rjamorim.com/test/ Ona predstavlja testove različitih kodeka na različitim brzinama prijenosa. Prikazani rezultati općenito se dobro slažu s drugim izvorima. Evo nekih rezultata za MP3 i AAC kodere koji će vam pomoći u usporedbi njihove kvalitete.

Najbolji MP3 koder je besplatni Lame. Međutim, kod većine brzina prijenosa inferioran je kvalitetom u odnosu na novije standarde kompresije. Kod velikih brzina prijenosa (iznad 128 kbps) taj je zaostatak mali, a prednjači koder Ogg Vorbis.

Već pri bitrateu od 64 kbps prednost AAC-a je vidljiva. U varijanti HE-AAC, algoritam zarađuje ocjenu 3,68. To otprilike odgovara Lameu s bitrateom od 96 kbps i znači da je AAC oko 1,5 puta bolji od MP3. Lameov rezultat na 128 kbps je 4,29.

Pri brzini prijenosa od 32 kbit/s, AAC koder tvrtke Nero ima značajno poboljšanje kvalitete u usporedbi s MP3: rezultati 3,23 odnosno 1,72. Međutim, AAC je tek neznatno ispred MP3PRO formata, koji je dobio ocjenu 3,08. To ukazuje da SBR tehnologija značajno poboljšava kvalitetu pri niskim brzinama prijenosa.

zaključke

Zahvaljujući novim tehnologijama koje se koriste u AAC standardu, ovaj format ima primjetnu prednost u odnosu na MPEG-1 Layer 3 (MP3), omogućujući mu postizanje najbolja kvaliteta zvuk u istim bitrate-ovima. Posebno jak dobitak uočen je u području niskih brzina prijenosa: 96 kbit/s i niže. Ovo potvrđuje obećanje AAC formata za digitalno emitiranje.

Popularnost AAC-a za distribuciju glazbe na Internetu danas je i dalje niska u usporedbi s MP3 formatom. Korisnici i dalje preferiraju bolju prenosivost MP3-a u odnosu na jaču kompresiju AAC-a. Značajan dio glazbenih arhiva na stranicama koje distribuiraju glazbu već je u početku u MP3 formatu, a pružatelji nemaju pristup nekomprimiranim snimkama. To znači da nema smisla transkodirati takve snimke u AAC format - kvaliteta je često već izgubljena. Međutim, novi džepni igrači a neke online trgovine već podržavaju AAC format, često uz provjeru legalnosti sadržaja (što također obeshrabruje korisnike koji se ne žele ograničavati u kopiranju glazbe).

Iako vrlo obećavajući, AAC format nije jedini format kompresije zvuka visoke kvalitete. Pri velikim brzinama prijenosa (iznad 128 kbps), AAC je često slabije kvalitete od Ogg Vorbis i Musepack kodera. Pri najnižim brzinama prijenosa (manje od 32 kbit/s), AAC može biti lošiji od parametarskih audio kodera, uključujući specijalizirane kodere za kompresiju govora. Međutim, u rasponu srednje niske brzine prijenosa AAC je uključen ovaj trenutak zadržava dlan.

Aleksej Lukin
Časopis "Sound Engineer" 2008 #1

Oba formata koriste isti spremnik, ali s ALAC-om nema gubitka informacija.

AAC (Advanced Audio Coding) izvorno je stvoren kao nasljednik MP3 s poboljšanom kvalitetom kodiranja. Format AAC, službeno poznat kao ISO/IEC 13818-7, objavljen je 1997. kao sedmi član obitelji MPEG-2. Postoji i AAC format poznat kao MPEG-4 Part 3.

Kako radi AAC?

  1. Uklanjaju se komponente signala koje ljudi ne percipiraju.
  2. Uklanja se redundantnost u kodiranom audio signalu.
  3. Signal se potom obrađuje metodom MDCT prema svojoj složenosti.
  4. Dodani su interni kodovi za ispravljanje pogrešaka.
  5. Signal se pohranjuje ili prenosi.
  • .m4a - Standardni nastavak;
  • .m4b - AAC datoteka koja podržava knjižne oznake; koristi se za audio knjige i podcastove;
  • .m4p - zaštićena AAC datoteka; koristi se za zaštitu datoteke od kopiranja prilikom legalnog preuzimanja glazbe zaštićene autorskim pravima iz internetskih trgovina kao što je iTunes Store;
  • .m4r je datoteka zvona koja se koristi u Apple iPhoneu.

vidi također

Napišite recenziju o članku "Napredno audio kodiranje"

Bilješke