Yangi aac rivojlangan audio kodlash. HE-AAC formati, uning versiyalari va ularning farqlari

Men yaqinda quyidagi elektron pochta xabarini oldim:

Salom sayt, MP3 eng mashhur audio formatdir, lekin AAC, FLAC, OGG va WMA kabilar shunchalik ko'pki, men qaysi birini ishlatishim kerakligini bilmayman. Ularning orasidagi farq nima va musiqamni saqlash uchun qaysi birini ishlatishim kerak?

Savol juda mashhur, men unga oddiy, ammo tushunarli tarzda javob berishga harakat qilaman.

Biz allaqachon yo'qotishsiz va yo'qolgan o'rtasidagi farq haqida gapirgan edik, ammo qisqacha aytganda, audio sifatining ikki turi mavjud:

  • yo'qotishsiz: FLAC, ALAC, WAV;
  • yo'qolgan: MP3, AAC, OGG, WMA.

Lossless formati to'liq audio sifatini, aksariyat hollarda CD darajasini saqlab qoladi, Lossless formati bo'sh joyni tejash uchun fayllarni siqadi (albatta, audio sifati yomonlashadi).

Siqilmagan saqlash formatlari: FLAC, ALAC, WAV va boshqalar

  • WAV va AIFF: WAV ham, AIFF ham siqilmagan audioni saqlaydi, ya'ni ular asl audioning aniq nusxalaridir. Bu ikki format asosan bir xil sifatga ega; Ular ma'lumotlarni bir oz boshqacha saqlashadi. AIFF Apple tomonidan ishlab chiqarilgan, shuning uchun uni Apple mahsulotlarida tez-tez ko'rishingiz mumkin va WAV juda ko'p qirrali. Biroq, ular siqilmaganligi sababli, ular juda ko'p keraksiz joyni egallaydi. Agar siz audioni tahrir qilmasangiz, audioni ushbu formatlarda saqlashingiz shart emas.
  • FLAC: Bepul Lossless Audio Codec (FLAC) eng mashhur yo'qotmaydigan audio saqlash formati bo'lib, uni yaxshi tanlov qiladi. WAV va AIFF dan farqli o'laroq, u ma'lumotlarni biroz siqadi, shuning uchun u kamroq joy egallaydi. Biroq, bu yo'qotishsiz audioni saqlaydigan format deb hisoblanadi, musiqa sifati asl manba bilan bir xil bo'lib qoladi, shuning uchun uni WAV va AIFFga qaraganda ishlatish samaraliroq. Bu bepul va ochiq manba.
  • Apple yo'qotishsiz: ALAC nomi bilan ham tanilgan Apple Lossless FLACga o'xshaydi. Bu engil siqilgan format, ammo musiqa sifatini yo'qotmasdan saqlanib qoladi. Uning siqilishi FLAC kabi samarali emas, shuning uchun fayllaringiz biroz kattaroq bo'lishi mumkin, lekin ular iTunes va iOS tomonidan to'liq qo'llab-quvvatlanadi (FLAC esa bunday emas). Shunday qilib, agar siz iTunes va iOS-dan asosiy sifatida foydalansangiz dasturiy ta'minot musiqa tinglash uchun siz ushbu maxsus formatdan foydalanishingiz kerak bo'ladi.
  • APE: APE - musiqani yo'qotishsiz saqlash uchun eng agressiv siqish algoritmiga ega, ya'ni siz maksimal joyni tejashga erishasiz. Uning ovoz sifati FLAC, ALAC bilan bir xil, ammo moslik bilan bog'liq muammolar keng tarqalgan. Bundan tashqari, ushbu formatni o'ynash protsessorni dekodlash uchun ko'proq stressni keltirib chiqaradi, chunki ma'lumotlar juda siqilgan. Umuman olganda, agar siz bo'sh xotirangiz cheklangan bo'lsa va dasturiy ta'minot bilan moslik muammosi bo'lmasa, men ushbu formatdan foydalanishni tavsiya etmayman.

Siqilgan audio saqlash formatlari: MP3, AAC, OGG va boshqalar


Agar siz shu yerda va hozir musiqa tinglamoqchi bo'lsangiz, ehtimol siz yo'qolgan formatdan foydalanasiz. Ular tonnalab xotirani tejaydi, bu sizga portativ pleyerda qo'shiqlar uchun ko'proq joy qoldiradi va agar etarlicha baland bo'lsa, ular asl manbadan farq qilmaydi. Bu erda siz uchrashishingiz mumkin bo'lgan formatlar:

  • MP3: MPEG Audio Layer III yoki MP3, eng keng tarqalgan yo'qolgan audio saqlash formatidir. Shunday qilib, u yuklab olinadigan musiqa bilan sinonimga aylandi. MP3 - bu eng samarali format emas, lekin u eng yaxshi qo'llab-quvvatlanadigan formatdir eng yaxshi tanlov siqilgan audioni saqlash uchun.
  • AAC: AAC nomi bilan ham tanilgan Kengaytirilgan audio kodlash, bir oz samaraliroq bo'lsa-da, MP3 ga o'xshaydi. Bu shuni anglatadiki, sizda kamroq joy egallagan, lekin MP3 kabi bir xil audio sifatiga ega bo'lgan fayllar bo'lishi mumkin. Bugungi kunda ushbu format uchun eng yaxshi xushxabarchi Apple-ning iTunes-idir, bu AAC-ni shunchalik mashhur qildiki, u deyarli MP3 sifatida mashhur bo'ldi. Uzoq vaqt davomida menda AAC-ni o'ynay olmaydigan faqat bitta qurilma bor edi va bu bir necha yil oldin edi, shuning uchun musiqangizni saqlash uchun ushbu formatdan foydalanishingiz mumkin.
  • Ogg Vorbis: Ogg konteyneridan foydalanganligi sababli Ogg Vorbis nomi bilan tanilgan Vorbis formati MP3 va AAC-ga bepul muqobildir. Uning asosiy xususiyati shundaki, u patentlar bilan cheklanmaydi, lekin u sizga oxirgi foydalanuvchi sifatida umuman ta'sir qilmaydi. Haqiqatan ham, uning ochiqligi va shunga o'xshash sifatiga qaramay, u MP3 va AACga qaraganda ancha kam mashhur, ya'ni kamroq dasturlar uni qo'llab-quvvatlaydi. Shuning uchun, biz dasturiy ta'minotning muvofiqligi bilan bog'liq muammolarni oldini olish uchun uni ishlatishni tavsiya etmaymiz.
  • WMA: Windows Media Audio bu MP3 yoki AACga o'xshash Microsoft-ning o'ziga xos formatidir. U boshqa formatlarga nisbatan hech qanday afzalliklarga ega emas va Windows platformasidan tashqarida ham yaxshi qo'llab-quvvatlanmaydi. Agar barcha musiqalar Windows platformasida yoki ushbu formatga mos keluvchi pleyerlarda tinglanishini aniq bilmasangiz, CD-larni ushbu formatga o'chirib tashlashingizni tavsiya etmaymiz.

Xo'sh, qaysi birini ishlatishingiz kerak?

Endi siz har bir format o'rtasidagi farqni tushunganingizdan so'ng, musiqangizni yirtib tashlash yoki yuklab olish uchun nimadan foydalanish kerak? Umuman olganda, biz MP3 yoki AAC dan foydalanishni tavsiya qilamiz. Ular deyarli har bir aylanuvchi patnisga mos keladi va ikkalasini ham asl nusxadan ajratib bo'lmaydi. Agar sizda boshqacha talab qilinadigan maxsus ehtiyojlar bo'lmasa, MP3 va AAC sizning eng yaxshi pul tikishingizdir.

Biroq, musiqangizni FLAC kabi yo'qotishsiz formatda saqlash haqida gapirish kerak bo'lgan narsa bor. Garchi siz ko'proq narsani sezmaysiz Yuqori sifat Lossless musiqani saqlash uchun juda mos keladi, agar siz uni keyinroq boshqa formatlarga o'tkazishni rejalashtirmoqchi bo'lsangiz, chunki yo'qolgan formatni boshqa yo'qolgan formatga (masalan, AAC dan MP3 ga) o'zgartirsangiz, fayllar sifati sezilarli darajada past bo'ladi. Shuning uchun, arxiv maqsadlarida biz FLAC-ni tavsiya qilamiz... Biroq, siz har qanday yo'qotishsiz formatdan foydalanishingiz mumkin, chunki fayl sifatini o'zgartirmasdan yo'qotishsiz formatlar o'rtasida konvertatsiya qilishingiz mumkin.

Ushbu maqolada men audio fayllarni siqishning samarali usulini ko'rib chiqishni taklif qilaman. Bu mobil telefonlar uchun kontentni optimallashtirish seriyasining ikkinchi qismi, birinchisi, eslatib o'taman, unga bag'ishlangan.

Audio fayllar, qoida tariqasida, eng ko'p egallaydi, ba'zan har bir kompozitsiyaning hajmi o'rtacha 3-5 megabaytga etadi. Mobil telefon xotirasidagi bunday hajmlar isrofgarchilikdir.

Eng mashhur format hali ham mp3, ammo kodlashning "samaradorligi" nuqtai nazaridan u idealdan uzoqdir. Bir muqobil AAC, mp3 bilan solishtirganda, u o'xshash fayl hajmi bilan yuqori sifatli ishlab chiqarishga qodir.

Amalda, bu audio fayllarni o'rtacha hajmi 1,5-2 Mb ga siqish imkonini beradi, ular asl nusxadan bir oz farq qiladi. Ushbu maqola foobar2000 yordamida audio fayllarni AAC formatiga aylantirish bo'yicha qo'llanmani taqdim etadi.

Kengaytirilgan audio kodlash (AAC)

Bu 8 dan 96 kHz gacha bo'lgan namuna olish tezligida 1 dan 48 gacha kanallarni qo'llab-quvvatlaydigan keng polosali audio kodlash algoritmidir. AAC bir nechta kodlash/dekodlash davrlaridan foydalangan holda yuqori sifatli kodlash uchun mono nutq uchun 8 kbps dan har bir kanal uchun tasavvur qilib bo'lmaydigan 160 kbps gacha bit tezligida ishlaydi.

Format bir nechta kompaniyalar tomonidan birgalikda ishlab chiqilgan: AT&T Bell Laboratories, Fraunhofer IIS, Dolby Laboratories, Sony Corporation va Nokia. AAC formati patent egalari tomonidan faol ravishda targ'ib qilinadi. Birinchi navbatda rahmat mobil qurilmalar ushbu format uchun apparat ta'minoti mavjud. Telefonlarning joylashishini eslab qolishingiz mumkin Sony Ericsson Walkman seriyasi ovoz sifatini qadrlaydigan odamlar uchun mo'ljallangan. Ushbu format iTunes onlayn-do'konida va boshqa ko'plab ommaviy axborot vositalari bilan bog'liq sohalarda ham qo'llaniladi.

AAC ning asosiy afzalliklari

  • 48 tagacha audio kanal;
  • B O Doimiy va o'zgaruvchan bit tezligi bilan yuqori kodlash samaradorligi;
  • 8 Gts dan 96 kHz gacha bo'lgan namuna olish tezligi (MP3: 8 Gts - 48 kHz);
    Ko'proq moslashuvchan Joint stereo rejimi.

AAC kodlash

Buning uchun dasturdan foydalanamiz


Foobar2000 minimalist va kengaytiriladigan interfeysga ega bo'lib, metama'lumotlarni qo'llab-quvvatlash uchun ko'plab xususiyatlarni o'z ichiga oladi yuqori sifatli ijro audio. Rasmiy komponentlar ham mavjud va
keng ko'lamli qo'shimcha funktsiyalarga ega uchinchi tomon komponentlari.

Foobar 2000 ning asosiy xususiyatlari

  • Qo'llab-quvvatlanadigan audio formatlari: MP3, MP4, AAC, Vorbis, FLAC, WAV, Audio CD va boshqalar;
  • Unicode to'liq qo'llab-quvvatlash;
  • Ovozni tenglashtirish (ReplayGain);
  • Oson sozlanishi interfeys dizayni;
  • Teglar (teglar) bilan ishlash uchun kengaytirilgan xususiyatlar;
  • Audio CDni yirtib tashlashni qo'llab-quvvatlash, shuningdek komponent konvertori yordamida barcha qo'llab-quvvatlanadigan audio formatlarni transkodlash;
  • ReplayGain-ni to'liq qo'llab-quvvatlash;
  • Uchinchi tomon ishlab chiquvchilari pleerning funksionalligini kengaytirish imkonini beruvchi ochiq arxitektura.
Operatsion tizim
Windows XP - SP2 yoki undan yuqori, Vista, Seven.

Ishlash uchun siz ofisdan foobar 2000 ning so'nggi barqaror versiyasini yuklab olishingiz kerak. sayt. U erda siz qo'shimcha komponentlar va plaginlarni ham yuklab olishingiz mumkin. Foobar2000 audio fayllarni AAC formatida kodlay olishi uchun siz ushbu bepul kodekni yuklab olishingiz va uni dasturning o'zi fayllari joylashgan papkaga joylashtirishingiz kerak.

Kodekni ofisdan yuklab olishingiz mumkin. dasturchilar saytlari. Ikkita mashhur alternativa mavjud - Neronning AAC kodek yoki Apple QuickTime AAC.

Professional forumlarda uzoq vaqt davomida qizg'in munozaralar bo'lib o'tdi, ular AAC kodeklari yaxshiroq, ular ko'pincha Neron halqasidagi psixoakustik algoritmlar yaxshiroq amalga oshirilishiga rozi bo'lishadi. Ushbu maqola uchun Nero-dan (neroAacEnc.exe) kodek tanlangan, kodlash texnologiyasini o'zlashtirganingizdan so'ng, siz QT AAC (qaac.exe) bilan tanishishingiz mumkin bo'ladi.

foobar2000 ni ishga tushiring, o'zgartiriladigan faylni oching (Fayl - Ochish ...). Chiziqni tanlang, ochiladigan ro'yxatdan konvertatsiya qilish elementini tanlang.


Bizni Chiqish formati elementi qiziqtiradi.


Quyidagi oyna ochiladi


O'rnatish menyusini aylantirish


Yarim avtomatik sozlash rejimini ishga tushirish uchun AAC (Nero) elementiga o'ting va Edit tugmasini bosing.


Ushbu menyuda siz AAC kodlovchisi (Encoder) - kodlash rejimi (Rejim) va bit tezligi (Sifat) uchun parametrlarni o'rnatishingiz mumkin. Ko'pchilik samarali rejim o'zgaruvchan bit tezligi bilan - foobar2000 bizga tavsiya qiladigan VBR. Sifat bizga chiqish faylining sifatini aniqlash imkonini beradi - bit tezligi qanchalik yuqori bo'lsa, u kilobit / s bilan o'lchanadi, yakuniy audio faylning sifati va uning hajmi shunchalik yuqori bo'ladi.
Bu erda siz sifat va o'lcham o'rtasida murosani topishingiz kerak. Buni faqat eksperimental tarzda aniqlash mumkin. O'z tajribamdan shuni aytishim mumkin
mobil telefon uchun 23 dan 30 gacha bo'lgan q ko'p musiqa fayllari uchun juda etarli.Bularning barchasi musiqiy kompozitsiyaning murakkabligiga bog'liq.

Sozlamalardan chiqing - OK, keyin Orqaga va nihoyat, Konvertatsiya tugmasini bosing. Yo'qotilgan formatga kodlash haqida ogohlantiruvchi oyna paydo bo'ladi.


Kelajakda ushbu aac faylini o'ynatish rejalashtirilgan Uyali telefon, keyin sifatning ma'lum bir pasayishi muqarrar jarayondir. Biz kodlashni boshlashga rozimiz.


Bir necha daqiqadan so'ng, agar hamma narsa to'g'ri bajarilgan bo'lsa, konteynerdagi m4a - aac kengaytmali fayl yaratiladi. Ushbu fayl telefonda hech qanday muammosiz o'ynashi kerak, lekin agar modelingiz faylni o'ynatishdan bosh tortsa, siz shunchaki kengaytmani o'zgartirishga urinib ko'rishingiz mumkin. .m4a ustida .aac.

Bundan tashqari, qo'shimcha buyruqlar mavjud bo'lib, ular sizga ko'proq narsani bajarishga imkon beradi puxta sozlash kodek.

VBR rejimida kodlashda eng muhimini ko'rib chiqing

- e'tiborsiz uzunlik- fayl davomiyligini e'tiborsiz qoldiring, afzalroq foydalaning.

-q- tovush sifatini o'rnatadi, 0 - minimal sifat, 1 - maksimal. Ko'rib chiqilgan AAC profilidan foydalanib, tegishli bit tezligi qiymatini aniqlashingiz mumkin.

Qolgan buyruqlar quyidagi misoldan ko'chirilishi mumkin.

Kalitlarni kiritish uchun siz foobar2000 da yangi profil yaratishingiz kerak. Buni amalga oshirish uchun O'rnatishni aylantirish menyusida bosing Yangi qo'shish va qadriyatlarimizni belgilang.


Kalitlar ma'lum bir ketma-ketlikda borishi kerak.

Yaroqli qatorga misol:-e'tibor bermaslik -q 0,52 -agar - -of% d

HE-AAC va HE-AACv2 kabi formatlarning xilma-xilligi mavjud - bu formatlar AAC kodek ultra past bit tezligi uchun maxsus algoritmlardan foydalanishini bildiradi. Gap shundaki, AAC kodekining o'zi optimal kodlash rejimini tanlaydi, shuning uchun -lc, -he va -hev2 kalitlaridan foydalanishning hojati yo'q.

Dasturda audio faylning qabul qilingan xususiyatlarini ko'rishingiz mumkin

Bugungi kunga kelib, AAC formati audio tashuvchilarda ommaviy tarqatishga hali etib bormadi, lekin bir qator parametrlar bo'yicha u barcha mavjud audio siqish turlaridan ustundir, ya'ni u bizning e'tiborimizga loyiqdir.

Bu nima?

Ta'rifdan boshlaylik: AAC - bu audio faylni siqishning xususiy (xususiy) usuli. Shu bilan birga, u bir xil bit tezligi sharoitida MP3 bilan solishtirganda kodlash paytida kamroq sifat yo'qotadi. Bundan tashqari, AAC formati keng polosali audio kodlash algoritmi bo'lib, yuqori sifatli raqamli audioni uzatish uchun zarur bo'lgan ma'lumotlar miqdorini sezilarli darajada kamaytirish uchun ikkita asosiy kodlash tamoyilidan foydalanadi. Ushbu yechim yo'qolgan siqishni texnologiyasidan foydalangan holda amalga oshirilgan eng yuqori sifatlardan biri sifatida tan olingan. Format ko'pgina zamonaviy jihozlarni, hatto portativ qurilmalarni ham qo'llab-quvvatlaydi. Shuni ta'kidlash kerakki, AAC ringtonlarini sotib olish mumkin iTunes do'koni, va bu do'konda musiqa taqdim etiladi, faqat yordamida siqilgan bu qaror... Shuni ham aytish kerakki, AAC formati dastlab MP3 ning vorisi sifatida yaratilgan bo'lib, kodlash sifatini yaxshilash imkonini beradi. Yechim 1997 yilda MPEG-2 oilasining yangi, 7-chi qismi sifatida nashr etilgan.

Ish printsipi

Kodlashda bu format quyidagi jarayonlar amalga oshiriladi: sezilmaydigan komponentlar signaldan chiqariladi, kodlangan ovozli signal ortiqchalikdan tozalanadi. Shundan so'ng, ma'lumotlar murakkabligi bo'yicha MDCT usuliga muvofiq qayta ishlanadi. Keyingi bosqichda har xil tuzatish uchun kodlar qo'shiladi ichki xatolar... Nihoyat, signal uzatiladi yoki saqlanadi.

Barcha tafsilotlar

Qizig'i shundaki, AAC formati 8-96 kHz oralig'ida namuna olish tezligiga, shuningdek, 1-48 oralig'idagi kanallar soniga ega. MP3 gibrid filtr to'plamidan foydalanadi. O'z navbatida, AAC 2048 nuqtaga yetadigan kattalashtirilgan oyna o'lchamidagi o'zgartirilgan diskret kosinus transformatsiyasiga ishora qiladi.

Shunday qilib, AAC MP3 ga qaraganda murakkab impulslar oqimi va kvadrat to'lqinli signallarga ega bo'lgan audio kodlash uchun ancha mos keladi. Format MDCT bloklari uzunligini 2048-256 ball oralig'ida dinamik ravishda almashtirish qobiliyatiga ega bo'ldi. Qisqa yoki yagona o'zgarish bo'lsa, eng yaxshi piksellar sonini olish uchun 256 balldan iborat kichik "oyna" qo'llaniladi. Bu kodlash samaradorligini oshirish uchun sukut bo'yicha 2048 nuqtali katta "oyna" dan foydalanadi. AAC an'anaviy MP3 ga nisbatan bir qator afzalliklarga ega. Ular orasida shuni ta'kidlash kerak: amalga oshirish katta raqam audio kanallar (48 gacha), doimiy va o'zgaruvchan bit tezligi sharoitida muhim kodlash samaradorligi, shuningdek 8 Gts dan 96 kHz gacha bo'lgan namuna olish tezligi (MP3 uchun bu ko'rsatkich 8 Gts dan 48 kHz gacha) va yanada moslashuvchan. Qo'shma stereo deb nomlangan maxsus rejim. Yechimga kelsak, "AAS +" - bu past bit tezligi bilan ishlashga qaratilgan kodek. Bu SBR va AAC LC ning kombinatsiyasi bo'lib, buning natijasida 32-48 kbps diapazonida yaxshi ovozga erishiladi.

2009-09-30 20:52

2009-09-30 20:52

Audiofillar uchun dasturiy ta'minot

Ovozni siqish uchun psixoakustik niqobni qo'llash haqidagi birinchi g'oyalar 1979 yilga borib taqaladi. Biroq, tegishli audiokoderlar faqat 90-yillarning o'rtalaridan boshlab, hisoblash quvvati paydo bo'lganda keng tarqala boshladi. shaxsiy kompyuterlar siqilgan audioni real vaqtda ijro etish uchun yetarli bo‘ldi va MP3 nomi bilan mashhur bo‘lgan MPEG-1 Audio Layer 3 standarti paydo bo‘ldi. Siqilgan audio formatlari 128 kbps dan yuqori bit tezligida "deyarli shaffof" stereo tovush sifatini (ya'ni, kodlangan signalni ko'pchilik tinglovchilar uchun asl nusxadan ajratib bo'lmaydi) ta'minlab, ovozni Internet orqali uzatish uchun ajralmas bo'lib qoldi. MP3 formatining asosiy tamoyillarini K. Glasmanning (2 ... 8/2005) maqolalarida topish mumkin.

Ma'lumotlarni siqish va psixoakustika usullarining rivojlanishi asta-sekin MP3 standartining audio kodlashda yangi g'oyalarni amalga oshirish uchun "qattiq" bo'lishiga olib keldi. Natijada, 1997 yilga kelib, 90-yillarning boshlarida MP3-ni yaratgan Fraunhofer IIS, shuningdek Dolby, AT&T, Sony va Nokia ishlab chiqildi. yangi usul audio siqish - Kengaytirilgan audio kodlash (AAC), MPEG-2 va MPEG-4 standartlariga kiritilgan. MP3 standartidan asosiy farqlar:

  • kengroq formatlar diapazonini (48 kanalgacha) va audio namuna olish tezligini (8 kHz dan 96 kHz gacha) qo'llab-quvvatlash;
  • yanada samarali va sodda filtrlar banki: gibrid MP3 filtrlar banki an'anaviy MDCT (Modified Discrete Cosine Transform) bilan almashtirildi;
  • filtrlar bankida vaqt-chastota ruxsatini o'zgartirishning kengroq diapazonlari - sakkiz marta (MP3 formatida - uch marta) - audio signalning o'tish (o'tish) va statsionar bo'limlarini kodlashning yaxshilanishiga olib keldi;
  • 16 kHz dan yuqori chastotalarni yaxshiroq kodlash;
  • turli chastota diapazonlarida mustaqil ravishda M / S ("qo'shma stereo") rejimiga o'tish imkonini beruvchi yanada moslashuvchan stereo kodlash rejimi;
  • siqishni samaradorligini oshiradigan standartning qo'shimcha xususiyatlari: vaqt sohasida shovqinni shakllantirish texnologiyasi (TNS), vaqt bo'yicha MDCT koeffitsientlarini bashorat qilish (uzoq muddatli bashorat), parametrik stereo kodlash rejimi, shovqin sintezi (idrok shovqinini almashtirish), yuqori. chastotalar (SBR).

Ushbu xususiyatlar tufayli AAC standarti yanada moslashuvchan va samarali va shuning uchun yanada sifatli audio kodlashga erisha oladi. MP3 formatining keng qo'llanilishi natijasida AAC standarti hali MP3 formati bilan taqqoslanadigan mashhurlikka ega emas. Shunga qaramay, AAC mashhur iTunes do'konidagi asosiy format, iPod, iTunes, iPhone telefoni, PlayStation 3, Nintendo Wii va DAB + / DRM raqamli radiosi.

Keling, AAC ning asosiy xususiyatlarini batafsil ko'rib chiqaylik.

Filtr banki

Boshqa psixoakustik audiokoderlar singari, AAC ham quyidagi tarzda ishlaydi. Kirish signali filtrlar banki orqali o'tkaziladi - signalni vaqt domenidan vaqt-chastota domeniga (spektrogramma qurishga o'xshash) o'zgartiruvchi transformatsiya. Bunga parallel ravishda, psixoakustik model signalni tahlil qiladi va psixoakustik niqoblash uchun chegaralarni aniqlaydi. Bundan tashqari, filtrlar bankining chiqishidagi signalning spektral koeffitsientlari kvantlangan bo'lib, shovqin spektri, agar iloji bo'lsa (agar bit tezligi imkon bersa) niqoblash chegaralaridan past bo'ladi va eshitilmaydi. Kvantlangan koeffitsientlar yo'qotishsiz AAC chiqish fayliga siqiladi. Shunday qilib, filtr bankining o'zi signalni siqmaydi, faqat uni siqish uchun qulayroq shaklga aylantiradi.

Har bir filtrlar bankining o'ziga xos xususiyati uning chastota o'lchamlari, ya'ni signal spektrini ajratadigan chastota diapazonlari soni. Ovozni siqish uchun ishlatiladigan filtrlarning aksariyat banklari bir necha yuz diapazonga ega. Bu shuni anglatadiki, noaniqlik munosabati tufayli bunday filtr banklari bir necha o'nlab millisekundlar tartibidagi vaqtinchalik ruxsatga ega. Signalning spektral koeffitsientlari kvantlanganda signalni dekodlashda kiritilgan kvantlash xatosi vaqt o'tishi bilan filtr bank oynasining butun uzunligi bo'ylab tarqaladi. Ba'zi hollarda, bu pre-echo deb ataladigan kiruvchi ta'sirga olib keladi. O'tkinchidan kvantlash xatosi (signaldagi energiyaning keskin portlashi) o'tkinchidan oldingi vaqt segmentiga vaqt o'tishi bilan tarqalib, eshitilishi mumkin bo'lganda o'zini namoyon qiladi (1-rasm). Ushbu ta'sirni kamaytirish uchun o'zgaruvchan vaqt chastotasi ruxsatiga ega filtr banklari qo'llaniladi. Masalan, MP3 26 dan 9 ms gacha bo'lgan vaqtinchalik ruxsatni almashtirish filtri bankidan foydalanadi. Statsionar signallar uchun 26 ms uzunlikdagi oynalar yaxshi chastotali rezolyutsiyani beradi va o'tish davri uchun 9 ms uzunlikdagi oynalar ishlatiladi, bu esa aks-sadodan oldingi effektni kamaytiradi (1-rasmga qarang).

AAC algoritmi MDCT oyna o'lchamini almashtirishdan ham foydalanadi. Deraza o'lchamidagi farq sakkiz baravar: 6 va 48 ms (256 va 2048 namunalar). Bu algoritmga kengroq signal diapazoniga moslashish va yaxshi siqilishga erishish imkonini beradi.

TNS texnologiyasi - amplituda shovqin konvertini shakllantirish

Zamonaviy psixoakustik audio signal enkoderlarining muammolaridan biri bu vaqtinchalik jarayonlar (audio signalidagi vaqtinchalik jarayonlar) bilan ishlashdir. Shaffof kodlashni ta'minlash uchun kvantlash shovqini vaqtga bog'liq bo'lgan niqoblash chegarasidan pastga tushishini ta'minlash kerak. Biroq, amalda, bu talabni o'tkinchi davrlar yaqinida qondirish qiyin, chunki kodlash paytida hosil bo'lgan kvantlash shovqini MDCT oynasining butun uzunligi bo'ylab dekodlash vaqtida o'z vaqtida tarqaladi. Bu vaqtni niqoblash chegaralarida kvantlash shovqinining sezilarli darajada oshishiga olib kelishi mumkin.

AAC TNS (vaqtinchalik shovqinni shakllantirish) texnologiyasi har bir MDCT oynasida vaqt ajratuvchi shovqinning tarqalishini nazorat qiladi. TNS texnologiyasi signalning amplitudali konverti va uning spektri konvertining o'xshashligiga (vaqt-chastota dualizmiga), shuningdek spektrni kvantlashda chastotada chiziqli bashoratdan (LPC) foydalanishga asoslangan.

Ma'lumki, spektri oq rangdan (masalan, ohanglar) juda farq qiladigan signallar uchun vaqt sohasida chiziqli bashorat qilish (LPC) dan foydalanish spektrni samarali "oqlashi" va bunday signallarni ularni parchalash orqali kodlashi mumkin. bashorat qilish koeffitsientlari va amplituda nisbatan kichik. bashorat qilish xatosi (qoldiq). Dekodlashda chiziqli bashorat filtri asl signalning spektriga muvofiq xato spektrini hosil qiladi.

AAC kodlovchisida chiziqli bashorat teskari yo'l bilan qo'llaniladi: chastota domenidagi spektr namunalarini bashorat qilish uchun. Dastlabki va bashorat qilingan MDCT koeffitsientlari o'rtasidagi farq niqoblash chegaralariga ko'ra kvantlanadi (an'anaviy enkoderlarda asl MDCT koeffitsientlari kvantlangan). Chiziqli bashorat koeffitsientlari ham chiqish fayliga yoziladi. Signalni dekodlashda chastota zonasidagi qoldiq signalga qo'llaniladigan chiziqli bashorat qilish filtri (shu jumladan kvantlash xatosi) vaqt sohasida asl signalning amplituda konvertini (va kvantlash xatolarini) hosil qiladi. Shunday qilib, kvantlash xatolarining amplitudali konverti dastlabki signalning amplituda konvertiga yaqinlashadi (2-rasm).

TNS texnologiyasi tovush ishlab chiqarishning impulsiv xarakteriga ega bo'lgan ba'zi garmonik signallarda (nutq, ba'zi shamol va kamon torli asboblar) pre-echo effektini va kvantlash xatolarining ko'rinishini kamaytiradi. Shaklda. 2 bir xil bit tezligi bilan AAC va MP3 algoritmlari tomonidan ovozli signalga kiritilgan kvantlash xatolarini taqqoslaydi. Kvantlash xatosining umumiy kamayishi bilan birga (AAC ning yuqori samaradorligi tufayli) dastlabki signalning konvertiga muvofiq vaqtni kvantlash xatosining amplitudali konvertining shakllanishi kuzatiladi.

AAC standartida TNS spektrning individual chastota diapazonlariga mustaqil ravishda qo'llanilishi yoki umuman o'chirilishi mumkin.

SBR texnologiyasi - yuqori chastotali tiklash

Keng chastota diapazonining ishonchli uzatilishi sifatli kodlashning muhim talabidir. Biroq, audio diapazonning har bir keyingi oktavasining uzatilishi an'anaviy audio kodlovchi uchun bit tezligi talablarini bir yarim-ikki baravar oshiradi. Saqlashda bit tezligini pasaytirish uchun yuqori chastotalar kodlangan materialda yuqori chastotali SBR (spektral tarmoqli replikatsiyasi) ni sun'iy sintez qilish texnologiyasi yaratildi.

Texnologiya bizning eshitishimiz yuqori chastotalarni o'rta va past chastotalarga qaraganda kamroq aniqlik bilan tahlil qilishiga asoslanadi. Yuqori chastotalar mavjudligi effektini yaratish uchun to'lqin shaklini matematik jihatdan aniq qayta qurish shart emas, faqat yuqori chastotalarda signalning ba'zi muhim psixoakustik parametrlarini tiklash kifoya. Ushbu muhim parametrlarga signal energiyasining vaqt-chastota taqsimoti (konvert) va uning tonallik / shovqin darajasi kiradi.

Algoritmning g'oyasi quyidagicha. Kodlashda yuqori chastotalar asl audio signalida tahlil qilinadi va ularning parametrlari chiqariladi: birinchi navbatda, bir nechta (odatda sakkizta) chastota diapazonidagi amplituda konvert. Keyin yuqori chastotalar yozuvdan olib tashlanadi va faqat qolgan past va o'rta chastotalar kodlanadi. Shu bilan birga, chiqish fayliga yo'qolgan yuqori chastotalar parametrlari haqida nisbatan kichik ma'lumotlar oqimi ham qo'shiladi.

Ijro paytida, avval bosh va o'rta chastotalar dekodlanadi. Keyin (agar pleerda mavjud bo'lsa) SBR dekoderi ishlay boshlaydi. Birinchi bosqichda u mavjud o'rta chastotalarning transpozitsiyasi (aniqrog'i, chastota siljishi) orqali yuqori chastotali signalni sintez qiladi. O'rta va yuqori chastotalarda spektrdagi tonallik / shovqin darajasi taxminan teng bo'lganligi sababli, bu bosqich ishonchli spektr tuzilishiga ega bo'lgan yuqori chastotali signalga olib keladi. Ikkinchi bosqichda SBR dekoderi har bir chastota diapazonida kerakli amplituda konvertni berish uchun yuqori chastotalar haqidagi qo'shimcha saqlangan ma'lumotlardan foydalanadi. Natijada yuqori chastotalar o'rtalardan to'liq sintez qilingan signal bo'lib, asl yuqori chastotalarni saqlab qoladi.

SBR texnologiyasi ko'plab mavjud audio kodlash usullariga moslashtirilishi mumkin. Masalan, MP3 bilan birlashtirilgan SBR MP3 PRO, AAC bilan birlashtirilgan SBR esa HE-AAC (yuqori samarali AAC) deb ataladi. Asosan, SBR nisbatan past bit tezligida kodlash uchun ishlatiladi: 64 kbps va undan past. Texnologiya bit tezligini minimal oshirish (bir necha kbps) bilan audio signalning chastota diapazonini sezilarli darajada kengaytirish imkonini beradi.

Parametrik stereo texnologiyasi

Stereo signalni uzatish, odatda, mono signalni uzatishdan 2 baravar ko'proq bit tezligini etkazib berish uchun kodlovchini talab qiladi. Bunday holda, stereo kanallar mustaqil ravishda ham, M / S konvertatsiyasidan keyin ham kodlanishi mumkin. Ikkinchi holda, S-kanalda M-kanalga qaraganda pastroq bit tezligi ko'pincha sarflanadi. Ushbu kodlash rejimi qo'shma stereo deb ham ataladi. AAC standartida ushbu rejim har bir chastota diapazoni uchun enkoder tomonidan mustaqil ravishda yoqilishi va o'chirilishi mumkin.

Stereo signallarni juda past bit tezligida (16 ... 32 kbit / s) yanada samarali kodlash uchun parametrik stereo kodlash texnologiyasi ishlab chiqilgan. Bu shuni anglatadiki, kodlashdan oldin stereo signal monoga kamayadi, lekin asl stereo faylning stereo panoramasi haqida ma'lumotni o'z ichiga olgan chiqish fayliga kichik oqim (2 ... 3 kbps) qo'shiladi. Ushbu oqim vaqt chastotasi tekisligi uchun (siqilgan shaklda) o'ziga xos "panorama xaritasi" ni o'z ichiga oladi.

Dekodlash bosqichida qabul qilingan mono signalga chastotaga bog'liq panorama qo'llaniladi. Buni chap va o'ng kanallarning dastlab teng bo'lgan MDCT koeffitsientlariga tegishli amplitudali omillarni qo'llash orqali dekodlash bilan bir vaqtda amalga oshirish mumkin.

Parametrik stereo texnologiya mono kodlash bilan solishtirganda bit tezligining ozgina oshishi hisobiga tovushning asl stereo panoramasi haqida yaxshi taassurot qoldiradi. Biroq, bu sizga to'liq shaffof ovozga erishishga imkon bermaydi, chunki u stereo panoramaning barcha nuanslarini, masalan, stereo kanallar orasidagi faza almashinuvini hisobga olmaydi.

Parametrik stereo texnologiya HE-AAC v2 ga kiritilgan.

PNS texnologiyasi - shovqin hosil qilish

Shovqin signallarini kodlash samaradorligini yanada oshirish uchun AAC standarti shovqin sintezi uchun pertseptiv shovqinlarni almashtirish (PNS) texnologiyasini taqdim etadi. Ma'lumki, bizning qulog'imiz faza spektriga qaraganda signalning amplituda spektriga ko'proq sezgir. Shuning uchun, shovqin hududlarida dastlabki signalning MDCT koeffitsientlarini kodlash o'rniga, faqat shovqin parametrlarini uzatish mumkin: chastota va vaqt funktsiyasi sifatida uning kuchi.

PNS texnologiyasi shunday ishlaydi. Kodlash jarayonida shovqin bo'lgan spektrning qismlari aniqlanadi va MDCT koeffitsientlarining tegishli guruhlari kodlash jarayonidan chiqarib tashlanadi. Chastota diapazoni shovqin sifatida belgilanadi va uning uchun umumiy shovqin energiyasi saqlanadi.

Dekodlash vaqtida kerakli umumiy quvvatga ega psevdo-tasodifiy MDCT koeffitsientlari shovqin sifatida belgilangan chastota diapazonlariga almashtiriladi. Natijada, ko'rsatilgan chastota diapazonlari tovush jihatidan asl shovqinga o'xshash shovqin sintezlanadi.

Uzoq muddatli bashorat qilish texnologiyasi - vaqtni bashorat qilish

Ohanglarni psixoakustik kodlash shovqin signallarini kodlashdan (masalan, mos ravishda 20 dB va 6 dB) nisbatan yuqori mahalliy signal-shovqin nisbatini talab qiladi. Va bu, o'z navbatida, yuqori bit tezligini talab qiladi. Biroq, ohanglarning MDCT koeffitsientlari vaqt o'tishi bilan bashorat qilinadi. Bu holat bit tezligini kamaytirish uchun ularning vaqtga bog'liqligidan foydalanishga imkon beradi.

AAC standarti uzoq muddatli bashorat qilish rejimini taqdim etadi, bunda MDCT koeffitsientlari chiziqli bashorat yordamida qo'shimcha ravishda vaqt bilan kodlanadi. "Uzoq muddatli" atamasi bashorat qo'shni namunalar tomonidan emas, balki ma'lum chastotadagi ohangning eng ehtimoliy davrida joylashgan namunalar tomonidan amalga oshirilishini anglatadi.

MDCT koeffitsientlarini kvantlash va siqish

MP3 standartiga o'xshab, AAC MDCT koeffitsientlarini chiziqli bo'lmagan kvantlash va ularni Huffman usuli bilan siqishdan foydalanadi. MDCT koeffitsientlari 0,75 quvvatga ko'tarilgandan so'ng kvantlanadi, bu esa har bir chastota diapazoni ichida kuchli signallar uchun kvantlash xatosini oshirish va zaif signallar uchun kamaytirish imkonini beradi. Shunday qilib, shovqin spektrining qo'shimcha yashirin shakllantirilishi amalga oshiriladi.

Kvantlashdan so'ng, MDCT koeffitsientlari qat'iy Huffman jadvallari to'plami yordamida siqiladi. AAC standartida bu jadvallar MP3 ga qaraganda ko'proq va koeffitsientlarni guruhlash imkoniyatlari kengroq. Bu siqilishning qo'shimcha kuchayishiga olib keladi.

Ovoz sifati

Ovozli kodlovchilarning ovoz sifatini baholashda odatda sub'ektiv testlar qo'llaniladi. Tinglovchilarga turli enkoderlar tomonidan siqilgan yozuvlar bo'laklari taqdim etiladi va ular har bir fragmentning tovush tozaligini 1 dan 5 gacha bo'lgan shkalada baholaydilar. berilgan bit tezligi.

Bunday testlar natijalari berilgan juda nufuzli Internet manbasi http://www.rjamorim.com/test/ sayti bo'lib, u turli bit tezligida turli kodeklarning sinovlarini taqdim etadi. Umuman olganda, yuqoridagi natijalar boshqa manbalar bilan yaxshi mos keladi. MP3 va AAC kodlovchilarining sifatini solishtirishga yordam beradigan ba'zi natijalar.

Eng yaxshi MP3 kodlovchisi bepul Lame hisoblanadi. Biroq, ko'p bit tezligida u sifat jihatidan yangi siqish standartlariga qaraganda pastroq. Yuqori bit tezligida (128 kbps dan yuqori) bu kechikish kichik va etakchi Ogg Vorbis kodlovchisidir.

64 kbps tezlikda AAC ning afzalligi allaqachon sezilarli bo'lib bormoqda. HE-AAC variantida algoritm 3,68 ball oladi. Bu taxminan 96 kbps bit tezligiga ega Lame-ga to'g'ri keladi va AAC MP3 dan taxminan 1,5 baravar ustunlikka ega ekanligini anglatadi. 128 kbps bilan oqsoq ball 4,29 ni tashkil qiladi.

32 kbps tezlikda Nero'dan AAC kodlovchisi MP3 bilan solishtirganda sifat jihatidan jiddiy g'alaba qozonadi: mos ravishda 3,23 va 1,72 baholar. Biroq, AAC MP3PRO ning 3.08 reytingidan biroz oldinda. Bu shuni ko'rsatadiki, SBR texnologiyasi haqiqatan ham past bit tezligida sifatni sezilarli darajada yaxshilaydi.

xulosalar

AAC standartida qo'llaniladigan yangi texnologiyalar tufayli ushbu format MPEG-1 Layer 3 (MP3) dan sezilarli ustunlikka ega bo'lib, sizga erishishga imkon beradi. eng yaxshi sifat bir xil bit tezligida ovoz. Past bit tezligi sohasida ayniqsa kuchli o'sish kuzatiladi: 96 kbps va undan past. Bu raqamli eshittirish uchun AAC formatining va'dasini tasdiqlaydi.

Bugungi kunda Internetda musiqa tarqatish uchun AAC mashhurligi MP3 formatiga nisbatan pastligicha qolmoqda. Foydalanuvchilar kuchliroq AAC siqishdan ko'ra yaxshiroq MP3 portativligini afzal ko'rishda davom etmoqdalar. Musiqa tarqatish saytlaridagi musiqa arxivlarining aksariyati allaqachon MP3 formatida va provayderlar siqilmagan yozuvlarga kirish imkoniga ega emaslar. Bu shuni anglatadiki, bunday yozuvlarni AAC formatiga qayta kodlashning ma'nosi yo'q - sifat ko'pincha allaqachon yo'qoladi. Biroq, yangi cho'ntak o'yinchilari va ba'zi onlayn-do'konlar allaqachon AAC formatini qo'llab-quvvatlamoqda, ko'pincha kontentning qonuniyligini tekshirish (bu musiqani nusxalash bilan cheklanmaslikni afzal ko'rgan foydalanuvchilarni ham qo'rqitadi).

Juda istiqbolli bo'lsa-da, AAC yagona yuqori sifatli audio siqish formati emas. Yuqori bit tezligida (128 kbps dan yuqori) AAC ko'pincha sifat jihatidan Ogg Vorbis va Musepack kodlovchilaridan past bo'ladi. Eng past bit tezligida (32 kbps dan kam) AAC parametrik audio kodlovchilardan, jumladan nutqni siqish uchun maxsus kodlovchilardan ham past bo'lishi mumkin. Biroq, AAC ning o'rta-past bit tezligi oralig'ida bu daqiqa kaftni ushlab turadi.

Aleksey Lukin
"Ovoz muhandisi" jurnali 2008 yil №1

Ikkala format ham bir xil konteynerdan foydalanadi, ammo ALAC bilan hech qanday ma'lumot yo'qolmaydi.

AAC (Advanced Audio Coding) dastlab kodlash sifati yaxshilangan MP3 ning vorisi sifatida yaratilgan. Rasmiy ravishda ISO / IEC 13818-7 nomi bilan tanilgan AAC formati 1997 yilda MPEG-2 oilasining yangi, ettinchi qismi sifatida chiqarilgan. MPEG-4 3-qism deb nomlanuvchi AAC formati ham mavjud.

AAC qanday ishlaydi

  1. Odamlar tomonidan sezilmaydigan signal komponentlari olib tashlanadi.
  2. Kodlangan audio signaldagi ortiqchalikni olib tashlaydi.
  3. Keyin signal murakkabligiga qarab MDCT usuli bo'yicha qayta ishlanadi.
  4. Ichki xatolarni tuzatish kodlari qo'shiladi.
  5. Signal saqlanadi yoki uzatiladi.
  • .m4a - standart kengaytma;
  • .m4b - xatcho'plarni qo'llab-quvvatlaydigan AAC fayli; audiokitoblar va podkastlar uchun ishlatiladi;
  • .m4p - himoyalangan AAC fayli; iTunes Store kabi onlayn-do'konlardan mualliflik huquqi bilan himoyalangan musiqalarni qonuniy ravishda yuklab olishda faylni nusxalashdan himoya qilish uchun foydalaniladi;
  • .m4r Apple iPhone tomonidan ishlatiladigan rington faylidir.

Shuningdek qarang

“Kengaytirilgan audio kodlash” mavzusiga sharh yozing

Eslatmalar (tahrirlash)