MP3
From Wikipedia, the free encyclopedia
Remove ads
MPEG-1 alebo MPEG-2 Audio Layer III,[4] najviac známy ako MP3 je patentovaný dekódovací formát stratovej kompresie digitálneho zvuku, založený na kompresnom algoritme definovanom skupinou MPEG (Motion Picture Experts Group). Je bežným zvukovým formátom pre streaming alebo ukladanie zvuku a takisto je de facto štandardom digitálnej zvukovej kompresie na prenos a prehrávanie hudby vo väčšine digitálnych hudobných prehrávačov.
MP3 súbor, ktorý je vytvorený s konštantnou bitovou rýchlosťou 128 kbit/s zaberá približne len jedenástinu toho, ako súbor rovnakého zvuku uložený v bezstratovom zvukovom formáte (zvyčajne pre CD vo formáte Waveform Audio File Format (WAV)). MP3 súbor je možné vytvoriť s vyššou alebo nižšou bitovou rýchlosťou, z čoho vyplýva aj vyššia alebo horšia kvalita. 128 kbit/s predstavuje stupeň kompresie, pri ktorej laik zvyčajne nerozpozná rozdiel či ide o komprimovaný formát mp3 alebo súbor uložený bez strát.
Jedným z najobľúbenejších a najpoužívanejších kodekov mp3 je LAME, ktorý je dostupný bezplatne.
Po uplynutí posledných ochranných patentov v Spojených štátoch v máji 2017 vývojári (Fraunhofer a Technicolor (predtým Thomson) ukončili licencovanie mp3[7] (v Európe bol MP3 od roku 2012 bez ochranných patentov). Teraz je čiastočne voľným štandardom. [8]
Remove ads
História
Bol vyvinutý v roku 1991 a vydaný ako súčasť štandardu ISO/IEC 11172-3 (MPEG-1 Part 3) v roku 1993. Rozšírenia o nižšie dátové toky a vzorkovacie frekvencie boli vydané ako súčasť štandardu ISO/IEC 13818-3 (MPEG-2 Part 3) v roku 1995.
O vývoj formátu MP3 sa zaslúžil nemecký vedec Karlheinz Brandenburg, riaditeľ pobočky Frauenhoferovho ústavu pre mediálnu komunikáciu v Erlangene, a jeho vedecký tím v snahe vytvoriť dátovo menej náročný štandard vhodný pre použitie pre digitálne rozhlasové vysielanie DAB.
Remove ads
Bitová rýchlosť
Ako štandard pre MPEG-1 Audio Layer III sú špecifikované tieto bitové rýchlosti (ang. bitrate): 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 a 320 kbit/s, s dostupnými vzorkovacími frekvenciami 32, 44,1 a 48 kHz.[9]
MPEG-2 Audio Layer III má prípustné bitové rýchlosti 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 kbit/s pri vzorkovacích frekvenciách 16, 22,05 a 24 kHz.
MPEG-2.5 Audio Layer III má obmedzené bitové rýchlosti 8, 16, 24, 32, 40, 48, 56 a 64 kbit/s pri vzorkovacích frekvenciách 8, 11,025, a 12 kHz.
Neštandardné bitové rýchlosti až do 640 kbit/s je možné dosiahnuť kodekom LAME, avšak viacero MP3 prehrávačov nedokážu tieto súbory prehrať. Podľa štandardu ISO sú dekodery schopné prehrať súbory s bitovou rýchlosťou do 320 kbit/s.[10]
CBR a VBR
CBR - konštantná (constant) bitová rýchlosť - nech už je signál akýkoľvek, stále bude zakódovaný pomocou konštantného počtu bitov: Pôvodné vyjadrenia o kvalite zrovnateľnej s audio CD už pri 128 kbps sa ukázali ako mierne prehnané a často je používaný vyššia rýchlosť.[15]
VBR - premenlivá (variable) bitová rýchlosť umožňuje podľa potreby meniť bitový tok v závislosti na kódovanom signále. Pokiaľ je napríklad na začiatku alebo na konci skladby ticho, bitová rýchlosť sa automaticky zníži podľa vopred daných kritérií a to umožní mierne zmenšenie výslednej veľkosti zakódovaného súboru. Nevýhodou však je, že VBR nie je podporovaný niektorými prenosnými prehrávačmi.[15]
Remove ads
Počet kvantizačných úrovní
Pretože sa digitálny signál zvyčajne spracováva na zariadeniach (obsahujúcich analógovo-digitálny prevodník alebo digitálno-analógový prevodník) pracujúcich v dvojkovej číselnej sústave, bývajú počty kvantizačných úrovní rovné N-tej mocnine čísla 2, pričom pôvodný signál potom možno vyjadriť v N bitoch.
N = 16 bitov (2 byty) alebo tzv. CD kvalita používa zvyčajná spotrebná audio elektroniku (vrátane MP3 prehrávačov) a umožňuje rozlíšiť 216 teda 65 536 úrovní a teoreticky je odstup signálu od kvantizačného šumu 96 dB. Dávnejšie sa ešte pri zázname zvuku na počítačoch z dôvodov malej kapacity záznamových zariadení používala 8 bitová kvantizacia (telefónna kvalita),. Naopak, v štúdiovom spracovaní sa dnes používa 20 alebo 24 bitov (16 777 216 úrovní) kvantizácia (DVD - 5.1 kanál).
Stereo mód[15]
- Joint stereo - pri tomto móde sa vychádza z predpokladu, že väčšinou je i pri stereo zázname obsah ľavého L a pravého R kanálu veľmi podobný a preto sa L a R kanály prevedú na stredový M=L+R a postranný S=L-R. Pri enkódovani sa potom viac bitov pridelí tomu stredovému, ktorý obsahuje dôležitejšie informácie. To umožňuje efektívne vylepšiť kvalitu kompresie. Pri prehrávaní sú potom spätne dopočítané pôvodné obsahy ľavého a pravého kanála. Všeobecne platí zásada, že joint stereo je vhodné použiť pri nízkych bitových rýchlostiach .
- Stereo - enkodér pracujúci v tomto móde nevyužíva možných podobností medzi ľavým a pravým kanálom. Môže však prideliť jednému z kanálov viac bitov z celkového bitového toku a to v prípade, že druhý kanál obsahuje napríklad ticho alebo menej náročný signál z hľadiska kódovania.
- Dual - každý kanál je kódovaný úplne samostatne a každému je pridelená presne polovina bitov. Použitie nachádza napríklad v jazykových aplikáciách (v jednom kanály angličtina, v druhom slovenčina).
- Mono - mono záznam obsahuje iba polovicu informácie a preto mu stačí polovičný bitrate ako stereu (dual).
Remove ads
ID3 a ďalšie tagy
"Tag" vo zvukovom súborovom formáte je jeho časť, ktorá obsahuje metadáta, ako sú názov skladby, meno interpreta skladby, žáner skladby, album, číslo skladby a ďalšie informácie o obsahu súboru. Od roku 2010 sú najrozšírenejšími tagovými formátmi ID3v1 a ID3v2 a nedávno uvedený formát APEv2. Tieto tagy sú normálne vložené buď na začiatku alebo na konci súboru MP3, ale oddelene od zvukových dát.
Softvéry na prehrávanie alebo úpravu často obsahujú aj funkciu na úpravu tagov, avšak existuje aj viacero samostatných aplikácií na úpravu tagov (tag editor) ako napríklad TagScanner určených iba na tento účel.
Remove ads
Psychoakustika
MP3 sa snaží odstrániť redundanciu zvukového signálu na základe psychoakustického modelu. Teda zo vstupného signálu sa odoberú informácie, ktoré človek nepočuje, alebo si ich neuvedomuje. Využíva sa princíp časového a frekvenčného maskovania. Kompresia zvuku podľa štandardu MPEG-1 obsahuje 3 vrstvy, ktoré sa líšia kvalitou a obtiažnosťou implementácie.
Referencie
Pozri aj
Iné projekty
Externé odkazy
Zdroj
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads
