影片壓縮標準 来自维基百科,自由的百科全书
H.264,又稱為MPEG-4第10部分,進階視訊編碼(英語:MPEG-4 Part 10, Advanced Video Coding,縮寫為MPEG-4 AVC)是一種面向塊,基於運動補償的視訊編碼標準 。到2014年,它已經成為高精度視訊錄製、壓縮和發布的最常用格式之一。第一版標準的最終草案於2003年5月完成。
H.264/AVC專案的目的是為了建立一個更佳的視訊壓縮標準,在更低的位元速率的情況下依然能夠提供良好視訊品質的標準(如,一半或者更少於MPEG-2,H.263,或者MPEG-4 Part2 )。同時,還要不會太大的增加設計的複雜性。H.264的另外一個目標是提供足夠的靈活性,以允許該標準能夠應用於各種各樣的網路和系統的各應用上,包括低和高位元速率,低和高解析度視訊,廣播,DVD儲存,RTP / IP分組網路和ITU-T多媒體電話系統。H.264標準可以被視為由多個不同的應用框架 / 設定檔(profiles)組成的「標準系列」。
H.264/MPEG-4 AVC是一種面向塊的基於運動補償的編解碼器標準。由ITU-T視訊編碼專家組與ISO/IEC聯合工作群組——即動態圖像專家組(MPEG)——聯合組成的聯合視訊組(JVT,Joint Video Team)開發。因ITU-T H.264標準和ISO/IEC MPEG-4 AVC標準(正式名稱是ISO/IEC 14496-10—MPEG-4第十部分,進階視訊編碼)有相同的技術內容,故被共同管理。
H.264因其是藍光碟片的其中一種編解碼標準而著名,所有藍光碟片播放器都必須能解碼H.264。它也被廣泛用於網路串流媒體資料如Vimeo、YouTube、以及iTunes Store,網路軟體如Adobe Flash Player和Microsoft Silverlight,以及各種高解析度電視無線電視(DVB-T、DVB-T2)、有線電視(DVB-C)以及衛星(DVB-S和DVB-S2)。
H.264/AVC專案是想建立一種視訊標準。與舊標準相比,它能夠在更低頻寬下提供優質視訊(換言之,只有MPEG-2,H.263或MPEG-4第2部分的一半頻寬或更少),也不增加太多設計複雜度使得無法實現或實現成本過高。另一目的是提供足夠的靈活性以在各種應用、網路及系統中使用,包括高、低頻寬,高、低視訊解析度,廣播,DVD儲存,RTP/IP網路,以及ITU-T多媒體電話系統。
H.264標準可以被看作一個「標準家族」,成員有下面描述的各種組態(profile)。一個特定的解碼器至少支援一種,但不必支援所有的。解碼器標準描述了它可以解碼哪些組態。
H.264的命名遵循了ITU-T的命名約定,它是VCEG視訊編碼標準H.26x線中的一員;MPEG-4 AVC的命名來自ISO/IEC MPEG的命名約定,它是ISO/IEC 14496的第10部分,該協定族被稱為MPEG-4。該標準是作為VCEG和MPEG的一部分開發的,此前在ITU-T作為VCEG的專案,叫做H.26L。所以常用於指代此標準的名稱有H.264/AVC,AVC/H.264,H.264/MPEG-4 AVC,或MPEG-4/H.264 AVC,以強調共同遺產。有時,也用「JVT編解碼」指代它,以指明是JVT(聯合開發組)組織開發的。(這種夥伴關係和多命名並不少見。例如,視訊編碼標準MPEG-2也出現在MPEG和ITU-T的夥伴關係中,MPEG-2視訊在ITU-T社群中稱作H.262。[1])一些軟體(如VLC media player)內部標識此標準為AVC1。
H.264/AVC標準化的第一個版本於2003年5月完成。在第一個擴充原始標準的專案中,JVT開發了高精度拓展(Fidelity Range Extensions,FRExt)。該拓展通過支援更高的像素精度(包括10位元和12位元像素精度)和支援更高的色度抽樣率(包括YUV 4:2:2和YUV 4:4:4)來支援更高精度的影片編碼。該拓展加入了一些新的特性(比如自適應的4x4和8x8的整數變換,使用者自訂量化加權矩陣,高效的訊框間無失真編碼,支援新增的色度空間和色度參差變換)。該拓展的設計於2004年7月完成,草案也於2004年9月完成。
對標準進一步的最新擴充包括:增加五個新的組態,主要用於專業應用;增加擴充全範圍(extended-gamut)色彩空間的支援;定義附加長寬比標識;定義「補充增強資訊」的兩個附加類型(濾波後提示和色調對映);以及廢棄一個根據產業回饋應該另行設計的早期FRExt組態。
接著加入標準的主要特性是可適應視訊編碼(Scalable Video Coding,SVC)。據H.264/AVC附件G,SVC允許碼流結構中包含遵循標準的子碼流,這種稱作「基礎層」的碼流要能夠為不支援SVC的H.264/AVC編解碼器所解碼。為達成在時間上的可適應性,在推導子碼流時,從碼流中移除了完整訪問單元(complete access unit)。這種情況下,要按相應方式來構造碼流中的高層語法和訊框間預測參考訊框。另一方面,為達成空間和品質的可適應性(換言之,低解析度/低品質作為子碼流而不是主碼流),推導子碼流時移除了NAL(網路抽象層)。這種情況下,層間預測(暨,從低解析度/低品質訊號資料中預測高解析度/高品質訊號)常被用於提高編碼效率。可適應視訊編碼擴充於2007年11月完成。
下一個加入標準的主要特性是多視圖編碼(Multiview Video Coding,MVC)。據H.264/AVC附件H,MVC使得碼流結構可以表達一個視訊場景的不止一個視圖。該功能的一個重要例子是3D立體視訊編碼。MVC的工作中開發了兩個組態:多視圖高組態(Multiview High Profile)支援任意數量的視圖,立體高組態(Stereo High Profile)是為雙視圖立體視訊特別設計的。多視圖編碼擴充於2009年11月完成。
![]() |
H.264/AVC包含了一系列新的特徵,使得它比起以前的編解碼器不但能夠更有效的進行編碼,還能在各種網路環境下的應用中使用。這些新特性包括:
上述這些技術,與其它技術的結合,使得H.264比起以前的影片編解碼能夠帶來效能上顯著的提高,並在各種不同的環境下達成更廣泛的應用。H.264在壓縮效能上比起MPEG-2有很大的提高,在相同的圖像品質下,位元速率可以減少到一半或者更少。
和MPEG的其它影片標準一樣,H.264/AVC也提供了一個參考軟體,並可以免費下載。它的主要目的是提供一個演示H.264/AVC各種功能的演示平台,而不是作為一個直接的應用平台。目前在MPEG也同時在進行一些硬體參考設計的實現。
和MPEG-2第一部分、第二部分,MPEG-4第二部分一樣,使用H.264/AVC的產品製造商和服務提供商需要向他們的產品所使用的專利的持有者支付專利許可費用。這些專利許可的主要來源是一家稱為MPEG-LA LLC的私有組織,該組織和MPEG標準化組織沒有任何關聯,但是該組織也管理著MPEG-2第一部分系統、第二部分影片、MPEG-4第二部分影片和其它一些技術的專利許可。
其他的專利許可則需要向另一家稱為VIA Licensing的私有組織申請,這家公司另外也管理偏向音訊壓縮的標準如MPEG-2 AAC及MPEG-4 Audio的專利許可。
當時競爭的兩種下一代光碟格式技術,都已經計劃在2005年下半年,將H.264/MPEG-4 AVC作為必需的編碼格式,包括:
歐洲的數位電視廣播(DVB)標準組織,於2004年下半年通過了採用H.264/MPEG-4 AVC於歐洲地區進行數位電視廣播,而法國總理讓-皮埃爾·拉法蘭於2004年宣佈法國將會選用H.264/MPEG-4 AVC作為高畫質電視接收器和數位電視無線廣播服務的付費電視頻道的一項要求。
另外,美國正在考慮使用H.264/MPEG-4 AVC,作為數位電視無線廣播的視訊編碼規格。
至於亞洲地區,日本所採用的ISDB數位電視廣播格式,提供的ISDB行動電視廣播服務,使用了H.264/MPEG-4 AVC編碼,而其中包括了以下的電視台:
在台灣以DVB-T數位電視廣播格式進行高解析度無線數位電視頻道,自2020年10月12日起,均採用H.264/MPEG-4 AVC作為視訊編碼格式。
香港的無綫電視、港台電視與香港電視娛樂的所有頻道都使用H.264/MPEG-4 AVC作為編碼格式。[4]
澳門方面,澳廣視的所有自家及轉播頻道均採用H.264作為視訊編碼格式。
韓國也正在考慮改使用H.264/MPEG-4 AVC,作為數位電視無線廣播的視訊編碼規格。
衛星數位電視廣播方面,以下數間服務供應商亦採用了該編碼標準,包括:
南京電信在南京推廣的IPTV業務由於受頻寬限制,將原有4M左右碼流的MPEG-2格式的標準畫質衛星節目用H.264重新編碼約為2.23M碼流的節目播放。
第三代移動通訊合作組織(3GPP)已經在第六次發佈中批准H.264/AVC作為其移動多媒體電話服務標準的可選技術。
美國國防部下的運動圖像標準協會(MISB for The Motion Imagery Standards Board)已經接受H.264/AVC為其核心應用的推薦影片編解碼器。
網際網路工程工作小組(IETF)已經完成了一個負載打包格式(RFC 3984)作為在其實時傳輸協定(RTP)上傳輸H.264/AVC碼流的打包辦法。
網際網路流媒體協會(ISMA for Internet Streaming Media Alliance)已經接受H.264/AVC作為其ISMA 2.0的技術規範。
MPEG組織將H.264/AVC完全的整合進入了它的系統協定(例如MPEG-2和MPEG-4系統)和ISO媒體格式協定。
國際電信聯盟ITU-T標準組已經採納H.264/AVC作為其H.32x系列的多媒體電話系統的系統規範的一部分。ITU-T的採納,使得H264/AVC已經被廣泛的使用在影片會議系統中,並獲得了影片電話主要的兩家產品提供商(Polycom和Tandberg的支援。實際上所有新的影片會議產品都支援H.264/AVC。
H.264將很可能被各種影片點播服務(Video-On-Demand,VOD)使用,用來在網際網路上提供電影和電視節目直接到個人電腦的點播服務。
有幾家公司正在製作能夠對H.264/AVC影片進行解碼的可程式化晶片。2005年1月,博通(Broadcom)的BCM7411、科勝訊公司(Conexant)的CX2418X、Neomagic的MiMagic 6和意法半導體(STMicroelectronics)的STB7100等幾家公司推出的產品都提供了可供測試的樣片。Sigma Designs預計在2005年3月提供樣片。這些晶片的出現將極大的推動低成本的能夠播放標準畫質和高畫質解析度的H.264/AVC影片的快速推廣。除了Neomagic的晶片是針對低能耗應用以外,其他四種晶片都具有播放高畫質解析度影片的能力,而且大部分都將支援標準中的High Profile。
蘋果公司已經將H.264整合進入Mac OS X版本v10.4(暱稱Tiger),並於2005年5月發佈了支援H.264的QuickTime版本7.0。2005年4月蘋果公司升級了軟體DVD Studio Pro以支援授權的高畫質格式的內容。該軟體支援將HD-DVD格式的內容刻錄到標準DVD或者HD-DVD媒體上。為了播放刻錄在標準DVD上的HD-DVD內容,所需要的硬體是PowerPC G5、軟體是Apple DVD Player v4.6,以及Mac OS X v10.4或者更新版本。
Envivio公司已經可以提供針對H.264組播用的標準畫質實時編碼器和離線的高畫質(720p、1080i、1080p)編碼器。Envivio公司同時提供針對windows、Linux和Macintosh平台的H.264解碼器,H.264影片伺服器和授權工具。
Modulus Video公司提供廣播、電話用廣播品質的H.264標準畫質實時編碼器,並宣佈將與2005年中提供高畫質實時編碼器(ME6000)。該公司曾在2004年4月在NAB上演示過高畫質實時編碼器,並獲得"Pick Hit"獎項。該公司使用LSI Logic的技術。
Tandberg television公司推出了EN5990實時編碼器。DirecTV和BSkyB已經把EN5990編碼器用於它們的衛星直播服務(DBS)。
哈雷(Harmonic)也推出了型號DiviCom MV 100的實時編碼器,。法國的廣播商TF1和Video Networks Limited(VNL)在倫敦的家用影片點播服務已經宣佈使用該產品。佩斯公司(Pace Micro)為一些主要的直播衛星公司提供了機上盒。
Sony公司的PSP在硬體上提供對H.264 Main Profile Level 3解碼的支援。
Nero Digital公司推出的由Nero AG和Ateme共同開發的軟體包提供了對H.264編碼的支援,並在Doom9獲得"Pick Hit"[1] 獎項。
Sorenson提供了H.264實現方式。相關的編解碼軟體Sorenson AVC Pro codec已經包含在Sorenson Squeeze 4.1 for MPEG-4中。
InterVideo的WinDVD 7於2005年6月24日正式發佈。發佈版本分為WinDVD 7 Gold黃金版和WinDVD 7 Platinum白金版,白金版支援H.264/MPEG-4 AVC解碼播放,推薦組態為P4 3.6G。(不屬於原文)
ATI於2005年10月5日發佈的Radeon X1300、X1600、X1800系列圖形晶片支援H.264硬體加速解碼。
Matrox公司推出的Matrox Mxo2 mini with MAX產品提供了H.264加速運算的功能,可以更快的輸出檔案。
Level | 最大解碼速度 | 最大幀率 | 最大影片編碼層位元速率[a] | 高解析度@ 最高幀率 切換詳細資訊
| ||
---|---|---|---|---|---|---|
Luma samples/s | Macroblocks/s | 明亮度 | 大區塊 | |||
1 | 380,160 | 1,485 | 25,344 | 99 | 64 | 128×96@30 176×144@15
|
1b | 380,160 | 1,485 | 25,344 | 99 | 128 | 128×96@30 176×144@15
|
1.1 | 768,000 | 3,000 | 101,376 | 396 | 192 | 128x96@60 352×288@7.5
176×144@30 |
1.2 | 1,536,000 | 6,000 | 101,376 | 396 | 384 | 128x96@120 352×288@15
176×144@60 |
1.3 | 3,041,280 | 11,880 | 101,376 | 396 | 768 | 128x96@172 352×288@30
176×144@120 |
2 | 3,041,280 | 11,880 | 101,376 | 396 | 2,000 | 128x96@172 352×288@30
176x144@120 |
2.1 | 5,068,800 | 19,800 | 202,752 | 792 | 4,000 | 176x144@172 352×576@25
352×240@60 352×288@50 352×480@30 |
2.2 | 5,184,000 | 20,250 | 414,720 | 1,620 | 4,000 | 176×144@172 720×576@12.5
352×480@30 352×576@25 720×480@15 |
3 | 10,368,000 | 40,500 | 414,720 | 1,620 | 10,000 | 176×144@172 720×576@25
352×240@120 352×480@60 720×480@30 |
3.1 | 27,648,000 | 108,000 | 921,600 | 3,600 | 14,000 | 352x288@172 1,280×720@30
352x576@130 640x480@90 720×576@60 |
3.2 | 55,296,000 | 216,000 | 1,310,720 | 5,120 | 20,000 | 640x480@172 1,280×720@60
720x480@160 720x576@130 |
4 | 62,914,560 | 245,760 | 2,097,152 | 8,192 | 20,000 | 720x480@172 2,048×1,024@30
720x576@150 1,280×720@60 |
4.1 | 62,914,560 | 245,760 | 2,097,152 | 8,192 | 50,000 | 720x480@172 2,048×1,024@30
720x576@150 1,280×720@60 |
4.2 | 133,693,440 | 522,240 | 2,228,224 | 8,704 | 50,000 | 720x576@172 2,048×1,080@60
1,280×720@140 |
5 | 150,994,944 | 589,824 | 5,652,480 | 22,080 | 135,000 | 1,024×768@172 3,680×1,536@25
1,280×720@160 2,048×1,080@60 2,560×1,920@30 |
5.1 | 251,658,240 | 983,040 | 9,437,184 | 36,864 | 240,000 | 1,280×720@172 4,096×2,048@30
1,920×1,080@120 2,048×1,536@80 |
5.2 | 530,841,600 | 2,073,600 | 9,437,184 | 36,864 | 240,000 | 1,920×1,080@172 4,096×2,160@60
2,048×1,536@160 |
6 | 1,069,547,520 | 4,177,920 | 35,651,584 | 139,264 | 240,000 | 2,048×1,536@300 8,192×4,320@30
4,096×2,160@120 |
6.1 | 2,139,095,040 | 8,355,840 | 35,651,584 | 139,264 | 480,000 | 2,048×1,536@300 8,192×4,320@60
4,096×2,160@240 |
6.2 | 4,278,190,080 | 16,711,680 | 36,651,584 | 139,264 | 800,000 | 4,096*2,304@300 8,192×4,320@120
|
The maximum bit rate for High Profile is 1.25 times that of the Base/Extended/Main Profiles, 3 times for Hi10P, and 4 times for Hi422P/Hi444PP.
The number of luma samples is 16x16=256 times the number of macroblocks (and the number of luma samples per second is 256 times the number of macroblocks per second).
Seamless Wikipedia browsing. On steroids.