JVT(Joint Video Team,視頻聯(lián)合工作組)于2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個(gè)國際標準化組織的有關(guān)視頻編碼的專(zhuān)家聯(lián)合組成。JVT的工作目標是制定一個(gè)新的視頻編碼標準,以實(shí)現視頻的高壓縮比、高圖像質(zhì)量、良好的網(wǎng)絡(luò )適應性等目標。目前JVT的工作已被ITU-T接納,新的視頻壓縮編碼標準稱(chēng)為H.264標準,該標準也被ISO接納,稱(chēng)為AVC(Advanced Video Coding)標準,是MPEG-4的第10部分。
H.264標準可分為三檔:
基本檔次(其簡(jiǎn)單版本,應用面廣);
主要檔次(采用了多項提高圖像質(zhì)量和增加壓縮比的技術(shù)措施,可用于SDTV、HDTV和DVD等);
擴展檔次(可用于各種網(wǎng)絡(luò )的視頻流傳輸)。
H.264不僅比H.263和MPEG-4節約了50%的碼率,而且對網(wǎng)絡(luò )傳輸具有更好的支持功能。它引入了面向IP包的編碼機制,有利于網(wǎng)絡(luò )中的分組傳輸,支持網(wǎng)絡(luò )中視頻的流媒體傳輸。H.264具有較強的抗誤碼特性,可適應丟包率高、干擾嚴重的無(wú)線(xiàn)信道中的視頻傳輸。H.264支持不同網(wǎng)絡(luò )資源下的分級編碼傳輸,從而獲得平穩的圖像質(zhì)量。H.264能適應于不同網(wǎng)絡(luò )中的視頻傳輸,網(wǎng)絡(luò )親和性好。
一、H.264視頻壓縮系統
H.264標準壓縮系統由視頻編碼層(VCL)和網(wǎng)絡(luò )提取層(Network Abstraction Layer,NAL)兩部分組成。VCL中包括VCL編碼器與VCL解碼器,主要功能是視頻數據壓縮編碼和解碼,它包括運動(dòng)補償、變換編碼、熵編碼等壓縮單元。NAL則用于為VCL提供一個(gè)與網(wǎng)絡(luò )無(wú)關(guān)的統一接口,它負責對視頻數據進(jìn)行封裝打包后使其在網(wǎng)絡(luò )中傳送,它采用統一的數據格式,包括單個(gè)字節的包頭信息、多個(gè)字節的視頻數據與組幀、邏輯信道信令、定時(shí)信息、序列結束信號等。包頭中包含存儲標志和類(lèi)型標志。存儲標志用于指示當前數據不屬于被參考的幀。類(lèi)型標志用于指示圖像數據的類(lèi)型。
VCL可以傳輸按當前的網(wǎng)絡(luò )情況調整的編碼參數。
二、H.264的特點(diǎn)
H.264和H.261、H.263一樣,也是采用DCT變換編碼加DPCM的差分編碼,即混合編碼結構。同時(shí),H.264在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,更貼近實(shí)際應用。
H.264沒(méi)有繁瑣的選項,而是力求簡(jiǎn)潔的“回歸基本”,它具有比H.263++更好的壓縮性能,又具有適應多種信道的能力。
H.264的應用目標廣泛,可滿(mǎn)足各種不同速率、不同場(chǎng)合的視頻應用,具有較好的抗誤碼和抗丟包的處理能力。
H.264的基本系統無(wú)需使用版權,具有開(kāi)放的性質(zhì),能很好地適應IP和無(wú)線(xiàn)網(wǎng)絡(luò )的使用,這對目前因特網(wǎng)傳輸多媒體信息、移動(dòng)網(wǎng)中傳輸寬帶信息等都具有重要意義。
盡管H.264編碼基本結構與H.261、H.263是類(lèi)似的,但它在很多環(huán)節做了改進(jìn),現列舉如下。
1.多種更好的運動(dòng)估計
高精度估計
在H.263中采用了半像素估計,在H.264中則進(jìn)一步采用1/4像素甚至1/8像素的運動(dòng)估計。即真正的運動(dòng)矢量的位移可能是以1/4甚至1/8像素為基本單位的。顯然,運動(dòng)矢量位移的精度越高,則幀間剩余誤差越小,傳輸碼率越低,即壓縮比越高。
在H.264中采用了6階FIR濾波器的內插獲得1/2像素位置的值。當1/2像素值獲得后, 1/4像素值可通過(guò)線(xiàn)性?xún)炔瀚@得,
對于4:1:1的視頻格式,亮度信號的1/4 像素精度對應于色度部分的1/8像素的運動(dòng)矢量,因此需要對色度信號進(jìn)行1/8像素的內插運算。
理論上,如果將運動(dòng)補償的精度增加一倍(例如從整像素精度提高到1/2像素精度),可有0.5bit/Sample的編碼增益,但實(shí)際驗證發(fā)現在運動(dòng)矢量精度超過(guò)1/8像素后,系統基本上就沒(méi)有明顯增益了,因此,在H.264中,只采用了1/4像素精度的運動(dòng)矢量模式,而不是采用1/8像素的精度。
多宏塊劃分模式估計
在H.264中,可采用多個(gè)參數幀的運動(dòng)估計,即在編碼器的緩存中存有多個(gè)剛剛編碼好的參數幀,編碼器從其中選擇一個(gè)給出更好的編碼效果的作為參數幀,并指出是哪個(gè)幀被用于預測,這樣就可獲得比只用上一個(gè)剛編碼好的幀作為預測幀的更好的編碼效果。
2.小尺寸4?4的整數變換
視頻壓縮編碼中以往的常用單位為8?8塊。在H.264中卻采用小尺寸的4?4塊,由于變換塊的尺寸變小了,運動(dòng)物體的劃分就更為精確。這種情況下,圖像變換過(guò)程中的計算量小了,而且在運動(dòng)物體邊緣的銜接誤差也大為減少。
當圖像中有較大面積的平滑區域時(shí),為了不產(chǎn)生因小尺寸變換帶來(lái)的塊間灰度差異,H.264可對幀內宏塊亮度數據的16個(gè)4?4塊的DCT系數進(jìn)行第二次4?4塊的變換,對色度數據的4個(gè)4?4塊的DC系數(每個(gè)小塊一個(gè),共4個(gè)DC系數)進(jìn)行2?2塊的變換。
H.263不僅使圖像變換塊尺寸變小,而且這個(gè)變換是整數操作,而不是實(shí)數運算,即編碼器和解碼器的變換和反變換的精度相同,沒(méi)有“反變換誤差”。
3.更精確的幀內預測
在H.264中,每個(gè)4?4塊中的每個(gè)像素都可用17個(gè)最接近先前已編碼的像素的不同加權和來(lái)進(jìn)行幀內預測。
4.統一的VLC
H.264中關(guān)于熵編碼有兩種方法。
統一的VLC(即UVLC:Universal VLC)。UVLC使用一個(gè)相同的碼表進(jìn)行編碼,而解碼器很容易識別碼字的前綴,UVLC在發(fā)生比特錯誤時(shí)能快速獲得重同步。
內容自適應二進(jìn)制算術(shù)編碼(CABAC:Context Adaptive Binary Arithmetic Coding)。其編碼性能比UVLC稍好,但復雜度較高。
三、性能優(yōu)勢
H.264與MPEG-4、H.263++編碼性能對比采用了以下6個(gè)測試速率:32kbit/s、10F/s和QCIF;64kbit/s、15F/s和QCIF;128kbit/s、15F/s和CIF;256kbit/s、15F/s和QCIF;512kbit/s、30F/s和CIF;1024kbit/s、30F/s和CIF。測試結果標明,H.264具有比MPEG和H.263++更優(yōu)秀的PSNR性能。
H.264的 PSNR比MPEG-4平均要高2dB,比H.263++平均要高3dB。
四、新的快速運動(dòng)估值算法
新的快速運動(dòng)估值算法UMHexagonS(中國專(zhuān)利)是一種運算量相對于H.264中原有的快速全搜索算法可節約90%以上的新算法,全名叫“非對稱(chēng)十字型多層次六邊形格點(diǎn)搜索算法”(Unsymmetrical-Cross Muti-Hexagon Search)”,這是一種整像素運動(dòng)估值算法。由于它在高碼率大運動(dòng)圖像序列編碼時(shí),在保持較好率失真性能的條件下,運算量十分低,已被H.264標準正式采納。
ITU和 ISO合作發(fā)展的 H.264(MPEG-4 Part 10)有可能被廣播、通信和存儲媒體(CD DVD)接受成為統一的標準,最有可能成為寬帶交互新媒體的標準。我國的信源編碼標準尚未制定,密切關(guān)注H.264的發(fā)展,制定我國的信源編碼標準的工作正在加緊進(jìn)行。
H264標準使運動(dòng)圖像壓縮技術(shù)上升到了一個(gè)更高的階段,在較低帶寬上提供高質(zhì)量的圖像傳輸是H.264的應用亮點(diǎn)。H.264的推廣應用對視頻終端、網(wǎng)守、網(wǎng)關(guān)、MCU等系統的要求較高,將有力地推動(dòng)視頻會(huì )議軟、硬件設備在各個(gè)方面的不斷完善。
聯(lián)系客服