AVS-視頻技術(shù)概述
本文關(guān)鍵字:
AVS(28),
視頻編碼(3),
MPEG(13),
H.264(11),
DSP(1),
ASIC(1),
數字電視(1),
多媒體通信(1)
AVS是中國自主制定的音
視頻編碼技術(shù)標準。AVS工作組成立于2002年6月,當年8月開(kāi)始了第一次的工作會(huì )議。經(jīng)過(guò)7次AVS正式工作會(huì )議和3次視頻組附加會(huì )議,經(jīng)歷一年半的時(shí)間,審議了182個(gè)提案,先后采納了41項提案,2003年12月19日AVS視頻部分終于定稿!當前,AVS視頻主要面向高清晰度電視、高密度光存儲媒體等應用中的視頻壓縮。
在2002年的最初幾次會(huì )議中,視頻組專(zhuān)家統一了以當前國際上最先進(jìn)的
MPEG-4 AVC/
H.264框架為起點(diǎn),自主制定適合既定應用的中國標準,其中強調自主知識產(chǎn)權,同時(shí)充分考慮實(shí)現復雜度。
一、AVS-視頻的核心技術(shù)
AVS-視頻當中具有特征性的核心技術(shù)包括:8x8整數變換、量化、幀內預測、1/4精度像素插值、特殊的幀間預測運動(dòng)補償、二維熵編碼、去塊效應環(huán)內濾波等。
1.變換量化
AVS的8x8變換與量化可以在16位處理器上無(wú)失配地實(shí)現,從而克服了MPEG-4 AVC/H.264之前所有視頻壓縮編碼國際標準中采用的8x8 DCT變換存在失配的固有問(wèn)題。而MPEG-4 AVC/H.264所采用的4x4整數變換在高分辨率的視頻圖像上的去相關(guān)性能不及8x8的變換有效。AVS采用了64級量化,可以完全適應不同的應用和業(yè)務(wù)對碼率和質(zhì)量的要求。在解決了16位實(shí)現的問(wèn)題后,目前AVS所采用的8x8變換與量化方案,即適合于16位
DSP或其他軟件方式的快速實(shí)現,也適合于
ASIC的優(yōu)化實(shí)現。
2.幀內預測
AVS的幀內預測技術(shù)沿襲了MPEG-4 AVC/H.264幀內預測的思路,用相鄰塊的像素預測當前塊,采用代表空間域紋理方向的多種預測模式。但AVS亮度和色度幀內預測都是以8x8塊為單位的。亮度塊采用5種預測模式,色度塊采用4種預測模式,而這4種模式中又有3種和亮度塊的預測模式相同。在編碼質(zhì)量相當的前提下,AVS采用較少的預測模式,使方案更加簡(jiǎn)潔、實(shí)現的復雜度大為降低。
3.幀間預測
幀間運動(dòng)補償編碼是混合編碼技術(shù)框架中最重要的部分之一。AVS標準采用了16×16,16×8,8×16和8×8的塊模式進(jìn)行運動(dòng)補償,而去除了MPEG-4 AVC/H.264標準中的8×4,4×8,4×4的塊模式,目的是能更好地刻畫(huà)物體運動(dòng),提高運動(dòng)搜索的準確性。實(shí)驗表明,對于高分辨率視頻,AVS選用的塊模式已經(jīng)能足夠精細地表達物體的運動(dòng)。較少的塊模式,能降低運動(dòng)矢量和塊模式傳輸的開(kāi)銷(xiāo),從而提高壓縮效率、降低編解碼實(shí)現的復雜度。
AVS和MPEG-4 AVC/ H.264都采用了1/4像素精度的運動(dòng)補償技術(shù)。MPEG-4 AVC/H.264采用6抽頭濾波器進(jìn)行半像素插值并采用雙線(xiàn)性濾波器進(jìn)行1/4像素插值。而AVS采用了不同的4抽頭濾波器進(jìn)行半像素插值和1/4像素插值,在不降低性能的情況下減少插值所需要的參考像素點(diǎn),減小了數據存取帶寬需求,這在高分辨率視頻壓縮應用中是非常有意義的。
在傳統的視頻編碼標準(MPEG-x系列與H.26x系列)中,雙向預測幀B幀都只有一個(gè)前向參考幀與一個(gè)后向參考幀,而前向預測幀P幀則只有一個(gè)前向參考幀。而新近的MPEG-4 AVC/H.264充分地利用圖片之間的時(shí)域相關(guān)性,允許P幀和B幀有多個(gè)參考幀,最多可以有31個(gè)參考幀。多幀參考技術(shù)在提高壓縮效率的同時(shí)也將極大地增加存儲空間與數據存取的開(kāi)銷(xiāo)。AVS中P幀可以利用至多2幀的前向參考幀,而B(niǎo)幀采用前后各一個(gè)參考幀,P幀與B幀(包括后向參考幀)的參考幀數相同,其參考幀存儲空間與數據存取的開(kāi)銷(xiāo)并不比傳統視頻編碼的標準大,而恰恰是充分利用了必須預留的資源。
AVS的B幀的雙向預測使用了直接模式(direct mode)、對稱(chēng)模式(symmetric mode)和跳過(guò)模式(skipmode)。使用對稱(chēng)模式時(shí),碼流只需要傳送前向運動(dòng)矢量,后向運動(dòng)矢量可由前向運動(dòng)矢量導出,從而節省后向運動(dòng)矢量的編碼開(kāi)銷(xiāo)。對于直接模式,當前塊的前、后向運動(dòng)矢量都是由后向參考圖像相應位置塊的運動(dòng)矢量導出,無(wú)需傳輸運動(dòng)矢量,因此也可以節省運動(dòng)矢量的編碼開(kāi)銷(xiāo)。跳過(guò)模式的運動(dòng)矢量的導出方法和直接模式的相同,跳過(guò)模式編碼的塊其運動(dòng)補償的殘差也均為零,即該模式下宏塊只需要傳輸模式信號,而不需要傳輸運動(dòng)矢量、補償殘差等附加信息。
4.熵編碼
AVS熵編碼采用自適應變長(cháng)編碼技術(shù)。
在A(yíng)VS熵編碼過(guò)程中,所有的語(yǔ)法元素和殘差數據都是以指數哥倫布碼的形式映射成二進(jìn)制比特流。采用指數哥倫布碼的優(yōu)勢在于:一方面,它的硬件復雜度比較低,可以根據閉合公式解析碼字,無(wú)需查表;另一方面,它可以根據編碼元素的概率分布靈活地確定以k階指數哥倫布碼編碼,如果k選得恰當,則編碼效率可以逼近信息熵。
對預測殘差的塊變換系數,經(jīng)掃描形成(level、run)對串,level、run不是獨立事件,而存在著(zhù)很強的相關(guān)性,在A(yíng)VS中level、run采用二維聯(lián)合編碼,并根據當前l(fā)evel、run的不同概率分布趨勢,自適應改變指數哥倫布碼的階數。
二、AVS-視頻目前的性能與應用
AVS-視頻目前定義了一個(gè)檔次(profile)即基準檔次。該基準檔次又分為4個(gè)級別(level),分別對應高清晰度與標準清晰度應用。
與MPEG-4 AVC/ H.264的baselineprofile相比,AVS-視頻增加了B幀、interlace等技術(shù),因此其壓縮效率明顯提高,而與MPEG-4 AVC/ H.264的mainprofile相比,又減少了CABAC等實(shí)現難度大的技術(shù),從而增強了可實(shí)現性。
AVS-視頻的主要特點(diǎn)是應用目標明確,技術(shù)有針對性。因此在高分辨率應用中,其壓縮效率明顯比現在在
數字電視、光存儲媒體中常用的MPEG-2視頻提高一個(gè)層次。在壓縮效率相當的前提下,又較MPEG-4 AVC/ H.264的 main profile的實(shí)現復雜度大為降低。
目前的AVS-視頻技術(shù)可實(shí)現標準清晰度(CCIR 601或相當清晰度)、低清晰度(CIF、SIF)等不同格式視頻的壓縮,但針對此類(lèi)應用的壓縮效率還有待提高,這應當是AVS-視頻下一步的工作重點(diǎn)。
----《中國
多媒體通信》