日韩伦理片免费播放_ 數字電視信源編碼的主要技術(shù)與標準

數字電視信源編碼的主要技術(shù)與標準

　【摘要】:本文介紹了有關(guān)數字電視信源編碼的一些主要技術(shù)和標準,包括數字演播室標準ITU--601,壓縮編碼的基本原理和方法,圖像壓縮編碼標準H261,JPEG和MPEG,以及作為數字電視信源編碼標準輸出的MPEG--2碼流的形成。

　　準數字電視和數字高清晰度電視在內的數字電視體系的開(kāi)發(fā)研究正加緊進(jìn)行。美國已完成稱(chēng)為GA的數字高清晰度電視的標準制定及其進(jìn)入實(shí)用的時(shí)間表，歐洲則在開(kāi)發(fā)獨立的數字電視方案，并制定了數字電視廣播DVB的標準。這一切都是以數字電視信源編碼的一系列技術(shù)與標準的成熟為基礎的。信源編碼作為數字電視系統的核心構成部分，直接決定了數字電視的基本格式及其信號編碼效率，決定了數字電視最終如何在實(shí)際的系統中實(shí)現。 

　　一.數字電視的信源編碼

　　一個(gè)完整的數字電視系統包括數字電視信號的產(chǎn)生、處理、傳輸、接收和重現等諸多環(huán)節。數字電視信號在進(jìn)入傳輸通道前的處理過(guò)程一般如圖1所示： 



　　電視信號在獲取后經(jīng)過(guò)的第一個(gè)處理環(huán)節就是信源編碼。信源編碼是通過(guò)壓縮編碼來(lái)去掉信號源中的冗余成分，以達到壓縮碼率和帶寬，實(shí)現信號有效傳輸的目的。信道編碼是通過(guò)按一定規則重新排列信號碼元或加入輔助碼的辦法來(lái)防止碼元在傳輸過(guò)程中出錯，并進(jìn)行檢錯和糾錯，以保證信號的可靠傳輸。信道編碼后的基帶信號經(jīng)過(guò)調制，可送入各類(lèi)通道中進(jìn)行傳輸。目前數字電視可能的傳輸通道包括衛星，地面無(wú)線(xiàn)傳輸和有線(xiàn)傳輸等。 

　　信源編碼的目的是通過(guò)在編碼過(guò)程中對原始信號冗余度的去除來(lái)壓縮碼率，因此壓縮編碼的技術(shù)與標準成為信源編碼的核心。九十年代以來(lái)，各種壓縮編碼的國際標準相繼推出，其中MPEG－2是專(zhuān)為數字電視《包括標準數字電視和數字高清晰度電視》制定的壓縮編碼標準。MPEG－2壓縮編碼輸出的碼流作為數字電視信源編碼的標準輸出碼流已被廣泛認可。目前數字電視系統中信源編碼以外的其他部分，包括信道編碼，調制器，解調器等，大都以MPEG－2碼流作為與之適配的標準數字信號碼流。

　　信源編碼的第一步首先要對模擬電視信號進(jìn)行取樣和模數變換，相應的需要一個(gè)統一的標準。數字演播室標準ITU－R601正是為此制定的國際標準。

　　二.數字演播室標準ITU－R601

　　早在七十年代末，英國廣播公司和索尼公司就分別展示了其各自開(kāi)發(fā)的彩色數字錄像機，成為最早的數字電視編錄產(chǎn)品，由此促成了電視信號模數轉換規范的產(chǎn)生。1980年，國際無(wú)線(xiàn)電咨詢(xún)委員會(huì )CCIR提出了電視信號模數轉換標準的建議，即稱(chēng)為數字演播室標準的CCIR601。后來(lái)CCIR成為國際電信聯(lián)盟的無(wú)線(xiàn)電委員會(huì )，稱(chēng)為ITU－R，相應的CCIR－601也改稱(chēng)ITU－R601，成為模擬電視向數字電視轉變過(guò)程中的第一個(gè)標準規范，其分量編碼標準如表1所示。

　　表 1 ITU－R601數字演播室分量編碼標準《4：2：2》

參數 電視制式 PAL NTSC

每行取樣數 亮度信號 每個(gè)色差信號 

864 858 432 429 

取樣結構 正交取樣，色差信號與亮度信號的奇次樣值同位

取樣頻率 亮度信號 每個(gè)色差信號 

13.5兆赫 6.75兆赫 

編碼方式 亮度和色差信號均采用線(xiàn)性PCM，8比特量化 

每數字有效行取樣數 亮度信號 每個(gè)色差信號 720 360

量化級數 亮度信號 每個(gè)色差信號

220 224 

　　參數說(shuō)明：

　　1.取樣頻率：根據奈奎斯特定理，取樣頻率應至少不低于信號最高頻率的2倍。其次，為便于進(jìn)行信源編碼，取樣結構最好為正交結構，即每個(gè)取樣點(diǎn)應與其相鄰行和相鄰幀對齊。為此取樣頻率必須為行頻的整數倍。要同時(shí)滿(mǎn)足PAL與NTSC的正交取樣，取樣頻率應為兩者行頻的公倍數。同時(shí)，取樣頻率的選取還必須兼顧碼率和帶寬。綜合考慮上述因素，亮度信號的取樣頻率定為13.5兆赫。在4：2：2格式中，每個(gè)色差信號取樣數為亮度信號的一半，取樣頻率定為6.75兆赫； 

　　2.每行取樣數：由取樣頻率除以行頻得到每行取樣數。為提高編碼效率，去掉行場(chǎng)逆程的取樣，得到降低了的每數字有效行取樣數；

　　3.編碼方式：采用簡(jiǎn)單的線(xiàn)性PCM編碼。量化比特數為8比特，這是一個(gè)由實(shí)驗決定的結果。具體實(shí)驗顯示，8比特量化產(chǎn)生的256級量化級，已完全能滿(mǎn)足人眼對亮度與色度層次分辨的需要。

　　ITU－R601主要是一種取樣標準。模擬電視信號據此取樣后進(jìn)行8比特量化和線(xiàn)性PCM編碼，即可得到符合數字演播室標準的基帶數字信號。但是，由此得到的數字電視信號具有非常高的碼率和帶寬，難以進(jìn)入實(shí)用。雖然ITU－R601建議早在1980年已經(jīng)制定，但直到九十年代一系列有效的圖像數碼壓縮技術(shù)及相應的國際標準出現以后，數字電視才得到了迅速的發(fā)展。

　　圖像數據的壓縮主要基于對各種圖像數據冗余度及視覺(jué)冗余度的壓縮，包括如下一些方法： 

　　1.統計冗余度的壓縮：對于一串由許多數值構成的數據來(lái)說(shuō)，如果其中某些值經(jīng)常出現，而另外一些值很少出現，則這種由取值上的統計不均勻性就構成了統計冗余度，可以對之進(jìn)行壓縮。具體方法是對那些經(jīng)常出現的值用短的碼組來(lái)表示，對不經(jīng)常出現的值用長(cháng)的碼組來(lái)表示，因而最終用于表示這一串數據的總的碼位，相對于用定長(cháng)碼組來(lái)表示的碼位而言得到了降低，這就是熵編碼的思想。目前用于圖像壓縮的具體的熵編碼方法主要是霍夫曼編碼，即一個(gè)數值的編碼長(cháng)度與此數值出現的概率盡可能地成反比。 霍夫曼編碼雖然壓縮比不高，約為1.6：1，但好處是無(wú)損壓縮，目前在圖像壓縮編碼中被廣泛采用。

　　視頻圖像在每一點(diǎn)的取值上具有任意性。對于運動(dòng)圖像而言，每一點(diǎn)在一段時(shí)間內能取可能的任意值，在取值上具有統計均勻性，難以直接運用熵編碼的方法，但可以通過(guò)適當的變換編碼的方法，如DCT變換，使原圖像變成由一串統計不均勻的數據來(lái)表示，從而利用霍夫曼編碼來(lái)進(jìn)行壓縮。

　　2.空間冗余度的壓縮：一幅視頻圖像相鄰各點(diǎn)的取值往往相近或相同，具有空間相關(guān)性，這就是空間冗余度。圖像的空間相關(guān)性表示相鄰象素點(diǎn)取值變化緩慢。從頻域的觀(guān)點(diǎn)看，意味著(zhù)圖像信號的能量主要集中在低頻附近，高頻信號的能量隨頻率的增加而迅速衰減。通過(guò)頻域變換，可以將原圖像信號用直流分量及少數低頻交流分量的系數來(lái)表示，這就是變換編碼中的正交余弦變換DCT的方法。DCT是JPEG和MPEG壓縮編碼的基礎，可對圖像的空間冗余度進(jìn)行有效的壓縮。

　　視頻圖像中經(jīng)常出現一連串連續的象素點(diǎn)具有相同值的情況，典型的如彩條，彩場(chǎng)信號等。只傳送起始象素點(diǎn)的值及隨后取相同值的象素點(diǎn)的個(gè)數，也能有效地壓縮碼率，這就是行游程編碼。目前在圖像壓縮編碼中，行游程編碼并不直接對圖像數據進(jìn)行編碼，主要用于對量化后的DCT系數進(jìn)行編碼。

　　3.時(shí)間冗余度的壓縮：時(shí)間冗余度表現在電視畫(huà)面中相繼各幀對應象素點(diǎn)的值往往相近或相同，具有時(shí)間相關(guān)性。在知道了一個(gè)象素點(diǎn)的值后，利用此象素點(diǎn)的值及其與后一象素點(diǎn)的值的差值就可求出后一象素點(diǎn)的值。因此，不傳送象素點(diǎn)本身的值而傳送其與前一幀對應象素點(diǎn)的差值，也能有效地壓縮碼率，這就是差分編碼DPCM。在實(shí)際的壓縮編碼中，DPCM主要用于各圖像子塊在DCT變換后的直流系數的傳送。相對于交流系數而言，DCT直流系數的值很大，而相繼各幀對應子塊的DCT直流系數的值一般比較接近，在圖像未發(fā)生跳變的情況下，其差值同直流系數本身的值相比是很小的。

　　由差分編碼進(jìn)一步發(fā)展起來(lái)的預測編碼，是根據一定的規則先預測出下一個(gè)象素點(diǎn)或圖像子塊的值，然后將此預測值與實(shí)際值的差值傳送給接收端。目前圖像壓縮中的預測編碼主要用于幀間壓縮編碼，方法是先根據一個(gè)子塊的運動(dòng)矢量求出下一幀對應子塊的預測值及其與實(shí)際值的差值，接收端根據運動(dòng)矢量及差值恢復出原圖像。由于運動(dòng)矢量及差值的數據量低于原圖像的數據量，因而也能達到圖像數據壓縮的目的。

　　4.視覺(jué)冗余度的壓縮：視覺(jué)冗余度是相對于人眼的視覺(jué)特性而言的。人眼對于圖像的視覺(jué)特性包括：對亮度信號比對色度信號敏感，對低頻信號比對高頻信號敏感，對靜止圖像比對運動(dòng)圖像敏感，以及對圖像水平線(xiàn)條和垂直線(xiàn)條比對斜線(xiàn)敏感等。因此，包含在色度信號，圖像高頻信號和運動(dòng)圖像中的一些數據并不能對增加圖像相對于人眼的清晰度作出貢獻，而被認為是多余的，這就是視覺(jué)冗余度。

　　壓縮視覺(jué)冗余度的核心思想是去掉那些相對人眼而言是看不到的或可有可無(wú)的圖像數據。對視覺(jué)冗余度的壓縮通常已反映在各種具體的壓縮編碼過(guò)程中。如對于DCT系數的直流與低頻部分采取細量化，而對高頻部分采取粗量化，使得DCT變換能借此壓縮碼率，并能有效地進(jìn)行行游程編碼。在幀間預測編碼中，大碼率壓縮的預測幀及雙向預測幀的采用，也是利用了人眼對運動(dòng)圖像細節不敏感的特性。

　　圖像壓縮編碼的具體方法雖然還有多種，但大都是建立在上述基本思想之上的。DCT變換，行游程編碼，DPCM，幀間預測編碼及霍夫曼編碼等編碼方法，因技術(shù)上的成熟，已被有關(guān)國際組織定為壓縮編碼的主要方法。

　　四.圖像壓縮的主要技術(shù)與標準

　　目前有關(guān)圖像壓縮方面的主要標準包括CCITT的H.261,JPEG和MPEG。是分別針對電視電話(huà)圖像，靜止圖像和活動(dòng)圖像的壓縮編碼標準。這幾種壓縮標準雖然各自針對性不同，但壓縮編碼方法大體相似。

　　1.H261

　　圖像壓縮編碼標準的提出最早源于通訊中對可視電話(huà)的研究。經(jīng)過(guò)多年努力，至1980年，國際電報電話(huà)咨詢(xún)委員會(huì )CCITT所屬的視頻編碼專(zhuān)家組的H.261建議被通過(guò)，成為可視電話(huà)和電話(huà)會(huì )議的國際標準。H.261又稱(chēng)Px64，傳輸碼率為Px64kbps，其中P＝1－30可變，根據圖像傳輸清晰度的不同，碼率變化范圍在64kbps至1.92Mbps之間，編碼方法包括DCT變換，可控步長(cháng)線(xiàn)性量化，變長(cháng)編碼及預測編碼等。其簡(jiǎn)化的編碼原理框圖如圖2所示。



　　圖中，DCT變換的輸入輸出選擇開(kāi)關(guān)由幀內/幀間模式選擇電路控制。在幀內模式時(shí)，開(kāi)關(guān)打到上面，輸入信號經(jīng)DCT變換，線(xiàn)性量化和變長(cháng)編碼后輸出，圖像只進(jìn)行幀內壓縮。在幀間模式時(shí)，開(kāi)關(guān)打到下面，前一幀圖像信號經(jīng)過(guò)預測環(huán)中的運動(dòng)補償后產(chǎn)生一個(gè)后幀的預測信號。后幀的實(shí)際輸入信號與其預測值相減后，在進(jìn)行一個(gè)幀內壓縮編碼的過(guò)程后輸出。 

　　圖中變長(cháng)編碼器產(chǎn)生的控制信號送量化器以控制其量化步長(cháng)。當變長(cháng)編碼器的輸入中連續出現許多大數值的數據，導致集中出現長(cháng)的碼組，使緩存器接近溢出時(shí)，控制信號使量化器的量化步長(cháng)加大，以降低大數值數據的出現；反之，也可控制量化器以減小其量化步長(cháng)。在預測環(huán)路中由于存在用于恢復前幀信號的反量化器，量化步長(cháng)控制信號也要送到預測環(huán)中的反量化器中。

　　H.261所針對的可視電話(huà)信號最初考慮是在一般電話(huà)網(wǎng)中傳輸的，帶寬和碼率是其考慮的核心問(wèn)題。其每幀取樣點(diǎn)數比ITU－R601所規定的低許多，且采取抽幀傳輸的方法，無(wú)法滿(mǎn)足數字電視壓縮編碼的要求，但H.261是此前壓縮編碼數十年研究的結果，成為以后JPEG和MPEG編碼方法的重要基礎。

　　2.JPEG

　　1986年，國際標準化組織ISO和國際電報電話(huà)咨詢(xún)委員會(huì )CCITT共同成立了聯(lián)合圖像專(zhuān)家組《Joint Photographic Experts Group》，對靜止圖像壓縮編碼的標準進(jìn)行了研究，JPEG小組于1988年提出建議書(shū)，1992年成為靜止圖像壓縮編碼的國際標準。JPEG是一個(gè)達到數字演播室標準的圖像壓縮編碼標準，其亮度信號與色度信號均按照ITU－R601的規定取樣后劃分為8x8子塊進(jìn)行編碼處理。

　　JPEG是一種不含幀間壓縮的幀內壓縮編碼方法，其主要編碼過(guò)程與H.261的幀內編碼過(guò)程大致相同。輸入信號經(jīng)DCT變換后，按固定的亮度與色度量化矩陣進(jìn)行非線(xiàn)性量化。對量化后的DCT直流系數進(jìn)行差分編碼，交流系數進(jìn)行行游程編碼，再按霍夫曼碼表進(jìn)行變長(cháng)編碼后，送緩存器輸出 。

　　JPEG不含幀間壓縮，壓縮比較幀內/幀間壓縮低。但因為不含幀間壓縮，使得各幀在壓縮編碼后是各自獨立的，這一點(diǎn)對于編輯來(lái)說(shuō)是有利的，可以做到精確到逐幀的編輯。所以對于活動(dòng)畫(huà)面只進(jìn)行幀內壓縮的Motion-JPEG，目前仍然在一些數字電視編錄設備，如非線(xiàn)性編輯系統中得到應用。

　　3.MPEG

　　1988年，國際標準化組織ISO和國際電工委員會(huì )IEC共同組建了運動(dòng)圖像專(zhuān)家組《Moving Picture Experts Group》，對運動(dòng)圖像的壓縮編碼標準進(jìn)行了研究。1992年和1994年分別通過(guò)了MPEG－1和MPEG－2壓縮編碼標準。

　　MPEG－1主要是針對運動(dòng)圖像和聲音在數字存儲時(shí)的壓縮編碼，典型應用如VCD等家用數字音像產(chǎn)品，其編碼最高碼率為1.5Mbps。MPEG－2則針對數字電視的視音頻壓縮編碼，對數字電視各種等級的壓縮編碼方案及圖像編碼中劃分的層次作了詳細的規定，其編碼碼率可從3Mbps到100Mbps。

　　MPEG的基本編碼過(guò)程與H.261相似，即通過(guò)DCT進(jìn)行幀間壓縮。除了在編碼語(yǔ)法上加進(jìn)了一些特別規定外，與H.261的一個(gè)重要不同是MPEG在預測編碼中加進(jìn)了一個(gè)雙向預測幀B幀，如圖3所示。



　　圖中，I幀只進(jìn)行幀內壓縮，是作為預測基準的獨立幀，具有較小的壓縮比。由I幀前向預測產(chǎn)生的P幀具有中等壓縮比，并與I幀一起成為B幀的預測基準。由此產(chǎn)生的B幀則具有最高的壓縮比。I幀出現的頻率及I，B，P幀之間如何組合，MPEG未作具體規定，可由編碼器自行選擇。如索尼的數字Betacom錄像機，為便于精確地編輯，在壓縮編碼過(guò)程中抽掉了B幀，只有I幀與P幀的組合。 

　　在上述各種圖像壓縮編碼標準中，MPEG－2是專(zhuān)門(mén)針對數字電視的。MPEG－2的壓縮編碼及其標準碼流的形成構成了數字電視信源編碼的核心。

　　五.MPEG－2標準碼流的形成

　　符合MPEG－2格式的碼流成為數字電視信源編碼的標準輸出碼流。 數字電視信道編碼，DVB及MPEG－2解碼器等均認同和適應此標準。為了形成統一標準的MPEG－2輸出碼流，MPEG－2對其壓縮編碼的適用范圍和編碼語(yǔ)法，對碼流的打包與復用等作了詳細具體的規定。

　　1.MPEG－2的類(lèi)和級

　　在對數字電視信號進(jìn)行壓縮編碼時(shí)，MPEG－2可采用多種編碼工具并實(shí)現不同層次的清晰度，分別稱(chēng)為MPEG－2的類(lèi)《Profile》和級《Level》，具體分為五類(lèi)四級。

　　圖像清晰度由LOW到HIGH逐級提高，使用的編碼工具從SIMPLE到HIGH依次遞增。20個(gè)可能的組合中有11個(gè)已獲通過(guò)，稱(chēng)為MPEG－2 適用點(diǎn)，其中主類(lèi)主級MP@ML適用于標準數字電視，主類(lèi)高級MP@HL則用于高清晰度電視。

　　2.MPEG－2的層

　　MPEG－2根據圖像塊和圖像幀的不同組合劃分為六層。MPEG－2的層直接決定了編碼碼流的形成和結構。MPEG－2的層從下至上依次為：

　　象塊層:由8x8個(gè)象素點(diǎn)構成的DCT變換基本單元；

　　宏塊層:在4：2：2取樣中，一個(gè)宏塊由4個(gè)亮度象塊，2個(gè)Cr象塊和2個(gè)Cb 象塊構成。另外還有4：2：0取樣和4：4：4取樣的兩種宏塊；

　　像條層:一連串宏塊可構成一個(gè)像條；

　　圖像層:一系列像條可以構成一幅圖像，圖像分為I，B，P三類(lèi)；

　　圖像組層:由相互間相關(guān)的一組I，B，P幀組成，I幀為第一幀；

　　視頻序列層:一系列圖像組構成了一個(gè)視頻序列；

　　從象塊開(kāi)始從下至上依次編碼，并在除象塊和宏塊外的每一層的開(kāi)始處加上起始碼和頭標志，就形成了MPEG－2基本碼流（Elementary Stream〕。

　　3.MPEG－2基本碼流的打包與復用

　　分別從MPEG－2編碼器中輸出的視頻，音頻和數據基本碼流無(wú)法直接送信道傳輸，需要經(jīng)過(guò)打包和復用，形成適合傳輸的單一的MPEG－2傳輸碼流。

　　視頻，音頻及數據基本碼流ES先被打成一系列不等長(cháng)的PES小包，稱(chēng)為打包的基本碼流。每個(gè)PES小包帶有一個(gè)包頭，內含小包的種類(lèi)，長(cháng)度及其他相關(guān)信息。視頻，音頻及數據的PES小包，按照共同的時(shí)間基準，經(jīng)節目復用后形成單一的節目碼流。多路節目碼流經(jīng)傳輸復用后形成由定長(cháng)傳輸小包組成的單一的傳輸碼流，成為MPEG－2信源編碼的最終輸出信號

　　在數字化電視信號的信源編碼中，根據對圖像清晰度的不同要求及其他方面的考慮，可分別采用JPEG、MPEG-1和MPEG-2作為編碼方法。其中，MPEG-2由于專(zhuān)門(mén)針對數字電視的信源編碼制定了一系列的語(yǔ)法和規范并被廣泛認可，已成為數字電視廣播信源編碼的核心技術(shù)與標準。

H.264

H.264/AVC 是ITU-T VCEG 和ISO/IEC MPEG共同開(kāi)發(fā)的視頻處理標準，ITU-T作為標準建議H.264，ISO/IEC作為國際標準14496-10（MPEG-4 第10部分）高級視頻編碼（AVC）。

MPEG-2視頻編碼標準（又稱(chēng)為ITU-T H.262[2]）已有10年的歷史了，由MPEG-1擴充而來(lái)，支持隔行掃描。使用十分廣泛，幾乎用于所有的數字電視系統，適合標清和高清電視，適合各種媒體傳輸，包括衛星、有線(xiàn)、地面等，都能有效地傳輸。然而，類(lèi)似xDSL、UMTS（通用移動(dòng)系統）技術(shù)只能提供較小的傳輸速率，甚至DVB-T，也沒(méi)有足夠的頻段可用，提供的節目很有限，隨著(zhù)高清電視的引入，迫切需要高壓縮比技術(shù)的出現。

應用于電信的視頻編碼經(jīng)歷了ITUT H.261、H.262（MPEG-2）、H.263、H.263+、H.263++，提供的服務(wù)從ISDN和T1/E1到PSTN、移動(dòng)無(wú)線(xiàn)網(wǎng)和LAN/INTERNET網(wǎng)。

最近MPEG-4第二部分進(jìn)入了實(shí)用領(lǐng)域，提供了視頻形狀編碼，目標是與MPEG-2一樣獲得廣泛的數字電視應用。

1998年，視頻編碼專(zhuān)家組（VCEG-ITU-T SG16Q.6）啟動(dòng)了H.26L工程，旨在研制出新的壓縮標準，與以前的任何標準相比，效率要提高一倍，同時(shí)具有簡(jiǎn)單、直觀(guān)的視頻編碼技術(shù)，網(wǎng)絡(luò )友好的視頻描述，適合交互和非交互式應用（廣播、存儲、流煤體）。

2001年12月，VCEG和運動(dòng)圖像專(zhuān)家組（MPEG-ISO/IEC JTC 1/SC 29/WG 11）組成了聯(lián)合視頻組（JVT，Joint Video Team），研究新的編碼標準H.264/AVC，該標準于2003年3月正式獲得批準。

視頻的各種應用必須通過(guò)各種網(wǎng)絡(luò )傳送，這要求一個(gè)好的視頻方案能處理各種應用和網(wǎng)絡(luò )接口。H.264/AVC為了解決這個(gè)問(wèn)題，提供了很多靈活性和客戶(hù)化特性。H.264/AVC的設計方案包含兩個(gè)層次，視頻編碼層（VCL，Video Coding Layer）和網(wǎng)絡(luò )抽象層（NAL，Network Abstraction Layer）。視頻編碼層主要致力于有效地表示視頻內容，網(wǎng)絡(luò )抽象層格式化VCL視頻表示，提供頭部信息，適合多種傳輸和存儲媒體。

VCL的設計同以前的ITU-T和 ISO/IEC JTC一樣，基于塊的混合視頻編碼方法?；镜脑淳幋a算法是：利用時(shí)間統計的相關(guān)性，開(kāi)發(fā)幀間預測算法；利用預測殘留變換編碼，開(kāi)發(fā)空間統計的相關(guān)性。在提高編碼效率方面，沒(méi)有一個(gè)單一的算法做出特別的貢獻，而是大量的小的改善算法綜合產(chǎn)生的結果。

一、主要特性

1、H.264/AVC相對以前的編碼方法，以MPEG-2為例，在圖像內容預測方面提高編碼效率，改善圖像質(zhì)量的主要特點(diǎn)如下：

● 可變塊大小運動(dòng)補償：選擇運動(dòng)補償大小和形狀比以前的標準更靈活，最小的亮度運動(dòng)補償塊可以小到4×4。

●1/4采樣精度運動(dòng)補償：以前的標準最多1/2精度運動(dòng)補償，首次1/4采樣精度運動(dòng)補償出現在MPEG-4第二部分高級類(lèi)部分，但H.264/AVC大大減少了內插處理的復雜度。

●運動(dòng)矢量可跨越圖像邊界：在以前的標準中，運動(dòng)矢量限制在已編碼參考圖像的內部。圖像邊界外推法作為可選技術(shù)首次出現在H.263中。

●多參考圖像運動(dòng)補償：在MPEG-2及以前的標準中，P幀只使用一幀，B幀只使用兩幀圖像進(jìn)行預測。H.264/AVC使用高級圖像選擇技術(shù)，可以用以前已編碼過(guò)且保留在緩沖區的大量的圖像進(jìn)行預測，大大提高了編碼效率。

●消除參考圖像順序和顯示圖像順序的相關(guān)性：在以前的標準中，參考圖像順序依賴(lài)顯示圖像順序，H.264/AVC消除了該限制，可以任意選擇。

● 消除參考圖像與圖像表示方法的限制：在以前的標準中，B幀圖像不能作為預測圖像，H.264/AVC在很多情況可以利用B幀圖像作為參考。

● 加權預測：H.264/AVC采用新技術(shù)，允許加權運動(dòng)補償預測和偏移一定量。在淡入淡出場(chǎng)景中該技術(shù)極大提高編碼效率，該技術(shù)還可用于其他多種用途。

● 改善“跳過(guò)”和“直接”運動(dòng)推測：在以前的標準中，預測編碼圖像的“跳過(guò)”區不能有運動(dòng)。當編碼有全局運動(dòng)的圖像時(shí)，該限制非常有害。H.264/AVC對“跳過(guò)”區的運動(dòng)采用推測方法。對雙預測的B幀圖像，采用高級運動(dòng)預測方法，稱(chēng)為“直接”運動(dòng)補償，進(jìn)一步改善編碼效率。

● 幀內編碼直接空間預測：將編碼圖像邊沿進(jìn)行外推應用到當前幀內編碼圖像的預測。

● 循環(huán)去塊效應濾波器：基于塊的視頻編碼在圖像中存在塊效應，主要來(lái)源于預測和殘余編碼。自適應去塊效應濾波技術(shù)是非常著(zhù)名的技術(shù)，能有效消除塊效應，改善視頻的主觀(guān)和客觀(guān)質(zhì)量。

2、除改善預測方法外，其他改善編碼效率的特性如下：

● 小塊變換：以前的標準變換的塊都是8×8，H.264/AVC主要使用4×4塊變換，使編碼器表示信號局部適應性更好，更適合預測編碼，減少“鈴”效應。另外圖像邊界需要小塊變換。

● 分級塊變換：H.264/AVC通常使用小塊變換，但有些信號包含足夠的相關(guān)性，要求以大塊表示，H.264/AVC有兩種方式實(shí)現。低頻色度信號可用8×8，；對幀內編碼，可使用特別的編碼類(lèi)型，低頻亮度信號可用16×16塊。

● 短字長(cháng)變換：所有以前標準使用的變換要求32位運算，H.264/AVC只使用16位運算。

● 完全匹配反變換：所有以前標準反變換和變換之間存在一定容限的誤差，因此，每個(gè)解碼器輸出視頻信號都不相同，產(chǎn)生小的漂移，最終影響圖像的質(zhì)量，H.264/AVC實(shí)現了完全匹配。

● 基于上下文的熵編碼：H.264/AVC使用兩種熵編碼方法，CAVLC（上下文自適應的可變長(cháng)編碼）和CABAC（上下文自適應二進(jìn)制算術(shù)編碼），兩種都是基于上下文的熵編碼技術(shù)。

3、H.264/AVC具有強大的糾錯功能和各種網(wǎng)絡(luò )環(huán)境操作靈活性，主要特性如下：

● 參數集結構：H.264/AVC參數集結構設計了強大、有效的傳輸頭部信息。在以前的標準中，如果少數幾位關(guān)鍵信息丟失，可能解碼器產(chǎn)生嚴重解碼錯誤。H.264/AVC采用很靈活、特殊的方式，分開(kāi)處理關(guān)鍵信息，能在各種環(huán)境下可靠傳送。

● NAL單元語(yǔ)法結構：H.264/AVC中的每一個(gè)語(yǔ)法結構放置在稱(chēng)為NAL的單元中，以前的標準采用強制性特定的位流接口。NAL單元語(yǔ)法結構允許很自由的客戶(hù)化，幾乎適合所有的網(wǎng)絡(luò )接口。

● 靈活的像條大?。涸贛PEG-2中，規定了嚴格的像條結構，頭部數據量大，降低預測效率，編碼效率低。在H.264/AVC可采用非常靈活的像條大小。

● 靈活宏塊排序（FMO）：H.264/AVC可以將圖像劃分為像條組，又稱(chēng)為圖像區，每個(gè)像條可以獨立解碼。FMO通過(guò)管理圖像區之間的關(guān)系，具有很強的抗數據丟失能力。

● 任意像條排序：因為每個(gè)像條幾乎可以獨立解碼，所以像條可以按任意順序發(fā)送和接收，在實(shí)時(shí)應用中，可以改善端到端的延時(shí)特性，特別適合于接收順序和發(fā)送順序不能對應的網(wǎng)絡(luò )中，如使用INTERNET網(wǎng)絡(luò )協(xié)議的應用。

● 冗余圖像：為提高抗數據丟失的能力，H.264/AVC設計中包含一種新的能力，允許編碼器發(fā)送圖像區的冗余表示，當圖像區的主表示丟失時(shí)仍可以正確解碼。

● 數據劃分：視頻流中的編碼信息的重要性不同，有些信息（如運動(dòng)矢量、預測信息等）比其他信息更為重要。H.264/AVC可以根據每個(gè)像條語(yǔ)法元素的范疇，將像條語(yǔ)法劃分為3部分，分開(kāi)傳送。

二、網(wǎng)絡(luò )層

NAL規范視頻數據的格式，主要是提供頭部信息，以適合各種媒體的傳輸和存儲。NAL支持各種網(wǎng)絡(luò )，包括：

● 任何使用RTP/IP協(xié)議的實(shí)時(shí)有線(xiàn)和無(wú)線(xiàn)Internet 服務(wù)。

● 作為MP4文件存儲和多媒體信息文件服務(wù)。

● MPEG-2系統。

● 其他網(wǎng)。

1、NAL 單元

編碼的視頻流組織成NAL單元，視頻數據放置在網(wǎng)絡(luò )單元中傳輸，每個(gè)網(wǎng)絡(luò )單元包含整數個(gè)字節，第一個(gè)字節是頭部信息，指示NAL單元的數據類(lèi)型，其余是凈荷。

凈荷數據與仿真預防字節做交織處理，仿真預防字節是特殊值字節，防止偶然在凈荷中出現同步字節圖樣。

NAL規定一種通用的格式，既適合面向包傳輸，也適合流傳送。實(shí)際上，包傳輸和流傳輸的方式是相同的，不同之處是流傳輸前面增加了一個(gè)起始碼前綴。

2、NAL單元在字節流中的應用

類(lèi)似H.320和MPEG-2/H.222.0等傳輸系統，傳輸NAL作為有序連續字節或比特流，同時(shí)要依靠數據本身識別NAL單元邊界。在這樣的應用系統中，H.264/AVC規范定義了字節流格式，每個(gè)NAL單元前面增加3個(gè)字節的前綴，即同步字節。在比特流應用中，每個(gè)圖像需要增加一個(gè)附加字節作為邊界定位。還有一種可選特性，在字節流中增加附加數據，用做擴充發(fā)送數據量，能實(shí)現快速邊界定位，恢復同步。

3、NAL單元在面向包傳送中的應用

在類(lèi)似Internet/RTP面向包傳送協(xié)議系統中，包結構中包含包邊界識別字節，在這種情況下，不需要同步字節。

4、VCL和非VCL的NAL單元

NAL單元分為VCL和非VCL兩種，VCL NAL單元包含視頻圖像采樣信息，非VCL包含各種有關(guān)的附加信息，例如參數集（頭部信息，應用到大量的VCL NAL單元）、提高性能的附加信息、定時(shí)信息等。

5、參數集

參數集是很少變化的信息，用于大量VCL NAL單元的解碼，分為兩種類(lèi)型：

● 序列參數集，作用于一串連續的視頻圖像，即視頻序列。

● 圖像參數集，作用于視頻序列中的一個(gè)或多個(gè)個(gè)別的圖像。

序列和圖像參數集機制，減少了重復參數的傳送，每個(gè)VCL NAL單元包含一個(gè)標識，指向有關(guān)的圖像參數集，每個(gè)圖像參數集包含一個(gè)標識，指向有關(guān)的序列參數集的內容，因此，只用少數的指針信息，引用大量的參數，大大減少每個(gè)VCL NAL單元重復傳送的信息。

序列和圖像參數集可以在發(fā)送VCL NAL單元以前發(fā)送，并且重復傳送，大大提高糾錯能力。序列和圖像參數集可以在“帶內”，也可以用更為可靠的其他“帶外”通道傳送。

6、存儲單元

一組指定格式的NAL單元稱(chēng)為存儲單元，每個(gè)存儲單元對應一個(gè)圖像。每個(gè)存儲單元包含一組VCL NAL單元，組成一個(gè)主編碼圖像，VCL NAL單元由表示視頻圖像采樣的像條所組成。存儲單元前面可以加一個(gè)前綴，分界存儲單元，附加增強信息（SEI）（如圖像定時(shí)信息）也可以放在主編碼圖像的前面。

主編碼圖像后附加的VCL NAL單元，包含同一圖像的冗余表示，稱(chēng)為冗余編碼圖像，當主編碼圖像數據丟失或損壞時(shí)，可用冗余編碼圖像解碼。

7、編碼視頻序列

一個(gè)編碼視頻序列由一串連續的存儲單元組成，使用同一序列參數集。每個(gè)視頻序列可獨立解碼。編碼序列的開(kāi)始是即時(shí)刷新存儲單元（IDR）。IDR是一個(gè)I幀圖像，表示后面的圖像不用參考以前的圖像。一個(gè)NAL單元流可包含一個(gè)或更多的編碼視頻序列。

MPEG-4標準

運動(dòng)圖像專(zhuān)家組MPEG 于1999年2月正式公布了MPEG-4（ISO/IEC14496）標準第一版本。同年年底MPEG-4第二版亦告底定，且于2000年年初正式成為國際標準。

   MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法，它是針對數字電視、交互式繪圖應用（影音合成內容）、交互式多媒體（WWW、資料擷取與分散）等整合及壓縮技術(shù)的需求而制定的國際標準。MPEG-4標準將眾多的多媒體應用集成于一個(gè)完整的框架內，旨在為多媒體通信及應用環(huán)境提供標準的算法及工具，從而建立起一種能被多媒體傳輸、存儲、檢索等應用領(lǐng)域普遍采用的統一數據格式。

   MPEG-4的編碼理念是：MPEG-4標準同以前標準的最顯著(zhù)的差別在于它是采用基于對象的編碼理念，即在編碼時(shí)將一幅景物分成若干在時(shí)間和空間上相互聯(lián)系的視頻音頻對象，分別編碼后，再經(jīng)過(guò)復用傳輸到接收端，然后再對不同的對象分別解碼，從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象采用不同的編碼方法和表示方法，又有利于不同數據類(lèi)型間的融合，并且這樣也可以方便的實(shí)現對于各種對象的操作及編輯。例如，我們可以將一個(gè)卡通人物放在真實(shí)的場(chǎng)景中，或者將真人置于一個(gè)虛擬的演播室里，還可以在互聯(lián)網(wǎng)上方便的實(shí)現交互，根據自己的需要有選擇的組合各種視頻音頻以及圖形文本對象。

   MPEG-4系統的一般框架是：對自然或合成的視聽(tīng)內容的表示；對視聽(tīng)內容數據流的管理，如多點(diǎn)、同步、緩沖管理等；對靈活性的支持和對系統不同部分的配置。

   與MPEG-1、MPEG-2相比，MPEG-4具有如下獨特的優(yōu)點(diǎn)：

   （1）基于內容的交互性

   MPEG-4提供了基于內容的多媒體數據訪(fǎng)問(wèn)工具，如索引、超級鏈接、上下載、刪除等。利用這些工具，用戶(hù)可以方便地從多媒體數據庫中有選擇地獲取自己所需的與對象有關(guān)的內容，并提供了內容的操作和位流編輯功能，可應用于交互式家庭購物，淡入淡出的數字化效果等。MPEG-4提供了高效的自然或合成的多媒體數據編碼方法。它可以把自然場(chǎng)景或對象組合起來(lái)成為合成的多媒體數據。

   （2）高效的壓縮性

   MPEG-4基于更高的編碼效率。同已有的或即將形成的其它標準相比，在相同的比特率下，它基于更高的視覺(jué)聽(tīng)覺(jué)質(zhì)量，這就使得在低帶寬的信道上傳送視頻、音頻成為可能。同時(shí)MPEG-4還能對同時(shí)發(fā)生的數據流進(jìn)行編碼。一個(gè)場(chǎng)景的多視角或多聲道數據流可以高效、同步地合成為最終數據流。這可用于虛擬三維游戲、三維電影、飛行仿真練習等

   （3）通用的訪(fǎng)問(wèn)性

   MPEG-4提供了易出錯環(huán)境的魯棒性，來(lái)保證其在許多無(wú)線(xiàn)和有線(xiàn)網(wǎng)絡(luò )以及存儲介質(zhì)中的應用，此外，MPEG-4還支持基于內容的的可分級性，即把內容、質(zhì)量、復雜性分成許多小塊來(lái)滿(mǎn)足不同用戶(hù)的不同需求，支持具有不同帶寬，不同存儲容量的傳輸信道和接收端。

   這些特點(diǎn)無(wú)疑會(huì )加速多媒體應用的發(fā)展，從中受益的應用領(lǐng)域有：因特網(wǎng)多媒體應用；廣播電視；交互式視頻游戲；實(shí)時(shí)可視通信；交互式存儲媒體應用；演播室技術(shù)及電視后期制作；采用面部動(dòng)畫(huà)技術(shù)的虛擬會(huì )議；多媒體郵件；移動(dòng)通信條件下的多媒體應用；遠程視頻監控；通過(guò)ATM網(wǎng)絡(luò )等進(jìn)行的遠程數據庫業(yè)務(wù)等。MPEG-4主要應用如下：

   （1）應用于因特網(wǎng)視音頻廣播

   由于上網(wǎng)人數與日俱增，傳統電視廣播的觀(guān)眾逐漸減少，隨之而來(lái)的便是廣告收入的減少，所以現在的固定式電視廣播最終將轉向基于TCP/IP的因特網(wǎng)廣播，觀(guān)眾的收看方式也由簡(jiǎn)單的遙控器選擇頻道轉為網(wǎng)上視頻點(diǎn)播。視頻點(diǎn)播的概念不是先把節目下載到硬盤(pán)，然后再播放，而是流媒體視頻（streaming video），點(diǎn)擊即觀(guān)看，邊傳輸邊播放。

   現在因特網(wǎng)中播放視音頻的有：Real Networks公司的 Real Media，微軟公司的 Windows Media，蘋(píng)果公司的 QuickTime，它們定義的視音頻格式互不兼容，有可能導致媒體流中難以控制的混亂，而MPEG-4為因特網(wǎng)視頻應用提供了一系列的標準工具，使視音頻碼流具有規范一致性。因此在因特網(wǎng)播放視音頻采用MPEG-4，應該說(shuō)是一個(gè)安全的選擇。

   （2）應用于無(wú)線(xiàn)通信

   MPEG-4高效的碼率壓縮，交互和分級特性尤其適合于在窄帶移動(dòng)網(wǎng)上實(shí)現多媒體通信，未來(lái)的手機將變成多媒體移動(dòng)接收機，不僅可以打移動(dòng)電視電話(huà)、移動(dòng)上網(wǎng)，還可以移動(dòng)接收多媒體廣播和收看電視。

   （3）應用于靜止圖像壓縮

   靜止圖像（圖片）在因特網(wǎng)中大量使用，現在網(wǎng)上的圖片壓縮多采用JPEG技術(shù)。MPEG-4中的靜止圖像（紋理）壓縮是基于小波變換的，在同樣質(zhì)量條件下，壓縮后的文件大小約是JPEG壓縮文件的十分之一。把因特網(wǎng)上使用的JPEG圖片轉換成MPEG-4格式，可以大幅度提高圖片在網(wǎng)絡(luò )中的傳輸速度。

   （4）應用于電視電話(huà)

   傳統用于窄帶電視電話(huà)業(yè)務(wù)的壓縮編碼標準，如H261，采用幀內壓縮、幀間壓縮、減少象素和抽幀等辦法來(lái)降低碼率，但編碼效率和圖像質(zhì)量都難以令人滿(mǎn)意。MPEG-4的壓縮編碼可以做到以極低碼率傳送質(zhì)量可以接受的聲像信號，使電視電話(huà)業(yè)務(wù)可以在窄帶的公用電話(huà)網(wǎng)上實(shí)現。

   （5）應用于計算機圖形、動(dòng)畫(huà)與仿真

   MPEG-4特殊的編碼方式和強大的交互能力，使得基于MPEG-4的計算機圖形和動(dòng)畫(huà)可以從各種來(lái)源的多媒體數據庫中獲取素材，并實(shí)時(shí)組合出所需要的結果。因而未來(lái)的計算機圖形可以在MPEG-4語(yǔ)法所允許的范圍內向所希望的方向無(wú)限發(fā)展，產(chǎn)生出今天無(wú)法想象的動(dòng)畫(huà)及仿真效果。

   （6）應用于電子游戲

   MPEG-4可以進(jìn)行自然圖像與聲音同人工合成的圖像與聲音的混合編碼，在編碼方式上具有前所未有的靈活性，并且能及時(shí)從各種來(lái)源的多媒體數據庫中調用素材。這可以在將來(lái)產(chǎn)生象電影一樣的電子游戲，實(shí)現極高自由度的交互式操作。

本站僅提供存儲服務(wù)，所有內容均由用戶(hù)發(fā)布，如發(fā)現有害或侵權內容，請點(diǎn)擊舉報。

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久