| 北京廣播學(xué)院電視工程系 教授 郭 斌 MPEG是運動(dòng)圖像專(zhuān)家組(Moving Picture Experts Group)的簡(jiǎn)稱(chēng),其實(shí)質(zhì)上的名稱(chēng)為國際標準化組織(ISO)和國際電工委員會(huì )(IEC)聯(lián)合技術(shù)委員會(huì )(JTC)1的第29 分委員會(huì )的第11工作組,即ISO/IEC JTC1/SC29/WG11,成立于1988年。其任務(wù)是制定世界通用的視音頻編碼標準。因為,廣播電視數字化所產(chǎn)生的海量數據對存儲容量、傳輸帶寬、處理能力及頻譜資源利用率提出了不切合實(shí)際的要求,使數字化難以實(shí)現。為此,該專(zhuān)家組基于幀內圖像相鄰像素間及相鄰行間的空間相關(guān)性和相鄰幀間運動(dòng)圖像的時(shí)間相關(guān)性,采用壓縮編碼技術(shù),將那些對人眼視覺(jué)圖像和人耳聽(tīng)覺(jué)聲音不太重要的東西及冗余成分拋棄,從而縮減了存儲、傳輸和處理的數據量,提高了頻譜資源利用率,制定了如表1所示的一系列MPEG標準,使數字化正在變?yōu)楝F實(shí)。其中,MPEG-2是一組用于視音頻壓縮編碼及其數據流格式的國際標準。它定義了編解碼技術(shù)及數據流的傳輸協(xié)議;制定了MPEG-2解碼器之間的共同標準(MPEG-2編碼器之間尚無(wú)共同標準)。本文以MPEG-2的系統、MPEG-2的編碼、及MPEG-2的應用為題,討論MPEG-2壓縮編碼技術(shù)。 ![]() 一、MPEG-2的系統 1.系統的定義 MPEG-2系統是將視頻、音頻及其它數據基本流組合成一個(gè)或多個(gè)適宜于存儲或傳輸的數據流的規范,如圖1所示。由圖1可見(jiàn),符合ITU-R. 601標準的、幀次序為I1B2B3P4B5B6P7B8B9I10數字視頻數據和符合AES/EBU標準的數字音頻數據分別通過(guò)圖像編碼和聲音編碼之后,生成次序為I1P4B2B3 P7B5B6I10 B8B9視頻基本流(ES)和音頻ES。在視頻ES中還要加入一個(gè)時(shí)間基準,即加入從視頻信號中取出的27MHz時(shí)鐘。然后,再分別通過(guò)各自的數據包形成器,將相應的ES打包成打包基本流(PES)包,并由PES包構成PES。最后,節目復用器和傳輸復用器分別將視頻PES和音頻PES組合成相應的節目流(PS)包和傳輸流(TS)包,并由PS包構成PS和由TS包構成TS。顯然,不允許直接傳輸PES,只允許傳輸PS和TS;PES只是PS轉換為T(mén)S或TS轉換為PS的中間步驟或橋梁,是MPEG數據流互換的邏輯結構,本身不能參與交換和互操作。由系統的定義,可知MPEG-2系統的任務(wù)。 ![]() ![]() 2.系統的任務(wù) MPEG-2的標準由表2所示的8個(gè)文件組成,MPEG-2系統是其關(guān)鍵部分。MPEG以開(kāi)放系統互聯(lián)(OSI-Open System Interconnection)為目標,爭取全球標準化。在詳細規定視音頻編碼算法的基礎上,為傳輸和交換編碼數據流(比特流,碼流,流)創(chuàng )造統一條件。以利于接收端重建為指導,按照既定的參數給數據流以一定程度的“包裝”。因此,MPEG-2系統應完成的任務(wù)有: ● 規定以包方式傳輸數據的協(xié)議; 由系統的任務(wù),可知完成任務(wù),系統應具備的基礎。 3.系統的要點(diǎn) 根據數字通信信息量可以逐段傳輸的機理,將已編碼數據流在時(shí)間上以一定重復周期結構分割成不能再細分的最小信息單元,這個(gè)最小信息單元就定義為數據包,幾個(gè)小數據包(Data Packet)又可以打包成大數據包(Data Pack)。用數據包傳輸的優(yōu)點(diǎn)是:網(wǎng)絡(luò )中信息可占用不同的連接線(xiàn)路和簡(jiǎn)單暫存;通過(guò)數據包交織將多個(gè)數據流組合(復用)成一個(gè)新的數據流;便于解碼器按照相應順序對數據包進(jìn)行靈活地整理。從而,數據包為數據流同步和復用奠定了基礎。因此,MPEG-2系統規范不僅采用了PS、TS和PES三種數據包,而且也涉及PS和TS兩種可以互相轉換的數據流。顯然,以數據包形式存儲和傳送數據流是MPEG-2系統的要點(diǎn)。為此,MPEG-2系統規范定義了三種數據包及兩種數據流: 1) 打包基本流(PES) 將MPEG-2壓縮編碼的視頻基本流(ES-Elementary Stream)數據分組為包長(cháng)度可變的數據包,稱(chēng)為打包基本流(PES- Packetized Elementary Stream)。廣而言之,PES為打包了的專(zhuān)用視頻、音頻、數據、同步、識別信息數據通道。所謂ES,是指只包含1個(gè)信源編碼器的數據流。即ES是編碼的視頻數據流,或編碼的音頻數據流,或其它編碼數據流的統稱(chēng)。每個(gè)ES都由若干個(gè)存取單元(AU-Access Unit)組成,每個(gè)視頻AU或音頻AU都是由頭部和編碼數據兩部分組成的。將幀順序為I1P4B2B3P7B5B6 的編碼ES,通過(guò)打包,就將ES變成僅含有1種性質(zhì)ES的PES包,如僅含視頻ES的PES包,僅含音頻ES的PES包,僅含其它ES的PES包。PES包的組成見(jiàn)圖2。 ![]() 由圖2可見(jiàn),1個(gè)PES包是由包頭、ES特有信息和包數據3個(gè)部分組成。由于包頭和ES特有信息二者可合成1個(gè)數據頭,所以可認為1個(gè)PES包是由數據頭和包數據(有效載荷)兩個(gè)部分組成的。 包頭由起始碼前綴、數據流識別及PES包長(cháng)信息3部分構成。包起始碼前綴是用23個(gè)連續“0”和1個(gè)“1”構成的,用于表示有用信息種類(lèi)的數據流識別,是1個(gè)8 bit的整數。由二者合成1個(gè)專(zhuān)用的包起始碼,可用于識別數據包所屬數據流(視頻,音頻,或其它)的性質(zhì)及序號。例如: 比特序1 1 0 ×××××是號碼為××××的MPEG-2音頻數據流; PES包長(cháng)用于包長(cháng)識別,表明在此字段后的字節數。如,PES包長(cháng)識別為2 B ,即2×8 = 16 bit字寬,包總長(cháng)為216-1=65535 B,分給數據頭9 B(包頭6 B + ES特有信息3 B ),可變長(cháng)度的包數據最大容量為65526 B。盡管PES包最大長(cháng)度可達(216 -1)=65535 B(Byte),但在通常的情況下是組成ES的若干個(gè)AU中的由頭部和編碼數據兩部分組成的1個(gè)AU長(cháng)度。1個(gè)AU相當于編碼的1幅視頻圖像或1個(gè)音頻幀,參見(jiàn)圖2右上角從ES到PES的示意圖。也可以說(shuō),每個(gè)AU實(shí)際上是編碼數據流的顯示單元,即相當于解碼的1幅視頻圖像或1個(gè)音頻幀的取樣。 ES特有信息是由PES包頭識別標志、PES包頭長(cháng)信息、信息區和用于調整信息區可變包長(cháng)的填充字節4部分組成的PES包控制信息。其中,PES包頭識別標志由12個(gè)部分組成:PES加擾控制信息、PES優(yōu)先級別指示、數據適配定位指示符、有否版權指示、原版或拷貝指示、有否顯示時(shí)間標記(PTS-Presentation Time Stamp)/解碼時(shí)間標記(DTS-Decode Time Stamp)標志、PES包頭有否基本流時(shí)鐘基準(ESCR-Elementary Stream Clock Reference)信息標志、PES包頭有否基本流速率信息標志、有否數字存儲媒體(DSM)特技方式信息標志、有否附加的拷貝信息標志、PES包頭有否循環(huán)冗余校驗(CRC-Cyclic Redundancy Check)信息標志、有否PES擴展標志。有擴展標志,表明還存在其它信息。如,在有傳輸誤碼時(shí),通過(guò)數據包計數器,使接收端能以準確的數據恢復數據流,或借助計數器狀態(tài),識別出傳輸時(shí)是否有數據包丟失。 其中,有否PTS/DTS標志,是解決視音頻同步顯示、防止解碼器輸入緩存器上溢或下溢的關(guān)鍵所在。因為,PTS表明顯示單元出現在系統目標解碼器(STD-System Target Decoder)的時(shí)間, DTS表明將存取單元全部字節從STD的ES解碼緩存器移走的時(shí)刻。視頻編碼圖像幀次序為I1P4B2B3P7B5B6I10B8B9的ES,加入PTS/DTS后,打包成一個(gè)個(gè)視頻PES包。每個(gè)PES包都有一個(gè)包頭,用于定義PES內的數據內容,提供定時(shí)資料。每個(gè)I、P、B幀的包頭都有一個(gè)PTS和DTS,但PTS與DTS對B幀都是一樣的,無(wú)須標出B幀的DTS。對I幀和P幀,顯示前一定要存儲于視頻解碼器的重新排序緩存器中,經(jīng)過(guò)延遲(重新排序)后再顯示,一定要分別標明PTS和DTS。例如,解碼器輸入的圖像幀次序為I1P4B2B3P7B5B6I10B8B9,依解碼器輸出的幀次序,應該P4比B2、B3在先,但顯示時(shí)P4一定要比B2、B3在后,即P4要在提前插入數據流中的時(shí)間標志指引下,經(jīng)過(guò)緩存器重新排序,以重建編碼前視頻幀次序I1B2B3P4B5B6P7B8B9I10。顯然,PTS/DTS標志表明對確定事件或確定信息解碼的專(zhuān)用時(shí)標的存在,依靠專(zhuān)用時(shí)標解碼器,可知道該確定事件或確定信息開(kāi)始解碼或顯示的時(shí)刻。例如,PTS/DTS標志可用于確定編碼、多路復用、解碼、重建的時(shí)間。 (未完待續) |
聯(lián)系客服