活動圖像專家組(MPEG)針對數(shù)字音頻和視頻的編碼原則制定了MPEG標準,通過MPEG壓縮引擎,實現(xiàn)了以經(jīng)濟的成本為消費者提供高質(zhì)量的數(shù)字多媒體內(nèi)容的理想,也為多媒體市場帶來了無限商機。最新開發(fā)的MPEG-4,旨在為機頂盒、互聯(lián)網(wǎng)、移動設備等應用實現(xiàn)更高質(zhì)量的壓縮和更靈活的格式,提供更加豐富的選擇。
MPEG-4標準目前已發(fā)展為ISO/IEC-14496第一版和第二版。隨著MPEG-4 第十部分H.264/先進的視頻編碼(AVC)的提出,MPEG標準進一步演進。與此同時,中國自主知識產(chǎn)權的數(shù)字音視頻編解碼標準(AVS)的制定也為便攜式多媒體技術開創(chuàng)了新的發(fā)展空間。
高質(zhì)量有效傳輸數(shù)字多媒體內(nèi)容
MPEG-4可同時處理各種“媒體對象(視頻和音頻內(nèi)容的統(tǒng)稱)”,形成視聽場景,為整套工具包提供互動和個性化媒體內(nèi)容的視聽數(shù)據(jù),同時,還可壓縮/解壓其他媒體對象,如文本、圖像、語音、動畫、2D和3D對象等。為實現(xiàn)該標準的有效實施,MPEG-4系統(tǒng)對子集、視頻和音頻工具集都進行了定義,以應用于各種特殊應用,為音頻/視頻對象的編碼提供更豐富的工具。
圖1 H.264/AVC宏塊視頻編碼層框圖
H.264/AVC打造MPEG-4新特性
MPEG-4 第十部分H.264/AVC在本質(zhì)上與MPEG-2等其他標準類似,是由時間預測和空間預測的綜合體與編碼轉(zhuǎn)換共同組成的,但這一新標準并不會取代現(xiàn)有的MPEG-4 第二部分“編碼解碼器”,也不與其兼容。
除此之外,H.264/AVC還采用了視頻編碼領域的最新研究成果。由于采用了幀內(nèi)預測、整數(shù)轉(zhuǎn)換、可變的塊尺寸運動評估/補償和去塊過濾等現(xiàn)有先進技術,H.264/AVC與之前的標準相比又增加了新的特性,在幫助其他現(xiàn)有的標準在維持相同視頻質(zhì)量的同時,還可平均降低50%的位率。
表1 H.264/AVC與其他標準的比較
幀間預測功能
H.264/AVC可根據(jù)每個宏塊片編碼類型的不同,以幾種編碼類型中的一種進行傳輸,并且所有片編碼類型可支持INTRA-4×4和INTRA-16×16兩種類別的幀內(nèi)編碼類型。在以往的視頻編碼標準中,預測操作都是在轉(zhuǎn)換域中進行的,而在H.264/AVC標準中,這一操作往往是根據(jù)已編碼塊中的相鄰樣本,在空間域中進行的。幀內(nèi)預測不能跨越片邊界,以保持片與片之間的相互獨立性。
P片中的活動補償
除幀內(nèi)宏塊編碼類型外,H.264/AVC還包含多種針對P片宏塊的預測性或活動補償性的編碼類型。宏塊被分割在用于活動描述的大小固定的塊中,每個P類宏塊對應一個特定的宏塊分區(qū)。活動補償?shù)木葹橐粋€樣本距離的四分之一。
一般情況下,H.264/AVC的語法可支持無限制的活動矢量,即活動矢量可以超出畫面區(qū)域,但活動矢量元件預測不能跨越片邊界。
整數(shù)轉(zhuǎn)換
此外,與以往的視頻編碼標準相似,H.264/AVC也采用預測剩余的轉(zhuǎn)換編碼,但這種轉(zhuǎn)換僅應用于4×4塊,而且計算中采用了與4×4離散余弦轉(zhuǎn)換(DCT)特性基本相同的分離整數(shù)轉(zhuǎn)換,以此取代了4×4DCT。由于整個逆轉(zhuǎn)換過程由精確整數(shù)運算定義,因此避免了逆轉(zhuǎn)換過程中的不錯配現(xiàn)象。而對于轉(zhuǎn)換系數(shù)的量化,H.264/AVC運用了標量化的方法。塊中的量化轉(zhuǎn)換系數(shù)通常按照之字形順序進行掃描,并采用平均信息量編碼的方式傳輸。只要16位整數(shù)值相加,并在16位整數(shù)值的基礎上進行位移操作,H.264/AVC 中的所有轉(zhuǎn)換就都能實現(xiàn)。
圖2 一個H.264的P片宏塊的分區(qū)結(jié)構
圖3 多畫面活動補償預測
平衡信息量編碼
為實現(xiàn)量化轉(zhuǎn)換系數(shù)的傳輸,H.264/AVC采用了更先進的前后自適應可變長度編碼(CAVLC),與僅采用單個VLC列表的方法相比,這一技術能進一步改善平均信息量編碼質(zhì)量。此外H.264/AVC還支持前后自適應二進制算術編碼(CABAC),與CAVLC相比,CABAC在進行相同質(zhì)量的電視信號編碼時,通常能夠節(jié)約10%到15% 的位率,從而進一步提升了平均信息量編碼效率。
多基準幀
H.264/AVC 還支持多畫面活動補償預測。如圖3所示,H.264/AVC可提供不止一個的預先編碼畫面作為活動補償預測基準。然而,無論是編碼器還是解碼器都必須存儲基準畫面,以實現(xiàn)多畫面緩沖器中的畫面間預測。
基于以上特別的先進技術,與其他現(xiàn)有標準相比,H.264/AVC所帶來的益處顯而易見。例如,與MPEG-2、MPEG-4 ASP 和H.263 HLP等現(xiàn)有的編碼標準相比,在使用H.264/AVC播放DVD品質(zhì)的電視或進行HD視頻編碼時,相關的位率可節(jié)省2.25 到2.5,如表1所示。
AVS開創(chuàng)MEPG-4發(fā)展新境界
隨著中國數(shù)字音頻/視頻多媒體設備和系統(tǒng)市場的發(fā)展,為建立全國性的壓縮、處理和數(shù)字版權管理標準,中國數(shù)字音視頻編解碼技術標準工作組(中國AVS工作組)開發(fā)了數(shù)字音視頻編解碼標準(AVS),并于2002年6月由中國信息產(chǎn)業(yè)部科學技術司批準通過。2003年12月,AVS工作組針對高清和高質(zhì)量數(shù)字廣播、數(shù)字存儲媒體及其他相關應用制定的首個AVS視頻標準問世。
由于采用的模塊相同,AVS與H.264/AVC編碼器的架構看起來比較類似。但是,考慮到目標應用與MPEG-2的向后兼容性以及解碼復雜程度等因素, AVS音視頻編碼解碼器中模塊還是采用了獨到的技術,實現(xiàn)了編碼效率的進一步大幅提升。
AVS需要對輸入宏塊進行預測,圖4所示的開關S0 用于選擇幀間和幀內(nèi)宏塊所需的正確預測方法。幀內(nèi)預測源自左上方塊中的相鄰像素。由于采用的是8×8整數(shù)轉(zhuǎn)換,因此空間預測的單元大小也是8×8。幀間預測則源自解碼幀和解碼場。AVS支持16×16、16×8、8×16和8×8這4種尺寸的塊,但總體而言,高分辨率視頻很少使用小尺寸的塊。AVS幀間塊的活動矢量精度為四分之一像素。
在AVS中,預測剩余誤差需通過8×8整數(shù)轉(zhuǎn)換方法進行轉(zhuǎn)換。漸進塊仍然按照之字形順序進行掃描,與MPEG-2中的掃描順序相似。但AVS卻通過自適應VLC編碼技術在逐行掃描塊中定義了一種新的掃描順序,四種不同類型的Exp-Golomb密碼本也分別對應不同的分配方式。此外,AVS還定義了一些映射表,可將編碼符號映射到特殊編碼及其成分中。
預測與當前重建錯誤圖像的總數(shù)構成了重建基準。AVS在活動補償環(huán)路中使用了一個去塊濾波器,能夠根據(jù)塊的工作情況與QP參數(shù)進行自動調(diào)節(jié)。
由于MPEG-2編碼解碼器與系統(tǒng)在現(xiàn)有的廣播系統(tǒng)中得到了廣泛的運用,因此AVS的語法結(jié)構也特別采用了與MPEG-2類似的設計,因此能夠直接應用于現(xiàn)有的MPEG-2系統(tǒng)。
目前,AVS可支持YUV 4:2:0和YUV 4:2:2采樣結(jié)構,以及8位樣本精度,用于色度格式的2位無正負整數(shù)則為諸如YUV 4:4:4 或RGB 4:4:4之類的其他順序格式保留了應用空間。
圖4 AVS 視頻編碼器框圖
圖5 PR8185單芯片解決方案
實現(xiàn)AVS視頻標準的主要技術
平均信息量編碼
首先,AVS 采用了 序列Exp-Golomb編碼表 (k=0, 1, 2, 3)、CBP、宏塊編碼模式和活動矢量, 并通過 序列 Exp-Golomp 編碼表進行解碼。由于對Exp-Golomp 編碼表進行了調(diào)整,AVS解碼器并不需要存儲這些編碼表。而語法元素可以利用帶有可選擇查找表的簡單分析進行解碼。 AVS定義的19 個映射表盡管只占用了不到2k 字節(jié)的空間,卻能很好地適應不同的分配,并具有很高的編碼能力。
轉(zhuǎn)換和量化
與 H.264/AVC 和 MPEG-2不同的是, AVS 采用8×8 整數(shù)轉(zhuǎn)換。為了減少解量化和逆轉(zhuǎn)換中的取整誤差,AVS還專門設置了一種特殊程序,并且各種操作均可在16 位內(nèi)完成。
幀內(nèi)預測
AVS 視頻標準采用了幀內(nèi)預測技術,改進了幀內(nèi)編碼的宏塊性能。與AVC/H.264相比, AVS 定義了5種用于8×8亮度塊的模式和 4種用于8×8 色度塊的模式。





