<li id="i93a3"><meter id="i93a3"></meter></li>

        1. DAV首頁
          數字音視工程網

          微信公眾號

          數字音視工程網

          手機DAV

          null
          null
          null
          卓華,
          null
          null
          null
          null
          null
          null

          我的位置:

          share

          IPTV編解碼標準綜述

          來源:中廣互聯        編輯:ann    2012-10-25 11:52:44     加入收藏

            IPTV是一種利用寬帶網,集互聯網、多媒體、通訊等多種技術于一體,向家庭用戶提供包括數字電視在內的多種交互式服務的嶄新技術。由于國際上固話運營商都是從最近兩年才興起IPTV熱,所以至今也沒有一個國家在IPTV業務方面形成成熟標準,國內IPTV業務也同樣無標準可循。中國通信標準化協會(CCSA)IP與多媒體工作委員會IPTV特別工作組于2005年下半年成立,并啟動了對IPTV標準的研究和制訂工作。參加IPTV特別工作組的單位幾乎包含了目前從事IPTV業務運營、開發和研究的國內外所有企業。

            IPTV最重要的標準就是編解碼標準,編碼直接關系到解碼,解碼又會影響到機頂盒。標準化是產業化成功的前提,之所以目前尚沒有廠家大規模生產網絡機頂盒,一個重要原因就是沒有確定的標準支持。盡管IPTV編解碼標準有很多種,但在中國主要是采用MPEG-4、H.264技術以及中國提出的具有自主知識產權的標準AVS,國內企業面臨一場抉擇。

            1 MPEG-4標準簡介

            運動圖像專家組MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)標準第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成為國際標準。MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法,它是針對數字電視、交互式繪圖應用、交互式多媒體等整合及壓縮技術的需求而制定的國際標準。MPEG-4標準將眾多的多媒體應用集成于一個完整的框架內,旨在為多媒體通信及應用環境提供標準的算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等應用領域普遍采用的統一數據格式。

            MPEG-4的編碼理念是:MPEG-4標準同以前標準的最顯著的差別在于它是采用基于對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯系的視頻音頻對象,分別編碼后,再經過復用傳輸到接收端,然后再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象采用不同的編碼方法和表示方法,又有利于不同數據類型間的融合,并且這樣也可以方便的實現對于各種對象的操作及編輯。

            MPEG-4除采用第一代視頻編碼的核心技術,如變換編碼、運動估計與運動補償、量化、熵編碼外,還提出了一些新的有創見性的關鍵技術,并在第一代視頻編碼技術基礎上進行了卓有成效的完善和改進。下面重點介紹其中的一些關鍵技術。

            (1)視頻對象提取技術

            MPEG-4實現基于內容交互的首要任務就是把視頻/圖像分割成不同對象或者把運動對象從背景中分離出來,然后針對不同對象采用相應編碼方法,以實現高效壓縮。因此視頻對象提取即視頻對象分割,是MPEG-4視頻編碼的關鍵技術,也是新一代視頻編碼的研究熱點和難點。

            盡管MPEG-4 框架已經制定,但至今仍沒有通用的有效方法去根本解決視頻對象分割問題,視頻對象分割被認為是一個具有挑戰性的難題,基于語義的分割則更加困難。目前進行視頻對象分割的一般步驟是:先對原始視頻/圖像數據進行簡化以利于分割,這可通過低通濾波、中值濾波、形態濾波來完成;然后對視頻/圖像數據進行特征提取,可以是顏色、紋理、運動、幀差、位移幀差乃至語義等特征;再基于某種均勻性標準來確定分割決策,根據所提取特征將視頻數據歸類;最后是進行相關后處理,以實現濾除噪聲及準確提取邊界。

            (2)VOP視頻編碼技術

            視頻對象平面(VOP,Video Object Plane)是視頻對象(VO)在某一時刻的采樣,VOP是MPEG-4視頻編碼的核心概念。MPEG-4在編碼過程中針對不同VO采用不同的編碼策略,即對前景VO的壓縮編碼盡可能保留細節和平滑;對背景VO則采用高壓縮率的編碼策略,甚至不予傳輸而在解碼端由其他背景拼接而成。這種基于對象的視頻編碼不僅克服了第一代視頻編碼中高壓縮率編碼所產生的方塊效應,而且使用戶可與場景交互,從而既提高了壓縮比,又實現了基于內容的交互,為視頻編碼提供了廣闊的發展空間。MPEG-4支持任意形狀圖像與視頻的編解碼。

            (3)視頻編碼可分級性技術

            隨著因特網業務的巨大增長,在速率起伏很大的IP(Internet Protocol)網絡及具有不同傳輸特性的異構網絡上進行視頻傳輸的要求和應用越來越多。在這種背景下,視頻分級編碼的重要性日益突出,其應用非常廣泛,且具有很高的理論研究及實際應用價值,因此受到人們的極大關注。

            MPEG-4通過視頻對象層(VOL,Video Object Layer)數據結構來實現分級編碼。MPEG-4提供了兩種基本分級工具,即時域分級(Temporal Scalability)和空域分級(SpatialScalability),此外還支持時域和空域的混合分級。每一種分級編碼都至少有兩層VOL,低層稱為基本層,高層稱為增強層?;緦犹峁┝艘曨l序列的基本信息,增強層提供了視頻序列更高的分辨率和細節。

            在隨后增補的視頻流應用框架中,MPEG-4提出了FGS(Fine Granularity Scalable,精細可伸縮性)視頻編碼算法以及PFGS(Progressive Fine Granularity Scalable,漸進精細可伸縮性)視頻編碼算法。

            FGS編碼實現簡單,可在編碼速率、顯示分辨率、內容、解碼復雜度等方面提供靈活的自適應和可擴展性,且具有很強的帶寬自適應能力和抗誤碼性能。但還存在編碼效率低于非可擴展編碼及接收端視頻質量非最優兩個不足。 PFGS則是為改善FGS編碼效率而提出的視頻編碼算法,其基本思想是在增強層圖像編碼時使用前一幀重建的某個增強層圖像為參考進行運動補償,以使運動補償更加有效,從而提高編碼效率。

            (4)運動估計與運動補償技術

            MPEG-4采用I-VOP、P-VOP、B-VOP三種幀格式來表征不同的運動補償類型。它采用了H.263中的半像素搜索(half pixel searching)技術和重疊運動補償(overlapped motioncompensation)技術,同時又引入重復填充(repetitive padding)技術和修改的塊(多邊形)匹配(modified block (polygon)matching)技術以支持任意形狀的VOP區域。

            此外,為提高運動估計算法精度,MPEG-4采用了MVFAST(Motion Vector Field Adaptive Search Technique)和改進的PMVFAST(Predictive MVFAST)方法用于運動估計。對于全局運動估計,則采用了基于特征的FFRGMET(Feature-based Fast and Robust Global Motion Estimation Technique)方法。

            在MPEG-4視頻編碼中,運動估計相當耗時,對編碼的實時性影響很大。因此這里特別強調快速算法。運動估計方法主要有像素遞歸法和塊匹配法兩大類,前者復雜度很高,實際中應用較少,后者則在H.263和MPEG中廣泛采用。目前有三種常用的匹配準則:(1)絕對誤差和(SAD, Sum of Absolute Difference)準則:(2)均方誤差(MSE, Mean Square Error)準則;(3)歸一化互相關函數(NCCF, Normalized Cross Correlation Function)準則。在上述三種準則中,SAD準則具有不需乘法運算、實現簡單方便的優點而使用最多,但應清楚匹配準則的選用對匹配結果影響不大。

            在選取匹配準則后就應進行尋找最優匹配點的搜索工作。最簡單、最可靠的方法是全搜索法(FS, Full Search),但計算量太大,不便于實時實現。因此快速搜索法應運而生,主要有交叉搜索法、二維對數法和鉆石搜索法,其中鉆石搜索法被MPEG-4校驗模型(VM, Verification Model)所采納。

            2 H.264標準簡介

            2003年,ITU-T通過了一個新的數字視頻編解碼標準,即H.264標準,H.264是由ISO/IEC與ITU-T組成的聯合視頻組(JVT)制定的新一代視頻壓縮編解碼標準。國際電信聯盟將該系統命名為H.264/AVC,國際標準化組織和國際電工委員會將其稱為14496-10/MPEG-4 AVC。

            H.264標準只有三個子集:基本子集、主體子集和擴展子集?;咀蛹菍橐曨l會議應用設計的,這套標準幾近完美,能夠提供強大的差錯隱消技術(應用該技術,即使在Internet這樣的易錯網絡上也可以得到較好的視頻效果),并且支持低延時編/解碼技術,使視頻會議顯得更自然。主體子集和擴展子集更適合于電視應用(數字廣播、DVD)和延時顯得并不很重要的視頻流應用。

            H.264標準的關鍵技術如下:

            (1)幀內預測編碼

            幀內編碼用來縮減圖像的空間冗余。為了提高H.264幀內編碼的效率,在給定幀中充分利用相鄰宏塊的空間相關性,相鄰的宏塊通常含有相似的屬性。因此,在對一給定宏塊編碼時,首先可以根據周圍的宏塊預測,然后對預測值與實際值的差值進行編碼,這樣,相對于直接對該幀編碼而言,可以大大減小碼率。H.264提供6種模式進行4×4像素宏塊預測,包括1種直流預測和5種方向預測,H.264也支持16×16的幀內編碼。

            (2)幀間預測編碼

            幀間預測編碼利用連續幀中的時間冗余來進行運動估計和補償。H.264的運動補償支持以往的視頻編碼標準中的大部分關鍵特性,而且靈活地添加了更多的功能,除了支持P幀、B幀外,H.264還支持一種新的流間傳送幀——SP幀,碼流中包含SP幀后,能在有類似內容但有不同碼率的碼流之間快速切換,同時支持隨機接入和快速回放模式。

            (3) 整數變換

            在變換方面,H.264使用了基于4×4像素塊的類似于DCT的變換,但使用的是以整數為基礎的空間變換,不存在反變換。與浮點運算相比,整數DCT變換會引起一些額外的誤差,但因為DCT變換后的量化也存在量化誤差,與之相比,整數DCT變換引起的量化誤差影響并不大。此外,整數DCT變換還具有減少運算量和復雜度,有利于向定點DSP移植的優點。

            (4)量化

            H.264中可選32種不同的量化步長,這與H.263中有31個量化步長很相似,但是在H.264中,步長是以12.5%的復合率遞進的,而不是一個固定常數。在H.264中,變換系數的讀出方式也有兩種:之字形(Zigzag)掃描和雙掃描,大多數情況下使用簡單的之字形掃描;雙掃描僅用于使用較小量化級的塊內,有助于提高編碼效率。

            (5)熵編碼

            視頻編碼處理的最后一步就是熵編碼,H.264標準采用的熵編碼有兩種:一種是基于內容的自適應變長編碼(CAVLC)與統一的變長編碼(UVLC)結合;另一種是基于內容的自適應二進制算術編碼(CABAC)。CAVLC與CABAC根據相臨塊的情況進行當前塊的編碼,以達到更好的編碼效率。CABAC比CAVLC壓縮效率高,但要復雜一些。

            3 AVS標準簡介

            AVS是基于我國創新技術和部分公開技術的自主標準,AVS標準包括系統、視頻、音頻、數字版權管理等四個主要技術標準和一致性測試等支撐標準。2002年,在信息產業部支持下,成立了“數字音視頻編解碼技術標準”工作組(簡稱AVS工作組),2003年,國家發展和改革委員會批準了《數字音視頻編解碼技術標準AVS研究開發與測試驗證重大專項》。在國內外上百家企業和科研單位共同參與下,AVS標準制定工作進展順利,其中最重要的視頻編碼標準于2005年通過國家廣電總局測試,2006年1月得到信息產業部批準,2月國家標準化管理委員會正式頒布,3月1日起實施。

            AVS視頻編解碼的核心技術包括:8x8整數變換、量化、幀內預測、1/4精度像素插值、特殊的幀間預測運動補償、二維熵編碼等。

            (1)變換量化

            AVS的8x8變換與量化可以在16位處理器上無失配地實現,從而克服了H.264之前所有視頻壓縮編碼國際標準中采用的8x8 DCT變換存在失配的固有問題。而H.264所采用的4x4整數變換在高分辨率的視頻圖像上的去相關性能不及8x8的變換有效。AVS采用了64級量化,可以完全適應不同的應用和業務對碼率和質量的要求。

            (2)幀內預測

            AVS的幀內預測技術沿襲了H.264幀內預測的思路,用相鄰塊的像素預測當前塊,采用代表空間域紋理方向的多種預測模式。但AVS亮度和色度幀內預測都是以8x8塊為單位的。亮度塊采用5種預測模式,色度塊采用4種預測模式,而這4種模式中又有3種和亮度塊的預測模式相同。在編碼質量相當的前提下,AVS采用較少的預測模式,使方案更加簡潔、實現的復雜度大為降低。

            (3)幀間預測

            幀間運動補償編碼是混合編碼技術框架中最重要的部分之一。AVS標準采用了16×16,16×8,8×16和8×8的塊模式進行運動補償,而去除了H.264標準中的8×4,4×8,4×4的塊模式,目的是能更好地刻畫物體運動,提高運動搜索的準確性。實驗表明,對于高分辨率視頻,AVS選用的塊模式已經能足夠精細地表達物體的運動。較少的塊模式,能降低運動矢量和塊模式傳輸的開銷,從而提高壓縮效率、降低編解碼實現的復雜度。

            AVS和H.264都采用了1/4像素精度的運動補償技術。H.264采用6抽頭濾波器進行半像素插值并采用雙線性濾波器進行1/4像素插值。而AVS采用了不同的4抽頭濾波器進行半像素插值和1/4像素插值,在不降低性能的情況下減少插值所需要的參考像素點,減小了數據存取帶寬需求。

            在傳統的視頻編碼標準中,雙向預測幀B幀都只有一個前向參考幀與一個后向參考幀,而前向預測幀P 幀則只有一個前向參考幀。AVS中P幀可以利用至多2幀的前向參考幀,而B幀采用前后各一個參考幀,P幀與B幀(包括后向參考幀)的參考幀數相同,其參考幀存儲空間與數據存取的開銷并不比傳統視頻編碼的標準大,而恰恰是充分利用了必須預留的資源。AVS的B幀的雙向預測使用了直接模式(direct mode)、對稱模式(symmetric mode)和跳過模式(skip mode)。使用對稱模式時,碼流只需要傳送前向運動矢量,后向運動矢量可由前向運動矢量導出,從而節省后向運動矢量的編碼開銷。對于直接模式,當前塊的前、后向運動矢量都是由后向參考圖像相應位置塊的運動矢量導出,無需傳輸運動矢量,因此也可以節省運動矢量的編碼開銷。跳過模式的運動矢量的導出方法和直接模式的相同,跳過模式編碼的塊運動補償的殘差為零,即該模式下宏塊只需要傳輸模式信號,而不需要傳輸運動矢量、補償殘差等附加信息。

            (4)熵編碼

            AVS熵編碼采用自適應變長編碼技術,在AVS熵編碼過程中,所有的語法元素和殘差數據都是以指數哥倫布碼的形式映射成二進制比特流。采用指數哥倫布碼的優勢在于:一方面,它的硬件復雜度比較低,可以根據閉合公式解析碼字,無需查表;另一方面,它可以根據編碼元素的概率分布靈活地確定以k階指數哥倫布碼編碼,如果k選得恰當,則編碼效率可以逼近信息熵。對預測殘差的塊變換系數,經掃描形成(level、run)對串,level、run不是獨立事件,而存在著很強的相關性,在AVS中level、run采用二維聯合編碼,并根據當前level、run的不同概率分布趨勢,自適應改變指數哥倫布碼的階數。

          免責聲明:本文來源于中廣互聯,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯系或有侵權行為聯系本站刪除。
          掃一掃關注數字音視工程網公眾號

          相關閱讀related

          評論comment

           
          驗證碼:
          您還能輸入500
            成人69视频,狠狠天天,91尤物在线视频,国产毛片一级