視音頻編解碼技術及其實現(xiàn)
來源:杭州??低晹?shù)字技術股份有限公司 作者:胡揚忠 編輯:數(shù)字音視工程 2009-07-08 20:49:46 加入收藏
視音頻編解碼技術及其實現(xiàn)
一、視音頻編碼國際標準化組織及其壓縮標準介紹
國際上有兩個負責視音頻編碼的標準化組織,一個是VCEG(Video code Expert Group),是國際電信聯(lián)合會下的視頻編碼專家組,一個是MPEG(Motion Picture Expert Group),是國際標準化組織下的運動圖象專家組。這兩個視音頻編碼標準化組織都對視音頻的編解碼做出了非常重要的貢獻:一是推動視音頻編碼技術的發(fā)展,一是推動視音頻編解碼的應用。
國際上有兩個負責視音頻編碼的標準化組織,一個是VCEG(Video code Expert Group),是國際電信聯(lián)合會下的視頻編碼專家組,一個是MPEG(Motion Picture Expert Group),是國際標準化組織下的運動圖象專家組。這兩個視音頻編碼標準化組織都對視音頻的編解碼做出了非常重要的貢獻:一是推動視音頻編碼技術的發(fā)展,一是推動視音頻編解碼的應用。
視音頻編解碼涉及很多項視頻和音頻處理技術,每一項技術的改進都對視音頻編碼做出貢獻,但作為一套完整、高效的編碼方案,需要集中全人類在視音頻編解碼方面的最新智慧。個人或公司的研究成果,都希望被標準化組織,其經(jīng)濟回報是標準使用許可權費。
這兩個標準化組織制定的相關編碼標準都獲得了廣泛的應用,VCEG制定的標準有H.261(被國際電信聯(lián)合會選定為電視會議的視頻壓縮標準)、H.262(該標準同MPEG-2完全一樣,是VCEG同MPEG組成的聯(lián)合編碼專家組JVT制定的壓縮標準,VCEG發(fā)布的是H.262,MPEG發(fā)布的是MPEG-2)、H.263(該標準被國際電信聯(lián)合會選定為可視電話的視頻壓縮標準,有增強型版本H.263+、H.263++)、H.264(該標準是2002年5月VCEG為新一代交互式視頻通訊制定的標準)。MPEG名氣要大得多,制定的標準有MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21 ,MPEG-1壓縮標準為VCD所采納,MPEG-2的壓縮標準為DVD采納,MPEG-4是為交互式多媒體通訊制定的壓縮標準,MPEG-7是為互聯(lián)網(wǎng)視頻檢索制定的壓縮標準。
VCEG制定的壓縮標準H.26X都是針對單一矩形視頻對象,其追求的是更高的壓縮效率。MPEG-4在目前之所以很熱,是因為MPEG-4是基于多個視音頻對象的壓縮編碼標準,這非常適合于互聯(lián)網(wǎng)上的多媒體應用。在互聯(lián)網(wǎng)上傳播的多媒體信息,很多是可以劃分為多個視頻對象的,如電腦制作的動畫節(jié)目、電視新聞節(jié)目等,而在實時視頻圖象編碼中,在一個圖象矩形框中很難實時識別多個視頻對象,還是把一個視頻源當作一個矩形視頻對象進行編碼。
VCEG在97年發(fā)布H.263的壓縮標準后,制定了短期開發(fā)計劃H.26N和長期開發(fā)計劃H.26L,H.26N發(fā)展成H.263+和H.263++,H.26L經(jīng)過5年時間的發(fā)展,在2002年5月作為H.264壓縮標準進行發(fā)布。
MPEG在VCEG發(fā)布H.263之后,發(fā)布了MPEG-4 SP(即MPEG-4第一板),在該版本中引入了兩個非常重要的概念:一個是一個視頻源多個視音頻對象編碼,一個是碼流傳輸異常處理(特別是無線傳輸應用)。從這里可以看出,VCEG致力于高效率的視頻編碼技術,MPEG更側(cè)重系統(tǒng)和框架。
在2001年第四季度,VCEG H.26L發(fā)展到TML9.0時,MPEG同VCEG再次組成聯(lián)合聯(lián)合視頻編碼專家組JVT,對H.26L的算法進行了改進和完善,在2003年5月VCEG發(fā)布了H.264的壓縮標準。MPEG在JVT對H.26L壓縮算法修改的基礎上,將該技術規(guī)范納入到MPEG-4的標準中,作為MPEG-4 PART10發(fā)布,即MPEG-4的第三版,MPEG-4 AVC。H.264和MPEG-4 AVC代表了全人類在視音頻編解碼方面的最新成果。
針對單一矩形視頻對象,MPEG-4 AVC比MPEG-4第二版MPEG-4 ACE的壓縮效率提高30%以上。
二、H.264與MPEG-4 PART10的技術說明
同以前的視頻壓縮標準H.263++和MPEG-4 ACE相比,H.264與MPEG-4 PART10采用了一些新的算法,主要表現(xiàn)在以下幾個方面:
1、運動搜索
a、引入多參考幀
引入多達5個參考幀。
b、多種BLOCK形狀
有16*16、16*8、8*16、8*8、8*4、4*8、4*4七種BLOCK形狀。
c、運動搜索精度更高
1/2象素精度搜索采用了6階濾波器,搜索精度有很大提高。也引入了1/4象素精度搜索和1/8象素精度搜索。
同以前的視頻壓縮標準H.263++和MPEG-4 ACE相比,H.264與MPEG-4 PART10采用了一些新的算法,主要表現(xiàn)在以下幾個方面:
1、運動搜索
a、引入多參考幀
引入多達5個參考幀。
b、多種BLOCK形狀
有16*16、16*8、8*16、8*8、8*4、4*8、4*4七種BLOCK形狀。
c、運動搜索精度更高
1/2象素精度搜索采用了6階濾波器,搜索精度有很大提高。也引入了1/4象素精度搜索和1/8象素精度搜索。
2、殘余編碼
a、 采用整型4*4 DCT變換
b、 量化技術改進
c、 采用DE-BLOCK技術
d、 SP幀技術
這些技術的改變,一方面提高了壓縮效率,另一方面運算強度大幅提高,大大地提高了實現(xiàn)的難度。
三、海康威視開發(fā)的視音頻數(shù)字化產(chǎn)品
??低晱?000年5月進入視音頻編解碼這個行業(yè),就緊跟標準化組織制定的視音頻編解碼標準的步伐,特別是在MPEG-4、H.26L等標準發(fā)展過程中,扮演實現(xiàn)者的角色,首先是在PC平臺上實時實現(xiàn)壓縮標準所描述的視音頻編解碼。但PC平臺上的應用,屬于商業(yè)化軟件的范疇,我們更適合做電子產(chǎn)品,在DSP上實時實現(xiàn),降低產(chǎn)品成本、提高產(chǎn)品的可靠性,才有更大的實用價值。
??低晱?000年5月進入視音頻編解碼這個行業(yè),就緊跟標準化組織制定的視音頻編解碼標準的步伐,特別是在MPEG-4、H.26L等標準發(fā)展過程中,扮演實現(xiàn)者的角色,首先是在PC平臺上實時實現(xiàn)壓縮標準所描述的視音頻編解碼。但PC平臺上的應用,屬于商業(yè)化軟件的范疇,我們更適合做電子產(chǎn)品,在DSP上實時實現(xiàn),降低產(chǎn)品成本、提高產(chǎn)品的可靠性,才有更大的實用價值。
從一個視音頻編解碼模型,到一個實用的視音頻編解碼軟件,要做大量的工作,從運算強度而言,要降低100倍以上。
??低曉跀?shù)字化視音頻編解碼方面做了大量的工作,主要成果在以下幾個方面:
1、在PC(P4 1.4GHz)平臺上完成了MPEG-4 ACE的編碼和解碼;
2、在PC(P4 1.4GHz))平臺上完成了H.264的編碼和解碼;
3、在PHILIPS公司的DSP PNX1301(166MHz主頻)上完成了MPEG-4 ACE的編碼和解碼(CIF或QCIF分辨率);
4、在PHILIPS公司的DSP PNX1301(180MHz)上完成了H.264的編碼和解碼(CIF或QCIF分辨率);
5、在PHILIPS公司的DSP PNX1302(200MHz)上完成了H.264的編碼和解碼(2CIF分辨率);
6、在EQUATOR公司的DSP BSP-15-350(350MHz)上完成了MPEG-4 AVC的編解碼(2CIF分辨率)。
其中,在PHILIPS公司的DSP PNX1301上完成了MPEG-4 ACE的編碼和解碼技術,應用在DS-400XM壓縮板卡上,在國內(nèi)獲得了廣泛的應用。
在推出DS-400XM壓縮板卡之后,又推出基于H.264壓縮技術的DS-400XH系列(CIF分辨率)和DS-400XH+系列(2CIF分辨率)。
四、結(jié)束語
杭州??低晹?shù)字技術有限公司是一家致力于研究視音頻編解碼核心技術、開發(fā)和生產(chǎn)自主數(shù)字視音頻壓縮產(chǎn)品的專業(yè)公司,作為國內(nèi)在視頻處理器(DSP)上開發(fā)視頻編碼軟件的先驅(qū),在多款視頻視頻處理器(DSP)上進行了不懈的嘗試,已經(jīng)取得了非常有意義的進展,目前推出的DS-400XH和DS-400XH+兩個系列的產(chǎn)品,代表了監(jiān)控類數(shù)字視音頻編碼產(chǎn)品邁向更低碼率、更高分辨率的發(fā)展方向。
杭州??低晹?shù)字技術有限公司是一家致力于研究視音頻編解碼核心技術、開發(fā)和生產(chǎn)自主數(shù)字視音頻壓縮產(chǎn)品的專業(yè)公司,作為國內(nèi)在視頻處理器(DSP)上開發(fā)視頻編碼軟件的先驅(qū),在多款視頻視頻處理器(DSP)上進行了不懈的嘗試,已經(jīng)取得了非常有意義的進展,目前推出的DS-400XH和DS-400XH+兩個系列的產(chǎn)品,代表了監(jiān)控類數(shù)字視音頻編碼產(chǎn)品邁向更低碼率、更高分辨率的發(fā)展方向。
免責聲明:本文來源于杭州??低晹?shù)字技術股份有限公司,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯(lián)系或有侵權行為聯(lián)系本站刪除。(原創(chuàng)稿件未經(jīng)許可,不可轉(zhuǎn)載,轉(zhuǎn)載請注明來源)
評論comment