視頻檢索技術(shù)不斷升級提升
來源:數(shù)字音視工程網(wǎng) 編輯:merry2013 2015-06-04 06:21:59 加入收藏
目前,從視頻數(shù)據(jù)中提取有效信息的技術(shù)已基本解決,主要面臨的是提高從海量數(shù)據(jù)提取信息的速度。視頻數(shù)據(jù)檢索的提述經(jīng)歷了三個階段:一、有效視頻數(shù)據(jù)提取;二、基于智能視頻分析算法的檢索;三、基于視頻數(shù)據(jù)的元數(shù)據(jù)的檢索。
有效視頻數(shù)據(jù)提取
該方法的技術(shù)基石是圖像分析技術(shù)中的移動偵測技術(shù)。該技術(shù)在業(yè)界已經(jīng)比較成熟。移動偵測我們可以在前端設(shè)備中完成,也可以通過后端處理來執(zhí)行。以24小時錄像來說,鬧市區(qū)場景的錄像可能有1/3左右的錄像是無運動目標(biāo);而郊區(qū)場景的錄像可能有2/3左右的錄像是無運動目標(biāo),在檢索視頻數(shù)據(jù)時,我們只需要觀看有運動目標(biāo)的視頻數(shù)據(jù)即可,無論是1/3或2/3,均能顯著降低所需檢索視頻數(shù)據(jù)的大小。
基于智能視頻分析算法的檢索
前面提到,一段24小時的錄像,人工查看即使用4倍速查看也需要6小時,而利用計算機(jī)通過智能視頻分析算法進(jìn)行視頻的自動檢索,檢索的速度則取決于視頻解碼和分析算法的運行速度。我們以對4cif的視頻數(shù)據(jù)執(zhí)行周界防范算法為例,一幀視頻數(shù)據(jù)解碼加上算法執(zhí)行的平均時間可以控制在10ms左右,也就是相當(dāng)于4倍速。同樣四倍速,一個是不知疲倦的計算機(jī),一個是極易疲倦和出錯的人腦。孰優(yōu)孰劣,一目了然。
如果我們把1段24小時的錄像,經(jīng)過解碼,智能分析,把獲取到的智能元數(shù)據(jù)都存儲下來,對元數(shù)據(jù)的查詢速度可以達(dá)到十秒的量級。
一段24小時錄像文件的查詢速度提升過程:人工,正常速度查詢,24小時;人工,四倍速查詢,6小時;視頻濃縮后,人工四倍速查詢,3小時左右;視頻濃縮后,基于智能分析算法查詢,3小時左右;基于視頻數(shù)據(jù)的元數(shù)據(jù)查詢,十秒量級。
可以看到,最后一步才是質(zhì)的提升,檢索速度量級的飛躍。盡管如此,視頻數(shù)據(jù)的元數(shù)據(jù)的檢索也并不是完美無缺的,仍有一些問題等待解決。
移動偵測算法雖然比較成熟,但對于飛蟲干擾、燈光干擾、樹葉抖動等問題目前還沒有特別有效的解決辦法;基于智能分析算法的檢索,比如車牌識別、人臉識別,對視頻數(shù)據(jù)的場景要求比較高,普通的治安監(jiān)控視頻基本無法執(zhí)行這種分析。對于視頻場景適應(yīng)性相對較好的周界防范,行為分析算法來說,雖然能較為準(zhǔn)確分析出目標(biāo),但是對于目標(biāo)進(jìn)一步的分類,比如人、物、非機(jī)動車、機(jī)動車、目標(biāo)的屬性特征,比如顏色、紋理、形狀等,目前還是業(yè)界面臨的技術(shù)難題。
雖然有上述兩大難題,隨著元數(shù)據(jù)的標(biāo)準(zhǔn)化,以及前端設(shè)備實時產(chǎn)生元數(shù)據(jù)和后處理產(chǎn)生元數(shù)據(jù)兩種機(jī)制和產(chǎn)品的并存,基于元數(shù)據(jù)的檢索必然會成為海量視頻數(shù)據(jù)檢索的主流。
評論comment