淺談大數(shù)據(jù)和視頻檢索技術(shù)
來源:數(shù)字音視工程網(wǎng) 編輯:merry2013 2015-04-30 07:30:59 加入收藏
近年來,大數(shù)據(jù)一詞越來越多地被提及與使用,其含義是廣泛的,涉及到各行業(yè),我們正處在一個數(shù)據(jù)爆炸性增長的 “大數(shù)據(jù)”時代,大數(shù)據(jù)對社會經(jīng)濟、政治、文化,人們生活等方面產(chǎn)生深遠的影響,大數(shù)據(jù)對人類的數(shù)據(jù)駕馭能力提出了新的挑戰(zhàn)與機遇。人們用大數(shù)據(jù)來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù)。這些數(shù)據(jù)包括:移動互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)、科學(xué)計算等等。其中視頻又是構(gòu)成大數(shù)據(jù)最大的一部分。
大數(shù)據(jù)的產(chǎn)生
根據(jù)相關(guān)機構(gòu)的調(diào)查顯示,全球監(jiān)控攝像機市場在未來五年內(nèi)將保持穩(wěn)步增長,到2017年預(yù)計將上升到1億臺。僅視頻監(jiān)控錄像而言,每天的數(shù)據(jù)量就達上千PB,累計的歷史數(shù)據(jù)將更為龐大,由此也可以看出,監(jiān)控視頻在大數(shù)據(jù)體系中占有極大地位置。如今隨著4K時代的到來,更高清的應(yīng)用越來越普及,由此產(chǎn)生的數(shù)據(jù)將會越來越大,視頻監(jiān)控也將步入更高清的大數(shù)據(jù)井噴時代。
大數(shù)據(jù)技術(shù)之視頻檢索
“大數(shù)據(jù)或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時間內(nèi)達到截取、管理、處理、并整理成為人類所能解讀的信息。”維基百科對大數(shù)據(jù)的定義將大數(shù)據(jù)的特點闡釋得非常清晰:“海量”和“非結(jié)構(gòu)化”。這兩個特點在視頻監(jiān)控行業(yè)尤為突出,如何在“海量”和“非結(jié)構(gòu)化”的監(jiān)控視頻數(shù)據(jù)中快速找到對人們有用的信息變的尤為重要。
正是基于上述思考,視頻檢索技術(shù)應(yīng)運而生。視頻檢索主要是依賴于視頻算法對視頻進行預(yù)處理,通過對視頻內(nèi)容進行結(jié)構(gòu)化處理,提取出視頻內(nèi)容中的有效信息,進行標記或者相關(guān)處理后,人后可以通過各種屬性描述進行快速檢索。因此視頻檢索最主要的是利用視頻檢測算法對視頻進行結(jié)構(gòu)化描述,目前已經(jīng)在相應(yīng)的產(chǎn)品中得到應(yīng)用的算法主要有以下幾種:行為分析算法、車牌識別算法、車輛顏色識別算法、車標識別算法、車型識別算法、人臉檢測識別算法、人體特征識別算法等。其中人體特征識別又包括人的年齡、性別、身高、衣服顏色、是否戴眼鏡等特征信息的識別。視頻檢索技術(shù)在安防領(lǐng)域的重要作用是毋庸置疑的,其可以快速地從海量的數(shù)以萬計的監(jiān)控錄像中,找到有用的關(guān)鍵信息,將為視頻監(jiān)控帶來革命性的影響。
在視頻檢索技術(shù)出現(xiàn)之前,海量視頻的分析一直是困擾人們的一個難題。據(jù)南方都市報報道,一個也門商人在廣州打的丟行李,廣州交通委花了兩天的時間才從海量的出租車GPS信息和交通監(jiān)控視頻找到丟失的行李。面對如此多的監(jiān)控數(shù)據(jù),去尋找到證據(jù)和線索,無異于大海撈針,但目前的現(xiàn)實情況通常是被迫使用人海戰(zhàn)術(shù)進行查看。一個案件的審看需要更為廣泛的查看相關(guān)的攝像機視頻,所審看的視頻量時常達到數(shù)百上千小時。在目前的人工查看模式下,傳統(tǒng)的方法需要從頭到尾順序播放,往往需要數(shù)倍于原始視頻的時間才能審看完成,因此需要大量人員審看。為了規(guī)避遺漏和誤差,很多刑偵隊采用加大人力投入的方法,但是這種辦法既影響了破案進度和效率,又使得工作人員疲憊不堪。如果有視頻檢索技術(shù)對視頻中運動的物體等進行檢索和排除,就能比較大的提高辦案效率。
雖然視頻檢索技術(shù)在實際應(yīng)用過程中,可以快速地從海量監(jiān)控錄像中找到一些有明顯特征的人或物,但是技術(shù)所限,傳統(tǒng)的檢索方式顯得比較單一,檢索方式不夠“智能”,這已經(jīng)成為大型監(jiān)控系統(tǒng)視頻資料分析中的一個瓶頸。隨著視頻檢索技術(shù)的不斷發(fā)展,國家、企事業(yè)單位人力物力的大量投入,比如杭州海康威視數(shù)字技術(shù)股份有限公司著力于此應(yīng)用的研發(fā),并開發(fā)出視頻檢索系統(tǒng),系統(tǒng)采用海康威視自主高效智能分析算法技術(shù),保證分析信息的全面和準確,同時系統(tǒng)采用集群化計算方式,可提供幾十上百倍實時以上的快速分析能力,并可根據(jù)應(yīng)用需要進行線性擴展,提高計算能力。
本系統(tǒng)在視頻資料錄入的同時,就自動對視頻中的目標信息進行格式歸一化與智能預(yù)處理分析,對視頻進行快速處理,提取視頻中目標的相關(guān)信息作為智能元數(shù)據(jù)保存至數(shù)據(jù)庫中。之后的相關(guān)操作,如智能審看、智能檢索等等就不用再做復(fù)雜的解碼以及智能分析的工作,而是直接從智能元數(shù)據(jù)中提取,大大的提高了工作效率。根據(jù)智能元數(shù)據(jù)信息,可對目標及目標細化特征等視頻內(nèi)容級別進行篩選,如顏色、人/車分類等。用戶還可根據(jù)案情的需要自定義設(shè)置不同的周界防范規(guī)則,通過在數(shù)據(jù)庫中對元數(shù)據(jù)進行檢索提取觸發(fā)規(guī)則的目標信息,達到快速檢索的目的,極大地提高了效率。系統(tǒng)可以幫助刑偵人員高效、精準地聚焦到所關(guān)注的目標,有效解決目前視頻眾多、信息量巨大等視頻查找的棘手問題,使通過視頻調(diào)查取證不再費時和繁瑣,提高辦案民警的工作效率,達到科技強警的目的,符合公安部對于公安信息化建設(shè)的要求。
大數(shù)據(jù)技術(shù)的延伸
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有豐富內(nèi)容和意義的數(shù)據(jù)進行專業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關(guān)鍵,在于如何讓數(shù)據(jù)會“說話”。如何將海量的數(shù)據(jù)落地,廣泛的應(yīng)用于商業(yè)趨勢分析、打擊犯罪或測定實時交通路況等,這些貼近民生的應(yīng)用正是 “大數(shù)據(jù)”盛行的本質(zhì)。在大數(shù)據(jù)的發(fā)展趨勢下,對海量視頻監(jiān)控數(shù)據(jù)的存儲和管理是當下各大廠商積極探索的命題之一。圍繞大數(shù)據(jù)的命題,經(jīng)過采集后的視頻數(shù)據(jù)通過創(chuàng)建數(shù)據(jù)倉庫,結(jié)構(gòu)化處理,進行數(shù)據(jù)的分析和挖掘,最終進行可視化的呈現(xiàn),就是大數(shù)據(jù)的衍變過程。雖然基于視頻分析的技術(shù)還有其局限性,但是我們也看得到視頻分析技術(shù)的前景,正是有此期望,企事業(yè)單位加大人員投入,將更多的計算機技術(shù)應(yīng)用于視頻分析,比如視頻摘要技術(shù),視頻摘要形成視頻片斷,不同時刻的目標“穿越時空”同時展現(xiàn)播放,使24小時的視頻被制作成一個簡短到幾分鐘摘要視頻成為現(xiàn)實。視頻摘要不僅濃縮的是事件的精華,也是活動事件的全部,沒有價值的視頻將被剔除。通過多分格快照技術(shù),可以在幾秒中看完所有的活動目標成為可能,回溯原始視頻功能,瞬間鎖定目標在原始視頻中的位置。這些智能視頻分析功能的實現(xiàn)和應(yīng)用將大大提高海量視頻監(jiān)控錄像分析的效率。
結(jié)束語
雖然,目前海量搜索視頻信息對相關(guān)工作人員來說是件讓人感覺苦楚的事情,但是智能視頻檢索技術(shù)的引入可以極大的提升原有海量監(jiān)控視頻存儲系統(tǒng)的檢索效率和命中率。隨著安防高清化、智能化的發(fā)展,智能視頻檢索技術(shù)的運用會逐漸大眾化。但是限于目前智能視頻分析技術(shù)的現(xiàn)狀,這一方案中還存在一些技術(shù)風險。雖然可以借助一些概率方法,引入類似“相似度”的概念來緩解“漏檢”的風險,這一方案的離最終的用戶要求還有一段距離。然而,從另一個角度看“距離產(chǎn)生美”,技術(shù)之所以引人入勝,很大程度上就是因為“距離”的存在。有理由相信,隨著行業(yè)的快速發(fā)展,在海量監(jiān)控視頻存儲系統(tǒng)上,引入智能視頻檢索技術(shù)將成為一種趨勢。到那時,再也不會出現(xiàn)花費許多天的時間、許多的人力去海量搜尋一輛的士信息的情況了。
評論comment