大數據和視頻檢索技術
來源:數字音視工程網 編輯:merry2013 2015-12-02 07:17:59 加入收藏
近年來,大數據一詞越來越多地被提及與使用,其含義是廣泛的,涉及到各行業(yè),我們正處在一個數據爆炸性增長的 “大數據”時代,大數據對社會經濟、政治、文化,人們生活等方面產生深遠的影響,大數據對人類的數據駕馭能力提出了新的挑戰(zhàn)與機遇。人們用大數據來描述和定義信息爆炸時代產生的海量數據。這些數據包括:移動互聯、社交網絡、電子商務、科學計算等等。其中視頻又是構成大數據最大的一部分。
大數據的產生
根據相關機構的調查顯示,全球監(jiān)控攝像機市場在未來五年內將保持穩(wěn)步增長,到2017年預計將上升到1億臺。僅視頻監(jiān)控錄像而言,每天的數據量就達上千PB,累計的歷史數據將更為龐大,由此也可以看出,監(jiān)控視頻在大數據體系中占有極大地位置。如今隨著4K時代的到來,更高清的應用越來越普及,由此產生的數據將會越來越大,視頻監(jiān)控也將步入更高清的大數據井噴時代。
大數據技術之視頻檢索
“大數據或稱巨量數據、海量數據、大資料,指的是所涉及的數據量規(guī)模巨大到無法通過人工,在合理時間內達到截取、管理、處理、并整理成為人類所能解讀的信息。”維基百科對大數據的定義將大數據的特點闡釋得非常清晰:“海量”和“非結構化”。這兩個特點在視頻監(jiān)控行業(yè)尤為突出,如何在“海量”和“非結構化”的監(jiān)控視頻數據中快速找到對人們有用的信息變的尤為重要。
正是基于上述思考,視頻檢索技術應運而生。視頻檢索主要是依賴于視頻算法對視頻進行預處理,通過對視頻內容進行結構化處理,提取出視頻內容中的有效信息,進行標記或者相關處理后,人后可以通過各種屬性描述進行快速檢索。因此視頻檢索最主要的是利用視頻檢測算法對視頻進行結構化描述,目前已經在相應的產品中得到應用的算法主要有以下幾種:行為分析算法、車牌識別算法、車輛顏色識別算法、車標識別算法、車型識別算法、人臉檢測識別算法、人體特征識別算法等。其中人體特征識別又包括人的年齡、性別、身高、衣服顏色、是否戴眼鏡等特征信息的識別。視頻檢索技術在安防領域的重要作用是毋庸置疑的,其可以快速地從海量的數以萬計的監(jiān)控錄像中,找到有用的關鍵信息,將為視頻監(jiān)控帶來革命性的影響。
在視頻檢索技術出現之前,海量視頻的分析一直是困擾人們的一個難題。據南方都市報報道,一個也門商人在廣州打的丟行李,廣州交通委花了兩天的時間才從海量的出租車GPS信息和交通監(jiān)控視頻找到丟失的行李。面對如此多的監(jiān)控數據,去尋找到證據和線索,無異于大海撈針,但目前的現實情況通常是被迫使用人海戰(zhàn)術進行查看。一個案件的審看需要更為廣泛的查看相關的攝像機視頻,所審看的視頻量時常達到數百上千小時。在目前的人工查看模式下,傳統的方法需要從頭到尾順序播放,往往需要數倍于原始視頻的時間才能審看完成,因此需要大量人員審看。為了規(guī)避遺漏和誤差,很多刑偵隊采用加大人力投入的方法,但是這種辦法既影響了破案進度和效率,又使得工作人員疲憊不堪。如果有視頻檢索技術對視頻中運動的物體等進行檢索和排除,就能比較大的提高辦案效率。
雖然視頻檢索技術在實際應用過程中,可以快速地從海量監(jiān)控錄像中找到一些有明顯特征的人或物,但是技術所限,傳統的檢索方式顯得比較單一,檢索方式不夠“智能”,這已經成為大型監(jiān)控系統視頻資料分析中的一個瓶頸。隨著視頻檢索技術的不斷發(fā)展,國家、企事業(yè)單位人力物力的大量投入,比如杭州??低?/a>數字技術股份有限公司著力于此應用的研發(fā),并開發(fā)出視頻檢索系統,系統采用??低曌灾鞲咝е悄芊治鏊惴夹g,保證分析信息的全面和準確,同時系統采用集群化計算方式,可提供幾十上百倍實時以上的快速分析能力,并可根據應用需要進行線性擴展,提高計算能力。
本系統在視頻資料錄入的同時,就自動對視頻中的目標信息進行格式歸一化與智能預處理分析,對視頻進行快速處理,提取視頻中目標的相關信息作為智能元數據保存至數據庫中。之后的相關操作,如智能審看、智能檢索等等就不用再做復雜的解碼以及智能分析的工作,而是直接從智能元數據中提取,大大的提高了工作效率。根據智能元數據信息,可對目標及目標細化特征等視頻內容級別進行篩選,如顏色、人/車分類等。用戶還可根據案情的需要自定義設置不同的周界防范規(guī)則,通過在數據庫中對元數據進行檢索提取觸發(fā)規(guī)則的目標信息,達到快速檢索的目的,極大地提高了效率。系統可以幫助刑偵人員高效、精準地聚焦到所關注的目標,有效解決目前視頻眾多、信息量巨大等視頻查找的棘手問題,使通過視頻調查取證不再費時和繁瑣,提高辦案民警的工作效率,達到科技強警的目的,符合公安部對于公安信息化建設的要求。
大數據技術的延伸
大數據技術的戰(zhàn)略意義不在于掌握龐大的數據信息,而在于對這些含有豐富內容和意義的數據進行專業(yè)化處理。換言之,如果把大數據比作一種產業(yè),那么這種產業(yè)實現盈利的關鍵,在于如何讓數據會“說話”。如何將海量的數據落地,廣泛的應用于商業(yè)趨勢分析、打擊犯罪或測定實時交通路況等,這些貼近民生的應用正是 “大數據”盛行的本質。在大數據的發(fā)展趨勢下,對海量視頻監(jiān)控數據的存儲和管理是當下各大廠商積極探索的命題之一。圍繞大數據的命題,經過采集后的視頻數據通過創(chuàng)建數據倉庫,結構化處理,進行數據的分析和挖掘,最終進行可視化的呈現,就是大數據的衍變過程。雖然基于視頻分析的技術還有其局限性,但是我們也看得到視頻分析技術的前景,正是有此期望,企事業(yè)單位加大人員投入,將更多的計算機技術應用于視頻分析,比如視頻摘要技術,視頻摘要形成視頻片斷,不同時刻的目標“穿越時空”同時展現播放,使24小時的視頻被制作成一個簡短到幾分鐘摘要視頻成為現實。視頻摘要不僅濃縮的是事件的精華,也是活動事件的全部,沒有價值的視頻將被剔除。通過多分格快照技術,可以在幾秒中看完所有的活動目標成為可能,回溯原始視頻功能,瞬間鎖定目標在原始視頻中的位置。這些智能視頻分析功能的實現和應用將大大提高海量視頻監(jiān)控錄像分析的效率。
結束語
雖然,目前海量搜索視頻信息對相關工作人員來說是件讓人感覺苦楚的事情,但是智能視頻檢索技術的引入可以極大的提升原有海量監(jiān)控視頻存儲系統的檢索效率和命中率。隨著安防高清化、智能化的發(fā)展,智能視頻檢索技術的運用會逐漸大眾化。但是限于目前智能視頻分析技術的現狀,這一方案中還存在一些技術風險。雖然可以借助一些概率方法,引入類似“相似度”的概念來緩解“漏檢”的風險,這一方案的離最終的用戶要求還有一段距離。然而,從另一個角度看“距離產生美”,技術之所以引人入勝,很大程度上就是因為“距離”的存在。有理由相信,隨著行業(yè)的快速發(fā)展,在海量監(jiān)控視頻存儲系統上,引入智能視頻檢索技術將成為一種趨勢。到那時,再也不會出現花費許多天的時間、許多的人力去海量搜尋一輛的士信息的情況了。
評論comment