視頻監(jiān)控技術(shù)的智能化趨勢(shì)分析
來(lái)源:慧聰安防網(wǎng) 作者:windy 編輯:數(shù)字音視工程 2010-12-22 00:00:00 加入收藏
視頻監(jiān)控是視頻工程中重要的技術(shù)和應(yīng)用領(lǐng)域,支撐其發(fā)展的視頻技術(shù)在不到一個(gè)世紀(jì)的發(fā)展過(guò)程中,大致經(jīng)歷了3個(gè)跨越式的發(fā)展階段。20世紀(jì)30年代,以電視廣播為代表的視頻技術(shù)走出了實(shí)驗(yàn)室,進(jìn)入廣播電視臺(tái)和千萬(wàn)家庭,實(shí)現(xiàn)了從靜止圖像傳輸?shù)交顒?dòng)圖像傳輸?shù)目缭?20世紀(jì)80年代末,以會(huì)議電視、視頻監(jiān)控等為代表的視頻技術(shù)走出了實(shí)驗(yàn)室,進(jìn)入眾多的電視會(huì)議室、安防系統(tǒng),實(shí)現(xiàn)了從模擬視頻通信到數(shù)字視頻通信的跨越;如今,以智能視頻監(jiān)控(IVS)為代表的視頻技術(shù),正處在走出實(shí)驗(yàn)室、進(jìn)入到各行各業(yè)的應(yīng)用階段,將要實(shí)現(xiàn)從“機(jī)械”的視頻信息處理向智能化視頻信息處理的跨越。當(dāng)前中國(guó)正處在這一跨越的關(guān)鍵時(shí)段。智能視頻監(jiān)控只是智能視頻技術(shù)的一個(gè)部分,一個(gè)將視頻技術(shù)引入智能時(shí)代的部分。
智能化視頻監(jiān)控技術(shù)的進(jìn)一步發(fā)展,仍然是仿生學(xué)引導(dǎo)的結(jié)果
智能化是視頻監(jiān)控的亮點(diǎn),但又是視頻監(jiān)控技術(shù)的關(guān)鍵和難點(diǎn)
智能視頻監(jiān)控產(chǎn)業(yè)的發(fā)展需要采用新的符合智能監(jiān)控要求的體系結(jié)構(gòu)
基金項(xiàng)目:國(guó)家自然科學(xué)基金(60672134、61071091)
1 IVS的發(fā)展歷程
和人類許多技術(shù)一樣,視頻技術(shù)也是仿生學(xué)引導(dǎo)的結(jié)果。視頻技術(shù)模仿人類眼睛的功能,把眼睛“拉”到實(shí)際難以到達(dá)的時(shí)空。電視廣播提供了大量有聲有色的娛樂(lè)節(jié)目,豐富了人們的文化生活;而視頻監(jiān)控的出現(xiàn),不僅提供了栩栩如生的現(xiàn)場(chǎng)信息,更解決了安全和生產(chǎn)方面的問(wèn)題,使人們深切感受到視頻技術(shù)的應(yīng)用范圍之廣和所起的重要作用。
視頻監(jiān)控已有三四十年的發(fā)展,最早安裝在銀行營(yíng)業(yè)廳的模擬視頻監(jiān)控設(shè)備,采用的是攝像頭加磁帶錄像機(jī);后來(lái)發(fā)展為數(shù)字監(jiān)控,實(shí)際上是數(shù)字視頻記錄(DVR),采用的是攝像頭、采集卡加計(jì)算機(jī)(主要用于壓縮、存儲(chǔ));近幾年的網(wǎng)絡(luò)視頻監(jiān)控裝置,主要是由嵌入式攝像機(jī)、傳輸網(wǎng)絡(luò)和計(jì)算機(jī)構(gòu)成。
智能視頻監(jiān)控經(jīng)過(guò)近四、五年的發(fā)展,已由簡(jiǎn)單的視頻監(jiān)控發(fā)展到具有人工智能的視頻監(jiān)控。視頻監(jiān)控的由來(lái)很簡(jiǎn)單,從需求層面來(lái)看:人們一直需要擴(kuò)大眼睛的功能,希望在必要的地方“掛上”一只“眼睛”進(jìn)行不間斷的監(jiān)控;從技術(shù)可行性的層面來(lái)看:傳感器技術(shù)從單點(diǎn)傳感器發(fā)展到多點(diǎn),從一維傳感器,發(fā)展到二維、三維傳感器(圖像、視頻傳感器),快速的發(fā)展為實(shí)現(xiàn)以看為主的監(jiān)控提供了可能。實(shí)際上這一過(guò)程再次體現(xiàn)了仿生學(xué)對(duì)技術(shù)發(fā)展的巨大影響力:監(jiān)控技術(shù)即智能化視頻監(jiān)控技術(shù)的進(jìn)一步發(fā)展,仍然是仿生學(xué)引導(dǎo)的結(jié)果。從仿生學(xué)的角度出發(fā),各種傳感器的出現(xiàn)均模仿人類的各種感覺(jué)的結(jié)果,從觸覺(jué)、嗅覺(jué)到聽(tīng)覺(jué)、視覺(jué),如模仿人耳的麥克風(fēng)和模仿人眼的攝像機(jī)。最近,如何在模仿視覺(jué)的基礎(chǔ)上模仿人腦功能,使現(xiàn)有的監(jiān)控設(shè)備具有一定的智能并、成為研究的焦點(diǎn)。智能的匯入使傳感的內(nèi)容、含義具有了主觀“感覺(jué)”,能夠給出分析、判斷和結(jié)論,而并非只對(duì)傳感對(duì)象的物理量作忠實(shí)的記錄。
早期的傳感器往往比較簡(jiǎn)單,傳感的是一維、單義的物理量,且易于分析、便于結(jié)論,如溫度傳感器,當(dāng)所獲得溫度超過(guò)某一閾值時(shí),說(shuō)明發(fā)生了異常情況。以攝像機(jī)為代表的視覺(jué)傳感器是一種多維、多義的傳感器:面對(duì)記錄的圖像難以判斷其內(nèi)容的含義,如難以判斷攝像機(jī)所面對(duì)的場(chǎng)景到底“發(fā)生”了什么事?,F(xiàn)階段該問(wèn)題的解決主要靠人工完成:值班人員用眼睛對(duì)成百上千的攝像機(jī)信息進(jìn)行屏幕“監(jiān)視”,對(duì)存儲(chǔ)的海量信息進(jìn)行回放“檢索”,對(duì)可疑信息進(jìn)行人工對(duì)比、分析。但人(尤其是人的眼睛和大腦)是很容易疲勞的,有數(shù)據(jù)表明:如值班人員緊盯屏幕十幾分鐘后將會(huì)不自覺(jué)丟掉大部份信息。再如在倫敦地鐵案中,安保人員為找到一點(diǎn)有價(jià)值的信息,往往要花幾十小時(shí)查看大量的存儲(chǔ)磁帶。尋找不會(huì)疲勞的眼睛和大腦,分析所監(jiān)控的內(nèi)容,減輕負(fù)擔(dān),提高監(jiān)控效率,這就是視頻監(jiān)控智能化的目標(biāo)。
評(píng)論comment