科達(dá)圖像識(shí)別技術(shù)在安防領(lǐng)域的應(yīng)用
來源:數(shù)字音視工程網(wǎng) 編輯:merry2013 2016-05-27 06:41:19 加入收藏
近一兩年來,人工智能領(lǐng)域得到了媒體界、產(chǎn)業(yè)界和學(xué)術(shù)界等前所未有的關(guān)注,機(jī)器正在越來越多的取代人類特有的優(yōu)勢和技能,這其中最為重要的可能就是圖像識(shí)別技術(shù)。本文將從圖像識(shí)別技術(shù)的原理闡述出發(fā),介紹這一技術(shù)在安防行業(yè)的具體應(yīng)用,并且闡述其在當(dāng)前安防應(yīng)用上碰到的困難。當(dāng)然,面對(duì)這些困難,圖像識(shí)別技術(shù)將以此為契機(jī),與安防技術(shù)實(shí)現(xiàn)更大范圍的融合與發(fā)展。
圖像識(shí)別技術(shù)與人工智能 說起圖像識(shí)別,人類的這一能力非常突出。圖形**作用于感覺器官,人們辨認(rèn)出它是經(jīng)驗(yàn)過的某一圖形,甚至能感知到與圖像距離或者形狀的改變,這一過程叫做圖像再認(rèn)。在圖像識(shí)別中,既要有當(dāng)時(shí)進(jìn)入感官的信息,也要有記憶中存儲(chǔ)的信息。只有通過存儲(chǔ)的信息與當(dāng)前的信息進(jìn)行比較的加工過程,才能實(shí)現(xiàn)對(duì)圖像的再認(rèn)。
計(jì)算機(jī)圖像識(shí)別技術(shù),則是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)象的技術(shù)。圖像識(shí)別所研究的問題,是如何用計(jì)算機(jī)代替人類去自動(dòng)處理大量的物理信息,解決人類所無法識(shí)別或者識(shí)別過于耗費(fèi)資源的問題,從而很大程度上解放人類的勞動(dòng)力。
圖像識(shí)別技術(shù)是人工智能的一個(gè)重要領(lǐng)域。圖像識(shí)別技術(shù)是以圖像的主要特征為基礎(chǔ)的。每個(gè)圖像都有它的特征,對(duì)圖像識(shí)別時(shí)眼動(dòng)的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。由此可見,在圖像識(shí)別過程中,知覺機(jī)制必須排除輸入的多余信息,抽出關(guān)鍵的信息。同時(shí),在大腦里必定有一個(gè)負(fù)責(zé)整合信息的機(jī)制,它能把分階段獲得的信息整理成一個(gè)完整的知覺映象。
為了編制模擬人類圖像識(shí)別活動(dòng)的計(jì)算機(jī)程序,人們提出了不同的圖像識(shí)別模型。例如模板匹配模型。這種模型認(rèn)為,識(shí)別某個(gè)圖像,必須在過去的經(jīng)驗(yàn)中有這個(gè)圖像的記憶模式,又叫模板。當(dāng)前的**如果能與大腦中的模板相匹配,這個(gè)圖像也就被識(shí)別了。但這種模型強(qiáng)調(diào)圖像必須與腦中的模板完全符合才能加以識(shí)別,有一定的局限性。格式塔心理學(xué)家又據(jù)此提出了一個(gè)原型匹配模型。這種模型認(rèn)為,在長時(shí)記憶中存儲(chǔ)的并不是所要識(shí)別的無數(shù)個(gè)模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗(yàn)所要識(shí)別的圖像。如果能找到一個(gè)相似的原型,這個(gè)圖像也就被識(shí)別了。但是,這種模型沒有說明人是怎樣對(duì)相似的**進(jìn)行辨別和加工的,它也難以在計(jì)算機(jī)程序中得到實(shí)現(xiàn)。因此又有人提出了一個(gè)更復(fù)雜的模型,即“泛魔”識(shí)別模型。 隨著計(jì)算機(jī)技術(shù)及人工智能技術(shù)的發(fā)展,圖像識(shí)別技術(shù)越來越成為人工智能的基礎(chǔ)技術(shù),它將是未來科技領(lǐng)域幾大關(guān)鍵產(chǎn)業(yè)的核心技術(shù)之一。微軟、谷歌、Facebook、亞馬遜、百度、騰訊等巨頭都在傾注大量資源推動(dòng)這項(xiàng)功能進(jìn)步。比如微軟的圖像識(shí)別應(yīng)用“我看起來有多大”(How Old Do I Look?),成為網(wǎng)絡(luò)上紅極一時(shí)的話題。在去年舉行的第六屆ImageNet圖像識(shí)別技術(shù)比賽中,微軟憑借“圖像識(shí)別的深度殘差學(xué)習(xí)”(Deep Residual Learning for Image Recognition)系統(tǒng)獲得第一名??萍脊救绱藷嶂杂趫D像識(shí)別技術(shù)的應(yīng)用和創(chuàng)新,這種進(jìn)步顯然會(huì)極大地方便互聯(lián)網(wǎng)、傳媒行業(yè)及科研領(lǐng)域的相關(guān)工作。
圖像識(shí)別技術(shù)與安防技術(shù)的融合
現(xiàn)在,圖像識(shí)別技術(shù)的應(yīng)用范圍已經(jīng)遠(yuǎn)遠(yuǎn)突破視覺的范圍,而更多地體現(xiàn)為機(jī)器智能、數(shù)字技術(shù)的特點(diǎn)。可以說,圖像識(shí)別技術(shù)就是人類視覺認(rèn)知的延伸。
視頻監(jiān)控在過去的實(shí)際應(yīng)用中,面臨的最大問題就是必須由人工查看視頻。視頻智能分析技術(shù)正是為解決這一問題而生,它通過對(duì)視頻進(jìn)行智能分析、有效信息的結(jié)構(gòu)化數(shù)據(jù)提取,從而讓視頻監(jiān)控的使用者真正告別人工安防而走進(jìn)自動(dòng)化安防的新時(shí)代。 目前視頻智能分析主要有兩種產(chǎn)品形態(tài):前端智能和后端智能。前端智能以感知型攝像機(jī)為代表,將智能分析算法嵌入到前端攝像機(jī),前端攝像機(jī)對(duì)采集的視頻內(nèi)容立即進(jìn)行分析,提取出畫面中關(guān)鍵的、感興趣的、有效的信息,形成結(jié)構(gòu)化的數(shù)據(jù),將后端感興趣的內(nèi)容實(shí)時(shí)傳給后端做存儲(chǔ)或深入分析。后端智能是前端攝像機(jī)只負(fù)責(zé)采集視頻圖像,將碼流傳遞到后端服務(wù)器做集中處理。這樣對(duì)于后端的計(jì)算壓力比較大,也不利于實(shí)時(shí)處理。更合理的方式是前端攝像機(jī)進(jìn)行基礎(chǔ)的結(jié)構(gòu)化數(shù)據(jù)提取,后端服務(wù)器再進(jìn)行深度二次分析;也就是說,將前端和后端配合起來做智能分析,才真正讓視頻圖像智能分析實(shí)現(xiàn)最大化價(jià)值。
視頻監(jiān)控領(lǐng)域是圖像識(shí)別技術(shù)一直在尋求突破的主要領(lǐng)域之一。視頻智能分析技術(shù)目前在公安、交通、零售、司法、教育等行業(yè)都獲得了普及性應(yīng)用。
公安
公安行業(yè)借助智能視頻分析主要用于實(shí)現(xiàn)城市道路、廣場及各類重點(diǎn)場所的人、車、物等目標(biāo)的識(shí)別,提取包括人的性別、人臉、全身等信息,車的車標(biāo)、車牌、車身顏色等信息,這些信息均可提煉為計(jì)算機(jī)能識(shí)別的結(jié)構(gòu)化數(shù)據(jù),送入后端進(jìn)行專業(yè)的安全管理應(yīng)用,主要包括實(shí)時(shí)布控、高危人員比對(duì)、以圖搜圖、多點(diǎn)碰撞、語義搜索等方面。
交通
具有分析、感知能力的智能攝像機(jī)通過視頻識(shí)別分析技術(shù),可對(duì)每輛車進(jìn)行完整的違法行為分析、識(shí)別、抓拍和錄像,記錄車輛違法的整個(gè)過程,再將每條記錄生成非結(jié)構(gòu)化的視頻、照片數(shù)據(jù)和結(jié)構(gòu)化的文本數(shù)據(jù)提交給后端智能管理與分析系統(tǒng),由系統(tǒng)進(jìn)行高度智能的交通違法行為處理。基于智能視頻分析技術(shù),智能交通管理系統(tǒng)還能得出不同品牌的車型擁有量、過車高峰期、車輛進(jìn)出城高峰期及行駛方向等豐富的交通數(shù)據(jù),為城市交通流量管控、交通道路規(guī)劃等提供詳實(shí)的數(shù)據(jù)支撐。
零售
視頻智能分析在零售門店視頻監(jiān)控方面的領(lǐng)先應(yīng)用,是公司為聯(lián)合利華門店建設(shè)的熱點(diǎn)統(tǒng)計(jì)系統(tǒng),系統(tǒng)通過感知型攝像機(jī)和后端的大數(shù)據(jù)分析平臺(tái)相配合,用于開展個(gè)人護(hù)理類商品陳列和貨架布局的顧客行為數(shù)據(jù)收集及分析,比如顧客在不同商品前的停留時(shí)間是多少、商品陳列和貨架布局調(diào)整前后的人流動(dòng)向?qū)Ρ群唾徺I金額對(duì)比等,進(jìn)而作為最終的經(jīng)營決策參考。這一系統(tǒng)不僅創(chuàng)新了視頻監(jiān)控系統(tǒng)遠(yuǎn)程管理零售門店的應(yīng)用,更為連鎖零售行業(yè)如何通過視頻監(jiān)控系統(tǒng)開展消費(fèi)數(shù)據(jù)比對(duì)、分析等大數(shù)據(jù)應(yīng)用開創(chuàng)了有益啟示。
司法和教育
在監(jiān)獄和看守所,視頻智能分析技術(shù)更是較早得到了運(yùn)用。除傳統(tǒng)的智能分析技術(shù)應(yīng)用之外,感知型攝像機(jī)也被用在AB門等出入口,用于對(duì)所有過往人員進(jìn)行臉部和全身的圖像采集,同時(shí)提供結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)給后端管理平臺(tái),平臺(tái)對(duì)人員進(jìn)行實(shí)時(shí)比對(duì),用于有效杜絕非法出入。學(xué)校采用視頻智能分析技術(shù)可以開展安全管理和教育錄播兩種應(yīng)用,后者通過教室內(nèi)的智能跟蹤攝像機(jī)自動(dòng)識(shí)別、跟蹤老師的運(yùn)動(dòng)圖像,同時(shí)對(duì)視頻和聲音進(jìn)行記錄,再生成錄播課程。
應(yīng)該說,圖像識(shí)別技術(shù)對(duì)于整個(gè)安防方案來說都是一項(xiàng)艱巨而又關(guān)鍵的任務(wù),直接決定了后續(xù)圖像處理與分析的準(zhǔn)確性和便捷性。在視頻監(jiān)控領(lǐng)域,圖像識(shí)別技術(shù)正面臨著不小的挑戰(zhàn),具體可闡釋為:其一,對(duì)圖像質(zhì)量的要求越來越高,圖像識(shí)別與處理的算法也越來越復(fù)雜;其二,對(duì)圖像的實(shí)時(shí)性處理和傳輸要求越來越高;其三,圖像識(shí)別的算法更加個(gè)性化,也更加成為市場競爭力的關(guān)鍵所在;其四,圖像數(shù)據(jù)往往涉及隱私,因此也需要提供可以信任的安全保證。面對(duì)這些挑戰(zhàn),我們深知要使圖像識(shí)別技術(shù)與安防技術(shù)實(shí)現(xiàn)更好的融合,任重而道遠(yuǎn)。盡管在業(yè)界已經(jīng)擁有了一定的知名度,我們?nèi)匀簧罡诎卜佬袠I(yè),把感知型攝像機(jī)視為視頻監(jiān)控的未來,在將圖像識(shí)別技術(shù)更好地應(yīng)用于具體的行業(yè)需求方面,為其他人工智能的應(yīng)用提供了一條有價(jià)值的參考路徑。
評(píng)論comment