2019年視頻監(jiān)控行業(yè)7大熱點,“聲紋+CV技術”上榜
來源:數字音視工程網 編輯:davedit26 2019-02-27 15:22:46 加入收藏
一、ReID
事實上,遍布城市的攝像機里面,扣除卡口攝像機、電子警察用的抓拍攝像機之外,符合人臉采集標準的攝像機相對而言鳳毛麟角,占比極少。而要最大限度挖掘傳統(tǒng)平安城市、天網工程的治安攝像機的潛力,無疑ReID是不二之選。
ReID(Person Re-identification),也稱為行人重識別、行人再識別、跨鏡追蹤,是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術,廣泛被認為是一個圖像檢索的子問題,目前主要應用于安防領域,未來與人臉識別相結合能夠應用于更多更豐富的場景。
ReID本身是一個非常難的問題,它是要從不同的視頻之中,把同一個人識別出來。視頻光照條件的不同、感興趣區(qū)域的分辨率和角度的不同、目標被遮擋的情況普遍、穿著相近衣服的人等等,都會造成識別的困難。對于監(jiān)控領域來說,ReID引申出來在實際應用上就是希望把不同視頻內的物體關聯起來,并可以透過有效的方法把物體找出來,能做到這樣整個監(jiān)控操作才完整,才能看到大局。
二、LoRa技術
LoRa是Semtech公司推出的超遠距離通信的無線標準。LoRa是低功耗廣域網的一種,源于Long Range這兩個單詞。其具有超遠距離、低功耗等特點,并且只需要一個網關就可以管理非常多的設備,這也從一方面降低了LoRa的部署成本。這對IoT技術在城市中的應用很重要,遠距離、低功耗、大規(guī)模這三點具有足夠的殺傷力。LoRa技術是可以實現和AI、視頻監(jiān)控進行深度融合的,尤其是在視頻監(jiān)控觸發(fā)聯動報警應用方面。
三、智慧城市建設新模式
最近兩年隨著AI技術的發(fā)展,AI賦能城市的能力逐漸顯現,不僅在視頻監(jiān)控,在社區(qū)、醫(yī)療、教育、金融行業(yè)都催生了很多全新的應用。以華為公司為例,在2018華為全聯接大會上,華為云推出EI城市智能體,用AI提供更優(yōu)秀的城市交通、水務、環(huán)保、燃氣等方案。這場大會標志著華為云開啟了芯片+框架+平臺+服務全棧協同的組合拳打法,開始全面對標國際AI巨頭。
我們相信在2019年,將會出現多類型、多樣本的全新的智慧城市建設新模式,而這都是AI所帶來的,AI將在城市中無所不在。
四、大腦工程
AI說到底還是模擬人的大腦,如果我們將AI賦能的應用能力放在城市就是建設城市大腦。城市大腦的提法要比智慧城市更精煉,是城市管理的中樞神經系統(tǒng),概念可能比智慧城市再小一點。如果把城市大腦分解得小一點,就會有城市警務大腦、城市交通大腦。
過去一年內,我們看到落地比較好的包括了阿里的城市大腦模式、方緯(佳都科技旗下企業(yè))的城市大腦模式和百度的城市大腦模式,不過以實際落地來看,交通大腦是最先落地的,這是因為交通的基礎設施比較好,遍布城市的紅綠燈、信號燈、電子警察和卡口攝像機,這都和視頻監(jiān)控緊密相關。
在2019年應該會有不少于10個大中型城市會啟動城市大腦的相關建設工作。
五、視頻大數據和視頻云的DT時代
數據時代(DT)已經被提了一些年,但對視頻監(jiān)控行業(yè)而言,真正的DT時代啟于2018年,在2019年開始大面積落地。
非結構化的視頻圖像數據被結構化之后就能夠形成視頻圖像大數據,這些數據可以分為四類:
一是全景數據。包含空間維度內的人、車、物、手機、門禁、WIFI、物聯感知、地圖、地址、門牌號、網格、人口、房屋、單位、城市部件等數據。全景數據體現的是多場景內的全數據、多維度的數據解析。
二是全量數據。在全景數據的基礎之上包括時間維度,全時空數據,包含軌跡、活動、事件等數據。
三是全域數據。在全景數據之上構建數據之間的關聯,屬于多維關聯信息,多渠道、多視角、多側面收集而成。包含了系統(tǒng)所有信息的模型,實現數據的關聯、碰撞和多維感知。
四是全息數據。將全域數據和視頻圖像進行融合,產生立體化空間、多維度、相互關聯的全時空數據。典型應用包括3D全息投影、虛擬顯示VR、增強顯示AR。全息數據體現的是社會屬性,體現的是數據價值。
筆者判斷,數據時代視頻監(jiān)控的特點就是能夠全面看、自動看、關聯看。全面看,即視頻圖像一體匯聚、全網共享。大范圍內多維數據的跨系統(tǒng)、跨區(qū)域共享。自動看,是高密度、高算力、多算法框架、千億級圖片秒級檢索,算得快、比得準。關聯看,視頻大數據與社會、網絡、政務、警務大數據等資源的碰撞分析。實現“圖事件關聯”、“人臉、車輛、手機等多軌合一”等應用。
六、3D、AR、VR深度融合應用
2018年北京安博會作為視頻監(jiān)控行業(yè)發(fā)展的風向標,我們能夠看到的視頻應用系統(tǒng)已經逐漸過渡到三維的深度融合,就是將3D地圖、AR、VR三度技術和視頻、數據進行深度融合,然后開發(fā)出全新的應用。
這種深度融合應用的基礎將是視頻監(jiān)控聯網平臺、視頻解析平臺、視頻圖像信息數據庫,還有一種城市管理基礎信息數據平臺(也被稱為一標三實網格化系統(tǒng)),而這些數據都能夠和3D、AR、VR相結合。比方說我們可以將多維數據直接內嵌到三維的地圖里面來,通過AR增強顯示的方法將視頻直接內嵌到地圖中來,實現可視化實時城市畫面呈現,通過VR技術將各類數據直接投視在人的眼中,實現信息數據的及時獲取。
七、聲紋+CV技術
音視頻系統(tǒng)中的聲音筆者認為一直沒有得到充分挖掘,我們已經看到眾多的CV頭部企業(yè)對語音都進行了大手筆的投入,市面上也出現了眾多的語音識別公司,雖然在2018年我們并沒有看到特別好的聲紋+CV技術結合的應用,但筆者相信二者相結合將產生巨大的潛力。以門禁系統(tǒng)為例,我們可以采用人臉+聲紋的雙模式,輸入一個人臉然后調取一個人的聲紋進行二次確認,或者輸入一個人的聲紋然后再調取一個人的人臉進行二次確認,就能夠實現1:1的精確匹配,可大大提高人臉識別的準確率和誤報率。希望2019年在這方面能夠看到行業(yè)的新應用、新熱點。
評論comment