智能視覺技術(shù)在安防領(lǐng)域的應(yīng)用與發(fā)展
來源:數(shù)字音視工程網(wǎng) 編輯:航行150 2015-03-26 09:55:55 加入收藏
通俗地說,智能視覺技術(shù),就是通過計算機(jī)自動對攝像頭采集的視頻信息進(jìn)行分析處理,從視頻序列中捕捉存在的感興趣區(qū)域及目標(biāo),并進(jìn)一步獲取目標(biāo)的出現(xiàn)時間、運(yùn)動軌跡、顏色等諸多信息,通過對各個目標(biāo)的上述信息的分析。
智能視覺技術(shù)核心是運(yùn)動目標(biāo)檢測、分類、跟蹤與識別技術(shù)等。運(yùn)動目標(biāo)檢測是將視頻圖像序列中的感興趣目標(biāo)(如車輛或人)檢測出來,以備后續(xù)步驟的使用;目標(biāo)檢測的目的就是準(zhǔn)確地從通過運(yùn)動檢測得到的運(yùn)動區(qū)域中提取出與目標(biāo)相對應(yīng)的團(tuán)點(diǎn)。
研究人員已經(jīng)開發(fā)了多種運(yùn)動目標(biāo)檢測的方法,包括幀間差分法,光流法和背景減除算法。根據(jù)實(shí)際應(yīng)用需求的不同,不同的檢測算法都是在可靠性、實(shí)時性和準(zhǔn)確性之間折衷得到的。目標(biāo)分類的目的是從檢測到的運(yùn)動區(qū)域中將對應(yīng)于人的運(yùn)動區(qū)域提取出來.不同的運(yùn)動區(qū)域可能對應(yīng)于不同的運(yùn)動目標(biāo),比如交通道路上監(jiān)控攝像機(jī)所捕捉的序列圖像中可能包含行人、車輛及其它諸如飛鳥、流云、搖動的樹枝等運(yùn)動物體,為了便于進(jìn)一步對行人進(jìn)行跟蹤和行為分析,運(yùn)動目標(biāo)的正確分類是完全必要的.注意,這個步驟在一些情況下可能是不必要的(比如已經(jīng)知道場景中僅僅存在人的運(yùn)動時)。運(yùn)動目標(biāo)跟蹤是在需要監(jiān)控的環(huán)境里,如何能夠判斷出進(jìn)入特定區(qū)域的目標(biāo),并且能夠跟蹤目標(biāo)的軌跡。
具體可分為兩種情況:一是靜態(tài)背景下的目標(biāo)跟蹤;二是動態(tài)背景下的目標(biāo)跟蹤。靜態(tài)背景下的目標(biāo)跟蹤方法具體可分為單目標(biāo)跟蹤與多目標(biāo)跟蹤。單目標(biāo)的靜態(tài)背景下的目標(biāo)跟蹤指的是攝像頭是固定在某一方位,其所觀察的視野也是靜止的。多目標(biāo)跟蹤是指在靜態(tài)環(huán)境下的多目標(biāo)跟蹤,需要確定每個目標(biāo)的特征,位置,運(yùn)動方向,速度等信息。動態(tài)背景下的目標(biāo)跟蹤指的是攝像頭在云臺控制下旋轉(zhuǎn),會使得他所采集的圖像時可在變化,所以,對于整個目標(biāo)跟蹤過程來說,背景是變化,目標(biāo)也是在整個過程中運(yùn)動的,所以跟蹤起來較有難度。人的行為理解與描述是越來越被廣泛關(guān)注的研究熱點(diǎn),它是指對人的運(yùn)動模式進(jìn)行分析和識別,并用自然語言等加以描述.行為理解可以簡單地認(rèn)為是時變數(shù)據(jù)的分類問題,即將測試序列與預(yù)先標(biāo)定的代表典型行為的參考序列進(jìn)行匹配。
當(dāng)前的智能視覺技術(shù)主要集中在基于RGB光學(xué)圖像的處理上,根據(jù)各種顏色空間、目標(biāo)的紋理結(jié)構(gòu)分析或者灰度特征、運(yùn)動特征等來檢測與跟蹤目標(biāo),但由于RGB圖像無法獲取物體在三維空間中的距離信息,相關(guān)的算法受到周圍環(huán)境、光照變化、背景等因素的影響,在目標(biāo)檢測與跟蹤上魯棒性較差,難以實(shí)現(xiàn)復(fù)雜場景下的任意目標(biāo)檢測和在線跟蹤,應(yīng)用受到很大的限制。
因?yàn)椴噬珨z像頭獲取的圖像只保留了空間的二維信息,所以這些方法都是二維空間上進(jìn)行處理,只能獲得目標(biāo)的二維運(yùn)動信息。真實(shí)世界中的目標(biāo)是在三維空間運(yùn)動的,如果只獲取二維運(yùn)動信息將難以達(dá)到實(shí)際應(yīng)用的魯棒性要求。因此,越來越多的研究者開始利用深度圖像來進(jìn)行目標(biāo)的檢測、跟蹤與識別。目前通過圖像感應(yīng)器獲取三維信息主要有兩種方式。其中一種原理與人眼視覺系統(tǒng)類似,采用兩個彩色攝像頭同時拍攝同一場景,通過兩個攝像頭的視差推導(dǎo)出場景中像素離攝像機(jī)的遠(yuǎn)近,即深度(Depth)。這種方式通常稱為雙目立體視覺(BinocularStereoVision)。利用雙目圖像推導(dǎo)深度信息需要先計算兩幅圖像像素之間的對應(yīng)關(guān)系,即左邊圖像的像素與右邊圖像的哪個像素是描述的空間中的同一個點(diǎn)。根據(jù)投影關(guān)系,距離較遠(yuǎn)的點(diǎn)投射到兩個圖像平面的坐標(biāo)偏差較小。利用這一原理可以通過坐標(biāo)偏差推導(dǎo)出深度。
評論comment