多方式人臉識(shí)別系統(tǒng) 微軟借此使設(shè)備更智能
來(lái)源:數(shù)字音視工程網(wǎng) 編輯:航行150 2015-12-08 17:01:55 加入收藏
“人臉識(shí)別”,一提到這個(gè)名詞,大家直觀印象大概是馬云在德國(guó)CeBIT上演示“刷臉支付”,引爆了全世界。此后中國(guó)資本大佬聞風(fēng)而動(dòng),紛紛布局“人臉識(shí)別”產(chǎn)業(yè)。但是對(duì)于人臉識(shí)別究竟是什么你真的了解嗎?
多方式人臉識(shí)別系統(tǒng) 微軟借助此使設(shè)備更智能(圖片自百度)
人臉識(shí)別方式多種多樣
其實(shí)看似高大尚德的人臉識(shí)別方式就是根據(jù)面部特征進(jìn)行的計(jì)算機(jī)系統(tǒng)識(shí)別,根據(jù)不同的特征也有多種識(shí)別方式。以下介紹幾種:
(1)幾何特征的人臉識(shí)別方法
幾何特征可以是眼、鼻、嘴等的形狀和它們之間的幾何關(guān)系(如相互之間的距離)。這些算法識(shí)別速度快,需要的內(nèi)存小,但識(shí)別率較低。
(2)基于特征臉(PCA)的人臉識(shí)別方法
特征臉?lè)椒ㄊ腔贙L變換的人臉識(shí)別方法,KL變換是圖像壓縮的一種最優(yōu)正交變換。高維的圖像空間經(jīng)過(guò)KL變換后得到一組新的正交基,保留其中重要的正交基,由這些基可以張成低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,就可以將這些投影用作識(shí)別的特征矢量,這就是特征臉?lè)椒ǖ幕舅枷?。這些方法需要較多的訓(xùn)練樣本,而且完全是基于圖像灰度的統(tǒng)計(jì)特性的。目前有一些改進(jìn)型的特征臉?lè)椒ā?/p>
(3)神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法
神經(jīng)網(wǎng)絡(luò)的輸入可以是降低分辨率的人臉圖像、局部區(qū)域的自相關(guān)函數(shù)、局部紋理的二階矩等。這類方法同樣需要較多的樣本進(jìn)行訓(xùn)練,而在許多應(yīng)用中,樣本數(shù)量是很有限的。
(4)彈性圖匹配的人臉識(shí)別方法
彈性圖匹配法在二維的空間中定義了一種對(duì)于通常的人臉變形具有一定的不變性的距離,并采用屬性拓?fù)鋱D來(lái)代表人臉,拓?fù)鋱D的任一頂點(diǎn)均包含一特征向量,用來(lái)記錄人臉在該頂點(diǎn)位置附近的信息。該方法結(jié)合了灰度特性和幾何因素,在比對(duì)時(shí)可以允許圖像存在彈性形變,在克服表情變化對(duì)識(shí)別的影響方面收到了較好的效果,同時(shí)對(duì)于單個(gè)人也不再需要多個(gè)樣本進(jìn)行訓(xùn)練。
(5)線段Hausdorff距離(LHD)的人臉識(shí)別方法
心理學(xué)的研究表明,人類在識(shí)別輪廓圖(比如漫畫(huà))的速度和準(zhǔn)確度上絲毫不比識(shí)別灰度圖差。LHD是基于從人臉灰度圖像中提取出來(lái)的線段圖的,它定義的是兩個(gè)線段集之間的距離,與眾不同的是,LHD并不建立不同線段集之間線段的一一對(duì)應(yīng)關(guān)系,因此它更能適應(yīng)線段圖之間的微小變化。實(shí)驗(yàn)結(jié)果表明,LHD在不同光照條件下和不同姿態(tài)情況下都有非常出色的表現(xiàn),但是它在大表情的情況下識(shí)別效果不好。
(6)支持向量機(jī)(SVM)的人臉識(shí)別方法
近年來(lái),支持向量機(jī)是統(tǒng)計(jì)模式識(shí)別領(lǐng)域的一個(gè)新的熱點(diǎn),它試圖使得學(xué)習(xí)機(jī)在經(jīng)驗(yàn)風(fēng)險(xiǎn)和泛化能力上達(dá)到一種妥協(xié),從而提高學(xué)習(xí)機(jī)的性能。支持向量機(jī)主要解決的是一個(gè)2分類問(wèn)題,它的基本思想是試圖把一個(gè)低維的線性不可分的問(wèn)題轉(zhuǎn)化成一個(gè)高維的線性可分的問(wèn)題。通常的實(shí)驗(yàn)結(jié)果表明SVM有較好的識(shí)別率,但是它需要大量的訓(xùn)練樣本(每類300個(gè)),這在實(shí)際應(yīng)用中往往是不現(xiàn)實(shí)的。而且支持向量機(jī)訓(xùn)練時(shí)間長(zhǎng),方法實(shí)現(xiàn)復(fù)雜,該函數(shù)的取法沒(méi)有統(tǒng)一的理論。
人臉識(shí)別的方法很多,當(dāng)前的一個(gè)研究方向是多方法的融合,以提高識(shí)別率。
微軟開(kāi)發(fā)人臉識(shí)別應(yīng)用
12月4日,據(jù)美國(guó)福布斯報(bào)道,微軟牛津計(jì)作為一個(gè)軟件應(yīng)用開(kāi)發(fā)項(xiàng)目,正處于向程序員開(kāi)放測(cè)試階段。這些工具擬讓開(kāi)發(fā)者開(kāi)發(fā)智能應(yīng)用,探測(cè)人的面部情緒:開(kāi)心、傷心、憤怒、失望等。按照微軟的說(shuō)法,“在人臉識(shí)別等這些實(shí)例中,系統(tǒng)接收幾組圖片進(jìn)行學(xué)習(xí),能學(xué)習(xí)并識(shí)別某些特征,然后這些信息會(huì)被應(yīng)用于識(shí)別新接收的圖片中的面部特征。”
借助人臉識(shí)別,把應(yīng)用做得更智能
為什么要如此煞費(fèi)苦心?答案還是在智能二字上。我們要在自己的設(shè)備上做出“智能應(yīng)用”。我們要把應(yīng)用做到能感知位置、時(shí)間,甚至還有動(dòng)態(tài)(感知是否有動(dòng)作發(fā)生)——那為什么不做情緒感知?
如果你手上的智能手機(jī)知道你現(xiàn)在不開(kāi)心,難道你不想聽(tīng)一首你最喜歡的歌曲嗎,或者至少也能主動(dòng)給你提供這樣的選擇?如果你的智能手機(jī)智能你很疲憊(通過(guò)面部識(shí)別和加速計(jì)的運(yùn)動(dòng)追蹤),難道你不想手機(jī)自動(dòng)給你一些打車回家的建議或選擇嗎?
微軟劍橋研究院院長(zhǎng)克里斯·畢曉普(Chris Bishop),在一場(chǎng)大會(huì)上展示了最新的情緒識(shí)別技術(shù)。微軟技術(shù)和研究團(tuán)隊(duì)表示,牛津項(xiàng)目是微軟在人工智能和視聽(tīng)說(shuō)解技術(shù)方面總投資的一部分。
“從開(kāi)發(fā)者角度來(lái)說(shuō),我們想點(diǎn)亮他們的想象力,證明開(kāi)發(fā)一個(gè)智能應(yīng)用是不難的,只要使用牛津項(xiàng)目和Azure服務(wù)。對(duì)那些想把應(yīng)用做得更智能和更差異化的開(kāi)發(fā)者,這些服務(wù)能讓他們跨越不同的平臺(tái),僅用3行代碼就能把智能技術(shù)注入應(yīng)用當(dāng)中,自身也不需要是人工智能方面的專家(例如無(wú)機(jī)器學(xué)習(xí)方面專業(yè)知識(shí))。微軟將繼續(xù)改進(jìn)項(xiàng)目模型,開(kāi)發(fā)者無(wú)需更換代碼。”
評(píng)論comment