人臉識(shí)別技術(shù)發(fā)展與展望(雜志)
來源:數(shù)字音視工程網(wǎng) 編輯:數(shù)字音視工程 2016-04-21 10:03:34 加入收藏
前言
2015年以來,人臉識(shí)別相關(guān)新聞?lì)l頻進(jìn)入人們的視野,國內(nèi)外的人臉識(shí)別算法團(tuán)隊(duì)不斷刷新著各種記錄,相關(guān)的產(chǎn)品與應(yīng)用也層出不窮,使得人臉識(shí)別成為近期最受關(guān)注的生物特征識(shí)別技術(shù)。
人臉識(shí)別作為一種生物特征識(shí)別技術(shù),早期主要應(yīng)用于公共安全領(lǐng)域,隨著近年來人臉考勤、人臉通過等應(yīng)用的普及,普通人逐漸接觸到以前在科幻片中才能看到的技術(shù)。尤其是近兩年,隨著技術(shù)的進(jìn)步,人臉識(shí)別在各個(gè)領(lǐng)域取得越來越多的應(yīng)用:馬云在德國演示了刷臉支付、微軟的How-Old.net測(cè)年齡刷爆朋友圈、銀行券商逐漸采用人臉識(shí)別技術(shù)輔助開戶。本文旨在回顧人臉識(shí)別技術(shù)的發(fā)展歷程,同時(shí)結(jié)合個(gè)人的觀察與總結(jié),展望人臉識(shí)別的未來趨勢(shì)。
人臉識(shí)別技術(shù)簡(jiǎn)介
完整的人臉識(shí)別系統(tǒng)一般包括人臉檢測(cè)、人臉配準(zhǔn)、人臉匹配、人臉屬性分析等模塊。
人臉檢測(cè):從圖片中獲得人臉的位置,目前常用的是AdaBoost級(jí)聯(lián)分類器。
人臉配準(zhǔn):在人臉圖像中獲得關(guān)鍵特征點(diǎn)(比如眼睛、鼻子、嘴巴)的位置,通常采用回歸的方法。
人臉匹配。人們常說的“人臉識(shí)別”通常指的是人臉匹配,包括兩種模式:鑒別(identification)與認(rèn)證(verification)。人臉鑒別給出測(cè)試人員的身份,即解決”你是誰”的問題,比如公安追逃系統(tǒng);人臉認(rèn)證用于判斷測(cè)試人員與其聲稱的身份是否一致,即驗(yàn)證“你是你”的問題,比如刷臉支付。目前主流的方法有兩種,一是通過人工設(shè)計(jì)特征+子空間投影實(shí)現(xiàn),二是采用深度學(xué)習(xí)算法。
人臉屬性分析。根據(jù)人臉分析出各種屬性,比如年齡,性別,表情,種族,發(fā)型,是否戴眼鏡,胡子的類型。通常采用一般的分類或者回歸技術(shù)。
人臉識(shí)別技術(shù)進(jìn)展
自動(dòng)人臉識(shí)別系統(tǒng)的研究始于20世紀(jì)中期,早期的人臉識(shí)別探索主要依靠一些手工標(biāo)定的幾何特征(比如眼鏡、嘴巴等器官的位置、距離)進(jìn)行分類,實(shí)用的成果較少。
1991年發(fā)表的EigenFaces是一種重要的方法,該方法通過主成分分析(PCA)將圖像投影到一個(gè)低維的“特征空間”,使得信息損失最少,在該“特征空間”上進(jìn)行人臉分類。該方法不僅對(duì)數(shù)據(jù)進(jìn)行了壓縮,而且識(shí)別效果比直接使用圖像像素也要好。EigenFaces將統(tǒng)計(jì)學(xué)習(xí)引入到人臉識(shí)別領(lǐng)域,直接影響了后續(xù)的一大類主流識(shí)別算法,即子空間方法,該類方法通過各種各樣準(zhǔn)則來尋找“特征空間”,使得在“特征空間”上分類準(zhǔn)確率更高,比如FisherFaces。與EigenFaces不同的是,在訓(xùn)練階段FisherFaces引入了監(jiān)督信息,投影的不標(biāo)不再是“信息損失最少”,而是“同類分布越緊,不同類分布越散”,即更容易分類,在有足夠帶標(biāo)簽樣本的情況下,該方法可以獲得更好的識(shí)別效果。1990年代,美國國防部反毒品技術(shù)發(fā)展計(jì)劃辦公室資助了FERET(Face Recognition Technology Test)項(xiàng)目,構(gòu)建了數(shù)據(jù)庫對(duì)自動(dòng)人臉識(shí)別算法進(jìn)行對(duì)比,在1996年最后一次FERET測(cè)試中,子空間方法取得了領(lǐng)先的測(cè)試結(jié)果。時(shí)至今日,子空間方法仍然發(fā)揮著非常重要的作用,不僅直接應(yīng)用于許多人臉識(shí)別系統(tǒng),而且許多人臉識(shí)別的新方向比如流形學(xué)習(xí)、稀疏表示、度量學(xué)習(xí),都或多或少的受到子空間方法的影響。
盡管子空間方法在FERET的一些簡(jiǎn)單測(cè)試集合上取得了不錯(cuò)的效果,但是當(dāng)測(cè)試集呈現(xiàn)出光照、姿態(tài)等變化時(shí),子空間人臉識(shí)別算法的性能急劇下降,因此在進(jìn)入21世紀(jì)后,人臉識(shí)別研究者們將更多的精力放在提高算法的魯棒性上面。子空間方法在非理想測(cè)試條件下性能下降的一個(gè)重要原因就是,原始的圖像像素包含了諸多不利于識(shí)別的信息,比如光照。研究人員主要有兩種思路來應(yīng)對(duì)這些不利因素:一是進(jìn)行專門的校正(去光照以降低光照的影響;3D校正以降低姿態(tài)的影響),二是尋找更加魯棒的特征。魯棒的特征是目前很多識(shí)別算法的基礎(chǔ),其中比較常用的有Gabor特征、LBP特征。在21世紀(jì)的前10年里,研究人員結(jié)合魯棒特征與子空間算法提出各種各樣的改進(jìn),使得人臉識(shí)別算法的性能得到不斷的提升,見圖1。人臉識(shí)別逐漸在一些場(chǎng)景中得以實(shí)用,比如人臉考勤機(jī)、自助通關(guān)。
圖1 NIST人臉測(cè)試歷程
盡管在一些測(cè)試集合上,魯棒特征+子空間的方法已經(jīng)取得了非常高的準(zhǔn)確率,但是在實(shí)際場(chǎng)景中,人臉識(shí)別性能仍然難以滿足要求?,F(xiàn)實(shí)環(huán)境下光照、姿態(tài)、清晰度等遠(yuǎn)遠(yuǎn)比實(shí)驗(yàn)室采集的測(cè)試圖片復(fù)雜的多。2007年LFW數(shù)據(jù)集被建立,該數(shù)據(jù)集旨在評(píng)價(jià)非約束場(chǎng)景下的人臉識(shí)別性能。由于該數(shù)據(jù)集包含復(fù)雜的姿態(tài)、表情、遮擋等變化,而且又沒有充足的訓(xùn)練樣本,很多算法并不能取得很高的準(zhǔn)確率,在2010左右最好的算法也只有85%左右的準(zhǔn)確率。研究者們發(fā)現(xiàn),要想取得好的效果,準(zhǔn)確的特征點(diǎn)定位、適當(dāng)?shù)膶W(xué)習(xí)算法以及大量的訓(xùn)練樣本起到至關(guān)重要的作用。于是從2010年開始,準(zhǔn)確地特征點(diǎn)定位、高層特征表示與度量學(xué)習(xí)、收集更多的訓(xùn)練樣本成為人臉識(shí)別研發(fā)的方向。一個(gè)代表性的算法就是微軟的HDLBP算法,該方法基于準(zhǔn)確定位的特征點(diǎn)提取高維的人臉特征,以稀疏投影的方式進(jìn)行降維,最后通過一種度量學(xué)習(xí)算法來計(jì)算相似度,在LFW上取得了93%以上的準(zhǔn)確率,此外,通過在大量的外部數(shù)據(jù)集上進(jìn)行訓(xùn)練,準(zhǔn)確率可進(jìn)一步提高到95%以上。2012年以后,隨著深度學(xué)習(xí)的復(fù)興,研究人員自然而然的想到通過深度學(xué)習(xí)來解決人臉識(shí)別問題。在剛開始的一些嘗試中,深度學(xué)習(xí)在人臉識(shí)別中并沒有取得非常領(lǐng)先的結(jié)果,在2013年的CVPR上仍然落后于傳統(tǒng)方法。之后研究人員針對(duì)人臉識(shí)別的特點(diǎn)進(jìn)行了一系列的改進(jìn),而且通過互聯(lián)網(wǎng)收集到更多的訓(xùn)練樣本,終于使得深度學(xué)習(xí)在人臉識(shí)別領(lǐng)域取得了不錯(cuò)的結(jié)果。在2014年的CVPR上,F(xiàn)acebook、CUHK、Face++等通過深度學(xué)習(xí)在LFW上取得了97%以上的準(zhǔn)確率,尤其是CUHK的湯曉鷗實(shí)驗(yàn)室對(duì)其DeepID系列算法不斷改進(jìn),其DeepID2算法取得了99%以上的準(zhǔn)確率,第一次使得算法的性能在LFW數(shù)據(jù)集上超過了人類。
據(jù)筆者統(tǒng)計(jì),截止目前已經(jīng)有至少10個(gè)人臉識(shí)別團(tuán)隊(duì)宣稱自己的算法識(shí)別準(zhǔn)確率(在LFW數(shù)據(jù)集上)超過99%,其中有百度、Google、騰訊這樣的互聯(lián)網(wǎng)巨頭,有Face++、Linkface等初創(chuàng)公司,也有香港中文大學(xué)、中科院、新加坡國立大學(xué)這樣的科研院所。這些團(tuán)隊(duì)的結(jié)果都得益于深度學(xué)習(xí)算法。毫無疑問,深度學(xué)習(xí)成為目前人臉識(shí)別領(lǐng)域最主流的研究方向。
人臉識(shí)別技術(shù)展望
毫無疑問,深度學(xué)習(xí)成為目前人臉識(shí)別領(lǐng)域最主流的研究方向,但是傳統(tǒng)方法仍然可以取得不錯(cuò)的效果。在大華股份內(nèi)部,傳統(tǒng)非深度方法與深度學(xué)習(xí)都起到重要的作用。深度學(xué)習(xí)算法學(xué)習(xí)能力更強(qiáng),在具備足夠多的訓(xùn)練樣本的情況下,往往可以取得更高的準(zhǔn)確率,但是目前的深度學(xué)習(xí)算法計(jì)算量一般都比較大,往往依賴于GPU等并行計(jì)算資源。非深度方法不僅速度快,而且在安防監(jiān)控等復(fù)雜環(huán)境下更加穩(wěn)定,比如在一個(gè)中國人日常生活照數(shù)據(jù)集上,大華的非深度學(xué)習(xí)算法可以超過某深度學(xué)習(xí)算法(該算法在LFW上準(zhǔn)確率超過99%)。深度學(xué)習(xí)在未來一段時(shí)間內(nèi)必將持續(xù)成為研究重點(diǎn)。同時(shí)傳統(tǒng)方法也不容忽視,尤其是在一些實(shí)用場(chǎng)景速度要求高、環(huán)境復(fù)雜而訓(xùn)練數(shù)據(jù)又不充足的情況下。算法改進(jìn)、數(shù)據(jù)資源、計(jì)算資源將成為核心競(jìng)爭(zhēng)力,尤其是數(shù)據(jù)資源,成為深度學(xué)習(xí)性能的關(guān)鍵因素。一定程度上可以說誰掌握了數(shù)據(jù)入口(尤其是特定領(lǐng)域的結(jié)構(gòu)化數(shù)據(jù)),誰就有機(jī)會(huì)做出真正的”終極應(yīng)用”,例如大華股份專注于安防領(lǐng)域的人臉識(shí)別,針對(duì)安防監(jiān)控采集、收集了大量結(jié)構(gòu)化數(shù)據(jù)用于算法改進(jìn),取得了較好的效果。
數(shù)據(jù)成為提升人臉識(shí)別算法性能的關(guān)鍵因素,很多應(yīng)用更加關(guān)注低誤報(bào)條件下的識(shí)別性能,比如支人臉支付需要控制錯(cuò)誤接受率在0.00001之內(nèi),因此以后的算法改進(jìn)也將著重于提升低誤報(bào)下的識(shí)別率。對(duì)于安防監(jiān)控而言,可能需要控制在0.00000001之內(nèi)(比如幾十萬人的注冊(cè)庫),目前學(xué)術(shù)界還沒有相關(guān)的數(shù)據(jù)庫可以測(cè)試如此低誤報(bào)下的識(shí)別性能,大華股份在內(nèi)部已經(jīng)建立了千萬級(jí)別的數(shù)據(jù)庫用于算法測(cè)試與改進(jìn)。
人臉識(shí)別的應(yīng)用展望與思考
隨著技術(shù)的日益進(jìn)步,人臉識(shí)別必將更多的走進(jìn)每個(gè)人的日常生活,比如越來越多的銀行與券商借助人臉識(shí)別進(jìn)行身份核實(shí),大大提高了工作效率;基于人臉識(shí)別的社保領(lǐng)取,方便了大批行動(dòng)不便的老人;證件照查重、嫌疑犯檢索協(xié)助公安機(jī)關(guān)破案。然而必須認(rèn)識(shí)到的是,目前的人臉識(shí)別技術(shù)遠(yuǎn)遠(yuǎn)沒有達(dá)到足以應(yīng)用到任意場(chǎng)景的程度,尤其是對(duì)安全性要求、識(shí)別率要求很高的場(chǎng)景下。過度宣傳“識(shí)別率達(dá)到99%” “識(shí)別率超過人類”之類的內(nèi)容并不利于人臉識(shí)別的長(zhǎng)遠(yuǎn)發(fā)展。首先,LFW只是一個(gè)很小的學(xué)術(shù)數(shù)據(jù)集,在上面達(dá)到99%以上的準(zhǔn)確率并不代表在實(shí)用中可以達(dá)到很高的準(zhǔn)確率,在更權(quán)威的數(shù)據(jù)集FRVT上,很多算法并沒有經(jīng)過測(cè)試,難以評(píng)價(jià)真正的性能。其次,人臉識(shí)別的很多問題還沒有得到真正解決,比如刷臉支付下的活體驗(yàn)證,現(xiàn)有的驗(yàn)證機(jī)制很可能被視頻合成、3D頭套等破解,存在巨大風(fēng)險(xiǎn)。
總之,人臉識(shí)別歷經(jīng)數(shù)十年的發(fā)展,已經(jīng)取得了巨大的進(jìn)步,應(yīng)用前景廣闊,但同時(shí)也面臨著巨大的挑戰(zhàn)。通過學(xué)術(shù)界、工業(yè)界同仁持續(xù)的腳踏實(shí)地的努力,人臉識(shí)別必將取得更多的進(jìn)展。
評(píng)論comment