麗臺教學(xué) | 利用 NVIDIA Jetson Nano 制作人臉識別“門禁系統(tǒng)” 第一部分
來源:麗臺科技 編輯:lsy631994092 2021-01-14 08:34:53 加入收藏
深度學(xué)習(xí)目前應(yīng)用最廣泛的即屬影像辨識相關(guān)應(yīng)用,例如自動駕駛系統(tǒng)、保安監(jiān)控系統(tǒng)、工業(yè)瑕疵檢測應(yīng)用、工廠安全監(jiān)測系統(tǒng)及醫(yī)療影像檢測應(yīng)用等。其中人臉辨識技術(shù)算是發(fā)展最久且應(yīng)用范圍最廣。人臉辨識技術(shù)可結(jié)合多種不同產(chǎn)業(yè)的應(yīng)用,如配合公司人員數(shù)據(jù)庫可開發(fā)門禁系統(tǒng),整合犯罪數(shù)據(jù)庫可開發(fā)保安監(jiān)控系統(tǒng),配合商場可做為后續(xù)市場分析應(yīng)用。人臉辨識整合進(jìn)數(shù)據(jù)庫,辨識出特定人員后,再整合控制即可衍生出很多應(yīng)用。
人臉辨識主要流程分為三個步驟:
· 人臉檢測(Face Detection)
· 人臉對齊(Face Alignment)
· 人臉特征表征(Feature Representation)
傳統(tǒng)機(jī)器學(xué)習(xí)的人臉辨識中,一般可分為高維度人工特征提取(例如 : LBP, Gabor)和降維(例如 : PCA, LDA)兩個步驟。不過透過深度學(xué)習(xí),可以從原始圖像直接學(xué)習(xí)人臉表征。主要三步驟如下:
找到所有臉孔
Step 1
現(xiàn)行常用的臉孔搜尋方法為2005年由Navneet Dalal及Bill Triggs所開發(fā)的,稱為定向梯度直方圖(Histogram of Oriented Gradient,簡稱HOG)。
HOG臉孔特征搜尋
臉孔特征點定位
Step 2
找到臉孔位置后,接下來則是進(jìn)一步找到臉孔上各部位的特征點,此處使用的是2014年Vahid Kazemi和Josephine Sullivan開發(fā)的方法。即便每個人的臉孔輪廓會有不同,但在人臉上基本都可以找到這68個定位點。若能訓(xùn)練模型準(zhǔn)確定位,不論臉孔位置如何改變,都可以準(zhǔn)確的找到臉孔各部位的相對位置。
臉孔特征點定位
臉孔編碼
Step 3
此部分如同我們在訓(xùn)練一組卷積神經(jīng)網(wǎng)絡(luò)(CNN),不過并非訓(xùn)練整張臉孔,而是訓(xùn)練一個模型讓每個臉部可以生成128個測量值。主要程序分別為載入已知人物的臉孔影像、載入同一位已知人物的另一張臉孔影像、載入完全不同的人物的臉孔影像。透過臉孔比對128個測量值,由于同一個人的任10張測量值都應(yīng)該大致相同,所以系統(tǒng)透過此方法可以快速比對及識別身份。此方法是由Google研究人員Florian Schroff、Dmitry Kalenichenko及James Philbin在2015年研發(fā)出來的。
臉孔編碼對比
上述簡單介紹人臉辨識的概念及理論。接下來就透過簡易的實操讓大家了解人臉辨識技術(shù)的導(dǎo)入其實并不難。
以下是所有的材料,當(dāng)然需要另行自備屏幕。NVIDIA Jetson Nano的顯示界面為HDMI。
除了房子模型外,其他裝置都可以很容易取得,請發(fā)揮創(chuàng)意制作好模型。
組裝完成后的成品如下圖,這里小麗還另外加裝一組按鈕,方便開關(guān)機(jī)。
馬達(dá)則安裝在下方門軸處。
大家可以發(fā)揮巧思,例如馬達(dá)軸心如果安裝在嘴巴處,就可以讓骷髏模型做嘴巴開合的動作。
組裝完成后,接下來就是Jetson Nano要載入人臉辨識的模型,小麗這里不僅導(dǎo)入人臉辨識模型,也導(dǎo)入包含情緒、年齡及性別共四個模型。
模型的參考資料如下:
人臉識別:
https://github.com/ageitgey/face_recognition
情緒識別:
https://github.com/amineHorseman/facial-expression-recognition-using-cnn
年齡以及性別識別:
https://github.com/dpressel/rude-carnie
大家可以參考一下上述的網(wǎng)址,這里小麗就先賣個關(guān)子,下篇中會繼續(xù)介紹如何組裝及導(dǎo)入四個模型進(jìn)行辨識。
評論comment