【新(xīn)東網技(jì )術大咖帶您走進人臉識别】這是一個刷臉的時代……
發布時間: 2017-03-06 15:58:56
文(wén)/謝(xiè)海東 華南研發
人臉識别是通過分(fēn)析臉部器官的唯一形狀和位置來進行身份鑒别,它是一種重要的生物(wù)特征識别技(jì )術,應用(yòng)非常廣泛。與其它身份識别方法相比,人臉識别具(jù)有(yǒu)直接、友好和方便等特點,以“天翼銷售門戶”中(zhōng)的預受理(lǐ)業務(wù)為(wèi)例,傳統的流程:
可(kě)以看出,現有(yǒu)的預受理(lǐ)業務(wù)中(zhōng)存在大量為(wèi)實名(míng)認證服務(wù)、卻與實際業務(wù)流程無關的環節,對提升工(gōng)作(zuò)效率十分(fēn)不利。
而引入人像識别之後的業務(wù)流程:
很(hěn)明顯,引入人像識别之後,業務(wù)流程能(néng)夠得到極大的簡化。同時,人臉識别問題的研究不僅有(yǒu)重要的應用(yòng)價值,而且在模式識别中(zhōng)具(jù)有(yǒu)重要的理(lǐ)論意義,目前人臉識别已成為(wèi)當前模式識别和人工(gōng)智能(néng)領域的研究熱點。
目前在國(guó)内和國(guó)外研究人臉識别的方法有(yǒu)很(hěn)多(duō),常用(yòng)的方法有(yǒu):基于幾何特征的人臉識别方法、基于代數特征的人臉識别方法、基于連接機制的人臉識别方法以及基于三維數據的人臉識别方法。人臉識别流程圖如圖所示:
基于幾何特征的方法是一種自下而上的人臉檢測方法。研究人員認為(wèi)有(yǒu)一個潛在的假設:人臉或人臉的部件可(kě)能(néng)具(jù)有(yǒu)在各種條件下都不會改變的特征或屬性,如形狀、膚色、紋理(lǐ)、邊緣信息等。基于幾何特征的方法的目标就是尋找上述這些不變特征,并利用(yòng)這些特征來定位人臉。這類方法在特定的環境下非常有(yǒu)效且檢測速度較高,對人臉姿态、表情、旋轉都不敏感。但是由于人臉部件的提取通常都借助于邊緣檢測算子,因此,這類方法對圖像質(zhì)量要求較高。對光照和背景等有(yǒu)較高的要求,因為(wèi)光照、噪音、陰影都極有(yǒu)可(kě)能(néng)破壞人臉部件的邊緣,從而影響算法的有(yǒu)效性。
模闆匹配算法首先需要人TN作(zuò)标準模闆(固定模闆)或将模闆先行參數化(可(kě)變模闆),然後在檢測人臉時,計算輸入圖像與模闆之間的相關值,這個相關值通常都是獨立計算臉部輪廓、眼睛、鼻子和嘴各自的匹配程度後得出的綜合描述,最後再根據相關值和預先設定的阈值來确定圖像中(zhōng)是否存在人臉。基于可(kě)變模闆的人臉檢測算法比固定模闆算法檢測效果要好很(hěn)多(duō),但是它仍不能(néng)有(yǒu)效地處理(lǐ)人臉尺度、姿态和形狀等方面的變化。
基于外觀形狀的方法并不對輸入圖像進行複雜的預處理(lǐ),也不需要人工(gōng)的對人臉特征進行分(fēn)析或是抽取模闆,而是通過使用(yòng)特定的方法(如主成分(fēn)分(fēn)析方法(PCA)、支持向量機(SVM)、神經網絡方法(ANN)等)對大量的人臉和非人臉樣本組成的訓練集(一般為(wèi)了保證訓練得到的檢測器精(jīng)度,非人臉樣本集的容量要為(wèi)人臉樣本集的兩倍以上)進行學(xué)習,再将學(xué)習而成的模闆或者說分(fēn)類器用(yòng)于人臉檢測。因此,這也是種自下而上的方法。這種方法的優點是利用(yòng)強大的機器學(xué)習算法,快速穩定地實現了很(hěn)好的檢測結果,并且該方法在複雜背景下,多(duō)姿态的人臉圖像中(zhōng)也能(néng)得到有(yǒu)效的檢測結果。但是這種方法通常需要遍曆整個圖片才能(néng)得到檢測結果,并且在訓練過程中(zhōng)需要大量的人臉與非人臉樣本,以及較長(cháng)的訓練時間。近幾年來,針對該方法的人臉檢測研究相對比較活躍。
在基于代數特征的人臉識别中(zhōng),每一幅人臉圖像被看成是以像素點灰度為(wèi)元素的矩陣,用(yòng)反映某些性質(zhì)的數據特征來表示人臉的特征。但在這種矩陣對應的多(duō)維空間中(zhōng),并不是每一部分(fēn)都包含有(yǒu)價值的信息,故一般情況下,需要通過某種變換,将如此巨大的空間中(zhōng)的這些點映射到一個維數較低的空間中(zhōng)去。然後利用(yòng)對圖像投影間的某種度量來确定圖像間的相似度,最常見的就是各種距離度量。 在基于代數特征的人臉識别方法中(zhōng),主成分(fēn)分(fēn)析法(PCA)是目前研究者使用(yòng)最多(duō)的方法之一。而完整的PCA(PrincipalComponentAnalysis)人臉識别的應用(yòng)包括四個步驟:
1、 人臉圖像預處理(lǐ);
2、 讀入人臉庫,訓練形成特征子空間;
3、 把訓練圖像和測試圖像投影的上一步驟中(zhōng)得到的子空間上;
4、 選擇一定的距離函數進行識别。
基于連接機制的識别方法的代表性有(yǒu)神經網絡和彈性匹配法。
神經網絡(ANN)在人工(gōng)智能(néng)領域近年來是一個研究熱門,基于神經網絡技(jì )術來進行人臉特征提取和特征識别是一個積極的研究方向。神經網絡通過大量簡單神經元互聯來構成複雜系統,在人臉識别中(zhōng)取得了較好的效果,特别是正面人臉圖像。常用(yòng)的神經網絡有(yǒu):BP網絡、卷積網絡、徑向基函數網絡、自組織網絡以及模糊神經網絡等。BP網絡的運算量較小(xiǎo)耗時也短,它的自适應功能(néng)使系統的健壯性增強。神經網絡用(yòng)于人臉識别,相比較其他(tā)方法,其可(kě)以獲得識别規則的隐性表達,缺點是訓練時間長(cháng)、運算量大、收斂速度慢且容易陷入局部極小(xiǎo)點等。彈性匹配法采用(yòng)屬性拓撲圖代表人臉,拓撲圖的每個頂點包含一個特征向量,以此來記錄人臉在該頂點位置周圍的特征信息。拓撲圖的頂點是采用(yòng)小(xiǎo)波變換特征,對光線(xiàn)、角度和尺寸都具(jù)有(yǒu)一定的适應性,且能(néng)适應表情和視角的變化,其在理(lǐ)論上改進了特征臉算法的一些缺點。
一個完整的人臉識别系統包括人臉面部數據的獲取、數據分(fēn)析處理(lǐ)和最終結果輸出三個部分(fēn)。三維人臉識别的基本步驟:
1 、通過三維數據采集設備獲得人臉面部的三維形狀信息;
2 、對獲取的三維數據進行平滑去噪和提取面部區(qū)域等預處理(lǐ);
3 、從三維數據中(zhōng)提取人臉面部特征,通過與人臉庫中(zhōng)的數據進行比對;
4 、用(yòng)分(fēn)類器做分(fēn)類判别,輸出最後決策結果。
基于三維數據的方法中(zhōng)比較有(yǒu)代表性的,是基于模型合成的方法的方法。
基于模型合成的方法,它的基本思想為(wèi):輸入人臉圖像的二維信息,用(yòng)某種技(jì )術恢複(或部分(fēn)恢複)人臉的三維信息,再重新(xīn)合成指定條件下的人臉圖像。典型代表是3D可(kě)變形模型和基于形狀恢複的3D增強人臉識别算法。3D可(kě)變形模型首先通過200個高精(jīng)度的3D人臉模型構建一個可(kě)變形的3D人臉模型,用(yòng)這個模型來對給定的人臉圖像拟合,獲得一組特定的參數,再合成任何姿态和光照的人臉圖像。基于形狀恢複的3D增強人臉識别算法則是利用(yòng)通用(yòng)的3D人臉模型合成新(xīn)的人臉圖像,合成過程改變了一定的姿态與光源情況。
以上就是當下常見的一些人臉識别研究方向的簡單描述。當然,在海量人臉數據比對速度甚至精(jīng)度方面,現有(yǒu)的自動人臉識别系統可(kě)能(néng)已經超過了人類,但對于複雜變化條件下的一般人臉識别問題,自動人臉識别系統的魯棒性和準确度還遠(yuǎn)不及人類。這種差距産(chǎn)生的本質(zhì)原因現在還不得而知,但從模式識别和計算機視覺等學(xué)科(kē)的角度判斷,這既可(kě)能(néng)意味着人類尚未找到對面部信息進行合理(lǐ)采樣的有(yǒu)效傳感器(考慮單目攝像機與人類雙眼系統的差别),更可(kě)能(néng)意味着目前為(wèi)止的研究都采用(yòng)了不合适的人臉建模方法(人臉的内部表示問題)。但無論如何,賦予計算設備與人類相類似的人臉識别能(néng)力是衆多(duō)該領域研究人員的夢想。相信随着研究的繼續深入,人類的認識應該能(néng)夠更加逼近這些問題的正确答(dá)案。