人臉識別技術(shù)走進(jìn)現實(shí):你被識別了么?
時(shí)間:2015-11-20 17:59:55 來(lái)源:深圳智慧安防行業(yè)協(xié)會(huì ) 作者:安防知識網(wǎng)
你還記得電影里的這些情節嗎?《變形金剛2》中,年輕的男主角和他的小伙伴們過(guò)關(guān)卡時(shí),雖然騙過(guò)了值班軍人,卻被軍方的人臉識別技術(shù)發(fā)現。2014年翻拍版的《機械戰警》中,機械戰警第一次面對大眾公開(kāi)亮相,就在人群中不停地掃描所有人臉,同時(shí)將獲取的人臉在通緝犯資料庫中作比對,瞬間就發(fā)現看熱鬧的人群中有一個(gè)逃逸多年的通緝犯,并將其制服。其他還有許多電影中,但凡是美國的機要部門(mén),進(jìn)門(mén)就要掃描各種生物特征,從早年電影中的指紋、虹膜,到現在的人臉。
人臉識別到底是什么?
人臉識別,是視覺(jué)模式識別的一個(gè)細分問(wèn)題,也大概是最難解決的一個(gè)問(wèn)題。
其實(shí)我們人每時(shí)每刻都在進(jìn)行視覺(jué)模式識別,我們通過(guò)眼睛獲得視覺(jué)信息,這些信息經(jīng)過(guò)大腦的處理被識別為有意義的概念。于是我們知道了放在我們面前的是水杯、書(shū)本,還是什么別的東西。
我們也無(wú)時(shí)無(wú)刻不在進(jìn)行人臉識別,我們每天生活中遇到無(wú)數的人,從中認出那些熟人,和他們打招呼,打交道,忽略其他的陌生人。甚至躲開(kāi)那些我們欠了錢(qián)還暫時(shí)還不上的人。
然而這項看似簡(jiǎn)單的任務(wù),對機器來(lái)說(shuō)卻并不那么容易實(shí)現。
對計算機來(lái)講,一幅圖像信息,無(wú)論是靜態(tài)的圖片,還是動(dòng)態(tài)視頻中的一幀,都是一個(gè)由眾多像素點(diǎn)組成的矩陣。比如一個(gè)1080p的數字圖像,是一個(gè)由1980*1080個(gè)像素點(diǎn)組成矩陣,每個(gè)像素點(diǎn),如果是8bit的rgb格式,則是3個(gè)取值在0-255的數。
機器需要在這些數據中,找出某一部分數據代表了何種概念:哪一部分數據是水杯,哪一部分是書(shū)本,哪一部分是人臉,這是視覺(jué)模式識別中的粗分類(lèi)問(wèn)題。
而人臉識別,需要在所有機器認為是人臉的那部分數據中,區分這個(gè)人臉屬于誰(shuí),這是個(gè)細分類(lèi)問(wèn)題。
人臉可以分為多少類(lèi)呢?
取決與所處理問(wèn)題的人臉庫大小,人臉庫中有多少目標人臉,就需要機器進(jìn)行相應數量的細分類(lèi)。如果想要機器認出每個(gè)他看到的人,則這世界上有多少人,人臉就可以分為多少類(lèi),而這些類(lèi)別之間的區別是非常細微的。由此可見(jiàn)人臉識別問(wèn)題的難度。
更不要提,這件事還要受到光照,角度,人臉部的裝飾物等各種因素的影響。這也不難解釋為什么人臉識別技術(shù)目前還沒(méi)有大量應用在日常生活中,大部分人只能在科幻電影中接觸人臉識別了。
傻傻分不清楚——一些容易被混淆的概念
一些不太被人熟悉的事物,經(jīng)常會(huì )伴隨著(zhù)大量的概念混淆。
比如對西方宗教不太了解的國人,可能搞不清楚為什么有些人信上帝但不信耶穌;都是在教堂工作的大叔,為什么有些要禁欲,有些卻能結婚。
而人臉識別作為一個(gè)新事物,也伴隨著(zhù)大量的概念混淆,而分清這些概念,對于理解人臉識別還是比較重要的。
人臉檢測與人臉識別
完成人臉識別的工作,要經(jīng)過(guò)幾個(gè)步驟。首先計算機需要在圖像或視頻中找到人臉的位置,這部分工作一般叫做人臉檢測。如前所述,這是一種粗分類(lèi),具體到人臉檢測中,實(shí)際上是二分類(lèi),計算機只需要判斷目標圖像是或者不是人臉。但由于并不能事先確定人臉的大小和位置,計算機需要以每個(gè)可能的人臉大小對全圖進(jìn)行掃描,逐個(gè)判斷子窗口所截取的圖像是否為人臉。而每次掃描過(guò)程,子窗口移動(dòng)的步長(cháng)可能是幾個(gè)像素。
所以你可以大致想象下,作一張圖的人臉檢測,計算機需要作多少次二分類(lèi)判斷。
人臉檢測步驟從一張圖中獲得人臉的位置和大小,并將該部分圖像送給后續步驟,包括:人臉部件點(diǎn)定位,人臉圖像的對齊和歸一化,人臉圖像質(zhì)量選取,特征提取,特征比對。所有步驟完成后,才能得知該人臉的身份。
當然,我們也可以單獨使用人臉檢測功能來(lái)完成某些應用,比如當前大部分照相機,及手機攝像頭都有人臉檢測功能,可以自動(dòng)獲得人臉位置,從而對圖片作一些自動(dòng)調焦和優(yōu)化。甚至對人臉做一些初步的判斷,比如性別、年齡,甚至顏值。