您好,歡迎來(lái)到深圳市智慧安防行業(yè)協(xié)會(huì )——(原深圳市視頻報警安防行業(yè)協(xié)會(huì ))
當前位置:協(xié)會(huì )首頁(yè) > 行業(yè)速遞 > 李子青:解密刷臉與生物特征識別

李子青:解密刷臉與生物特征識別

時(shí)間:2016-06-08 10:30:45 來(lái)源:深圳市智慧安防行業(yè)協(xié)會(huì ) 作者:新浪財經(jīng)

  【智慧安防網(wǎng)訊】“CC講壇”(第十三期)于2016年6月6日,在北京大學(xué)百周年紀念講堂舉行。中國科學(xué)院自動(dòng)化研究所研究員、生物識別與安全技術(shù)研究中心室主任李子青出席并做了題為《解密刷臉與生物特征識別》的演講。
  
  李子青:解密刷臉與生物特征識別
  
  以下為演講實(shí)錄:
  
  人臉識別在最近一兩年特別地火。有幾個(gè)原因,第一是技術(shù)的進(jìn)步所帶來(lái)的發(fā)展;第二個(gè)是應用有強勁的需求;第三,是大佬們的推波助瀾以及資本的熱捧。
  
  現在的人臉識別技術(shù)可以輕松地搞定普通的應用。比如,我們要用人臉識別來(lái)搜papi醬,那么它返回的結果,現在基本上可以做到都是papi醬本人。結果當中可能也會(huì )包含一些其他的不是papi醬本人的女孩子,但對這種人臉搜索的應用來(lái)說(shuō)也無(wú)傷大雅。況且,人家可能也是集美貌與才華于一身,對吧?再高端的一些應用,比如說(shuō)刷臉支付,現在還存在著(zhù)一些技術(shù)和安全性上的問(wèn)題。相信馬云他本人會(huì )授權,他自己的賬戶(hù)用刷臉來(lái)轉賬,那就too young too simple,sometimes naive!
  
  早在十多年以前,人臉識別就小火了一把。比爾·蓋茨他本人非??春蒙锾卣髯R別技術(shù)的應用與未來(lái)。他在2001年就對外界媒體公開(kāi)了自家的人臉識別技術(shù)。那是我研發(fā)的一個(gè)完整的、全自動(dòng)的、實(shí)時(shí)的人臉識別系統。后面有一個(gè)人肉背景,帶眼鏡的,那就是我年輕的時(shí)候。因為我們這個(gè)演示很成功。這個(gè)記者最后說(shuō)了一句,他說(shuō):“你們這幫人,這個(gè)星期的薪水,已經(jīng)有著(zhù)落了?!?/span>
  
  早在那之前,比爾蓋茨他發(fā)布一個(gè)Windows的新版本,在發(fā)布會(huì )上遇到了藍屏死機,所以在接受CNN采訪(fǎng)之前,我們做了各種各樣的預案。包括精心部署這個(gè)燈光,并且請比爾·蓋茨他老人家能夠正面配合一下,看著(zhù)攝像頭,還有請您不要太得意,夸張的表情可能會(huì )對識別造成錯誤。
  
  人臉識別,這樣一個(gè)事情是我們一生下來(lái)就在做的。這是幾百萬(wàn)年所進(jìn)化的我們一個(gè)能力。自動(dòng)的人臉識別算法,世界上第一個(gè)做這個(gè)事情的是一個(gè)英國人。他受一家政府機構的委托來(lái)開(kāi)展研究。他當時(shí)所采用的方法是一種半自動(dòng)的方法,就是用手工在圖像上標定人臉上面的關(guān)鍵點(diǎn),然后測量?jì)裳壑g的距離、嘴唇的厚度,以此作為特征來(lái)進(jìn)行人臉的比對。其實(shí)我很多的朋友,當我告訴他我是做人臉識別的。他就會(huì )告訴我:“我知道怎么做,就是兩眼之間的距離,眼睛大小、嘴唇大小?!钡珜?shí)際上,現在的技術(shù)不是這樣的。在那之后,有非常多的重大的技術(shù)突破,比較關(guān)鍵的是2001年的一個(gè)叫AdaBoost,這樣一個(gè)人臉檢測技術(shù),它很能快速地從照片當中、圖片當中把人臉框出來(lái)。最近的10年,深度學(xué)習的研究與應用使得人臉識別和人工智能的核心技術(shù)得到了極大的提升。圖像硬件的發(fā)展也有力地給這個(gè)人臉識別提供了很好的圖像基礎。
  
  人臉識別的流程大概是這樣的。首先我們在圖像當中找到這個(gè)人臉,然后把每個(gè)人臉進(jìn)行一種預處理,給它進(jìn)行光照、姿態(tài)、表情等等一些校正。然后在這個(gè)基礎之上,我們用算法對它這個(gè)人臉部分進(jìn)行一個(gè)特征的提取,把圖片變成一個(gè)二維碼。在此基礎上進(jìn)行特征的對比,然后進(jìn)行身份識別的判決。這里面遇到的技術(shù)難點(diǎn),首先是要解決光照問(wèn)題。比如說(shuō)在全黑的條件下,我們連圖像都采不到。怎么能進(jìn)行人臉識別?像在左邊這樣一個(gè)條件下,一個(gè)極端的光照我們現在的算法還不能很好地去對它進(jìn)行一個(gè)有效的、正確的比對。其他的包括姿態(tài)、表情、還有配飾。比如說(shuō)戴個(gè)墨鏡,還有頭發(fā)的遮擋。經(jīng)常女孩子會(huì )比較難以識別,因為她的頭發(fā)遮擋住了。還有化妝,很多人會(huì )問(wèn)我,“我到韓國去整個(gè)容,那么我進(jìn)海關(guān)怎么辦?”實(shí)際上我認為靠人臉識別的話(huà)如果你完全不一樣了,應該是當成不同的人。還有人問(wèn)我,“我雙胞胎,長(cháng)得一模一樣,那你能區分出來(lái)嗎?”我說(shuō):“NO!”因為靠長(cháng)相、靠人臉的話(huà),那雙胞胎他就是同一張人臉。還有一些問(wèn)題就是比如說(shuō)年齡的跨度,我從小到大,我的面容變化非常地巨大,這也是一個(gè)問(wèn)題。
  
  前面提到就是為了給比爾·蓋茨做演示,我們精心地布置了燈光。在那之后,我就在想如何解決這個(gè)光照問(wèn)題,這是第一步要解決的。直接的一個(gè)解決方案就是說(shuō)我們可以像數碼相機那樣在前面加個(gè)閃光燈?!芭尽钡囊幌?,只要能采到正面的照片,那么我們就能以很高的準確率進(jìn)行識別。但是如果說(shuō)每次做人臉識別的時(shí)候,都要用閃光燈閃一下給人的體驗是非常差的,那個(gè)是不太可行。但是我們有其它的方法,比如說(shuō),用近紅外主動(dòng)光源。大家可能看到聊天攝像頭上面和那種監控視頻上面,晚上都有一些肉眼看不見(jiàn)但是傳感器、攝像頭它能看得見(jiàn)的這樣一種方式。所以,我發(fā)明了這樣一個(gè)近紅外人臉識別的這樣一個(gè)方法。這樣一個(gè)產(chǎn)品長(cháng)相是這樣的,是不是大家看著(zhù)非常的土?這是第二代的樣品。第一代的樣品更土,是裝在一個(gè)蒙牛牛奶的包裝盒里邊的,所有的電路、包括二極管、包括一些傳感器什么東西都包在里面。但是它work,它解決了問(wèn)題。使得2004年,當時(shí)的這樣一個(gè)人臉識別率得到了極大的提升?,F在這個(gè)產(chǎn)品是長(cháng)成是這樣的。比以前要高大上多了,這樣一個(gè)產(chǎn)品的話(huà)在全世界各地每年銷(xiāo)售有幾十萬(wàn)臺。
  
  大數據和深度學(xué)習極大地推進(jìn)了人臉識別和人工智能,包括AlphaGO。這樣一個(gè)技術(shù)的發(fā)展這里面有三個(gè)要素,第一個(gè)是大數據。要學(xué)習到這個(gè)模型的這樣一個(gè)數據,它要能囊括能夠概括我們大多數場(chǎng)景下能夠看到的這樣一些數據。第二個(gè)就是深度網(wǎng)絡(luò )的結構。它層數很深,并且它是一個(gè)非線(xiàn)性變換,使得這樣一個(gè)函數它能處理像人臉識別、語(yǔ)音識別和機器下棋,這樣一些非常復雜的問(wèn)題。第三個(gè)要素就是深度學(xué)習的運算量非常的大,我們希望能在有限的、可以等待的時(shí)間內,把這個(gè)模型訓練學(xué)習完成,這就需要有GPU的加速。這三個(gè)要素缺一不可!
  
  在很多情況下,人臉的姿態(tài)和表情是不受控制的。那么如何去解決這個(gè)問(wèn)題?我們?yōu)榇搜邪l(fā)了三維可形變的模型。它具體就是把輸入圖像往一個(gè)內部的、三維模型上面給它貼上去,然后根據關(guān)鍵點(diǎn)的位置用三維模型把這個(gè)姿態(tài)給它轉過(guò)來(lái)。轉到正面之后,我們再把這個(gè)表情再給它歸一化,給它變成一個(gè)中性的表情,最后就得到這樣一個(gè)輸出。這樣的話(huà)就能夠提高在大姿態(tài)、大的表情條件下的人臉識別的準確率。最新的進(jìn)展就是我們把前面所說(shuō)的,三維可形變模型與深度學(xué)習處理進(jìn)一步結合,使得它更加強悍,能夠解決更加困難的問(wèn)題。
  
  各種各樣的生物特征識別,包括人臉、指紋、虹膜、眼睛等等一些,它都存在著(zhù)一些問(wèn)題。首先就是識別錯誤的問(wèn)題。因為沒(méi)有哪一個(gè)算法,哪一個(gè)人工智能的技術(shù)能夠保證百分之百。第二個(gè)就是這個(gè)系統會(huì )受到各種各樣的假體的攻擊。關(guān)于識別率錯誤的問(wèn)題,一個(gè)很典型的案例,就是趙薇的司機把趙薇老公的房子給賣(mài)了??赡苓@個(gè)新聞大家都知道,原因是趙薇的司機騙過(guò)了人臉識別系統。這司機得長(cháng)成啥樣?他才能夠騙過(guò)這個(gè)人臉識別系統,并且準確率、相似度高達98.3%,所以說(shuō)我就在網(wǎng)上搜了一下,這是趙薇老公,我也曾經(jīng)試圖去搜索那個(gè)司機的人臉,但是沒(méi)搜到。但是很機智的我,搜出了一個(gè)老司機的表情包。大家仔細看一下是不是挺像的,所以說(shuō)我們應該為那套人臉識別系統點(diǎn)贊,很智能、很準確!
  
  各種各樣的假體攻擊,人臉識別的話(huà)包括照片的打印、視頻的播放,比如說(shuō)安卓4.0,它推出了人臉解鎖。馬上就有人說(shuō),“我拿這個(gè)手機拍一張照片,對著(zhù)這個(gè)手機就能解鎖了?!边€有就是人臉的面具。對付照片打印還是比較簡(jiǎn)單的,我們可以采取人機交互的方法。比如說(shuō)我可以下指令,你給我眨個(gè)眼睛,那我就看你是不是眨了眼睛。你給我張張嘴,你給我搖搖頭。當這個(gè)防假體攻擊的技術(shù)出現之后,又出現了另外一種攻擊形態(tài)。他把這個(gè)照片打印出來(lái),然后把眼睛和嘴巴的地方給它摳出來(lái),你讓我眨眼我就眨眼,你要我張嘴我就張嘴,你讓我搖頭我就搖頭,所以說(shuō)這個(gè)技術(shù)就是有矛又有盾,我們是螺旋式的上升和技術(shù)進(jìn)步。網(wǎng)上可以買(mǎi)賣(mài)到的仿人皮的這樣一個(gè)人臉。除了這個(gè)人臉之外,指紋這個(gè)假體是更加普遍。你在百度上面去搜一下,就能搜出各種各樣的仿制的指紋的方法。它可以代打卡嘛!我可以不用去上班了。我也是非常希望我們每一個(gè)中國人都能在一個(gè)良好的環(huán)境當中去生存,就是能夠活得有尊嚴,所以說(shuō)這種騙術(shù)我們一定要給它鏟除。
  
  為了解決生物識別防假體攻擊這樣一個(gè)問(wèn)題,歐盟組織了12個(gè)團隊來(lái)開(kāi)展系統性的、合作研究,其中11個(gè)團隊是歐盟成員國的團隊,我們作為唯一的一個(gè)非歐團隊受邀參加這樣一個(gè)項目。我們在這個(gè)項目當中提出了,用多光譜的方法。就是多光譜,包括紫外、近紅外、熱紅外成像,這是我們肉眼不可見(jiàn),但是在各種光譜情況下的成像,它可能能分辨出。這個(gè)真人和假體的區別這樣一種技術(shù)它是需要一種特殊的硬件的。
  
  下面我來(lái)比較一下機器的識別與人工的這樣一個(gè)識別。招商銀行統計人工核驗的錯誤率大概是百分之五,而機器自動(dòng)識別的錯誤率大概在千分之一到萬(wàn)分之一之間,所以說(shuō)這個(gè)機器已經(jīng)遠遠超過(guò)了人工的這樣一個(gè)識別,但是這是有條件的。
  
  這個(gè)案例是在深圳羅湖海關(guān)抓有案底的這樣一些水客。因為人能夠識別的面孔大概只有幾千張,特別是對不熟悉的人,我很難去給他識別出來(lái)。像我本人的話(huà),我是特別的臉盲,我覺(jué)得我頂多只能識別不到一千張臉,遠遠低于這個(gè)平均水平。這個(gè)系統在頭三天的啟用就成功地識別兩百多個(gè)水客。
  
  那比較一下機器識別與人工識別在正常的條件下,機器人臉識別的成功率、準確率是遠遠高于人工識別的,但是機器它做人臉識別的時(shí)候,它只看人臉這樣一部分。它沒(méi)有用到一些外部的一些信息、線(xiàn)索,比如說(shuō)什么發(fā)型,高矮胖瘦啊。它是不看的,而人可以看這個(gè)。另外,機器的話(huà),剛才我說(shuō)了,我可以在大數據當中去搜索人臉。比如說(shuō),我們做的一個(gè)案例,搜索一千萬(wàn)張只需要不到一秒的時(shí)間,而剛才我說(shuō)了人他一生當中只能認識幾千個(gè)人,但是機器呢比較容易受到這種偽造的攻擊,用一張照片或者一段視頻,或者拿個(gè)手機,但是人能夠比較容易地去識別這樣一個(gè)假體攻擊。
  
  除了人臉之外,還有各種各樣的生物特征。我們比較熟悉的就是指紋、虹膜,像那些大片里面掌紋、掌靜脈、步態(tài)、簽名、指靜脈。那么我們把不同的多種的生物特征給它結合起來(lái),這樣的話(huà)有可能提升它的準確性與安全性。比如說(shuō)我拍臉的時(shí)候,我同樣把這個(gè)瞳孔,這個(gè)虹膜給它拍出來(lái)。這樣既不影響你使用的便捷性,又能提升你的識別率;指紋的話(huà),我既采指紋又采指靜脈,那這樣的話(huà)其實(shí)也是不會(huì )影響它使用的便捷性,但是可以提高它的準確性和安全性。
  
  最后談一下技術(shù)發(fā)展。深度學(xué)習已經(jīng)是目前人臉識別、物體識別、語(yǔ)音識別和人工智能的一種核心的這樣一個(gè)方法。大家有個(gè)感覺(jué),深度學(xué)習在最近幾年其實(shí)沒(méi)有什么太多發(fā)展,它之所以應用成功是因為我們在做很多工程上面的收集數據。然后進(jìn)行訓練,然后調參數、調應用,我不認為把這個(gè)技術(shù)的提升可以歸結為一個(gè)工程化的成果,我認為深度學(xué)習理論本身,還是有很大的潛力可以挖出來(lái)。很多的工程應用問(wèn)題都可以歸結成一個(gè)優(yōu)化的問(wèn)題,那么在定義了目標函數之后,我們要去尋優(yōu)要去求解一個(gè)最優(yōu)解,這里面就涉及到一個(gè)全局優(yōu)化的問(wèn)題。比如說(shuō)我知道,全球的最高峰是珠穆朗瑪峰,但是如果說(shuō)我順著(zhù)爬上去任何一座山的話(huà),也許我就爬到香山上面了,那就不是珠穆朗瑪峰了。所以說(shuō)要如何能跳出,要避免這樣一個(gè)不太好的局部極值,能夠找到全局的最優(yōu)點(diǎn)。其實(shí)這個(gè)已經(jīng)是在數學(xué)界、理論界是一個(gè)還是沒(méi)有很好解決的問(wèn)題。
  
  那么進(jìn)一步要把這個(gè)人工智能提升到更高的一個(gè)臺階,需要我們進(jìn)行一個(gè)跨界的努力,需要我們對自己的大腦進(jìn)行這樣一個(gè)更加深刻的認識。那么現在已經(jīng)知道,人的大腦里面有不同的區域是執行不同的功能的。這部分是識別人臉的,這部分是識別貓的,那這部分識別人臉里面是不是有張三李四。也在不同的一個(gè)細胞,這就是所謂稀疏表達問(wèn)題,或者在腦科學(xué)里面叫祖母細胞的問(wèn)題。
企業(yè)資訊
一文讀懂熵基國密門(mén)禁
在數字化轉型的洪流中,信息安全不僅是企業(yè)穩健運營(yíng)的基石,更是公共部門(mén)安全無(wú)虞的保障。隨著(zhù)數據價(jià)值的日益凸顯,其保密性和安全性成為
門(mén)禁“隱形冠軍”?是時(shí)候重新認識熵基科技了
在智慧出入口與身份識別、辦公等領(lǐng)域深耕多年的熵基科技,早已不局限于傳統的門(mén)禁與考勤系統,而是悄然邁入了智能物聯(lián)(AIoT)的廣闊
愛(ài)鑫微針對LED會(huì )議一體機推出intel 12-14代CPU+16G獨顯高性能5G+8K方案的電腦模塊
6月9日-12日,第29屆廣州國際照明展覽會(huì )(以下簡(jiǎn)稱(chēng)“光亞展”)于6月9-12日在廣州中國進(jìn)出口商品交易會(huì )展館盛大舉辦,匯聚了
項目活動(dòng)
熱門(mén)專(zhuān)題
  • 熵基科技出席數字經(jīng)濟及智慧城市空間未來(lái)應用創(chuàng )新峰會(huì )
  • 2021年智能安防機器人市場(chǎng)或將進(jìn)入井噴期
  • 2021年的智慧城市建設該怎么發(fā)展?聽(tīng)聽(tīng)行業(yè)大咖的觀(guān)點(diǎn)
  • 達實(shí)信息:顛覆傳統經(jīng)營(yíng)模式 構建互聯(lián)網(wǎng)+門(mén)禁新時(shí)代
日韩精品欧美激情|亚洲国产AV无码综合|亚洲av日韩综合一区|久久久久波多野结衣高潮|亚洲自偷自偷在线制服