神經(jīng)網(wǎng)絡(luò )、深度學(xué)習與神經(jīng)生物學(xué)之間啟發(fā)式的聯(lián)系
19世紀末期20世紀初從事解剖學(xué)領(lǐng)域研究的科學(xué)家們提出的神經(jīng)元理論奠定了現代神經(jīng)系統研究的基礎,而這也成為了40年之后其它領(lǐng)域的科學(xué)家們設計神經(jīng)網(wǎng)絡(luò )模型的靈感之源。從1940年至1980年這40年間,心理學(xué)家、數學(xué)家以及計算機科學(xué)家們基于此理論(與圖模型理論深度結合)不斷地改進(jìn)模型,使人工神經(jīng)網(wǎng)絡(luò )算法逐漸從理論探討邁向了工程實(shí)踐。具體來(lái)說(shuō),神經(jīng)元理論提出的神經(jīng)元和突觸概念被抽象化為DAG(或者UAG)中的頂點(diǎn)與邊,從而組成了一個(gè)完整的神經(jīng)網(wǎng)絡(luò )模型(例如多層感知機);理論提出的聯(lián)結特異性原理(特定的神經(jīng)元只能與另外一些特定神經(jīng)元發(fā)生聯(lián)系)進(jìn)一步激發(fā)了諸如嚴格玻爾茲曼機的研究;而動(dòng)態(tài)極化原理(在神經(jīng)元內部信號僅向一個(gè)方向傳遞)則幫助人們設計出了經(jīng)典的前饋神經(jīng)網(wǎng)絡(luò )結構。
而對靈長(cháng)類(lèi)動(dòng)物初級視覺(jué)系統的研究,人們基于視網(wǎng)膜上的神經(jīng)節細胞只能對視場(chǎng)中某一特定位置產(chǎn)生響應(感受野)這個(gè)事實(shí),創(chuàng )造性地將卷積、池化等引入了神經(jīng)網(wǎng)絡(luò )的結構中,如此簡(jiǎn)潔精妙的設計構思有效限制了由于網(wǎng)絡(luò )結構的復雜而引起的參數爆炸性增長(cháng);同時(shí)還提高了算法的計算效率。
其余的例子不勝枚舉。神經(jīng)元細胞彼此之間發(fā)生的抑制作用讓神經(jīng)網(wǎng)絡(luò )(特別是深度學(xué)習)的設計者們創(chuàng )造出了各種技巧。視覺(jué)上的側抑制效應則催生了局部響應歸一化層的構造;而我們從ReLU、Dropout等設計上不難看出神經(jīng)元細胞之間互補性控制的影子。
深度學(xué)習算法則是基于上述事實(shí)對人腦進(jìn)一步的仿生方式。人類(lèi)的大腦皮層由四個(gè)區域構成:額葉、頂葉、枕葉、顳葉。神經(jīng)生物學(xué)研究表明,在枕葉中存在著(zhù)兩條信息處理通路:腹側通路與背側通路,其中腹側通路從枕葉向下延伸至顳葉下部,加工對象或場(chǎng)景的視覺(jué)外觀(guān),如形狀、顏色、亮度、質(zhì)地和大小等。進(jìn)一步的研究表明,腹側通路中,不同區域內的神經(jīng)元僅對特定的視覺(jué)基元(visual primitives)產(chǎn)生響應。例如,V1區域對簡(jiǎn)單的邊緣與紋理產(chǎn)生響應;V2區域對上述邊緣與紋理組合形成的簡(jiǎn)單形狀產(chǎn)生響應;而V4區域則對上述形狀組合而成的更高級特征產(chǎn)生響應。連同將原始光信號轉換為生物電信號的人眼視網(wǎng)膜組織,腹側通路的這些區域形成了一條自底向上的信息處理鏈。信息從原始的像素開(kāi)始,逐級抽象,從簡(jiǎn)單到復雜,低級到高級,形成了人類(lèi)的視覺(jué)認知。打個(gè)比方,卷積神經(jīng)網(wǎng)絡(luò )好比是大腦皮層的枕葉(負責處理視覺(jué)信息),而循環(huán)神經(jīng)網(wǎng)絡(luò )則是大腦皮層的顳葉(負責處理時(shí)域信息)。
安防監控產(chǎn)業(yè)與深度學(xué)習之間的聯(lián)系
現在讓我們將討論的話(huà)題切換到安防領(lǐng)域上來(lái)。安防監控系統是應用光纖、同軸電纜或微波在其閉合的環(huán)路內傳輸視頻信號,并從攝像到圖像顯示和記錄構成獨立完整的系統。它能實(shí)時(shí)、形象、真實(shí)地反映被監控對象,不但極大地延長(cháng)了人眼的觀(guān)察距離,而且擴大了人眼的機能,它可以在惡劣的環(huán)境下代替人工進(jìn)行長(cháng)時(shí)間監視,讓人能夠看到被監視現場(chǎng)實(shí)際發(fā)生的一切情況,并通過(guò)錄像機記錄下來(lái)。同時(shí)報警系統設備對非法入侵進(jìn)行報警,產(chǎn)生的報警信號輸入報警主機,報警主機觸發(fā)監控系統錄像并記錄。從對安防監控的描述中我們可以知道,信號的來(lái)源主要為視頻和圖像,換而言之主要的信號源與“視覺(jué)”相關(guān)。用通俗的話(huà)來(lái)進(jìn)行描述,安防監控系統就是通過(guò)器械(攝像頭等)讓人們“看”到外部世界并對“感興趣”事件產(chǎn)生預警的系統。
傳統的安防監控系統以“人防”為主,但人防的缺點(diǎn)顯而易見(jiàn):隨著(zhù)需要監控的視頻通道數的增加,所需的人力也會(huì )相應增加,其直接影響就是遠高于收益的人力成本與遠低于回報的工作效率。正是由于這個(gè)原因,現在的安防監控系統都以“技防”為主,即用無(wú)間歇工作的智能算法來(lái)代替無(wú)法長(cháng)時(shí)間保持高效的人力對視頻畫(huà)面進(jìn)行監控。而讓智能算法徹底代替人力的愿景,在深度學(xué)習出現以前,如同科幻小說(shuō)一般,僅僅停留在人們的腦海中,猶如紙上談兵,無(wú)法落地。雖然傳統的智能算法能夠在特定環(huán)境和特定時(shí)間下表現出良好的性能,但只要一項因子發(fā)生改變(畫(huà)質(zhì)、環(huán)境等),傳統智能算法在應用上表現出的性能就會(huì )出現明顯的下降。換句話(huà)說(shuō),傳統的智能算法相比于人類(lèi)的大腦,欠缺的是對于所學(xué)“知識”的遷移能力。欠缺這種能力的本質(zhì)原因則需要讀者對機器學(xué)習具備一定的了解:實(shí)際問(wèn)題中數據的分布呈現出高度的復雜性,我們感興趣的對象的特征往往位于嵌入在更高維度的空間中的低維流型上。流型的維度雖低,但其幾何結構并不簡(jiǎn)單。更加嚴格地說(shuō),其超表面呈現高度的非線(xiàn)性性。傳統的智能算法背后其實(shí)對應著(zhù)傳統的機器學(xué)習方法,而這些傳統的機器學(xué)習方法大多被設計使用線(xiàn)性超曲面來(lái)近似表征數據的流型;另外一些方法則通過(guò)所謂的核技巧來(lái)進(jìn)行線(xiàn)性到非線(xiàn)性的“魔法”。這些方法雖然具有很好的數學(xué)定義,有些甚至具備優(yōu)雅的解析解,但“現實(shí)往往是殘酷的”:數學(xué)是人們形式化用于描述自然界如何工作的途徑 ,但對于人類(lèi)大腦而言,目前的科技水平并沒(méi)有解碼其工作原理。因此,確定的、有邏輯因果聯(lián)系的過(guò)程在目前看來(lái)并不適用于這個(gè)領(lǐng)域。
而深度學(xué)習則另辟蹊徑,在神經(jīng)網(wǎng)絡(luò )設計之初人們就賦予了其仿生的屬性。這門(mén)學(xué)科與其說(shuō)是一門(mén)科學(xué),還不如說(shuō)是一門(mén)藝術(shù)。目前大部分行之有效的技巧或方法往往來(lái)自于研究人員 的直覺(jué),而不是嚴謹的推導。對此詳細的說(shuō)明超出了本文的范疇,在這里省略??偠灾?,深度學(xué)習中的一個(gè)重要分支——卷積神經(jīng)網(wǎng)絡(luò )及其相關(guān)技巧解決了(在若干特定任務(wù)上,已經(jīng)接近甚至超越了人類(lèi)視覺(jué)系統)計算機如何“看世界”的問(wèn)題;而智能安防產(chǎn)業(yè)的首要數據來(lái)源便是圖像和視頻,因此這兩者能夠獲得相當高的默契度。
雖然從引起工業(yè)界的關(guān)注至今僅過(guò)了4個(gè)年頭,深度學(xué)習已然得到了安防產(chǎn)業(yè)的青睞。由于其對人類(lèi)視覺(jué)系統的模仿,凡是人眼能夠勝任的智能安防應用,都可以應用深度學(xué)習技術(shù)得以解決(不同程度上地)。往廣的范疇上來(lái)說(shuō),智能應用無(wú)非是檢測、跟蹤、識別三大主流方向;而如今無(wú)論是學(xué)術(shù)界還是工業(yè)界,這三大視覺(jué)主流方向已經(jīng)牢牢地被深度學(xué)習占領(lǐng)了。相比于傳統的智能算法,融合了深度學(xué)習的智能算法所得到的性能往往是突破性的。毫不夸張地打個(gè)比方,就好像四缸渦輪增壓發(fā)動(dòng)機與普通柴油發(fā)動(dòng)機的區別。圍繞著(zhù)這三大主流應用方向,深度學(xué)習的觸角觸及了行業(yè)的方方面面:人臉檢測、車(chē)輛檢測、非機動(dòng)車(chē)檢測、人臉識別、車(chē)輛品牌識別、行人檢索、車(chē)輛檢測、人體屬性、異常人臉檢測、人群行為分析、各種感興趣目標的跟蹤……
讓深度學(xué)習能夠如此大行其道的關(guān)鍵要素是數據,這也是深度學(xué)習獨創(chuàng )性的哲學(xué)——從數據中學(xué)習特征(數據的表征)——的立命之本。也就是說(shuō),大數據造就深度學(xué)習。而占大數據總量60%以上的為視頻監控數據,同時(shí)每年仍舊以20%的速度遞增。這樣的速度與規模得益于監控視頻的高清化——1080P已經(jīng)越來(lái)越普及,4K甚至更高的分辨率逐漸在重要場(chǎng)所得到應用——以及人們對營(yíng)造智能安全的社會(huì )居所的迫切需求。
更加讓人們感到充滿(mǎn)希望的是,深度學(xué)習算法不僅僅被動(dòng)地接受數據;相應地,它在吸收原有數據的基礎上,能夠增量式地提升模型的性能,給予數據的選擇過(guò)程一種反饋——形成一種數據選擇機制,能夠分辨哪種類(lèi)型的數據有助于持續提升模型性能,哪種類(lèi)型的數據則是毫無(wú)幫助的——從而最終形成一種良性循環(huán)體系。
未來(lái)的安防產(chǎn)業(yè)
歷史已經(jīng)昭示,科學(xué)技術(shù)的發(fā)展趨勢呈現高度的指數性質(zhì),初始階段為線(xiàn)性或者次線(xiàn)性,而加速階段則是超線(xiàn)性。安防產(chǎn)業(yè)也不例外。
未來(lái)是不可預知的,因此對于未來(lái)安防產(chǎn)業(yè)的預測也是自由的。我認為未來(lái)的安防產(chǎn)業(yè)將呈現兩極化的趨勢:更加偏重于宏觀(guān)的智慧城市大安防化與更加側重于微觀(guān)的民用服務(wù)微安防化。這兩者的發(fā)展都離不開(kāi)高度互聯(lián)的物聯(lián)網(wǎng)技術(shù)以及接近完美的人工智能技術(shù)。前者在很多安防類(lèi)文獻或書(shū)籍中都被頻繁說(shuō)明,在此由于篇幅所限不再贅述。由于所提甚少(即使被提起,也是在其它領(lǐng)域),我個(gè)人更加偏好于對后者的闡述。
安防始于對公共安全的防范與保護,其更加偏向于整體的概念,是以“集合”的安全來(lái)覆蓋“個(gè)體”的安全;而隨著(zhù)人們生活質(zhì)量的持續攀升,他們將不會(huì )僅滿(mǎn)足于能夠保護群體安全的方式,勢必產(chǎn)生對自身特殊化安全的需求。根據聯(lián)合國最新的人口數據預測,2011年以后的30年里,中國人口老齡化將呈現加速發(fā)展態(tài)勢,60歲及以上人口占比將年均增長(cháng)16.55%,2040年60歲及以上人口占比將達28%左右。在這30年里,中國開(kāi)始全面步入老齡化社會(huì )。到2050年,60歲及以上老人占比將超過(guò)30%,社會(huì )進(jìn)入深度老齡化階段。這意味著(zhù)“養老”將會(huì )成為那時(shí)社會(huì )的一個(gè)主要問(wèn)題,而這個(gè)問(wèn)題所帶來(lái)的市場(chǎng)也是無(wú)比廣闊的。能夠解決這一矛盾的重要一環(huán)便是人工智能技術(shù)(目前來(lái)看,深度學(xué)習技術(shù)已經(jīng)讓人們看到了實(shí)現人工智能技術(shù)的可能性)。
未來(lái)的安防產(chǎn)業(yè),靜態(tài)攝像頭將被動(dòng)態(tài)的移動(dòng)智慧安防服務(wù)型機器人所取代。這些機器人能夠通過(guò)嵌入在其身體上的各類(lèi)傳感器搜集周遭環(huán)境中的信息,通過(guò)人工智能算法生成其對周?chē)h(huán)境的時(shí)空模型,從而理解環(huán)境并與環(huán)境發(fā)生交互。以養老產(chǎn)業(yè)來(lái)說(shuō),機器人能夠通過(guò)視覺(jué)傳感器提供的深度信息和RGB圖像信息,結合聲音傳感器提供的語(yǔ)音信息理解被服務(wù)對象的表情、感受,從而推斷出被服務(wù)對象的需求。無(wú)法自理又無(wú)人照料的老人將通過(guò)自然交談控制機器人為他們拿取藥品、生活必需品,為他們購物、烹飪、打掃、處理飲食起居。機器人個(gè)體之間也將進(jìn)行自我驅動(dòng)式的互聯(lián),通過(guò)這種方式“分享”各自的經(jīng)驗,通過(guò)學(xué)習不斷改進(jìn)操作上述各類(lèi)事務(wù)的技巧。所有個(gè)體的數據同時(shí)也能被上傳到數據中心,人們能夠實(shí)時(shí)監測每個(gè)老人的健康狀況,并據此做出及時(shí)正確的響應措施。
著(zhù)名的未來(lái)學(xué)家雷?庫茲韋爾曾經(jīng)預測過(guò)2045年人類(lèi)科技發(fā)展將到達奇點(diǎn)。如果是這樣的話(huà),安防產(chǎn)業(yè)勢必將成為這一新宇宙的璀璨星云。