
還曾記得去年阿爾法狗與圍棋世界冠軍李世石的對弈嗎?阿爾法狗的勝利引起了公眾對于人工智能的高度關(guān)注。在今年《自然》發(fā)表的一篇論文《Mastering the game of Go without human knowledge》再次掀起大家對人工智能的關(guān)注。
不需要任何人類(lèi)的經(jīng)驗
據悉,這一款新版的AlphaGo計算機程序能夠從零學(xué)起,在不需要任何人類(lèi)輸入的條件下,迅速自學(xué)圍棋。這款新程序名叫AlphaGoZero(阿爾法元),以100比0的戰績(jì)打敗了它的前任AlphaGo(在2016年3月的錦標賽中,其前任打敗了圍棋世界冠軍李世石)。
這篇論文中所介紹的AlphaGo是全新的,它不是戰勝柯潔的那個(gè)最強的Master,但卻是孿生兄弟,它的名字叫AlphaGoZero。與以前的AlphaGo相比,它從零開(kāi)始學(xué)習,不需要任何人類(lèi)的經(jīng)驗。
據悉,AlphaGoZero最初是隨機落子,但通過(guò)反復與自己對弈,它的水平迅速提高。在進(jìn)行實(shí)驗3天后,面對2017年5月時(shí)對戰全球最強棋手柯潔九段取得3連勝的AlphaGo,取得了100戰全勝。也就是說(shuō),AlphaGoZero只需要在4個(gè)TPU上,花3天時(shí)間,自己左右互搏490萬(wàn)棋局。而阿爾法狗,需要在48個(gè)TPU上,花幾個(gè)月的時(shí)間,學(xué)習3000萬(wàn)棋局,才打敗人類(lèi)。
是一個(gè)跨時(shí)代的進(jìn)步
怎么看待AlphaGoZero100-0擊敗AlphaGo這件事?這個(gè)趨勢我們都能看到,但是沒(méi)想到這一天來(lái)得這么早。這個(gè)事情最大的突破,就是無(wú)監督的深度學(xué)習。無(wú)監督指的就是訓練數據沒(méi)有類(lèi)別標簽,就是我們并不知道我們訓練的數據它到底是什么。比如說(shuō),紅色的、圓形的、甜味的,我們并不知道它是蘋(píng)果,但是我們要學(xué)出來(lái)它是一個(gè)蘋(píng)果。之前阿爾法狗觀(guān)察了上萬(wàn)小時(shí)的視頻,從中自主學(xué)習到了一只貓,它用了數月的時(shí)間并且消耗了大量資源,而今天阿爾法元在一個(gè)短時(shí)間內的學(xué)習就擊敗了阿爾法狗,這是一個(gè)非常大的可以說(shuō)是一個(gè)跨時(shí)代的進(jìn)步。
人工智能的第一個(gè)方向,就是無(wú)監督的學(xué)習,就是不需要標簽,不需要人工的經(jīng)驗知識,不需要人為干預的一個(gè)學(xué)習過(guò)程,就像我們小時(shí)候學(xué)到一些基礎的數學(xué)知識之后,可以自主地去學(xué)習、推理、思考,很像我們人類(lèi)學(xué)習的過(guò)程。在這樣一種學(xué)習過(guò)程中,它丟掉了人為制約。大家可以看到國外的評論,它在開(kāi)局和收官的過(guò)程中,跟我們人類(lèi)的思考方式或者是下棋的方式接近;但是在盤(pán)中的時(shí)候,是一種完全不一樣的思路。而之前的阿爾法狗,由于有人為的、棋譜的限制,它并沒(méi)有跳出這樣的局限和約束。因此,阿爾法元的這種突破是對人類(lèi)固有思維模式的一個(gè)突破。
“人類(lèi)多余”?
AlphaGo擊敗的全球最強圍棋選手柯潔在社交平臺上表示:“一個(gè)純凈、純粹自我學(xué)習的AlphaGo是最強的,對于A(yíng)lphaGo的自我進(jìn)步來(lái)講,人類(lèi)太多余了?!?/span>
如果說(shuō)人類(lèi)完全多余,短時(shí)間內至少我們是看不到的。但是在不遠的將來(lái),有很大一部分從事簡(jiǎn)單、重復、不需要人類(lèi)付出創(chuàng )意的、思考的、抽象的這樣一些工作就會(huì )被完全替代。但是需要人類(lèi)思考的、抽象的、需要我們去創(chuàng )造的一些工作,比如說(shuō)藝術(shù)類(lèi),比如說(shuō)去構建這個(gè)人工智能本身等等這些工作,會(huì )隨著(zhù)人工智能的普及變得越來(lái)越重要、越來(lái)越吃香。
長(cháng)遠來(lái)看,從最本質(zhì)上講,人工智能和人類(lèi)智能或許沒(méi)什么不同,只是階段問(wèn)題,這個(gè)話(huà)題比較遠,暫且不論了。在幾十年的周期內,人工智能應該仍會(huì )在人類(lèi)設定的目標范圍內來(lái)完成特定任務(wù),但也存在失控的風(fēng)險。
原來(lái)的AlphaGo雖然比人快,但不可能比人能創(chuàng )造知識,現在發(fā)現它也有了。所以說(shuō),AlphaGoZero的出現,為強人工智能的出現奠定了基礎。過(guò)去我們說(shuō),在專(zhuān)一的問(wèn)題上人工智能有突破,通用問(wèn)題上它差得遠,而阿爾法元基本上已經(jīng)半通用了,它沒(méi)有用上人的知識,從0開(kāi)始學(xué)起的。
結語(yǔ):新阿爾法狗的出現是一直質(zhì)的跨越,對一切都產(chǎn)生了巨大的影響。未來(lái)電影中的人工智能將不再是幻想。