經(jīng)過(guò)3天的訓練后,這套系統已經(jīng)可以擊敗AlphaGoLee,也就是去年擊敗韓國頂尖棋手李世石的那套系統,且比分高達100比0。經(jīng)過(guò)40天訓練后,它總計運行了大約2900萬(wàn)次自我對弈,得以擊敗AlphaGoMaster(今年早些時(shí)候擊敗世界冠軍柯潔的系統),比分為89比11。DeepMind團隊將關(guān)于A(yíng)lphaGoZero的相關(guān)研究以論文的形式,發(fā)表在了《自然》雜志上。
值得注意的是,雖然AlphaGoZero在幾周的訓練期間學(xué)會(huì )了一些關(guān)鍵概念,但該系統學(xué)習的方法與人類(lèi)有所不同。自我學(xué)習能力的出現,對于人工智能和機器學(xué)習來(lái)說(shuō),是一個(gè)新的突破?!斑^(guò)去人們普遍認為機器學(xué)習是基于海量的大數據,但是從AlphaGoZero身上,我們發(fā)現算法比數據更重要?!盇lphaGo項目的主要負責人戴維?席爾瓦說(shuō)道。
這一消息的發(fā)布引發(fā)了網(wǎng)友熱烈的討論,網(wǎng)友紛紛表示,連阿法狗都在努力,你有什么理由逃避。甚至,就連柯潔都回應稱(chēng):一個(gè)純凈、純粹自我學(xué)習的alphago是最強的...對于alphago的自我進(jìn)步來(lái)講...人類(lèi)太多余了。
阿爾法狗再進(jìn)化有哪些積極意義?
我們可以看到AlphaGoZero與它的前輩們相比,技術(shù)發(fā)展有了質(zhì)的飛躍。AlphaGo此前的版本的學(xué)習,結合了數百萬(wàn)人類(lèi)圍棋專(zhuān)家的棋譜,以及強化學(xué)習的監督學(xué)習進(jìn)行了自我訓練。AlphaGoZero的能力則在這個(gè)基礎上有了質(zhì)的提升,最大的區別是,它不再需要人類(lèi)數據,它一開(kāi)始就沒(méi)有接觸過(guò)人類(lèi)棋譜,研發(fā)團隊只是讓它自由隨意地在棋盤(pán)上下棋,然后進(jìn)行自我博弈。值得一提的是,AlphaGoZero還非?!暗吞辑h(huán)?!?,由于算法的提升和數據的減少,使得AlphaGoZero只用到了一臺機器和4個(gè)TPU,與它前輩AlphaGo用到的48個(gè)TPU相比,極大地節省了資源,這是一個(gè)非常偉大的進(jìn)步,是AlphaGoZero帶來(lái)的第一個(gè)積極意義。
但這僅僅只是很小的一點(diǎn),AlphaGoZero的誕生還有更大的意義。DeepMind團隊希望通過(guò)培養自主學(xué)習的能力,來(lái)解決更多其他領(lǐng)域目前無(wú)法解決的棘手問(wèn)題。
在這次《自然》雜志上發(fā)表的論文中,戴維?席爾瓦表示:在過(guò)去,機器學(xué)習未能得到廣泛應用,主要原因之一就在于很多人類(lèi)無(wú)法解決的領(lǐng)域中,也缺少大量的數據樣本來(lái)讓機器進(jìn)行學(xué)習,例如醫療圖像處理等。AlphaGoZero能夠擺脫人類(lèi)的依賴(lài),不需要人類(lèi)給出數據和樣本,這為更廣泛的行業(yè)應用提供了新的可能性。
“AlphaGoZero是我們最強版本,它提升了很多。Zero提高了計算效率,并且沒(méi)有使用到任何人類(lèi)圍棋數據,”DeepMind聯(lián)合創(chuàng )始人兼CEO戴密斯?哈薩比斯說(shuō),“最終,我們想要利用它的算法突破,去幫助解決各種緊迫的現實(shí)世界問(wèn)題,如蛋白質(zhì)折疊或設計新材料?!?/span>
“人工智能威脅論”是時(shí)候提上日程了
但是,AlphaGoZero誕生的意義,遠不止于此,也遠不只是有美好的一面。有很多人對于A(yíng)lphaGoZero的這種進(jìn)化表示了深切的擔憂(yōu)。
果殼網(wǎng)編輯、美國加州伯克利大學(xué)博士生@Ent_evo就是這其中之一,他專(zhuān)門(mén)針對這條新聞發(fā)表了一篇博文,在文中評論道:這對人類(lèi)驕傲感是個(gè)很大的打擊。當年AlphaGo好歹還學(xué)習了大量的人類(lèi)經(jīng)驗,但是AlphaGoZero根本就不需要人類(lèi)圍棋棋手積攢了這么多年的歷史,人類(lèi)經(jīng)驗是好是壞,對AI而言完全無(wú)關(guān),這是所有AI末世中最令人恐懼的一個(gè)場(chǎng)景。
人類(lèi)被人工智能打敗并不會(huì )否認掉我們存在的意義,但如果那個(gè)第一根本不需要你,根本不在乎你,你做的任何事情都對它的追求沒(méi)有影響。如果AI拿走了人類(lèi)和現實(shí)的關(guān)聯(lián),讓人類(lèi)發(fā)現自己甚至已經(jīng)無(wú)法影響自己的歷史進(jìn)程了,這一切會(huì )令人恐慌。隨著(zhù)AI證明自己在越來(lái)越多的領(lǐng)域不再需要人,一定會(huì )有人反過(guò)來(lái)無(wú)法接受自己不再被需要的事實(shí)。當一切創(chuàng )造都被接管的時(shí)候,大概剩下的也只有毀滅了。
這不禁讓人想起著(zhù)名物理學(xué)家斯蒂芬?霍金在2017全球移動(dòng)互聯(lián)網(wǎng)大會(huì )(GMIC)發(fā)表的演講。他表示,人工智能的崛起可能是人類(lèi)文明的終結。
霍金在會(huì )上表示,人工智能的威脅分短期和長(cháng)期兩種。短期威脅包括自動(dòng)駕駛、智能性自主武器,以及隱私問(wèn)題;長(cháng)期擔憂(yōu)主要是人工智能系統失控帶來(lái)的風(fēng)險,如人工智能系統可能不聽(tīng)人類(lèi)指揮。
這已經(jīng)不是霍金第一次提出“人工智能威脅論”。在今年3月,霍金向英國《獨立報》表示,人類(lèi)必須建立有效機制盡早識別威脅所在,防止人工智能對人類(lèi)帶來(lái)的威脅進(jìn)一步上升。
總結
人工智能威脅論的提出由來(lái)已久,但是小編個(gè)人一直都不以為然。直到AlphaGoZero的出現,正如@Ent_evo所說(shuō),當人工智能不再需要人類(lèi),人類(lèi)的一切對于人工智能來(lái)說(shuō)都無(wú)關(guān)緊要的時(shí)候,那么人類(lèi)一定會(huì )被逐漸邊緣化,進(jìn)而走向毀滅。不過(guò),霍金先生也表示,雖然他對人工智能有各種擔憂(yōu),但他對人工智能技術(shù)本身還是抱有樂(lè )觀(guān)的態(tài)度。就像上文提到的那樣,可以預見(jiàn)的是,在不久的將來(lái),人工智能能夠幫助人類(lèi)完成很多人類(lèi)無(wú)法企及的任務(wù)。人類(lèi)到底是會(huì )被人工智能無(wú)限地幫助,還是無(wú)限地被邊緣化,是一件不確定的事,因此,我們也不應該因噎廢食,新的技術(shù)我們還是應該張開(kāi)懷抱去迎接。