2016年3月9日-15日,谷歌旗下公司DeepMind開發(fā)的人工智能AlphaGo挑戰(zhàn)世界排名第二、韓國棋手李世石九段,這場在首爾四季酒店舉行的五番棋大賽被視作有著重大歷史意義的世紀(jì)大戰(zhàn),谷歌設(shè)置了100萬美元的基礎(chǔ)獎(jiǎng)金。目前五番棋勝負(fù)已分,AlphaGo連取三盤后,李世石在第四盤扳回了一局。
此前,AlphaGo于去年10月與歐洲圍棋冠軍樊麾二段進(jìn)行了一場秘密賽事,AlphaGo以5:0獲勝,令棋界嘩然。計(jì)算機(jī)對(duì)棋類運(yùn)動(dòng)的挑戰(zhàn)可以追溯到1949年第一款國際跳棋軟件,而在1997年超級(jí)計(jì)算機(jī)深藍(lán)擊敗象棋大師卡斯帕羅夫的比賽上,更多人了解到人工智能在棋類運(yùn)動(dòng)上的超強(qiáng)能力。但是,由于圍棋分支系數(shù)大,巨大的計(jì)算量連計(jì)算機(jī)也難以企及,因此一直以來被視為人類智能的最后堡壘。
《自然》雜志在評(píng)論樊麾的失利時(shí)稱:“面對(duì)谷歌圍棋AI,人類最后的智力驕傲崩塌了?”因此,李世石與AlphaGo的這場比賽被看作人類與人工智能一決勝負(fù)的大戰(zhàn)而舉世矚目。作為圍棋的起源國,圍棋在中國有著超過2500年的歷史,國內(nèi)社會(huì)各界對(duì)這場比賽尤為關(guān)注,對(duì)于比賽本身和背后折射的人工智能問題的討論在過去一周內(nèi)層出不窮,下文將略作梳理。
李世石為什么輸,AlphaGo憑什么贏?
正在與AlphaGo對(duì)弈的李世石
開賽前,李世石對(duì)獲勝十分有信心,認(rèn)為“到目前為止還是人類比人工智能強(qiáng)”。中國國家圍棋隊(duì)總教練俞斌、圍棋國手柯潔、創(chuàng)新工場董事長李開復(fù)等人都認(rèn)為李世石將會(huì)贏得比賽,盡管也有一些相反的聲音,但隨著比賽的展開幾乎所有人都被AlphaGo的能力所震撼。
無論AlphaGo和李世石的棋藝是否對(duì)等,人機(jī)博弈都不是公平的比賽。樊麾接受科技媒體《機(jī)器之心》采訪時(shí)回顧了他與AlphaGo的那場對(duì)戰(zhàn),他認(rèn)為最大的問題在于人都會(huì)犯錯(cuò),而機(jī)器犯錯(cuò)的概率遠(yuǎn)低于人,這會(huì)形成負(fù)擔(dān),“我的形勢不管好還是不好,我都擔(dān)心自己犯錯(cuò)”,而人工智能沒有人類棋手的心理感覺,因此雙方的地位是不對(duì)等的。
這次人機(jī)大戰(zhàn)前夕,象棋大師卡斯帕羅夫在《新科學(xué)家》撰文評(píng)論稱,“圍棋,你的時(shí)間不多了”。他在文中回顧了與超級(jí)計(jì)算機(jī)深藍(lán)交手時(shí)的情形,分析可能決定比賽結(jié)果的因素時(shí)同樣強(qiáng)調(diào)了心理因素,指出心智運(yùn)動(dòng)需要高度集中精神,而面對(duì)早期機(jī)器的盲點(diǎn)時(shí)棋手可能會(huì)受到干擾。他認(rèn)為,人和機(jī)器的關(guān)鍵差異就在于機(jī)器有著保持前后一致的優(yōu)勢,計(jì)算機(jī)不會(huì)犯下大錯(cuò),也不會(huì)苦于驕傲、焦慮和精疲力盡。
另一方面,AlphaGo的表現(xiàn)令很多職業(yè)棋手嘆服,1997年出生的柯潔曾8次擊敗李世石,他賽前對(duì)人工智能不屑一顧的,但在第三場比賽結(jié)束后也坦言電腦“強(qiáng)得可怕”,“同樣的條件下我輸?shù)目赡苄苑浅4蟆薄?/p>
DeepMind創(chuàng)始人Demis Hassabis在接受英國《衛(wèi)報(bào)》采訪時(shí)曾表示,“圍棋是一個(gè)終極目標(biāo):它是一個(gè)游戲的巔峰,有著最豐富的智力深度。它如此迷人與美麗,令我們感到興奮不僅在于我們掌握了這個(gè)游戲,還在于我們還用漂亮的算法完成了它?!?
AlphaGo的漂亮算法究竟是什么樣的?卡耐基梅隆大學(xué)機(jī)器人系博士、Facebook人工智能組研究員、Facebook人工智能圍棋程序Darkforest負(fù)責(zé)人田淵棟在知乎分享了《自然》雜志上發(fā)表的關(guān)于AlphaGo的文章中對(duì)其系統(tǒng)的介紹。AlphaGo的系統(tǒng)主要由以下四個(gè)部分組成:
1.走棋網(wǎng)絡(luò)(Policy Network),給定當(dāng)前局面,預(yù)測/采樣下一步的走棋;
2.快速走子(Fast rollout),目標(biāo)和1一樣,但在適當(dāng)犧牲走棋質(zhì)量的條件下,速度要比1快1000倍;
3.估值網(wǎng)絡(luò)(Value Network),給定當(dāng)前局面,估計(jì)是白勝還是黑勝;
4.蒙特卡羅樹搜索(Monte Carlo Tree Search,MCTS),把以上這三個(gè)部分連起來,形成一個(gè)完整的系統(tǒng)。
依賴上述系統(tǒng),憑借學(xué)習(xí)3000萬步人類棋譜和晝夜不停息的自我對(duì)弈,AlphaGo獲得了在比賽中展現(xiàn)出的高超棋藝。
李世石接連失利后,有人質(zhì)疑他是不是代表人類出戰(zhàn)的最佳人選,職業(yè)圍棋棋手李喆六段的《這兩盤棋,沒人會(huì)比李世石做得更好!》一文激烈反駁了這種論調(diào)。李喆認(rèn)為AlphaGo的目標(biāo)只有贏,不求最優(yōu),其強(qiáng)勢表現(xiàn)是李世石的強(qiáng)大逼出來的。李喆稱,“我不知道AlphaGo的極限在哪里,看到無法用言語來表達(dá)的震撼和美,新時(shí)代真的來了?!崩钍朗诘谌龍龈尕?fù)后接受采訪時(shí)表示,“今天失敗的是李世石,而不是人類。”不過,也有人認(rèn)為李世石盡管輸?shù)袅吮荣悾⒎禽斀o了機(jī)器,而是輸給了機(jī)器背后人類的智慧結(jié)晶,這仍然是人類的勝利。
誰的未來:圍棋的?人工智能的?還是人類的?
DeepMind創(chuàng)始人Demis Hassabis
這場世紀(jì)大戰(zhàn)被視為一個(gè)重大的改變未來的轉(zhuǎn)折點(diǎn)。在圍棋領(lǐng)域,AlphaGo恐怕真的將會(huì)改寫歷史。在封閉系統(tǒng)博弈中,人類早晚會(huì)被人工智能遠(yuǎn)遠(yuǎn)甩在后頭。圍棋運(yùn)動(dòng)會(huì)就此衰落嗎?在知識(shí)分子公號(hào)刊發(fā)的“人工智能贏了棋,人類贏了未來”一文中,作者沈龐并不這樣認(rèn)為。他指出當(dāng)1997年深藍(lán)多次擊敗頂級(jí)象棋棋手之后,人們都以為這個(gè)游戲終結(jié)了,但事實(shí)并非如此。在那場比賽之后,卡斯帕羅夫率先提出了“人加機(jī)器”(Man-plus-Machine)的概念,即在比賽中使用人工智能增強(qiáng)國際象棋手的水平,而不是讓雙方相互對(duì)抗。這種比賽在之后被稱為自由式國際象棋賽。選手們可以獨(dú)自參賽,或者帶一臺(tái)人工智能照著它的路子下棋,也可以偶爾否決人工智能的選擇,在2014年的自由式國際象棋對(duì)抗錦標(biāo)賽上,純粹使用人工智能的選手贏得了42場比賽,而人機(jī)一起參加的選手贏得了53場。人工智能并未削弱國際象棋的魅力,而是讓人類成為了更好的棋手,這或許也會(huì)成為圍棋的未來。
那么AlphaGo的勝利是否意味著人工智能將進(jìn)入一個(gè)新階段?復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授危輝認(rèn)為對(duì)此應(yīng)該保持審慎樂觀,因?yàn)槿斯ぶ悄艿暮诵目茖W(xué)難題,從50年多前人工智能的誕生到現(xiàn)在,還一個(gè)都沒解決。他在日前的講座中指出,人工智能能夠解答的問題必須符合兩個(gè)條件:能夠精確定義以及范圍有限。但現(xiàn)實(shí)生活中的大量問題既無法被精確定義也無一定范圍。因此,AlphaGo并未帶來顛覆性的改變。
不過,AlphaGo或許預(yù)示著改變的方向。正如卡斯帕羅夫指出的那樣,完美計(jì)算一直以來都是計(jì)算機(jī)的長項(xiàng),而人類大腦擅長的是通用(generalities)、長期計(jì)劃和將通用主題運(yùn)用于新情況,這正是DeepMind努力的方向。創(chuàng)始人Hassabis正在把他從人腦中得到的啟發(fā)用于構(gòu)建首個(gè)“通用學(xué)習(xí)機(jī)器”:一套能像生物系統(tǒng)一樣學(xué)習(xí)的靈活、自適應(yīng)的算法,僅使用原始數(shù)據(jù)就能從頭開始掌握任何任務(wù),也就是通用人工智能(artificial general intelligence ,簡稱AGI)。他認(rèn)為未來超級(jí)智能機(jī)器將與人類專家合作解決一切問題,“癌癥、氣候變遷、能源、基因組學(xué)、宏觀經(jīng)濟(jì)學(xué)、金融系統(tǒng)、物理學(xué)等,太多我們想掌握的系統(tǒng)知識(shí)正變得極其復(fù)雜?!蓖ㄓ萌斯ぶ悄芩季S的方式能從巨大的人類無法掌握的信息量中轉(zhuǎn)換出可使用的東西,“我們所研究的東西可能是針對(duì)任何問題的元解決方法(meta-solution)?!?/p>
另一方面,這場比賽的結(jié)果再度激起了人們對(duì)于人工智能帶來的威脅的擔(dān)憂,人類與機(jī)器的對(duì)抗很容易讓人聯(lián)想起科幻小說和電影中機(jī)器人反叛的駭人場景。去年7月,物理學(xué)家霍金、哲學(xué)家喬姆斯基、技術(shù)專家伊隆·馬斯克和數(shù)千名知識(shí)分子在一封呼吁取締“機(jī)器人殺手”的研發(fā)和應(yīng)用的聯(lián)名公開信中警告稱人工智能方面的軍備競賽可能是人類的災(zāi)難。霍金近期總結(jié)道:“在創(chuàng)造人工智能方面取得的成功將會(huì)是人類歷史上最重要的事情。不幸的是,這也可能是最后一件?!?/p>
但Hassabis認(rèn)為至少在目前這種擔(dān)憂是過慮了,他認(rèn)為現(xiàn)在距離能夠達(dá)到人類級(jí)別的通用智能還差好幾十年,并且DeepMind也在積極采取措施來避免通用人工智能的潛在危險(xiǎn),包括發(fā)布它的代碼,在與谷歌的收購協(xié)議中附帶“禁止將該技術(shù)應(yīng)用于軍事或情報(bào)用途”的條款、在公司內(nèi)部召集倫理委員會(huì)和咨詢董事會(huì)等。不過他也坦言,“技術(shù)本身是中立的,但它是一個(gè)學(xué)習(xí)系統(tǒng),所以不可避免的,它們會(huì)承擔(dān)一些價(jià)值體系的印記和設(shè)計(jì)者的文化,所以我們需要非常小心翼翼地思考這些價(jià)值觀?!?/p>
Hassabis還在《衛(wèi)報(bào)》的采訪中提到,他不久前跟霍金就人工智能問題進(jìn)行了長達(dá)4個(gè)多小時(shí)的談話,他認(rèn)為那次會(huì)面可能一定程度上改變了霍金對(duì)人工智能的法,因?yàn)閺哪侵蠡艚鹁筒辉诿襟w面前提及“人工智能煽動(dòng)性言論”了。
更多精彩:《凱風(fēng)智見:兩大“影帝”飚戲成就清代滿蒙聯(lián)盟》