5月23日下午,上午10點半開始的人機大戰(zhàn)2.0,在持續(xù)四個多小時后終于落幕,柯潔0:1敗于AlphaGO。
這一版本的AlphaGo進行了大量的“自我對弈棋局”,這一過程循環(huán)往復(fù),積累了大量的數(shù)據(jù)。
柯潔苦笑著搖了搖頭,不時和坐其對面、代AlphaGO執(zhí)子的黃士杰博士談兩句。隨后,他將眼前的黑棋子全部收攏,裝進棋盒后,起身離開了座位。
這原本是一場五至六個小時的圍棋對決,但由于AlphaGO異于人類的落子速度,時間得以大大縮短。
柯潔賽后坦承,輸給AlphaGO在意料之中,但其意料之外的是,新版本的AlphaGO和去年戰(zhàn)勝韓國頂級棋手李世石的版本,幾乎是兩個完全不同的“人”。
AI再下一城
柯潔的“悲情”在比賽前一天晚上已有顯露,22日晚上,柯潔通過個人微博發(fā)文稱,“AI進步之快遠超我們的想象”,其相信“未來是屬于人工智能”的。
今年年初,柯潔已同AlphaGO扮演的馬甲“Master”有過交手,柯潔均以落敗而告終。“第一盤不知對手是誰,心態(tài)還好,后面因為知道對手不是人,心態(tài)就壞了。當(dāng)時也吃不下飯,后來就住院了。”柯潔在采訪中稱,人機對決給了他更大壓力。
多位業(yè)內(nèi)人士認(rèn)為,柯潔在當(dāng)天的比賽中發(fā)揮出了正常水平。圍棋專業(yè)人士潘達告訴記者,當(dāng)天“柯潔發(fā)揮還可以,布局有備而來,前半盤基本達成先撈實地的預(yù)定目標(biāo)”。但是AlphaGo整盤棋表現(xiàn)得相當(dāng)穩(wěn)定。
最終,柯潔以約四分之一子的劣勢輸給了AlphaGo。盡管AlphaGo是以微弱優(yōu)勢取勝,但柯潔在陷入逆境之后,即知道對于不會犯錯的AlphaGo而言,拿下勝利只是時間的問題。
賽后,柯潔在接受媒體采訪時也表示,此前其總結(jié)AlphaGo的弱點在于,“非常貪戀實地”,因此其制定的策略是“貫穿先撈后起”,但開局后在有些地方反而被阿爾法狗先撈實地,導(dǎo)致一下陷入了被動。柯潔稱,通過第一局比賽,未能找出AlphaGo的破綻。
潘達告訴記者,目前版本的AlphaGo穩(wěn)定性明顯好于對戰(zhàn)李世石的版本,但“具體實力進步了多少,一盤棋不能說明問題”。
柯潔坦承,輸?shù)舯荣愒谄湟饬现小Y惽埃櫺l(wèi)平在內(nèi)的重量級棋手均預(yù)測,柯潔取勝AlphaGo的概率在10%左右,此外大家認(rèn)為,若柯潔能夠贏下一場比賽,則可作為載入圍棋歷史的事件。
兩天之后,柯潔將再度迎戰(zhàn)AlphaGo。柯潔則早已在賽前宣布,同AlphaGO的三場對決,也將是其最后三場人機大戰(zhàn)。
人機對決無懸念?
盡管輸棋在意料之中,但柯潔仍驚異于一年以后AlphaGo發(fā)生的變化。
恰如DeepMind創(chuàng)始人兼CEO哈薩比斯在當(dāng)天所說,AlphaGo不是一個預(yù)編程的圍棋程序,而是采用人類相似的方式進行學(xué)習(xí)。據(jù)悉,AlphaGo所采用的機器學(xué)習(xí),結(jié)合了監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)。首先,AlphaGo搭建了一個策略網(wǎng)絡(luò)(policynetwork),對所有可落子區(qū)域進行概率分布,并且訓(xùn)練出一個價值網(wǎng)絡(luò)(valuenetwork)對自我對弈進行預(yù)測。
早期AlphaGo仍通過學(xué)習(xí)六段以上的圍棋選手下法來進行學(xué)習(xí),但如今版本的AlphaGo可怕之處在于,強大的自我迭代和更新能力。
上述基礎(chǔ)上,這一版本的AlphaGo進行了大量的“自我對弈棋局”,這一過程循環(huán)往復(fù),積累了大量的數(shù)據(jù)。當(dāng)天比賽的解說嘉賓華以剛,在白棋的一個落子后,也忍不出感嘆“AlphaGo對于落子效率的高度重視”。
如果說在AlphaGo、李世石的對決中,外界仍以支持人類和支持機器形成兩大派別,那么在AlphaGo和柯潔的對決中,這幾乎已經(jīng)是一個失去了懸念的答案。“很榮幸和AlphaGo對決,接下來我仍將全力以赴。”柯潔在賽后說。
他在賽后再度表示,當(dāng)天比賽讓他發(fā)現(xiàn)了圍棋下法的更多可能性。數(shù)千年以來,歷史留下了關(guān)于圍棋的無數(shù)玩法和總結(jié),但AlphaGo的出現(xiàn)使得不少固有的觀念被打破。不少棋手在當(dāng)天觀棋時感嘆,AlphaGo的下法突破了個人對于圍棋的理解。
此次圍棋峰會上,還將開展多位棋手對決AlphaGo的“群戰(zhàn)”,以及“棋手+AlphaGo”的混搭對決。施密特將這場峰會定義為“人機合作時代的開啟”。“去年我在韓國就說,不管勝負如何,人性終將獲勝。電腦有自己擅長的事情,人類有自己的專長。”谷歌母公司Alphabet執(zhí)行董事長施密特在當(dāng)天賽前的致辭上稱。
早在AlphaGo對決韓國棋手李世石時,即有不少業(yè)內(nèi)人士向記者評述:谷歌通過AlphaGo完成了一起全球性的AI普及,并且樹立了谷歌之于AI在普羅大眾心目中的地位。而通過AlphaGo和柯潔的對決,谷歌再度深化了這一過程。
更多資訊請關(guān)注工業(yè)機器人頻道