AlphaGo為何缺席計算機圍棋賽 或已是不同物種

圍棋 李世石 人工智能 日本 棋牌新聞 2017-04-04

AlphaGo為何缺席計算機圍棋賽 或已是不同物種

人機大戰第一季的盛況還歷歷在目

3月19日,UEC杯世界圍棋計算機大賽在日本結束,中國的圍棋程序絕藝擊敗日本的DeepZenGo,取得冠軍。這次比賽其實也邀請了 AlphaGo,但被他們拒絕了。參賽的圍棋程序大都是學習2016年DeepMind的那篇論文,而現在的AlphaGo又再度進化升級,成為更為強大 的“Master”了。與參賽的圍棋程序相比,現在的AlphaGo可能已經是不同“物種”了,自然沒必要參賽。

賽制並不完全“公平”

以往的UEC杯世界圍棋計算機大賽並不廣為人知,今年之所以備受關注,主要是兩個參賽程序的,日本的DeepZenGo和中國的絕藝。前者馬上要和羋昱廷、樸廷桓、井山裕太進行世界圍棋大賽,後者則一直在對弈網站上測試,積累了相當的人氣。

比賽的用時是每方30分鐘,平均下來20秒左右就要落子,參賽程序的計算能力顯然對比賽成績有著很大的影響。比賽並不是所有的程序都使用統一的 硬件配置,而是各自通過手裡的筆記本電腦,把比賽數據發送到各自的服務器計算平臺上完成。這也是為什麼18日現場斷網之後,比賽不得不暫停的原因。

AlphaGo為何缺席計算機圍棋賽 或已是不同物種

因斷網而暫停的比賽

應用了深度學習技術的圍棋程序,對局時策略網絡和價值網絡同時工作,還要配備強大GPU等計算資源。雖然計算資源堆積到一定程度之後能起到的提升效果有限,但在UEC的快棋賽制裡,計算資源上的差別還是很有影響的。

DeepZenGo是由日本最大的視頻網站作為技術支持,而絕藝的背景是騰訊,兩者在計算資源上的優勢是顯而易見的。據國內一位研究圍棋AI的同學介紹,絕藝能夠調用的計算資源大到無法想象,畢竟中國是目前超算能力最強的國家。

所以,絕藝和DeepZenGo一路過關斬將,沒有遭遇什麼抵抗就打進了決賽。兩者之間的對決才是真正意義上的戰鬥。

DeepZenGo的“離奇”失誤

(這段內容是絕藝和ZEN的決賽棋譜分析,如果你不會下棋,可以略過,大致意思是,ZEN在局面不錯的情況下,因為計算上的失誤被絕藝逆轉勝了。)

決賽DeepZenGo執黑先行,右下角黑棋的死活是這盤棋優劣的關鍵。但絕藝和DeepZenGo後來都沒有在右下角走棋,看來是對此有一致的判斷,黑棋是活的(如果某方認為黑角會死,肯定早就脫先搶著走了)。右下角的變化比較複雜,這裡就先不做討論了。

AlphaGo為何缺席計算機圍棋賽 或已是不同物種

圖1

圖1:棋局進行到中盤階段,黑棋圍棋上邊大空,判斷下形勢,黑棋要稍占上風。

AlphaGo為何缺席計算機圍棋賽 或已是不同物種

圖2

圖2:“絕藝”在黑棋上邊空裡行棋,DeepZenGo的應對很成問題,白1斷的時候,黑2虎效果比實戰要好不少,更關鍵的時候,白3頂的時候,黑棋明明可有在4位扳,這樣沒什麼棋。

AlphaGo為何缺席計算機圍棋賽 或已是不同物種

圖3

圖3:然而實戰DeepZenGo卻配合絕藝,在黑棋空裡出棋了……絕藝逆轉獲勝!

這盤棋DeepZenGo和絕藝到底使用了多大的計算資源我們不得而知,但很明顯,這樣的計算能力,DeepZenGo想在後天與人類世界冠軍的對抗中佔到上風,幾乎是不可能的。現在已經不是一年前了,人類棋手們已經對圍棋人工智能不再陌生。

與現在的AlphaGo可能不是同一“物種”

絕藝、DeepZenGo,還有此前新浪棋牌報道過的 “麗拉”,都是受到2016年DeepMind在《自然》雜誌上發表的關於AlphaGo論文啟發,進而發展成現在的圍棋人工智能的。從某種意義上講,它 們都是去年那個AlphaGo的跟隨者。從這次世界計算機大賽的棋譜體現出的水平來看,他們距離去年擊敗李世石的那一版AlphaGo似乎還有一定的差 距。

AlphaGo為何缺席計算機圍棋賽 或已是不同物種

改變了圍棋界的論文

這個差距一方面來自於,當時AlphaGo與李世石下的是慢棋,計算時間比這次要長;另外一方面可能是谷歌在深度學習技術應用上的優勢所致。

不過尤其要注意的是,現在這些圍棋程序對比的對象還只是2016年與李世石大戰的AlphaGo,現在的AlphaGo(或者說MAster)究竟進化到什麼程度我們並不知道。

DeepMind在公佈科學成果上是很謹慎的。去年人機大戰之前他們說AlphaGo通過自我對弈,取得了巨大的進步,所以才有信心挑戰李世石。當時不少人對此嗤之以鼻,結果被4比1的比分打了臉。

AlphaGo為何缺席計算機圍棋賽 或已是不同物種

樊麾微博截圖

2016年11月的時候,AlphaGo團隊的發言人樊麾通過微博宣佈:“我們很高興向大家宣佈,AlphaGo的棋力在已過半年有巨大的進 步,將在2017年初復出下棋。我們團隊會在近期內公佈更多訊息。”這個“巨大進步”耐人尋味,AlphaGo的研究又取得了怎樣的進展呢?之後 Master在網上的60盤快棋測試,讓我們驚鴻一瞥。計算時間極短、完美的局面掌控、精準的局部戰鬥,這些細節都告訴著我們,現在的AlphaGo或者 說Master,已經和一年前的它完全不同了,甚至可能已經進化到了一個更為先進的階段。

上一次AlphaGo公佈研究結果,改變了整個圍棋人工智能領域,為圍棋界打開了一道通往未來的大門。不久前,哈薩比斯說:“2017年將是AlphaGo與棋界興奮的一年”,這次他們會帶來什麼樣的驚喜呢?

AlphaGo為何缺席計算機圍棋賽 或已是不同物種

哈薩比斯和李世石

(周遊)

相關推薦

推薦中...