阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

圍棋柯潔英雄聯盟人工智能狂丸 2017-05-26

今日，圍棋人機大戰2.0新戰況傳來，

人類的最後防線，柯潔大魔王，

再次輸給了谷歌的AlphaGo···

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

不熟悉圍棋的人可能不瞭解，

柯潔是中國圍棋職業九段棋手，

也是目前世界圍棋第一人，

他基本代表了目前人類圍棋的最高水平，

這也意味著，

圍棋界已被AI人工智能徹底擊潰了。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

如果你覺得圍棋離生活還是遠了一些，

那麼阿爾法狗的下一步動作會更加震撼：

戰火即將燃燒到遊戲界。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

其實AlphaGo去年擊敗韓國李世石後，

就有意在遊戲競技領域和人類約一下，

甚至直接@暴雪，

點名要約戰《星際爭霸2》。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

雖然什麼時候打還沒譜，

但這並不妨礙廣大玩家先撕上一波。

很多玩家保持樂觀甚至亢奮，

他們的覺得在星際戰場的贏面很大，

完全可以教AlphaGo做狗。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

自信的來源是因為《星際2》和圍棋

在本質上有所差異。

圍棋AI對決其實可以稱為“完全信息”對戰，

一張棋盤你來我往，回合佈局。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

（圖片來源自網絡）

而《星際2》恰巧相反，

它的規則更接近於現實世界，

是一場需要即時演算、操作的戰略遊戲。

屬於“非完全信息”對戰，

其中最大的區別就是視野問題。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

RTS類遊戲一般都會設有戰爭迷霧，

雙方在經營自己基地的時候

根本不知道對方在幹什麼，

什麼開局、兵種如何搭配、謀劃哪些套路，

說是計算對方戰略，不如說是在猜測。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

（小地圖和戰場都會受到迷霧影響）

而在狂丸看來，

這其實也導致了人工智能另一個弱點出現，

那就是戰術上的博弈心理。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

（放棄正面戰鬥，看誰的建築先被拆光）

雖然《星際2》思維深度不如圍棋，

但勝在規則開放的多，

套路與應變情況更大。

戰術思維幾乎成倒螺旋狀發散出去，

打著打著就有可能出現新戰術，

導致瞬間戰局變化。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

（星際選手干擾對手開礦）

最著名的戰術型星際選手SOS，人稱狗哥···

他的各種奇葩打法多次出奇制勝，

以至於其他玩家紛紛模仿，

這類選手很有可能是AlphaGo的勁敵。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

當然大部分玩家也從圍棋人機大戰中，

意識到了AlphaGo的可怕，

並覺得以上這些優勢都是人類在意淫。

比如知名選手李帝東就認為，

人類最大的劣勢在於手速與機械勞動，

簡單的說，

就是操作上存在巨大差距。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

（用腳本設計的華麗操作）

星際選手是否優秀的評判指標之一

就是每分鐘能執行多少操作，

也就是APM，

這會直接影響到選手的技術水平，

戰術再好，操作不行也是硬傷。

而目前頂尖選手也不超過400，

當然算上有效操作就更少了。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

但AI幾乎可以毫無疲倦的完成高速操作。

這個對比其實可以看下面的實驗。

人類選手與AI分別操作100只小狗

去殺20輛攻城坦克，

看誰能做到最好的效果。

攻城坦克原本就比小狗強大的多，

所以這將是最好的操作差異證明。

而正如我們看到的，

職業選手操縱小狗一波A了過去，

僅消滅了4輛坦克就全軍覆滅：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

AI卻能判斷攻擊方位讓小狗避開攻擊，

這操作，狂丸都驚呆了：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

消滅全部坦克後還有近20只左右的剩餘，

所以這根本不是戰術上能夠填補的差距：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

樂觀和悲觀兩派爭論不斷，

此時一旁吃瓜看熱鬧的暴雪，

終於對這件事發表了意見，

在去年的嘉年華上正式對外宣佈：

人機大戰星際版，約！

並且《星際2》將與谷歌旗下，

研發AlphaGo的公司DeepMind達成合作，

開發《星際2》AI以用於提升選手水平，

“天網”真的要開始打星際了···

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

然後，DeepMind也低調的發出了聲明，

明確了《星際2》AI未來的基本情況。

首先它的視野和人類完全一樣，

而且AI需要直接去理解遊戲畫面內容，

通過畫面去判斷遊戲的一切，

思維過程與人類相似。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

其次為了讓比賽有意義，

確認AI不會有過於逆天的操作，

會對APM加以限制。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

(但它的有效操作還是100%啊···)

在這樣的條件下，

人類是否可以一戰？

《星際2》製作總監Time Morten較為樂觀，

他預言AlphaGo將不會戰勝人類玩家。

但狂丸在這裡要潑冷水了，

證據是，AlphaGo在懟圍棋之前，

其實是個資深玩家啊！

正是49款雅達利遊戲，

讓阿爾法狗成長到了今天的高度。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

（雅達利遊戲：70-80年代知名遊戲系列）

整個過程數年前就開始了：

DeepMind針對曾經流行的雅達利遊戲，

開發出一款人工智能系統，

通過玩遊戲訓練AI的學習能力，

而這個AI，正是AlphaGo的前身。

訓練遊戲包括《小蜜蜂》：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

《走迷宮》：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

這些遊戲雖然看上去很簡單，

但令狂丸真正震驚的，

是AI玩遊戲的方式和我們腦補的出入很大。

每當開始玩一款新遊戲，

DeepMind只提供給AI三樣東西，

畫面、控制權、目標得分，

其它一概不管，讓它自行學習。

以至於AI剛上手遊戲的時候各種血崩，

這是剛開始玩吃豆人時候的實況：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

但這也正是DeepMind的目的，

他們利用的是“深度學習”的技術，

通過模擬神經元網絡來處理信息，

簡單的說就是排除法，

利用無數的“錯誤”經驗

去篩選、引導出最終的“正確”結果。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

也就是不斷的試錯、試錯、再試錯，

最終讓AI在“錯誤”中成長，

自行學習、摸索出遊戲的玩法。

如此練習《吃豆人》23個小時後，

它玩的已經十分輕鬆了：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

這時候不禁要說一句：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

不僅有，而且操作的非常厲害。

DeepMind在2013年左右

向外界展示了AI的學習成果。

當時試驗了49種雅達利遊戲，

其中43種，成績超過了之前的AI，

在一半的遊戲中，成績要比人類好。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

到了決戰李世石的時候，

AI就已經能把更為複雜的動作遊戲

《祖瑪的復仇》玩的666了。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

這是一款人物非常脆弱的遊戲，

高空墜落會摔死、觸碰怪物也會死。

AI剛開始上手的時候，

一出門就摔死：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

而到了後期，

則學會了用各種姿勢解鎖關卡：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

但DeepMind好像還嫌它不夠聰明，

還為其加入了一種“好奇心”機制，

讓AI更多的去嘗試如何獲得更好的分數。

成績喜人，在好奇心的驅使下，

AI從原本只喜歡在2個房間內進行探索，

增加到了後來的15個。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

而在《打磚塊》這款遊戲中，

狂丸對AI的進化有了更深刻的理解。

起初AI在接觸這款遊戲時依然一臉懵逼：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

然而在不斷的試錯後，

它逐漸掌握了遊戲的規則與玩法，

可以穩步通關，

正常來說AI學習到了這種地步也就可以了：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

但到最後，

它自己竟然能夠“悟”出了通關祕訣。

AI後期會專注打通兩邊的牆壁，

然後努力把磚塊彈射到撞牆的背後：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

這種只有經驗豐富的人類玩家

才會刻意去做的操作，

竟然被一款人工智能“想”了出來···

就這樣，AI玩遊戲玩到了2015年，

雅達利遊戲基本已經被它玩遍了···

但谷歌並未滿足，

決定尋找更富有難度的遊戲進行挑戰，

於是才把目標投向了圍棋：

一年之後，AlphaGo出世，

先是完虐歐洲選手，

又是2：1懟了韓國名家李世石，

接著化身Master用快棋橫掃中國，

拿走了一個60連勝···

接下來的故事就是這兩天與柯潔的對戰了。

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

現在讓狂丸對AlphaGo的成長畫個重點：

從0開始，最終玩的比人還好···

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

還記得DeepMind為星際AI限定的規則麼？

所謂的看畫面打遊戲

AI早在五年前雅達利時代就玩過了。

而限制APM也完全不是特殊照顧，

這只不過是人家AI的日常訓練模式。

所以······

你還對星際戰勝AlphaGo抱有希望麼？

狂丸感覺完全打不過啊···

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

人工智能的優勢就是這樣，

手速、操作、記憶、思維方式

其實都不是最可怕的，

最令人害怕的是它的成長速度，

短短1年的時間，

阿爾法狗的成長簡直是飛躍一般，

任何人類都無法達到這樣的速度：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

（AlphaGo的等級評估）

當然我們也不要過度悲觀，

畢竟人工智能目前依然為人所用，

而人類的目前的心眼要遠大於AI···

單挑沒把握，

我們可以換一種更有人情味的玩法嘛。

比如讓AlphaGo在週末

單排幾局《王者榮耀》或者LOL：

你厲害，你能隨機到一樣厲害的隊友嗎？

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

或者來比抽卡啊，

你是厲害，你運氣也好嗎？

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

（圖片素材來自網絡）

再不行來三國殺狼人殺也行，

讓你這隻單純狗見識一下什麼叫人心險惡。

無論如何，星際的人機對戰已經箭在弦上，

而正面肛很有可能打不過。

慶幸的是，人類還有黃旭東的因果律武器：

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

最後請大家珍惜當下，

如果你身邊有人不常打人機，

記得奔走相告一下，

趁現在還能打得贏電腦，

趕緊多虐幾把，

時間不多了！

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

阿爾法狗再敗世界圍棋第一人柯潔，懟完圍棋下個目標竟然是暴雪？

相關推薦