☰

放棄吧！openAI玩DOTA2的表現比我們"更像人類"

本站愛玩百萬稿費活動投稿，作者尹紫電，未經授權請勿轉載

兩年前Alpha Go以4：1大敗李世石一戰，除了炒熱了“人工智能”這個概念之外，順便也讓打《星際爭霸》和《星際爭霸2》的AI們蹭了一次熱度。《星際爭霸2》微操AI“悍馬2000”機槍無傷甩毒爆、小狗踏破坦克陣、運輸機無限坐電梯的視頻又被翻了出來，在玩家間被大量轉發。而歷史悠久卻鮮爲人知的《星際爭霸1》AI大賽也開始爲玩家們所知曉。

不過彼時玩家的心態反而比較淡定，雖然AI玩家能做出人類玩家一輩子也沒法完成的操作，但沒有人認爲AI能在《星際》上戰勝人類。前《星際1》選手“總司令”宋炳具在韓國舉辦的“人類 vs AI”大賽中摧枯拉朽般4：0零封了AI，過程簡單的就像吃飯喝水，每次都是一拳打死AI。坊間的主流觀點是圍棋的規則簡單而明確，變量較少，沒有未知因素。但電子遊戲中的各種參數和變量遠超圍棋，光是戰爭迷霧的設定就夠AI頭疼的了。所以雖然AI能在圍棋上戰勝人類，但在遊戲這個項目上，AI想要有所突破目前來看幾乎不可能。

AI操作散槍兵

“悍馬2000”雖然能做出各種驚豔操作，但那是讀取了內存數據的結果，本質上等同於作弊。而已經有十幾年歷史的《星際爭霸1》的AI選手們在人類玩家面前表現得依舊像個弱智，也許能唬住初次面對AI的人類玩家，但很快就會“黔驢技窮”，被人類玩家找到漏洞吊打。2012年那屆《星際爭霸1》AI大賽上“AI VS 人類”的環節，AI玩家就因爲迅速被人類玩家發現“如果附近有敵人AI的農民就不會採礦”這個漏洞後被玩壞。

於是乎，“人類尊嚴的最後一塊遮羞布”這個接力棒順理成章的從圍棋交到了電子競技手中，不願接受現實的人們也可以安慰自己“還沒輸，AI打遊戲還打不過我們”。不久後又傳來消息，開發Alpha GO的公司Deep Mind轉攻《星際爭霸2》項目受挫，決定放棄項目出坑。這意味着連都Deep Mind認爲目前讓AI打《星際爭霸2》是不可能的，看來說AI戰勝人類還言之過早，真是令人歡欣鼓舞。

電子競技代替圍棋在當時成爲了“人類尊嚴之盾”，玩家們很是受寵若驚可是…

然後，就是OpenAI的SOLO專精AI在TI7上碾壓Dendi的表演——在這個振奮人心的當口給我們澆了一杯冷水。要知道，讓AI打《DOTA》可比打《星際2》難得多得多。《星際爭霸2》的遊戲形態和圍棋還比較接近，更多是宏觀決策。而《DOTA》則完全是另一碼事了，金錢、兵線、補刀、仇恨、技能等每一個機制都夠開發者頭疼的，複雜程度相比於《星際爭霸2》擴大了不止一個數量級。

就拿金錢來說，現有的MOBA遊戲中自帶的對戰AI都是定期“領工資”，永遠遵循着一套出裝順序，而一個正常的人類玩家則會選擇針對性的出裝。在兩年前的這個時候，在Deep Mind在《星際爭霸2》項目上棄療的時候，電子競技對於AI而言還是一堵不可逾越的城牆。但OpenAI所開發的SOLO AI卻橫空出世，在這堵牆上鑿了一個縫。

《星際爭霸2》等遊戲中自帶對戰電腦，與其說是AI，不如說是智障

它不僅在TI7現場戰勝了Dendi，根據過後放出的視頻，它還戰勝了一衆現役選手。但這仍然是一場有着諸多限制條件的勝利，對戰限定在中路，沒有神符和瓶子，英雄限定爲影魔，種種限定條件無疑是將遊戲中的變量儘可能的減少。所以覺得輸給AI很不服氣的玩家們都會這樣安慰自己“只不過是中路SOLO罷了，不服打一場標準的5V5。”但不可否認，電子競技這堵擋在AI面前的堅牆的確是被OpenAI鑿出了一道縫隙，電子競技這塊“遮羞布”可能也要不夠用了。

TI7上的亮相後，OpenAI宣佈下一步是開發能夠真正進行進行一局標準的5V5《DOTA2》對抗的AI，並表示希望在TI8上讓AI和人類玩家對抗。不客氣地說，當時的筆者認爲這存粹是爲了吸引投資者而吹的牛X、畫的大餅。因爲SOLO和5V5的複雜程度完全是兩個概念，才鼓搗出一個SOLO機器人而已，轉頭就號稱要在一年內開發出能5V5的AI？開什麼玩笑?

TI7上烏克蘭老司機千里迢迢被叫到西雅圖，然後被一頓暴打

結果你們都知道了，筆者被無情打臉。OpenAI的AI們在5V5的《DOTA2》比賽中戰勝了現場普通觀衆，同時也戰勝了由退役選手和解說組成的玩家水平前0.05%的隊伍，人類玩家甚至堅持不過半個小時。雖然依然是帶着限定條件的勝利：英雄池限定在18個英雄中，五隻無敵信使等等。人類玩家最後靠給AI選天然劣勢的脆皮陣容纔沒有被零封。

狼，這次真的來了。去年OpenAI的程序員號稱要開發出能夠進行一場標準《DOTA2》比賽的AI時，所有人都覺得他們在吹牛皮，但是在一年後的今天，雖然這個牛皮還沒有完全實現，但是至少也已經實現了40%。雖然有着種種限制條件，但是不可否認的是AI的確是像人類一樣在打《DOTA2》，而這很關鍵。

圖靈測試的核心在於機器是否能像人類一樣做出反饋

“人工智能之父”艾倫?圖靈提出過一個實驗思路用來鑑別機器是否擁有人類智能，這就是大名鼎鼎的圖靈測試。圖靈測試的核心思路就是讓人類在不知情的情況下向機器提問，如果人類無法分辨回答問題的是機器還是人類，那機器就通過了圖靈測試，可以被視爲擁有人類智能。

我們也可以將AI和人類玩家的《DOTA》比賽視爲另一種類型“圖靈測試”，如果AI玩家和人類玩家在ID、飾品等內容上無法區分，也不允許雙方打字或對話。觀衆們僅能通過玩家們在賽場上的表現區分誰是AI誰是人類，那麼OpenAI Five的表現已經可以欺騙相當一部分的玩家了。

AI在遊戲中打的極具進攻性

和《DOTA2》自帶對戰電腦打過的玩家，都知道那些電腦有多蠢，電腦在線上也不懂得維持自己的血量，玩家可以輕易在線上將電腦殺崩。而且電腦的思維模式也被玩家摸得一清二楚，無非就是五人抱團中推，一個人帶線就可以牽制所有電腦，再抓住落單的挨個擊殺。

而OpenAI Five的表現則完全不同，如果無視AI們的英雄頭上頂着的“OPEN XX”的ID，他們的表現似乎更像人類，而人類玩家倒更像是被抓住思維漏洞的一方。比如第一局比賽，AI用一個輔助巫妖在下路與人類玩家三核之一的死靈法師放單，通過巫妖的吃兵壓制死靈法師的經驗並把死靈法師拖在下路。而在上路通過剛三把人類的1號位大哥打崩。AI的這個思路不禁讓人想起田忌賽馬：用自己的下等馬和敵人的上等馬兌子，換取另外兩路的優勢。

OpenAI團隊，中間捧着的筆記本代表着Open DOTA的原型

除此之外，OpenAI Five還有許多或亮眼、或上頭、或犯蠢的舉動讓它們看起來更像是真正的人類玩家，例如塔下強殺後抓住對方沒有打斷淡定TP回家、四人抱團強衝下塔殺人、在敵人臉上開霧秒被破等等。相比之下，人類玩家們隊友被衝塔卻不TP支援、毫無戰術思路可言猶如一盤散沙、被AI各種偷塔牽制五人的表現反而更像那些平日裡被玩家暴捶的《DOTA2》自帶對戰電腦，也難怪會有玩家發出質疑“那些真人玩家不是在演戲放水吧？”

沒有，人類玩家們沒有演戲。這只是五個從未合練過的玩家野隊面對一支團隊時的正常表現，本質上等於五個路人碰到了五個黑店。而AI們對自己的戰術貫徹的又足夠堅決，於是就有了這幾場碾壓般的比賽。事實上普通玩家們在路人局中肯定也有過類似的體驗，如果前期打的很順，中期又有人願意出面指揮，五人齊心協力三路速推，普通玩家也能體驗到這種快到不可思議的勝利。

AI表示：菜雞，擡走，下一個

圖靈認爲，在2000年時人類可以設計出能夠在5分鐘問答內欺騙30%成年人的人工智能。如果我們將AI對陣人類的《DOTA2》比賽也視爲一種變相的圖靈測試的話，那麼OpenAI Five恐怕也能欺騙相當一部分的人類觀衆。雖然OpenAI Five距離完全通過“圖靈測試”還有相當一段距離，但它的確已經具有了相當程度上的智能。

而當下的我們正處於一個有趣的歷史節點中。一方面，號稱AI已經攻陷了《DOTA2》還爲之過早，因爲OpenAI Five顯然還不夠成熟，英雄池仍然限定在18個英雄中，AI們仍需要在額外限定若干條件才能進行遊戲。所以“人類一敗塗地”的說法無疑是個誇大的笑話，OpenAI Five想戰勝頂級《DOTA2》強隊還尚需時日。

AI目前還只會玩18個英雄，類似於DOTA2新手模式

但另一方面，事情有意思就有意思在這“尚需時日”四個字。雖然AI還不夠強，但是《DOTA2》項目的淪陷已經進入指日可待的狀態。根據OPENAI工作人員的Q&A以及公佈的內容，他們現在正在做的本質上不是訓練AI打《DOTA2》，而是告訴AI，怎樣纔算贏。只要AI明白在《DOTA2》什麼才叫贏，剩下的就是讓AI自己摸索。所以這次OpenAI Five VS 人類的對抗的重點不是輸贏，而是證明了OPENAI找對了路子，他們只要沿着這條路走下去就必然能超越人類玩家。

我們其實已經見識過AI一日千里的進步速度了。去年的TI7上，Sumail頭一天晚上還能和AI中路單挑時還能打的有來有回，但是他晚上睡覺時，AI根據白天的SOLO比賽優化了算法，於是第二天他與AI再次交手時慘遭痛毆，一個小分都沒能贏下。

蘇美爾被OPENAI吊打後…

而循着OpenAI Five的足跡，我們可以發現AI不僅在不斷進步，而且進步的速度越來越快。最早公佈的AI只能在全部玩家都是用相同英雄“矮人火槍手”的情況下進行遊戲。而且還有這諸多限制條件：沒有隱身、沒有神符、不能插眼等等。隨後，限制條件逐漸放寬，英雄池也逐漸拓展。

而就在OpenAI Five VS 人類高玩的比賽的不久之前，它們還有過一次亮相，也是與人類對戰並最終取勝。那時，AI們還只能在限制5個英雄，不能使用隱身道具、不能插眼、不能開霧、沒有神符等限制條件下比賽，而不久後的今天，這些限制條件都沒有了，英雄池也拓展到了18個。按照目前的進步速度，只要再給它們時間，我們必定能看到不需要附加任何限制，使用全英雄池的AI玩家們。而我們恰好就尚處於這個《DOTA2》尚未淪陷但即將淪陷的過渡期。

烏克蘭老司機屬於被殺了祭旗的宰牲

說實話，Alpha Go擊敗李世石時對於不下圍棋的DotAer而言並沒有什麼觸動，那畢竟是一件離自己很遙遠的事情。但這次不一樣，狼到了家門口了。所以當OpenAI Five殺敗一衆人類玩家時，至少筆者有那麼一點身爲人類自尊心受傷的感覺。也正是基於這種“不想承認人類輸了”的樸素情感，許多玩家開始強調一個詞——公平。

AI把英雄池限定成18個，這不公平；

AI比賽要用五個無敵信使，這不公平；

AI的反應速度太快了，這不公平；

AI五個人團隊意識強的如同一個人，玩家則從來沒合練過，這不公平；

AI一天能練習180萬次，人類玩家睡覺AI還能聯繫，這不公平；

AI直接使用接口進行數據交互，人類需要使用鍵鼠外設，這不公平……

AI一天的練習量，是人類一輩子都達不到的

總而言之就是：這是一場不公平的對抗，AI有着種種種種的優勢，所以我們不服，人類還沒輸。

AI和人類的對抗是否公平？爲了回答這個問題，我們可以逆向思維一下，那要怎麼樣纔算公平呢？給AI設計一套機械臂讓AI也使用鍵鼠操作？那機械臂是否要設計成人手的形狀和結構？如果AI有四個機械臂是否公平？給AI安裝攝像頭讓AI通過觀看顯示器獲取數據？那要裝一個攝像頭還是兩個攝像頭？人眼有兩億像素，給AI裝多少像素的攝像頭纔夠公平？甚至再吹毛求疵一些，人類通過呼吸作用獲取能量，而AI通電就可以，是否要給AI的主機裝一個生物胃纔夠公平呢？

追求這種“公平”其實已經走入了一種思維誤區，根本原因是我們不願意接受《DOTA2》項目淪陷而選擇逃避現實。追求人類和AI絕對公平是不可能的，而且與開發設計AI的最初目的南轅北轍。我們反過來說，讓AI與人類玩家在相同條件下比賽（使用機械臂等等），對AI玩家是否公平呢？畢竟通過光電信號交互信息是AI的天然屬性。

糾結公平不公平本質上只是因爲我們不服輸

更重要的是，像OpenAI Five這類項目的真正目的不是爲了證明人類不如AI，而是爲了證明AI也能像人類一樣根據接收的信息做出合理的決策。AI在某些方面的確是優於人類這是毋庸置疑的，根源上來說AI在內部使用光電信號以光速傳遞信息，而人類在內部使用化學信號+電信號傳遞信息的模式比AI低了N個數量級，所以AI能夠以遠超人類的速度進行計算和內部信息傳遞，這是AI的天然優勢。

OpenAI強化學習的遊戲庫中有上千款經典遊戲，進行“跨遊戲泛化”研究。檢驗AI一款遊戲玩輸了之後，能否把這個經驗運用到其他遊戲中去？

我們需要了解一點，開發AI的目的不是爲了和人類對抗，而是爲了和人類協作。只不過像圍棋、《星際爭霸2》、《DOTA2》這些項目對抗性太過激烈。所以讓我們產生了不服輸的心理。而實際上AI真正大展身手的地方不是臺前而是幕後，現有的遊戲廠商中，與AI技術結合的最好的不是別人，正是育碧。而育碧把AI技術用在了哪裡呢？他們沒有開發一款超強AI血虐玩家，而是用AI來——找BUG，順便改進了他們的動作捕捉系統讓遊戲中的人物動作更流暢更真實。作爲人類的助手，而不是人類的敵人，這纔是AI在未來真正的定位。

開發AI的目的不是對抗人類而是協助人類

至於當下，我們能做的只能是放下“人類不能輸給AI”的自尊，不再去找各種不公平的藉口，躺平接受《DOTA2》項目將要淪陷的事實，期待OpenAI Five在TI8上的表演。

AI的進步對人類而言是好事，唯一受傷的，只有我們的自尊心。

招募野生寫手！尋找遊戲達人！快來參加愛玩百萬稿費活動吧

遊戲專欄投稿信箱：otaku@vip.163.com

歡迎關注愛玩APP【精選】板塊，更多精彩等着你！

放棄吧！openAI玩DOTA2的表現比我們"更像人類"

相關資訊