在前不久舉行的Defcon黑客大會(huì)上,一位來自谷歌的研究人員公布了他開發(fā)的工具。通過估算玩家在場上的卡牌價(jià)值系數(shù),該工具的預(yù)測成功率最高可達(dá)97%。
想要在《爐石傳說》的對(duì)戰(zhàn)中預(yù)測對(duì)手的卡牌,甚至是下一步的動(dòng)作?先別急著去掛馬截屏,不用這么復(fù)雜。在前不久舉行的Defcon黑客大會(huì)上,一位來自谷歌的研究人員公布了他開發(fā)的工具。據(jù)介紹,通過估算玩家在場上的卡牌價(jià)值系數(shù)以及對(duì)手的職業(yè)和打法,該工具可以以最高97%的準(zhǔn)確率預(yù)測對(duì)手的卡牌。
開發(fā)這套工具的是Elie Bursztein博士,目前供職于谷歌,負(fù)責(zé)網(wǎng)絡(luò)反欺詐相關(guān)方向的研究。在Defcon大會(huì)的演講中,Bursztein博士詳細(xì)介紹了該工具的原理。首先他進(jìn)行的工作是計(jì)算卡牌價(jià)值,通過公式計(jì)算分析出每一張牌的價(jià)值參數(shù),利用它可以從游戲中找出有哪些卡牌的價(jià)值是被低估的。隨后,他通過統(tǒng)計(jì)卡牌之間的親和度(即兩張卡牌之間發(fā)生關(guān)聯(lián)的可能性)以及大量回放的統(tǒng)計(jì)建立了預(yù)測系統(tǒng)的模型。在Bursztein博士的博文中提到,最高預(yù)測準(zhǔn)確率發(fā)生在第3到5輪。而對(duì)于對(duì)手卡牌的預(yù)測,在對(duì)方手中有5張牌的時(shí)候可以達(dá)到80%,而當(dāng)對(duì)方手中有10張牌的時(shí)候可以達(dá)到56%。
事實(shí)上我們可以認(rèn)為Bursztein博士的工作屬于模擬AI的一部分。通過預(yù)測卡牌再配合相應(yīng)的出牌規(guī)則,可以建立出一個(gè)強(qiáng)大的《爐石傳說》AI模型。在大會(huì)的PPT中,他公布了該工具的下載地址。但據(jù)Bursztein博士說,在正式公布之前,他給Defcon主辦方發(fā)去的郵件似乎被傳到了其他的一些地方,比如暴雪。
據(jù)Bursztein博士說,在Defcon上的演示之后,爐石團(tuán)隊(duì)和他進(jìn)行了多次對(duì)話。暴雪方面認(rèn)為,這樣的工具將破壞游戲的平衡,同時(shí)也會(huì)減低游戲的樂趣。最終Bursztein博士做出了一個(gè)艱難的決定,刪除了在Github上提供的下載鏈接,盡管他本人對(duì)此十分不情愿。
不過這樣的研究對(duì)于游戲的整體進(jìn)程有著很大的好處。一方面促使暴雪更加重視對(duì)于游戲回放等功能的研發(fā),另一方面,相關(guān)的模型的簡歷也可以幫助爐石團(tuán)隊(duì)調(diào)整AI的難度,打造更有樂趣的單人冒險(xiǎn)模式——不過雖然它很有可能不會(huì)再出現(xiàn)了。
附卡牌價(jià)值估算方法的簡單介紹:
1 法力值與卡牌強(qiáng)度相稱
2 卡牌強(qiáng)度是線性增長的
3 卡牌的效果有著直接的價(jià)值
4 一張卡牌有著固有價(jià)值
5 一張卡牌的價(jià)值是它所有屬性的綜合
一張卡牌的法力值(M)與卡牌屬性(攻擊力A,生命力H,沖鋒C等屬性以及固有價(jià)值i)存在等式:
M=αA+βH+i+..
比如冰風(fēng)雪人(4費(fèi),4/5)和食人魔拳師(6/6/7),他們單位法力值的參數(shù)分別是1a+1.25h+i以及1a+1.17h+i,顯然前者要高于后者。
而至于法術(shù)牌,傷害型法術(shù)牌的價(jià)值在于它所造成的傷害。法師火球術(shù)的參數(shù)為1.5,而炎爆術(shù)的參數(shù)為1。在了解這些之后,便可以開始估算卡牌的實(shí)際價(jià)值了。將卡牌的參數(shù)按照法力值消耗、攻擊力、生命值、沖鋒、圣盾、風(fēng)怒……固有價(jià)值這樣分類列出,然后對(duì)矩陣進(jìn)行最小二乘法,算出一組標(biāo)準(zhǔn)系數(shù)的向量組,并且與每一張牌的參數(shù)構(gòu)成的向量組求點(diǎn)積,得出一個(gè)初步的值。
比如,以A=1,H=-1,C=2,D(圣盾)=1,i=1為標(biāo)準(zhǔn)系數(shù),銀色指揮官(6費(fèi)4/2,沖鋒)的價(jià)值值為6。但與此同時(shí),不同的屬性的值還有其計(jì)算公式,比如沖鋒的參數(shù)要用攻擊力乘以沖鋒系數(shù)獲得。而每一項(xiàng)執(zhí)行效果也要有不同的加成(比如沉默)。
在得到所有的值之后,通過計(jì)算線性回歸的方式,便可以得出有哪些卡牌實(shí)際上是被低估的。比如持盾衛(wèi)士(1/0/4,嘲諷)。更詳細(xì)的內(nèi)容,你可以從這份PDF中看到。