《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 設(shè)計(jì)應(yīng)用 > 基于機(jī)器學(xué)習(xí)的RTS游戲?qū)崟r(shí)勝率預(yù)測(cè)
基于機(jī)器學(xué)習(xí)的RTS游戲?qū)崟r(shí)勝率預(yù)測(cè)
2020年信息技術(shù)與網(wǎng)絡(luò)安全第3期
溫葉廷,黃海于
(西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 611756)
摘要: 游戲勝負(fù)預(yù)測(cè)可用于自適應(yīng)游戲AI的設(shè)計(jì),策略層面強(qiáng)化學(xué)習(xí)的反饋參數(shù)等。使用SC2LE公開(kāi)的數(shù)據(jù)集,首先通過(guò)游戲時(shí)間、MMR和AMP指標(biāo)進(jìn)行數(shù)據(jù)預(yù)處理,得到質(zhì)量較高的數(shù)據(jù)集;然后使用pysc2解析,提取游戲數(shù)據(jù);最后進(jìn)行特征分析,得到基礎(chǔ)特征和統(tǒng)計(jì)特征,完成游戲特征數(shù)據(jù)集的構(gòu)建。最終采用機(jī)器學(xué)習(xí)方法XGB分類(lèi)模型,利用10次十折交叉驗(yàn)證法進(jìn)行模型評(píng)估與優(yōu)選。結(jié)果表明使用基礎(chǔ)特性與統(tǒng)計(jì)特性的組合,可以使得實(shí)時(shí)勝率預(yù)測(cè)準(zhǔn)確率在不同匹配對(duì)局情況下均超過(guò)80%。
中圖分類(lèi)號(hào):TP391
文獻(xiàn)標(biāo)識(shí)碼:A
DOI: 10.19358/j.issn.2096-5133.2020.03.007
引用格式:溫葉廷,黃海于.基于機(jī)器學(xué)習(xí)的RTS游戲?qū)崟r(shí)勝率預(yù)測(cè)[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(3):35-39.
RTS game real-time winning rate prediction based on machine learning
Wen Yeting,Huang Haiyu
(School of Information Science and Technology,Southwest Jiaotong University,Chengdu 611756,China)
Abstract: Game outcome prediction can be used in the design of adaptive game AI and feedback parameters for reinforcement learning at the strategic level.In this paper,the data set disclosed by SC2LE(StarCraft II Learning Environment) is used to preprocess the data through game time,MMR(matchmaking rating),and AMP(actions per minute) indicators to obtain a highquality data set;then the pysc2 is used to analyze and extract the game data,and finally the feature analysis is carried out to obtain basic features and statistics features and complete the construction of game feature datasets.Finally,the machine learning method XGB classification model is used,and 10 times 10-fold crossvalidation method is adopted for model evaluation and optimization.The results show that using the combination of basic characteristics and statistical characteristics,the real-time win rate prediction accuracy rate can exceed 80% under different matching games.
Key words : AI;game;real time;machine learning;XGB

0    引言

實(shí)時(shí)戰(zhàn)略游戲(RTS)在過(guò)去十年中一直是人工智能研究領(lǐng)域的一個(gè)熱點(diǎn)。由于RTS游戲復(fù)雜性、部分可觀察和動(dòng)態(tài)實(shí)時(shí)變化戰(zhàn)局等游戲特點(diǎn)使得研究變得比較困難,因此對(duì)于獲勝者的預(yù)測(cè)成為了人工智能研究的一個(gè)高度相關(guān)的主題。

現(xiàn)有的研究主要集中在MOBA游戲DOTA2中,比如,文獻(xiàn)[2]使用兩種不同的方法對(duì)游戲勝負(fù)做出了預(yù)測(cè),第一種使用完整的賽后數(shù)據(jù),第二種在英雄選擇階段,上述的兩種方法是用來(lái)預(yù)測(cè)整局游戲的勝負(fù),而不是實(shí)時(shí)勝率;文獻(xiàn)[3]將賽前特征與比賽期間的特性相結(jié)合,使用邏輯回歸,得到了實(shí)時(shí)游戲預(yù)測(cè)勝率的準(zhǔn)確率為71.49%。雖然目前研究在游戲勝負(fù)預(yù)測(cè)方面已經(jīng)有了一些成果,但是由于游戲不同,RTS與MOBA游戲有著很大的區(qū)別,而被廣泛認(rèn)為是最具挑戰(zhàn)性的RTS游戲的星際爭(zhēng)霸II仍然沒(méi)有得到解決。星際爭(zhēng)霸II與其他的即時(shí)戰(zhàn)略游戲一樣分為雙人或多人游戲。每一名玩家可以選擇不同的種族(人族T、蟲(chóng)族Z和神族P)并且可以組建一支軍隊(duì)來(lái)?yè)魯橙耍颐恳晃煌婕铱赡茉谝粓?chǎng)游戲中同時(shí)操作很多單位。想要建立軍隊(duì),玩家就需要開(kāi)采資源、建造建筑、研究科技和訓(xùn)練單位。最后通過(guò)摧毀敵方建筑獲得勝利。



本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003174





作者信息:

溫葉廷,黃海于

(西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 611756)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。