本文轉(zhuǎn)載自:https://www./ 作者:XYPENG ELO Rating System 是當(dāng)今對(duì)弈水平評(píng)估的公認(rèn)權(quán)威規(guī)則,已被廣泛應(yīng)于國(guó)際象棋、圍棋、足球和籃球等體育運(yùn)動(dòng)以及游戲中。例如星際爭(zhēng)霸天梯排行,魔獸世界競(jìng)技場(chǎng),Dota天梯系統(tǒng),LOL匹配等游戲的競(jìng)技比賽系統(tǒng)中。ELO是一套較為完善的評(píng)分規(guī)則和機(jī)制,比較適合對(duì)競(jìng)技類游戲的選手的技術(shù)等級(jí)進(jìn)行評(píng)估,用以計(jì)量個(gè)體在對(duì)決類比賽中相對(duì)技能的算法系統(tǒng),對(duì)于游戲而言,需要讓每場(chǎng)游戲盡可能的接近公平,創(chuàng)造雙方勢(shì)均力敵的競(jìng)賽環(huán)境。它最初由美國(guó)物理學(xué)教授 Arpad Elo 創(chuàng)立,故命名為埃羅排名。 一、ELO Rating System模型思路 1.假設(shè)每個(gè)玩家每盤游戲中的表現(xiàn)是一個(gè)正態(tài)分布的隨機(jī)變量,盡管選手在不同的游戲中發(fā)揮可能差異很大,但每位選手在一段時(shí)間內(nèi)表現(xiàn)的平均值變化很小,ELO系統(tǒng)用隨機(jī)變量的平均值來(lái)代表選手的真正水平。 2.ELO系統(tǒng)用勝平負(fù)來(lái)評(píng)價(jià)選手在某一場(chǎng)游戲中的表現(xiàn),贏就代表這場(chǎng)發(fā)揮比對(duì)手好,反之就是不好,因此會(huì)用贏加分,輸扣分,平不得分來(lái)進(jìn)行評(píng)分。 二、積分計(jì)算公式 Ra:A玩家當(dāng)前的Rating Rb:B玩家當(dāng)前的Rating Sa:實(shí)際勝負(fù)值,勝=1,平=0.5,負(fù)=0 Ea:預(yù)期A選手的勝負(fù)值,Ea=1/(1+10^[(Rb-Ra)/400]) Eb:預(yù)期B選手的勝負(fù)值,Eb=1/(1+10^[(Ra-Rb)/400]) 因?yàn)镋值也為預(yù)估,則Ea+ Eb=1 R’a=Ra+K(Sa-Ea) R’a:A玩家進(jìn)行了一場(chǎng)比賽之后的Rating K:K值是一個(gè)極限值,代表理論上最多可以贏一個(gè)玩家的得分和失分,K/2就是相同rating的玩家其中一方勝利后所得的分?jǐn)?shù)。 國(guó)際象棋大師賽中,K=16;在大部分的游戲規(guī)則中,K=32。通常水平越高的比賽中其K值越小,這樣做是為了避免少數(shù)的幾場(chǎng)比賽就能改變高端頂尖玩家的排名。 三、實(shí)例說(shuō)明 若當(dāng)前A玩家rating為1500,B玩家rating為1600 預(yù)估A玩家的勝負(fù)值Ea = 1/(1+10^[(1600-1500)/400])≈0.36 預(yù)估B玩家的勝負(fù)值Eb = 1-Ea = 1-0.36 = 0.64 假設(shè)A玩家獲勝,實(shí)際勝負(fù)值為Sa = 1 A玩家最終得分為 R’a = 1500 + 32*(1-0.36) = 1500+20.5 = 1520,A玩家贏20分,B玩家輸20分。 假設(shè)B玩家獲勝,實(shí)際勝負(fù)值為Sa = 1 B玩家最終得分為 R’b = 1600 + 32*(1-0.64) = 1600 + 11.52 = 1612,B玩家贏12分,A玩家輸12分。 PS:^符號(hào)代表次方運(yùn)算。 |
|
來(lái)自: 弓道自然_改名 > 《統(tǒng)計(jì)》