SRFC“能力指數”車手評分系統升級為2.0

弓道自然_改名 2020-02-03

展開全文

概述：

我們的能力指數RRI系統自從2017年12月運行至今半年有余，期間逐步的發現了一些問題，針對這些問題，本文作者進行了潛心研究后對本系統提出了新的計算規則。

Elo評分系統

簡單回顧：

Elo評分系統是由一個叫Arpad Elo的人提出的一種實力評分系統，最早用于國際象棋的排名，現在也廣泛地被運用到各種游戲中。

單拿寶可夢來說，無論是PS，PO還是實機排位，其分數排名系統都是Elo系統。

相信大多數經常打以上三個游戲玩家，都至少有這么個感性認識：

在這個系統里，和分數比自己高的人比賽，贏了自己能加更多的分，輸了則會扣相對較少的分；反之亦然。

在Elo系統中，一個確定的分數差對應著一個確定的勝率。比如1950對1850的勝率是64%，1200對1100的勝率也是64%。反過來看，如果A對B的勝率大約是64%，那么他們的實力評分差約100分，如果A對B的勝率約76%，那么他門的實力評分大約差200分。

理論上，Elo系統可以用來關公戰秦瓊，兩個不同時期的玩家，可以通過直接比較Elo分來比較其水平強弱。另一方面，K的取值只影像分數調整的快慢，并不影響分差和勝率的對應關系。

Elo系統

的主要問題：

Elo系統的一大特點就是并非根據時間加減積分，這杜絕了一輪游也可以漲分的怪相，但卻暴露了另外的缺陷——并不考慮長時間遠離賽場后撲朔迷離的競技狀態，其問題在于無法確定選手評分的可信度。

假設兩名評分均為1700的選手A、B在進行一場對戰后A獲得勝利，在Elo系統下（K=32時），A選手評分將增長16，對應地B選手評分將下降16。但是假如A選手是已經很久沒玩，但B選手每周都會玩，那么在上述情況下A選手的1700評分并不能十分可信地用于評定其實力，而B選手的1700評分則更為可信。思考得出以下結論：

（1）A選手的評分增長值應該大于16分，因為他的1700評分作為初始值并不可信，同時擊敗一個穩定在1700評分的選手表明他的實力很可能高于1700；

（2）B選手的評分減少值應該小于16分，因為他的實力已經被很精準地定位在1700附近，而他輸給了一個評分并不可信的對手，那么B選手的實力評定其實從該場對戰中并不能有多少“學習”。

Glicko

評分系統

Glicko系統正是針對上述情況進行改進。第二版RRI'能力指數'評分系統是基于Glicko評分系統打造的。Glicko評分系統是Mark Glickman發明的，本質上是對Elo系統的一種改進。

Glicko系統在給玩家一個評分時，同時還需要給出一個標準差(既正態分布中的均值和標準差，也可以理解為范圍或者可信度)，例如玩家A的評分是 (1600, 50)，玩家B的評分是(1650, 100)。這樣，我們在評估一個剛剛進入系統的玩家時，就可以給出一個很大的標準差來避免其實際實力與暫時的分數不符的問題。而通過玩家不斷地進行對戰，調整其分數的同時，一定程度地減小其標準差，也既是慢慢地精確定位玩家的實際實力。Glicko系統中，需要設定一個實力均值以及一個最大標準差值（我們設定的均值為1500，最大標準差為350），同時，一個沒有任何對局的新玩家的評分就是(1500, 350)

Glicko

評分系統基本計算步驟：

步驟1 為所有選手設定一個初始評分和RD值

（a）如果選手未分級，設定評分 = 1500，RD值 = 350；

（b）否則，用選手最新的評分，同時根據RDold用以下公式計算新的RD值：

t是自最近對戰后，現在已經是第幾個周期（例如選手上次對戰就是在剛過去的一個評分周期，則t=1）；c是用于衡量隨時間增長不確定度的常量（后續會給出如何選擇c值的方法）。上述公式可以保證在評分周期開始，未頂級選手的RD值不會超過350。

步驟2 分別為每一個選手執行下述公式計算：

假定在評分周期初始，選手的評分為r，評分偏差為RD。設定m個對手在評分周期初始的評分分別為r1，r2，r3，……rm，其評分偏差分別為RD1，RD2，RD3，……RDm，同時設s1，s2，s3，……sm為其對戰各個選手的結果（在SRFC對戰結果只有2種：勝、負，分別對應的s值為1、0）。注意：與同一對手對戰多局，其使用的評分和RD值與對戰多個對手相同。

使用r’、RD’表示在評分周期過后選手新的評分和RD值，則相關的更新公式如下：

其中

上述公式在評分周期的末尾對每個選手進行一次計算。

實例

為了對上述步驟2進行計算，假定一個評分為1500的選手對戰3個選手評分分別為：1400，1550和1700，戰斗結果分別為勝、負、負，同事該選手RD值為200，而對手的RD值分別為30，100和300。我們可以得出：

得出：

d = 231.67

從而得出：

r’ = 1464，RD’ = 151.4

【演算過程略。。?！?/p>

關于C值

評分算法步驟1中的c值可以由數據分析決定，當然就需要非常復雜的計算過程。另外一個方法是決定過多少個評分周期后，一個沒再進行過評分對戰的正常選手的評分變得如一個未評分選手一樣不可信。為了示范計算該種方法，假設一個正常選手的RD值為50，評分周期持續2個月，并且假定5年（60個月）過后該選手評分如未評分選手一樣不可信，此時時間已經過去了t = 30個評分周期（30*2個月）。我們可以用以下公式解出c：

在該例中，c = 63.2。

一個實際應用過程中會遇到的問題是，當一個選手過于頻繁地進行匹配對戰時，他的評分變化不再明顯，因為此時他的RD值非常小。當選手的實力確實有了提高時，這種情況會阻止選手的評分發生實質性的變化。因此設定一個從不會低于某值（例如30）的RD值，這樣選手的評分在一個相對短的時間內也可以明顯地發生變化。

SRFC能力指數(RRI)

2.0版計算規則簡介：

我們以10場對戰（假設1場比賽有15人參加，那么每位參加的車手都經歷了14場對戰）為一個計算周期，C值設定為若缺席超過300個計算周期，這RD值變回初始值（如同新手一樣不可信）。

設定車手評分變動為2倍的RDnew以內。

退賽的情況：當車手未完成3圈時不參與計算。之后退賽的話，和所有退賽車手之間都算平局，和所有完賽車手之間都算失敗，以此規則進行計算。

目前2.0版RRI評分系統已經上線并已開始測試，地址為：http://www./app/RRI_SEARCH2.php?name='車手中心ID'。

能力指數RRI查看頁面

簡介：