久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    SRFC“能力指數”車手評分系統升級為2.0

     弓道自然_改名 2020-02-03

    概述:

    我們的能力指數RRI系統自從2017年12月運行至今半年有余,期間逐步的發現了一些問題,針對這些問題,本文作者進行了潛心研究后對本系統提出了新的計算規則。
    Elo評分系統
    簡單回顧:

    Elo評分系統是由一個叫Arpad Elo的人提出的一種實力評分系統,最早用于國際象棋的排名,現在也廣泛地被運用到各種游戲中。

    單拿寶可夢來說,無論是PS,PO還是實機排位,其分數排名系統都是Elo系統。

    相信大多數經常打以上三個游戲玩家,都至少有這么個感性認識:

    在這個系統里,和分數比自己高的人比賽,贏了自己能加更多的分,輸了則會扣相對較少的分;反之亦然。

    在Elo系統中,一個確定的分數差對應著一個確定的勝率。比如1950對1850的勝率是64%,1200對1100的勝率也是64%。反過來看,如果A對B的勝率大約是64%,那么他們的實力評分差約100分,如果A對B的勝率約76%,那么他門的實力評分大約差200分。

    理論上,Elo系統可以用來關公戰秦瓊,兩個不同時期的玩家,可以通過直接比較Elo分來比較其水平強弱。另一方面,K的取值只影像分數調整的快慢,并不影響分差和勝率的對應關系。

    Elo系統
    的主要問題:

    Elo系統的一大特點就是并非根據時間加減積分,這杜絕了一輪游也可以漲分的怪相,但卻暴露了另外的缺陷——并不考慮長時間遠離賽場后撲朔迷離的競技狀態,其問題在于無法確定選手評分的可信度。

    假設兩名評分均為1700的選手A、B在進行一場對戰后A獲得勝利,在Elo系統下(K=32時),A選手評分將增長16,對應地B選手評分將下降16。但是假如A選手是已經很久沒玩,但B選手每周都會玩,那么在上述情況下A選手的1700評分并不能十分可信地用于評定其實力,而B選手的1700評分則更為可信。思考得出以下結論:

    (1)A選手的評分增長值應該大于16分,因為他的1700評分作為初始值并不可信,同時擊敗一個穩定在1700評分的選手表明他的實力很可能高于1700;

    (2)B選手的評分減少值應該小于16分,因為他的實力已經被很精準地定位在1700附近,而他輸給了一個評分并不可信的對手,那么B選手的實力評定其實從該場對戰中并不能有多少“學習”。

    Glicko
    評分系統

    Glicko系統正是針對上述情況進行改進。第二版RRI'能力指數'評分系統是基于Glicko評分系統打造的。Glicko評分系統是Mark Glickman發明的,本質上是對Elo系統的一種改進。

    Glicko系統在給玩家一個評分時,同時還需要給出一個標準差(既正態分布中的均值和標準差,也可以理解為范圍或者可信度),例如玩家A的評分是 (1600, 50),玩家B的評分是(1650, 100)。這樣,我們在評估一個剛剛進入系統的玩家時,就可以給出一個很大的標準差來避免其實際實力與暫時的分數不符的問題。而通過玩家不斷地進行對戰,調整其分數的同時,一定程度地減小其標準差,也既是慢慢地精確定位玩家的實際實力。Glicko系統中,需要設定一個實力均值以及一個最大標準差值(我們設定的均值為1500,最大標準差為350),同時,一個沒有任何對局的新玩家的評分就是(1500, 350)

    Glicko
    評分系統基本計算步驟:

    步驟1 為所有選手設定一個初始評分和RD值

    (a) 如果選手未分級,設定評分 = 1500,RD值 = 350;

    (b) 否則,用選手最新的評分,同時根據RDold用以下公式計算新的RD值:

    t是自最近對戰后,現在已經是第幾個周期(例如選手上次對戰就是在剛過去的一個評分周期,則t=1);c是用于衡量隨時間增長不確定度的常量(后續會給出如何選擇c值的方法)。上述公式可以保證在評分周期開始,未頂級選手的RD值不會超過350。

    步驟2 分別為每一個選手執行下述公式計算:

    假定在評分周期初始,選手的評分為r,評分偏差為RD。設定m個對手在評分周期初始的評分分別為r1,r2,r3,……rm,其評分偏差分別為RD1,RD2,RD3,……RDm,同時設s1,s2,s3,……sm為其對戰各個選手的結果(在SRFC對戰結果只有2種:勝、負,分別對應的s值為1、0)。注意:與同一對手對戰多局,其使用的評分和RD值與對戰多個對手相同。

    使用r’、RD’表示在評分周期過后選手新的評分和RD值,則相關的更新公式如下:

    其中

    上述公式在評分周期的末尾對每個選手進行一次計算。

    實例

    為了對上述步驟2進行計算,假定一個評分為1500的選手對戰3個選手評分分別為:1400,1550和1700,戰斗結果分別為勝、負、負,同事該選手RD值為200,而對手的RD值分別為30,100和300。我們可以得出:

    得出:

    d = 231.67

    從而得出:

    r’ = 1464,RD’ = 151.4

    【演算過程略。。?!?/p>

    關于C值

    評分算法步驟1中的c值可以由數據分析決定,當然就需要非常復雜的計算過程。另外一個方法是決定過多少個評分周期后,一個沒再進行過評分對戰的正常選手的評分變得如一個未評分選手一樣不可信。為了示范計算該種方法,假設一個正常選手的RD值為50,評分周期持續2個月,并且假定5年(60個月)過后該選手評分如未評分選手一樣不可信,此時時間已經過去了t = 30個評分周期(30*2個月)。我們可以用以下公式解出c:

    在該例中,c = 63.2。

    一個實際應用過程中會遇到的問題是,當一個選手過于頻繁地進行匹配對戰時,他的評分變化不再明顯,因為此時他的RD值非常小。當選手的實力確實有了提高時,這種情況會阻止選手的評分發生實質性的變化。因此設定一個從不會低于某值(例如30)的RD值,這樣選手的評分在一個相對短的時間內也可以明顯地發生變化。

    SRFC能力指數(RRI)
    2.0版計算規則簡介:

    我們以10場對戰(假設1場比賽有15人參加,那么每位參加的車手都經歷了14場對戰)為一個計算周期,C值設定為若缺席超過300個計算周期,這RD值變回初始值(如同新手一樣不可信)。

    設定車手評分變動為2倍的RDnew以內。

    退賽的情況:當車手未完成3圈時不參與計算。之后退賽的話,和所有退賽車手之間都算平局,和所有完賽車手之間都算失敗,以此規則進行計算。

    目前2.0版RRI評分系統已經上線并已開始測試,地址為:http://www./app/RRI_SEARCH2.php?name='車手中心ID'。

    能力指數RRI查看頁面
    簡介:

    條形圖表示車手每場比賽后的能力指數(即r),折線圖表示車手每場比賽之后計算得出的穩定系數(即RD)

    一位車手的RRI應表達為r±RD。

    如上圖,GTR1994的以截圖時最新的RRI為1978±89.83,那么他的能力值為上限2067.83,下限1888.17的區間內某一個值。

    穩定系數的中位數:離最低穩定系數值越接近,則車手評級表現越穩定,反之越不穩定。

    參考文獻:https://en./wiki/Glicko_rating_system

      本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發現有害或侵權內容,請點擊一鍵舉報。
      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 无码国模国产在线观看免费| 青青草无码免费一二三区| 国产精品自在拍首页视频8| 国产成人AV大片大片在线播放| 日日碰狠狠添天天爽无码| 人妻一区二区三区三区| 亚洲 校园 欧美 国产 另类| 狠狠色噜噜狠狠狠狠777米奇| 午夜毛片精彩毛片| 久久综合97丁香色香蕉| 精品国产美女福到在线不卡| 八区精品色欲人妻综合网| 国产成人啪精品视频免费APP | 无码人妻一区二区三区精品视频 | 亚洲高潮喷水无码AV电影| 久久夜色撩人精品国产小说| 亚洲欧洲日产国无高清码图片| 精品久久久久久无码中文野结衣| 日韩av日韩av在线| 日韩AV无码免费播放| 亚洲国产良家在线观看| 久久97精品久久久久久久不卡 | 天天综合网网欲色| 亚洲AV少妇熟女猛男| 人妻少妇偷人精品一区| 欧美性大战久久久久XXX| 人人澡人摸人人添| 亚洲中文字幕国产综合| 国产乱码精品一区二区三区四川人| 中文字幕日韩精品人妻| 久久综合亚洲色HEZYO国产| 67194熟妇在线直接进入| 国产网友愉拍精品视频手机| 精品久久人妻AV中文字幕| 伊人久久大香线蕉成人| 40岁大乳的熟妇在线观看| 精品无码人妻一区二区三区| 国产SUV精品一区二区四| 国产精品福利自产拍久久| 国产福利深夜在线播放| 亚洲日韩一区精品射精|