ELO

来自皮卡鱼 Wiki
跳到导航 跳到搜索

返回“棋软知识”

ELO等级分,是追求反映棋手真实水平的评分方法。尽可能让分数接近棋手的实际水平,它可以用来为多个参赛者进行排名并量化它们之间的实力差异。

它的理念和传统的“积分”完全不同,ELO系统根据参赛者间的胜率来调整分数,使得分数能够直观地反映出他们的实力差距。比如ELO分高的,对上ELO分低的对手,若胜则加少量的分,若负则扣更多的分,若平局则扣少量的分。

elo的理念和传统积分是完全不同的,elo要反映棋手的真实水平,追求“真实实力怎么样,分数就应该待在某个分段”。而很多传统的积分,分数可以无限提高。 elo可以反映双方的预期胜率,比如双方相差100分,elo就认为双方胜率是64%对36%。如果一个高分棋手对上低分棋手一直和棋,为什么还要相信他的水平是高分呢?是对弈结果决定了elo等级分,既然和棋那就视为此局双方水平相等,缩小一些双方的elo差距。至于和棋多,那是棋类本身的因素,和ELO等级分没有关系。

在多个引擎排名中,其中两个引擎遇上,如果引擎A的ELO评分比引擎B高71分,那么根据ELO公式,我们可以计算出A对B的胜率大约为60%(和棋视为半胜半负)。实际比赛结果如果显示A的胜率不足60%,则A的ELO分会下调,B的ELO分相应上升,以更准确地反映两者的实力差异。多个引擎的Elo通常使用Bayeselo、Ordo等工具计算。

题外话:ELO在电子游戏领域内已经快要变为贬义词,但ELO只是个评分系统,和匹配机制无关,怎么使用这个分数去匹配是匹配机制的事情,就算评分再精准,也架不住匹配系统去把1000分和100分的匹配到一起。且电子游戏评分也基本不是使用ELO,而是使用更复杂的ELO变体或者根据ELO理念创造的评分系统(如mmr)

而在一对一的引擎测试中,ELO就完全可由胜率计算。

非一对一的情况下,不同的ELO系统可能因为计算方式不同,系统内的引擎(棋手)不同,比赛方法不同等等因素,导致不同ELO系统间的ELO分数不能互相比较,可以参考强弱关系,但不能直接比较分数。