足球队排名次

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

足球队排名次

摘要:本文利用高等代数中寻找特征向量的方法来解决足球排名次问题。

关键词:

一、问题的提出

下表给出了我国12支足球队在1988—1989年全国足球甲级联赛中的成绩,要求:

1)设计一个依据这些成绩排出诸队名次的算法,并给出用该算法排出名次的结果. 2)把算法推广到任意N个队的情况.

3)讨论:数据应具备什么样的条件,用你的方法才能够排出诸队的名次.

对下表的说明:

1)12支球队依次记作T1,T2,…,T12.

2)符号X表示两队未曾比赛.

3)数字表示两队比赛的结果,如T3行与T8行交叉的数字表示:T3与T8比赛了2场;

T3与T8的进球数之比为0:1和3:1.

二、问题的分析

本题中要给排序的足球队不只是参加足球锦标赛、循环赛、淘汰赛的球队,而是随机

进行比赛的一些球队.比赛场次肯定不全,也肯定不等,甚至每场比赛的重要性也不同,比赛的结果也有很大的随机性.如国际足联每三个月为全世界各个国家、各地区的足球队

所进行的排序.这些国家有些未参加世界杯比赛,甚至多数国家之间并未比赛过,如与中

国足球队比赛过的国家球队只占其中一小部分,因而完全套用一些锦标赛的方法是行不

通的.

众所周知,足球界对同一赛事中比赛结果的排名有现成的算法.例如,循环比赛结果

的排名,按前述二分制(或三分制)计算总积分,以总积分的高低来决定名次的先后(总

积分相同者,再比净胜球数的多少、总进球数的多数,再相同就抽签决定).但是,这一

算法着眼于排出比赛的胜负名次,并不总能合理地反映出各对的真实水平的高低.比赛名

次当然主要决定于各队的真实水平,但各队在比赛场次安排中“运气”的好坏也有相当

的影响.比如,某对在比赛中避开了强队而大胜弱队,就是由于运气好而得分高的例子.

我们不能完全排除这一类因素,但应尽可能合理地考虑并处理它.另外,足球队的上述算

法只适用于同一赛事的比赛结果,对于不同赛事的混合结果,特别对于比赛场次及数据

参差不齐的情况(如本题所给的数据),就显得无能为力了.

我们的目标就是针对这种不规则的比赛数据提出一种算法,尽可能合理地反映各队的

真实水平.

这里有一个问题可以反映本问题讨论的难度,即足球对之间的比赛结果不具有传递性.如甲队胜乙队,乙队胜丙队,然而丙队可以平甚至战胜甲队.再有甲队该场胜乙队,而另一场比赛可能乙队胜甲队,即使两场都是甲队胜了,也可能第一场3:2,,而第二场却是2:0胜了.然而数学上任何排序问题都应具有传递性,严格地讲,没有传递性就无法排序.

其实不只是足球比赛,其他球类比赛中都存在类似的情况.能否用一个恰当的数学模型来描述它呢?

其实这一问题是一个随机模型。某队在比赛中的表现是一个随机变量,有均值也有方差,服从一定的分布.正因为如此,在每场比赛中某队的表现不该是千篇一律的,会有失常也会有超常发挥,不过大多数情况下是正常发挥.一些训练有素、经验丰富的球队经常表现比较稳定,也就是他们的方差比较小.每场比赛实际上是两个球队分别独立抽样(多数情况下是如此,甲队对乙队有恐惧心理就另当别论),比赛的结果实际上是比较样品的大小.正是由于抽样的随机性,各种不同的结果分别按不同的概率发生,因而造成比赛结果的不可传递性.在这种情况下,题目要求对足球队进行排序应理解为是对均值的排序。变量是随机的,但均值却是不变的,从道理上来讲,是不受某场比赛的结果影响的.正因为如此,均值是具有传递性的,因此对均值进行排序从数学上来看是合理的.

还应该指出的是,足球比赛不像田径比赛,虽然每次比赛的成绩是随机的,但其样品的观测值完全是已知的;而对球队比赛中体现的实力并不知道,从随机变量的若干样品去估计其均值是数理统计中已有不少现成方法的问题.足球比赛虽然也是抽样,却无法观测样本的准确值,每个球队的实力只能通过比赛去体现,这样足球比赛不是只有一个随机变量,而是有两个随机变量.我们并不知道样本的准确观测值,我们仅仅只知道是两个样品比较的相对结果,因此也就没有多少现成的方法可以借用.

本问题的难点在于:一是,虽然知道比赛结果是两队抽样后样品的相对比较后的结果,但是应该指出的是这一相对比较结果是十分粗糙的.尽管国际足联排名的国家与地区的球队有100多个,加上各国家的甲级队、地方队,球队上万个,可是比赛的结果相比之下却是少得可怜,从9:0狂胜到0:9的惨败,只有几十种结果,这几十种结果去反映上千个(至

少会有上万个)球队之间的相对比较值(不足上百万个至少也有几万个吧),所以上述相对比较结果是十分粗糙的.本问题就是根据精度较差的数据去精确排序,难度当然可想而知.本问题的第二个难点是随机问题要能有较为准确的结论,应该有丰富的观测数据.根据大数定律频率代替概率可以得到较为可靠的结果.然而本题中不少球队之间连很少的样本也没有,根本没有进行过比赛,几乎有点“无米之炊”的味道了,因此如何充分利用这有限的少之又少的信息,就显得非常重要了.

本问题严格的数学描述如下: 为简化问题,假设每队在比赛中的实力体现服从正态分布,即有n 个总体

(,),1,2,...,,0,i i i i i N i n μσμσ=>>,,1,2,...,,i j x i j n i j

x =≠已知(,i j x x 为不全的观测值),

要求对i μ从大到小进行排序.

三、模型假设

由上述分析知,这是一个相当复杂的问题,那么该从什么地方入手呢,采用什么样的

数学工具呢?为了找到线索,应该简化问题,再对简化的问题进行分析以寻找突破点.为此先作如下假设(以后会逐步放松这些假设):

(1) 比赛是确定型的,或者每个队的方差均为0,抽样结果就是均值;

(2) 比赛的结果是可以精确反映相对实力的,没有误差;

(3) 比赛的场次是完全的,任意两个队之间都有比赛成绩.

四、模型的建立与求解

一、初步的排名方案

目前足球比赛排名最通用的算法是总积分法、平均积分法.以下我们先从这两种方

法开始,通过分析其缺点而进一步改进.

【模型1 总积分法】

按2分制或3分制,即胜一场得2分或者3分,平一场得1分,输一场不得分.计算各

队在所有比赛比赛中总的得分,按总积分的高低排出名次.如果两队积分相等,则看净胜球总数,多的名次靠前;如果净胜球数再相等,看进球总数,进球数多的名次靠前.再相等只有靠点球来决定.

点评:

优点----综合各场比赛的情况,也设法多利用一些结果信息.

缺点----(1)没有考虑对手的情况,胜第二名与胜第一名是同样看待的;

(2)没有考虑胜负的程度,9:0猛灌与5:4险胜没有差别;

(3)没有考虑到比赛场次的多少,显然多参加比赛是有利的.

结论:只适用于循环赛.

但是,在所给的数据表中,各队比赛场次有多有少,而按我们的假设,比赛场次的多

少并不是由于该队在以前的比赛中的胜负所致.如果按照总积分法,则比赛场次少的队吃亏.为了克服缺点(3),很自然改为下面模型.

相关文档
最新文档