数学建模(打印)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题的提出及分析
下表给出了我国12支足球队在1988—1989年全国足球甲级联赛中的成绩,要求:
1)设计一个依据这些成绩排出诸队名次的算法,并给出用该算法排出名次的结果.
2)把算法推广到任意N个队的情况.
3)讨论:数据应具备什么样的条件,用你的方法才能够排出诸队的名次.
对下表的说明:
1)12支球队依次记作T1,T2,…,T12.
2)符号X表示两队未曾比赛.
3)数字表示两队比赛的结果,如T3行与T8行交叉的数字表示:T3与T8比赛了2场;T3与T8的进球数之比为0:1和3:1.
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 T1 0:1 2:2 2:0 3:1 1:0 0:1 0:2 1:0 1:1
X 1:0 1:0 3:1 1:3 2:1 4:0 1:1 X X
0:0 0:2 1:0
T2 2:0 0:0 1:1 2:1 1:1 0:0 2:0 0:2
X 0:1 2:0 1:1 0:0 1:1 0:0 X X
1:3 0:0
T3 4:2 2:1 3:0 1:0 0:1 1:0 0:1
X 1:1 1:4 3:1 2:3 2:0 X X
0:0
T4 2:3 0:1 0:5 2:1 0:1 0:1
X 2:3 1:3 0:0 1:1 X X
T5 0:1 1:0 0:1
X X X X X 1:2 1:1
T6 X X X X X X
T7 1:0 2:1 3:1 3:1 2:0
X 2:0 3:0 3:0
0:0 1:0 2:2
T8 0:1 1:1 3:1 0:0
X 1:2 1:0
2:0 0:1
T9 3:0
X 1:0 1:0 1:0
0:0
T10 1:0 2:0
X
T11 1:1
X 1:2
T12 1:1
X
本题的表1给出的是我国12支足球队在1988-1989年全国甲级联赛中的成绩,要求通过建立数学模型,对各队进行排名次.
按照通常的理解,排名的目的是根据比赛成绩排出反映各队真实实力状况的一个顺序.为达到这一点,一个好的排名算法应满足下面一些基本要求:
(1)保序性;(2)稳定性;(3)能够处理不同场比赛的权重;(4)能够判断成绩表的可约性;(5)能够准确地进行补残;(6)容忍不一致现象;(7)对数
据可依赖程度给出较为精确的描述.
可以想象,各队的真实实力水平在成绩表中反映出来(见§3假定Ⅱ),所以根据排名目的,我们要求排名顺序与成绩表反映的各队实力水平的顺序是一致的,
这就是要求(1).
也就是说,如果a比b表现出色,a的名次就应排在b前面.但a比b出色不能只是由a对b这一场比赛所决定,必须参考a,b相对于其他队的成绩,像a平
c,c胜d,d平b这组比赛对a,b的相对表现是有影响的.为使一个算法满足保序
性,就必须充分考虑到将a,b连结起来的所有场比赛.下面的例子表明积分法布
满足保序性.
例1 a平c,c胜d,d平b,a平b.
在上述比赛中a表现应比b出色,但按积分法计算a,b都积2分.其原因就在于积分法没有把a平c,c胜d,d平b这组比赛中所体现的a,b实力对比情况考
虑进去;
要求(2)就是说成绩表小的变动不会对排名结果造成巨大影响.这是由于球队发挥水平存在正常波动而必须提供的,如果这种正常的小波动引起名次的巨
大变化,那么排名就不令人信服;
要求(3)使得不同场比赛在排名中的地位不同,这是因为在实际比赛中,往往会有的队不幸遇到较强的队而输掉.为了避免由于对手的强弱不同造成的不公
平,要求(3)是必须的.但现在的排名制度大都满足不了要求(3),以至于许多
时候“运气”对名次起了重要作用;
要求(4)—(7)是为了适应实际比赛中可能会出现在一些复杂情况而提出的.
首先是可能某两个队之间没有打比赛,我们称之为数据(成绩)残缺.对于两队成绩残缺,只能通过它们同其他队的比赛成绩来判断它们的实力比较.如果
残缺元素过多,就有可能导致参赛队分成两组,组与组之间没有比赛,称这种情况
为成绩表可约,这时显然是不应该排名次的.这样就有要求(4),(5);
其次是前后比赛成绩矛盾,比如说a胜b,b胜c,c平a,称这种情况为数据不一致.如果不一致的情况过于严重,说明比赛偶然因素太大,数据的可依赖程度太
低,应该考虑放弃比赛成绩.所以排名算法还应满足(6),(7).
本文使用的层次分析法的特征根方法已满足了上述要求,下面将在§2中给出具体算法.§3中给出算发满足上述要求的解释和论证.
§2 模型设计及其算法
一、基本假设和名词约定
假设Ⅰ参赛各队存在客观的真实实力(见名词约定1).这是任何一种排
名算法的基础.
假设Ⅱ 在每场比赛中体现出来的强队对弱队的表面实力对比是以它们的真实实力对比为中心的互相对立的正态分布.(见名词约定2)
这条假设保证了我们可以以比赛成绩为依据对球队的真实实力进行排名,另外它在很大程度上反映了球队水平发挥的不稳定性.
还应该指出的是,足球比赛不像田径比赛,虽然每次比赛的成绩是随机的,但其样品的观测值完全是已知的;而对球队比赛中体现的实力并不知道,从随机变量的若干样品去估计其均值是数理统计中已有不少现成方法的问题.足球比赛虽然也是抽样,却无法观测样本的准确值,每个球队的实力只能通过比赛去体现,这样足球比赛不是只有一个随机变量,而是有两个随机变量.我们并不知道样本的准确观测值,我们仅仅只知道是两个样品比较的相对结果,因此也就没有多少现成的方法可以借用.
本问题的难点在于:一是,虽然知道比赛结果是两队抽样后样品的相对比较后的结果,但是应该指出的是这一相对比较结果是十分粗糙的.尽管国际足联排名的国家与地区的球队有100多个,加上各国家的甲级队、地方队,球队上万个,可是比赛的结果相比之下却是少得可怜,从9:0狂胜到0:9的惨败,只有几十种结果,这几十种结果去反映上千个(至少会有上万个)球队之间的相对比较值(不足上百万个至少也有几万个吧),所以上述相对比较结果是十分粗糙的.本问题就是根据精度较差的数据去精确排序,难度当然可想而知.本问题的第二个难点是随机问题要能有较为准确的结论,应该有丰富的观测数据.根据大数定律频率代替概率可以得到较为可靠的结果.然而本题中不少球队之间连很少的样本也没有,根本没有进行过比赛,几乎有点“无米之炊”的味道了,因此如何充分利用这有限的少之又少的信息,就显得非常重要了.
本问题严格的数学描述如下:
为简化问题,假设每队在比赛中的实力体现服从正态分布,即有n 个总体
(,),1,2,...,,0,0,
i i i i i N i n μσμσ=>>,,1,2,...,,,
i j
x i j n i j x
=≠已知
(,i j x x 为不全的观测值),
要求对
i
μ从大到小进行排序.
模型假设
由上述分析知,这是一个相当复杂的问题,那么该从什么地方入手呢,采用什么样的数学工具呢?为了找到线索,应该简化问题,再对简化的问题进行分析以寻找突破点.为此先作如下假设(以后会逐步放松这些假设):
(1) 比赛是确定型的,或者每个队的方差均为0,抽样结果就是均值; (2) 比赛的结果是可以精确反映相对实力的,没有误差; (3) 比赛的场次是完全的,任意两个队之间都有比赛成绩.
我们的模型的主要部分是一个算法,模型的输入是一张成绩表,输出是关于
是否可约的判断、数据可依赖程度值和排名次的结果.
算法
(一)根据比赛成绩表构造判断矩阵A . i 从1到n,j 从1到n 的循环.
1)若i T 与j T 互胜场次相等,则
1
净胜球=0时令1ij
ji a a ==;跳出作下一步循环;
2
i T 净胜球多时以i T 净胜j
T 一场作后续处理.
2)若i T 净胜j T k 场且k>0,则
2,14;
19,
4.ij k k b k ≤≤⎧=⎨
>⎩
2ij i m T =
胜j
T 平均每场净胜球数;
1,2;
0,02;1,0.ij ij
ij ij m d m m ⎧>⎪
=≤≤⎨⎪-<⎩
3,1/ij ij ij ji ij a b d a a =+=
.
3)若i T 与j T 无比赛成绩,则0
ij
ji a a ==.
(二)检测A 的可约性,如果可约则输出可约信息后退出.
模型的建立与求解
一、初步的排名方案
目前足球比赛排名最通用的算法是总积分法、平均积分法.以下我们先从这两种方
法开始,通过分析其缺点而进一步改进. 【模型1 总积分法】
按2分制或3分制,即胜一场得2分或者3分,平一场得1分,输一场不得分.计算各队在所有比赛比赛中总的得分,按总积分的高低排出名次.如果两队积分相等,则看净胜球总数,多的名次靠前;如果净胜球数再相等,看进球总数,进球数多的名次靠前.再相等只有靠点球来决定.
点评: 优点----综合各场比赛的情况,也设法多利用一些结果信息. 缺点----(1)没有考虑对手的情况,胜第二名与胜第一名是同样看待的; (2)没有考虑胜负的程度,9:0猛灌与5:4险胜没有差别; (3)没有考虑到比赛场次的多少,显然多参加比赛是有利的.
结论:只适用于循环赛.
但是,在所给的数据表中,各队比赛场次有多有少,而按我们的假设,比赛场次的多少并不是由于该队在以前的比赛中的胜负所致.如果按照总积分法,则比赛场次少的队吃亏.为了克服缺点(3),很自然改为下面模型. 【模型
2 平均积分法】
将每个队的总积分除以该队参加比赛的场数,得出每场平均分.按各队平均积分的高低来排名. 但缺点(1)、(2)仍无法克服. 为克服缺点(1),自然的算法应该是:胜强队得分应该多一些,胜弱队得分应该少一些.用数学语言说就是给每个队赋予一个“强度系数”(i x 非负实数),来反映该队实力的强弱,强队的系数大,弱队的系数小.如果对手的强度系数为i x ,你胜了它,你的得分就用这个系数对基本得分(2分)加权,为2i x ⨯分.这就提出了特征向量法.
二、模型的建立与求解
【模型三 特征向量法】
为了叙述的方便,将第i 队记为T (1).i i N ≤≤要算出i T 的总的得分,先对
每个j T 算出i T 对j T 的各场比赛中按2分制的平均得分,记为.ij a 如果i T 与j T 没有进行比赛,就取0,ij
a =特别0ij a =(严格说来,对没有进行比赛的i
T ,j T 取0
ij
a =并不合理,这等于是判这两队各输一场,他们相对于其他队就吃亏了.对于这种情形的详细的讨论将在后面进行).
将i T 对j T 的上述得分ij a 用j T 的强弱系数j x 加权,则i T 对j T 的得分变为ij j j a x T 的总得分为: 1 (1)
i
i i iN N
y a x a x =++
这样算出的各队的总得分为1,...,N
y y 反映了各队的实力强弱的比,可以作为
排序的标准.
我们的目的是为了求出反映各队强弱的比向量12(,,...,)
T
N y y y y =,但为了得到
求y 又要用到反映各队实力强弱比的另一个向量12(,,...,).T
N x x x x =将x,y 都写成列
向量的形式,并记矩阵(),ij N N A
a ⨯=则以上的计算公式(1)可以写成矩阵形式
(2)y A x
=
由于x 未知,当然不能直接从这个公式算出来了,但既然x 与y 同样都是反映各队实力强弱比的向量,有理由认为他们所反映的比相等,即存在正实数λ,使得y
x
λ=,即A x
x
λ=,且是A 的特征根,x 是对应于λ的特征向量.
为方便起见,把矩阵A 称为得分矩阵,它的元素ij a 是T i j T 对的各场比赛的平均得分,是非负实数.按矩阵论的术语,A 是非负矩阵.按照矩阵论中关于非负矩阵Perron-Frobenius 定理,不可约的非负矩阵存在最大正实数根,对应于唯一(可相差常数倍)的实特征向量12(,,...,)
T
N x
x x x =,这里,说某个非负矩阵不可约是指
它不可能仅仅通过各行之间的置换和各列之间的置换化成至少有两个对角块的准对角阵.如果得分矩阵A 可约,就意味着N 支球队可以分成若干组(至少两组),所有的比赛只在同组的对之间举行.不同的组之间从未比赛过.在这样的情况下,显然不可能判定不同组队之间的水平的高低.因此,要能对各队排出名次,至少应要求得分矩阵是不可约的(如果将每个队用一个顶点表示,两队之间如果有比赛,就在相应的顶点之间连一条线,这样得到一个反映各队比赛情况的竞赛图.得分矩阵不可约,即相当于这个竞赛图是连同图).这时就可以由Perron-Frobenius 定理知道A 存在最大正实特征根及相应的特征向量x ,可以取这个x 作为反映各队实力比的向量. 在实际计算中,要求出矩阵的特征根需要解一元N 次方程,这一般是很困难的,更不要说还求特征向量了.而上述Perron-Frobenius 定理还指出:设(1,1, (1)
T
e
=是全由1组成的N 维列向量,A 是不可约的非负矩阵,λ是它的最大正实特征根,则极限
lim
m
m
x A e
x λ
→∞
=
存在,且就是A 对应于λ的特征向量.由此得出计算x 的使用算法如下.注意,我们所需要的是12(,,...,)
T
N x
x x x =的个分量的比值.而将个分量同时扩大或缩小相同的
倍数之后,其比值不变.为了使x 由这比值唯一决定,我们将x 的各分量同时除以它们的和
12...,
N x x x x =+++即用
12,,...,T
N x x x
x
x x x x ⎛⎫= ⎪⎝⎭代替
x
,化为12''...'1
N x x x +++=的情形,我们称满足条件
12''...'1
N x x x +++=的向量
12'(',',...,')
T
N x x x x =为“归一化向量”,称上述将非负向量12(,,...,)
T
N x
x x x =化成归
一向量12'(',',...,')
T
N x x x x =的过程为”归一化”.
先取(1,1, (1)
T
e
=的化归向量111(1)(
,,...,)T x n n n
=作为x 的初始值.换句话说,既
然一开始并不知道各队实力的强弱,不妨先认为各队实力相同.将
111(1)(
,,...,)T
x n n n
=代入(2)中,算出(1)(1)y A x =
作为y 的最初近似值(即先不加
权,直接计算i T 的总分12
i i iN
a a a ++作为(1)y 的第i 个分量). (1)y 当然比(1)x 更
好地反映了各队实力的强弱比,归一化后得到的(2)x 作为x 的更好近似值.再用这个(2)x 算出y 的更好近似值(2)(2)y A x =
.这个过程可以不断地进行下去,即在得到
x
的第m 个近似值()x m 之后,再由()x m 算出()y m ,将()y m 归一化后得到(1)
x m +,
作为x 的第1m +个近似值.由Perron-Frobenius 定理可知,这一迭代过程是收敛的,极限lim ()
x x
x m →∞
=存在且就是A 的对应于最大正实特征根的特征向量.实际计算
中,只要(1)()x m x m +-的各分量的绝对值都小于预先给定的误差允许值ε
,就可
以结束计算,取(1).x x m =+求A 的特征向量x 的这一算法,在计算数学中叫做“幂
方法”.
上面提出的特征向量法,是在建立了得分矩阵()ij N N
A
a ⨯=之后,求出A 的对应
于最大正实特征根的特征向量,作为代表各队水平比的向量,以它为根据来为各
队排名次.以下我们还需要提出进一步改进后的模型,它们都以求特征向量为基础,都可以叫做特征向量法.这些模型的区别是矩阵A 的构造法不同.我们将上述计算得分矩阵A 的特征向量的模型称为模型3'.
【模型3' 得分矩阵法】
矩阵()ij N N
A
a ⨯=的元素ij a 是i j T T 对各场比赛按二分制(或3分制)算出的平均
得分.当i j T T 与没有进行过比赛时取0.ij
a =
模型3'比模型1、2更合理.但仔细考虑还是有不合理之处:用来加权的向量
12(,,...,)
T
N x x x x =代表的是各队的水平比,而算出的向量12(,,...,)
T
N y
y y y A x
==的
各分量是各队的得分,严格地说来,向量12(,,...,)
T
N y y y y =代表的是各队水平的差
而不是比.如果某队屡战屡败,得分为0,它所对应的0.i
y =这当然说明它比别的
队都差,但不能说它与别队的水平比是0,或者说别队的水平是它的无穷倍.设想将记分制改为:胜一场得1分,平一场得0分,输一场得-1分,这也是合理的.这样就相当于将各队的得分各减去1分,y 的各分量同时减去1,它们互相的差不变,但比却变了.而代表各队水平的向量x 却不应因此而改变.由此看来,更合理的办法就是:用反映i j T T 与的水平的比的正实数ij ij b a 代替,用水平比矩阵()ij N N
B
b ⨯=
来代替得分矩阵.这样,有y
B x
=算出的向量y 就仍是水平比向量,它才是真正与
x
成正比,从而是特征向量.水平比矩阵B 与得分矩阵A 的一个显著区别是:所有
的矩阵元素ij b 都是正实数,不能为0.而且,既然ij b 是i j T T 与的水平比,而ji j i b T 是与T 的水平比,ij ji b b 与就应互为倒数.特别i 1(T 1ii
b =即与自己的水平比为).这样的矩阵
B
称为互反矩阵.B 的元素(1,)
ij b i j N ≤
≤是各队两两之间的水平比,而所求出的特
征向量x 就是各队的水平比.这正是“层次分析法”的主要思想.
现在的问题是:怎样具体算出水平比矩阵B 呢?显然应该根据i j T T 与比赛的成绩来算出ij b .很自然就会想到用,i j T T 相互比赛得分的比ij ji
a a 作为ij
b .这样ji ji
ij
a b a =
自
然就是ij b 的倒数了.但这也有个问题,假如0
ji
a =怎么办?我们可以认为,凡是有
资格参加比赛的队i T 都不是0,而是有一个起码水平0(a
a >是待定参数).将这个起
码分a 加上比赛得分ij a 作为i j T T 与的水平分.参数a 可以由体育界的人士根据经验来确定,它的大小在一定程度上反映比赛的成绩的可信度以及偶然因素起作用的机会塞维尔大小.这样就可以得到如下模型.
【模型4 参数法】
预先取定参数(0)
a a
>,设任意i j T T 对的各场比赛平均得分为ij a ,则取
ij ij ji
a a
b a a +=
+.所以的ji b 组成的水平比矩阵()ij N N
B
b ⨯=.再求出B 的对应于最大正实
特征根的特征向量作为反映各队水平的向量.
当i j T T 与未比赛时,两队水平比ij b 应该怎么选取呢?我们取.i ij j
x b x =
这样的取
法的正确性当然无可争议,但问题是,i j x x 未知,当i
j
≠时不能得到ij b 的确切值
(1.
i ii i
x i j x ==
=当时,b 有确切值)记
{1|}
i j J j N T T =≤≤与比赛过,
{1|}S j N j J =≤≤∉是与i T 未比赛过的队的编号的集合(包括
i 在内),则对任意
1,ij j N j J b ≤≤∈当时可以由比赛成绩算出,是已知的;而当.i ij j
x j S b x ∈=
时我们有
1
1
N
N
i i ij
j ij
j j ij
j i ij
j
j j J
j S
j J
j j
x y b
x b
x x b
x rx c
x x =∈∈∈==
=
+
=
+=
∑∑∑
∑∑
其中,||r
S =是与i T 未比赛过的队(包括i T 自己)的个数,则
,,0,ij ij b j J c r j i ∈⎧
⎪==⎨⎪∈≠⎩
当当当j S 且j i
可见,我们可以用矩阵()ij N N
C c ⨯=代替B 来进行计算.也就是说,如果共有r
个对(包括i T 自己)没有和i T 比赛过,则取ii b r
=,而当i j T T 与没有比赛(且i
j ≠)
时将i ,0.ij j b b 都取作再用幂方法求所得的矩阵特征向量即可.
上述模型4中的参数a 的选定带有主观随意性,不能令人满意.而且,a 是
否应因,i j T T 的不同而异,也是问题.更主要的问题是:计算ij b 时所用的得分ij a 是应用平均积分法求得的,其中有不理性.试想如果i j T T 与只赛了一场,i T 一战一胜得2分,平均得分2
ij
a =;假如i j T 对T 赛了三场,i T 三战三胜,共得6分,平均得
分2ij a 仍为.但实际上,三战三胜的难度显然比一战一胜大,而两者得分相同,这就不合理了.应该让三战三胜的得分比一战一胜的得分多,这才是合理的.为什么我们觉得三战三胜的得分比一战一胜大呢?假如i j T T 胜的概率是70%,则一战一胜的概率也是70%,很有可能实现;但三战三胜的概率就只有3
(70%)34.3%
=,很难
实现,如果实现了,就有理由认为胜j T 的概率不只70%,而有可能是370%89%
≈,
由此得出以下模型.
【模型5 概率法】
对任何两个队T T i j
、,客观存在着i j ij T T p 胜的概率.用ij p 和ji
p 的比ij ij ji
p b p =
作为
i j
T T 与的水平比,构造出水平比矩阵B ,算出各队的水平比向量.
以
ij ji
p p 作为i j T T 与的水平比,其合理性当然是毋庸置疑的.但同样显而易见的问
题是:怎样找出概率ij p 来呢?当然只能以两队的比赛成绩为依据,从成绩表中的数据算出ij p 来.从统计的额角度看,两队进行若干场比赛的结果,并不能绝对地反映两队水平的高低.但这些结果却是ij ji p p 和在一定程度上的实现.我们设法从这些结果反推出ij p 、ji p ,具体来说,根据i j T T 在对的各场比赛中的总得分(注意不是平均得分)来计算.我们的主要想法是:假如ij p 、ji p 预先给定了,则可以由它们分别算出i j T T 在对的各场比赛中总得分0分,1分,2分,…,的概率,这些概率都是ij ji p p 和的函数.假如i T 的实际总得分为m 分,就有理由认为i T 得m 分的概率比得其他分的概率都大(这就是极大似然估计的思想:认为实际发生了的事情比没有发生的事情的概率大).这样就可以得到关于ij ji p p 、的一些不等式,其中包含参数m .解这些不等式就得到ij ji p p 、对于m 的依赖关系,从而可以由已知数m (由比赛成绩表算出)决定未知的ij ji p p 、.
将这个想法付诸实施时,需要解决一个技术性问题:平均的概率怎么计
算?为此,我们将每场比赛抽象成由两个半场组成,没半场只有胜负,没有平局(注意:这只是为了分析问题而想象的两个半场,并不是实际比赛的上半场和下半场).在两个半场中一胜一负就是全场的平局,而胜两场和负两场分别是全场的胜和输.我们还规定在半场中胜得1分,负得0分,则全场的胜、负、平的得分就分别是2,1,0分,与原来的规定一致.将i j ij T T q 在半场中战胜的概率作为唯一一个独立参数,简记为,1.ji
q q q =-则由此可以算出i T T j
对进行多场比赛时i T 的各种
得分情况出现的概率.比如,在三场比赛中i T 如果得4分(可能是两胜或一胜两平),
那就是i T 在6个“半场”中胜四个半场,负两个半场,概率为442
6
C (1).q q -一般的,在n 场比赛中i T 得m 分的概率为C (1).m m n m
n
q q --如果i T 在对的n 场比赛中实际的总得分为
m
,则认为
i
T 得
m
分的概率比得其他分的概率都要大,即
n C (1)C (1)
,,.m
m
n m
k
k
n k
n q q q q k n k m --->-≤≤≠对所有的0
对给定的
m
值解出这些不等式,就得到由
m q 决定的的取值范围,结果如下表.
一场比赛 两场比赛 三场比赛 积分 q 积分 q
积分 q
2 1 0 0.671 0.330.67 00.33
4 3 2 1 0 0.81 0.60.8 0.40.6 0.20.4 00.2
6 5 4 3 2 1 0 0.861 0.710.86 0.510.71 0.430.5
7 0.290.43 0.140.29 00.14
这里,i T 的每一种得分值m 对应于q 的一个取值范围.将q 值到底定在这个范围里的什么位置呢?这个选择的自由仍留给体育界人士,按比赛结果的可信度来决定.
比如,可以选择在范围的上限或下限或中间.一个更为合理的处理方法是:根据净胜球数w 的多少来决定把q 值选在所得范围的高处或地处,也就是说,将q 设计成
w
的某个递增函数,其取值范围就是i T 的总得分m 所决定的q 的范围,随w 的增加
而趋近于这个范围的上界.q 值决定之后,就可以算出
ij ji
p p 、,从而算出
2
2
()
(1)
ij ij q
b b q =
-.也不妨直接取1ij
q b q
=
-.i j T T 与没有比赛的情形可以按模型4同样
的方法处理.
五、模型的检验与比较
前述5中方法得到的排名结果如下表: 名次 方案
1 2 3 4 5 6 7 8 9 10 11 12
(1)
(2)
(3)
(4)
(5)
7T 1T 3T 9T 2T 10T 8T 5T 4T 12T 6T 11T
7T 1T 3T 9T 2T 10T 8T 6T 5T 12T 11T 4T
7T 1T 3T 2T 10T 9T 8T 6T 5T 12T 11T 4T
7T 1T 3T 10T 2T 9T 8T 6T 5T 12T 11T 4T
7T 1T 3T 2T 10T 8T 9T 6T 5T 12T 4T 11T
注:(1)总积分法;(2)平均积分法;(3)得分矩阵法;(4)参数法;(5)概率法.
既然数学模型必须接受实际的检验,那么,为解决这个问题的前述各种模型孰优孰劣,用什么标准来检验呢?当然,直观上说,每战必胜的队一定排在第一,每战必败的队一定排在最后,无论用哪一个模型算出来的结果都是一样的,这检验不出模型的优劣。
而互有胜负的队孰优孰劣,各种模型的答案不一样,似乎又拿不出一个令人信服的客观标准来说明某个模型比其他模型更合理.下面我们采用计算机模拟的方法来比较各种模型的优劣.在计算机上随机地产生一个按元素大小顺序排列的向量12(,,...,).i
N t t t t =可以认为12,,...,N
t t t 代表N 支假想的球队
的实力强弱的比,决定他们相互比赛胜负的概率.在计算机上让这些球队按t 规定的胜负概率进行模拟比赛,任意两个球队比赛的场次可能是0,1,2,3场,产生出若干参差不齐的比赛成绩,如本题的数据情况那样.然后利用前面所说的各种模型,由这些比赛结果来对这些对进行排名.显然这里的排名结果是有标准答案的,那就是由最初的向量t 规定的排名顺序.由各种模型排除的名次与这个标准答案越接近,就说明这个模型越好,从而用这样的模型按本题的数据表排出的结果也就可以认为更正确.为了衡量各种模型排除的名次与预先规定的标准名次的偏差,定义偏差:
1
||N
i
i i erro r R
r ==
-∑
其中,i r 是第i 个队的标准名次,i R 是模拟给它排出的名次.为了减少计算机模拟中的随机性影响,使所得的结果更为可靠,可以进行多次模拟,计算每种模型所排出的名次的偏差的平均值,按照平均偏差的大小来判定模型的优劣.。