多元统计历年试题计算题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2005年试题
一、设对六个样品X1,X2,X3,X4,X5,X6,测试了六项指标,计算样品之间的相关系数如下表,试用最长距离法对这六个样品进行聚类,并画出谱系图。
答案:该题目有问题,无法进行相关解答。
二、类G1和G2的Fisher线性判别函数为:U=0.3X1-0.45X2-0.06X3,且U1=0.3332,U2=0.0665,N1=7,N2=9,U*=(N1U1+U2N2)/(N1+N2)计算临界值,判别新样品X0=(2.5,0.95,0.9)T属于哪一类?
解:将U1,U2,N1,N2带入U*=(N1U1+U2N2)/(N1+N2)得出临界值为0.1832,
据判别准则P80有:由于U(X0)=0.271,当U1>U2时,U(X0)>U*,所以新样品属于类G1。
某一年试题
一、5个样品X1,X2,X3,X4,X5,两两之间的距离矩阵,试用最长距离法做聚类并画出谱系图。
解:由于D14的距离最短,所以X1,X4聚为一类为新类X6;
有X2,X5聚为新类X7;
最后,X3与X8聚为一类。
二、4个变量X1,X2,X3,X4两两之间的相关系数矩阵,试用模糊聚类法作聚类并画出
谱系图。
解:记上述矩阵为R,现在要获得模糊等价矩阵,首先计算出R*R=R2
有:
继续有R2*R2=R4,为:
所以R4为模糊等价矩阵,其值λ由大到小依次为1>0.92>0.87>0.75,
有λ=1时,为四类{X1},{X2},{X3},{X4};
有λ=0.92时,为四类{X1,X2},{X3},{X4};
有λ=0.87时,为四类{X1,X2,X3},{X4};
有λ=0.75时,为四类{X1,X2,X3,X4}。
三、设三个总体G1、G2、G3的分布分别为:N(2,0.52),N(0,22),N(3,12).试问样品X=2.5应该判为那一个总体?(1)距离判别法;(2)按照贝叶斯判别准则(等先验概率和等误判损失)。
解:(1)距离判别准则:
D2(X,Gi)=(X-µi)TΣi-1(X-µi),当D2(X,Gi)=min{(X-µi)TΣi(x-µi)}时,X属于Gi。
有:D2(X,G1)=(X-2)T(0.25)-1(X-2)=1
D2(X,G2)=(X-0)T(4)-1(X-0)=1.6
D2(X,G3)=(X-3)T(1)-1(X-3)=0.25
当X=2.5时,可以得出X=2.5属于第三类。
(2)贝叶斯判别
D i Q(X)=-1/2In|Σi|-1/2(X-µi)TΣi-1(X-µi)+In qi
如果X属于Gi,则max{Dj Q(X)}(1< 有:D1Q(X)=0.193,D2Q(X)=-1.48,D3Q(X)=-0.125 当X=2.5时,可以得出X=2.5属于第一类。 2008年试题 一、年龄和体重如下表,试求最优三分割。 解:二分割为: S8(2;1)=d11+d28=0.7; S8(2;2)=d12+d38=8.2; S8(2;3)=d13+d48=8.2; S8(2;4)=d14+d58=8.3; S8(2;5)=d15+d68=8.5; S8(2;6)=d16+d78=8.6; S8(2;7)=d17+d88=8; 最优二分割为:{1}、{2,3,4,5,6,7,8,} 三分割为: J=2,S2(2;1)=8.2; J=3,S3(2;1)=0.7; J=4,S4(2;1)=0.9; J=5,S5(2;1)=1.1; J=6,S6(2;1)=1.2; J=7,S7(2;1)=0.6; 最优三分割为:{1}、{2,3,4,5,6,7}、{8} 六、设三元总体X的协方差Σ=δ2 有0<ρ<1. (1)试证第一主成分Z1=1/√3(X1+X2+X3) (2)试求第一主成分贡献率。 解:(1)根据协方差求得特征值为: Λ1=1+2ρ,Λ2=Λ3=1-ρ, 当Λ1=1+2ρ时,第一主成分为Z1=1/√3(X1+X2+X3)。 (2)第一主成分贡献率为=(1+2ρ)/.(1+2ρ+1-ρ1-ρ)=(1+2ρ)/3 (4)下面矩阵给出5个样品之间的距离,试利用最短距离法,类平均距离法聚类,画出谱系 图。 解:最短距离法: X1、X4聚为新类X6,有: X2,X5聚为新类X7,有: X6,X7聚为新类X8,最后是X3与X8聚为一类。 (2)类平均距离法 根据题目,可以得出以下距离: D212=16,D213=36,D214=1,D215=36,D223=81,D224=49,D225=9,D234=100,D235=25,D245=64. 那么X1、X4聚为新类X6, D226=1/2D212+1/2D224=32.5,D236=68,D256=50, D223=81,D225=9,D235=25.那么X2,X5聚为新类X7, D236=68,D237=1/2D223+1/2D235=53, D267=1/4D212+1/4D215+1/4D224+1/4D245=41.25. 那么X6,X7聚为新类X8,最后X3与X8聚为新类。 根据最短距离法和类平均距离法,我们可以看出得出的结果是一致的。 2009年试题 一.上面几套试卷中均已经给出答案,此处不再赘述。 二.有三个总体G1、G2、G3,概率密度为f1(X),f2(X),f3(X),假定各总体的先验概率相等,误判损失如下:C(2|1)=10,C(1|2)=100,C(3|1)=50,C(1|3)=200,C(2|3)=80, C(3|2)=120,现有一样品X0,使f1(X0)=0.1,f2(X0)=0.8,f3(X0)=1.5,根据贝叶斯判别准则,应该将样品归判为哪个总体? 解:据hj(X0)=Σfi(X)*qi*C(j|i)(1<=i<=3) 那么,h1(X0)=380;h2(X0)=121;h3(X0)=101. 得出,样品应该归判为第三个总体。 2010年试卷 二、一元正态总体G1(0,0.25),G2(0,4),假定两个总体的先验概率相等,误判损失如