多元统计分析(A)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013-2014学年第一学期
经数班、计算、统计专业《多元统计分析》(课程)试卷
一、计算(每小题10+12+10分,共32分)
1、(共8+2=10分)设X ~),(2∑μN ,其中),(21'=X X X ,)0,0('=μ,⎥⎦
⎤
⎢
⎣⎡=∑1001 试求: 1) ⎪⎪⎪⎭
⎫
⎝⎛--++=⎪⎪⎪⎭⎫ ⎝⎛=2212132111X X X X X Y Y Y Y 的分布; 2)计算1Y 和2Y 的相关系数;。
2、(共4+8=12分)、设一个容量为n=4的随机样本取自二维正态总体),(2∑μN ,其
数据矩阵为⎥⎥⎥⎥⎦
⎤⎢⎢⎢
⎢⎣⎡=124113113
106X , 1)计算样本均值x ,样本自方差2
S ;2) 对]10,5[0
='μ计算统计量2
T 的值,并将其变为F 统计量,同时在显著水平为0.05下检验0μμ=;3)该检验结果可能犯什么错误。(19)05.0(,5.199)05.0(2,21,
2==F F )
3、(共10分)已知五个样品的之间的距离矩阵如下:D=⎥⎥⎥⎥⎥⎥⎦
⎤
⎢⎢⎢⎢⎢
⎢⎣⎡08210507360
112060543215
4321 使用最长距离法,1)写出聚类步骤;2)将五个对象分为3类。
二、(每题6+8+6+4分,共24分)为了对14个地区进行分类管理,对数据进行聚类分析和判别分析,以下是Spss计算出判别分析的结果,试着回答下面问题。
Test Results (表3-1)
Box's M 60
F Approx. 8
df1 6
df2 150
Sig. .000
Tests null hypothesis of equal population covariance matrices.
Wilks' Lambda(表3-2)
Unstandardized coefficients
Classification Function Coefficients(表3-4)
1、表3-1是做得什么检验,结果是什么?(显著水平0.05)(必须有原假设)
2、第一类地区和第二类地区是否有显著差异?(显著水平0.05,要求写出原假设);表3-2中的第三列的(chi-square值42)和第五列(sig值0.000)间的关系;
3、分别写出典型相关判别函数和bayes判别函数;若一个地区数据计算得到因子得分为F1=20,F2=5,利用bayes判别函数判别这个地区是第一个类还是第二类。
4、本题判别分析需要满足什么条件。
5、快速聚类分析的步骤。
四、(每题6+4+4+4+6分,共24分)一项调查提供了14个地区关于五个社会经济变量的指标X1=总人数(千),X2=受教育年限,X3=总就业人数(千),X4=保健服务业就业人数(千),X5=家庭收入(万美元),对此数据利用Spss进行因子分析得到以下结果:Component Matrix(a) (表4-1)
由以上表格回答以下问题:
1、若计算五个原始变量相关矩阵的五个特征值分别为:3,1.5,0.3,0.10,0.10,累计贡献率大于85%的因子,此题中我们提取几个因子?每个因子的贡献率是多少?累计贡献率是多少?
2、前两个特征值对应的特征向量为(0.21,0.32,0.31,0.36,-0.1)T,(0.05,0.44,-0.15,-0.19,0.52)T,求:1)前两个主成分;2)教育年限与第一个主成分相关系数的平方值。
3、利用旋转后的因子载荷矩阵,计算提取的因子解释了原始变量保健收入和家庭收入的比例。(共同度)
4、简述因子旋转的作用,并解释此题中所给出的两个因子的实际意义(指出两个因子分别与那几个原始变量相关)。
五、(每题6分,共18分)为了考虑总人数、受教育年限两个经济指标与总就业人数、保健服务就业人数、家庭收入三个经济指标之间的关系(数据同第四题),利用spss 得到以下结果:
Canonical Correlations
1 .984
2 .682
Test that remaining correlations are zero:
Wilk's Chi-SQ DF Sig.
1 .017 40.937 6.000 .000
2 .634 7.266 2.000 .054
Raw Canonical Coefficients for Set-1
v1 v2
X1 -.491 -.359
X2 .024 .949
Raw Canonical Coefficients for Set-2
w1 w2
Y1 -1.361 1.497
Y2 .186 -1.191
Y3 -.037 .376
Correlations Between the VAR Variables and Their Canonical Variables
V1 V2
x1 -0.34 0.94
x2 0.95 0.30
Correlations Between the WITH Variables and Their Canonical Variables
W1 W2
y1 0.49 -0.67
y2 -0.42 -0.39
y3 0.92 0.15
Correlations Between the VAR Variables and the Canonical Variables of the WITH Variables W1 W2
x1 -0.29 0.16
x2 0.80 0.05
Correlations Between the WITH Variables and the Canonical Variables of the VAR Variables V1 V2
y1 0.41 -0.11
y2 -0.36 -0.06
y3 0.78 0.02
根据上面结果,试回答以下问题:1、这两组经济变量间的典型相关系数分别是多少,是否显着相关(显著水平为0.05),为什么?
2、分别用原始变量表示出显著相关的典型相关变量;
3、计算第二组典型相关变量(v2)分别解释第一组原始变量和第二组原始变量的比例,即冗余度分析。