多元统计分析(A)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2013-2014学年第一学期

经数班、计算、统计专业《多元统计分析》(课程)试卷

一、计算(每小题10+12+10分,共32分)

1、(共8+2=10分)设X ~),(2∑μN ,其中),(21'=X X X ,)0,0('=μ,⎥⎦

⎣⎡=∑1001 试求: 1) ⎪⎪⎪⎭

⎝⎛--++=⎪⎪⎪⎭⎫ ⎝⎛=2212132111X X X X X Y Y Y Y 的分布; 2)计算1Y 和2Y 的相关系数;。

2、(共4+8=12分)、设一个容量为n=4的随机样本取自二维正态总体),(2∑μN ,其

数据矩阵为⎥⎥⎥⎥⎦

⎤⎢⎢⎢

⎢⎣⎡=124113113

106X , 1)计算样本均值x ,样本自方差2

S ;2) 对]10,5[0

='μ计算统计量2

T 的值,并将其变为F 统计量,同时在显著水平为0.05下检验0μμ=;3)该检验结果可能犯什么错误。(19)05.0(,5.199)05.0(2,21,

2==F F )

3、(共10分)已知五个样品的之间的距离矩阵如下:D=⎥⎥⎥⎥⎥⎥⎦

⎢⎢⎢⎢⎢

⎢⎣⎡08210507360

112060543215

4321 使用最长距离法,1)写出聚类步骤;2)将五个对象分为3类。

二、(每题6+8+6+4分,共24分)为了对14个地区进行分类管理,对数据进行聚类分析和判别分析,以下是Spss计算出判别分析的结果,试着回答下面问题。

Test Results (表3-1)

Box's M 60

F Approx. 8

df1 6

df2 150

Sig. .000

Tests null hypothesis of equal population covariance matrices.

Wilks' Lambda(表3-2)

Unstandardized coefficients

Classification Function Coefficients(表3-4)

1、表3-1是做得什么检验,结果是什么?(显著水平0.05)(必须有原假设)

2、第一类地区和第二类地区是否有显著差异?(显著水平0.05,要求写出原假设);表3-2中的第三列的(chi-square值42)和第五列(sig值0.000)间的关系;

3、分别写出典型相关判别函数和bayes判别函数;若一个地区数据计算得到因子得分为F1=20,F2=5,利用bayes判别函数判别这个地区是第一个类还是第二类。

4、本题判别分析需要满足什么条件。

5、快速聚类分析的步骤。

四、(每题6+4+4+4+6分,共24分)一项调查提供了14个地区关于五个社会经济变量的指标X1=总人数(千),X2=受教育年限,X3=总就业人数(千),X4=保健服务业就业人数(千),X5=家庭收入(万美元),对此数据利用Spss进行因子分析得到以下结果:Component Matrix(a) (表4-1)

由以上表格回答以下问题:

1、若计算五个原始变量相关矩阵的五个特征值分别为:3,1.5,0.3,0.10,0.10,累计贡献率大于85%的因子,此题中我们提取几个因子?每个因子的贡献率是多少?累计贡献率是多少?

2、前两个特征值对应的特征向量为(0.21,0.32,0.31,0.36,-0.1)T,(0.05,0.44,-0.15,-0.19,0.52)T,求:1)前两个主成分;2)教育年限与第一个主成分相关系数的平方值。

3、利用旋转后的因子载荷矩阵,计算提取的因子解释了原始变量保健收入和家庭收入的比例。(共同度)

4、简述因子旋转的作用,并解释此题中所给出的两个因子的实际意义(指出两个因子分别与那几个原始变量相关)。

五、(每题6分,共18分)为了考虑总人数、受教育年限两个经济指标与总就业人数、保健服务就业人数、家庭收入三个经济指标之间的关系(数据同第四题),利用spss 得到以下结果:

Canonical Correlations

1 .984

2 .682

Test that remaining correlations are zero:

Wilk's Chi-SQ DF Sig.

1 .017 40.937 6.000 .000

2 .634 7.266 2.000 .054

Raw Canonical Coefficients for Set-1

v1 v2

X1 -.491 -.359

X2 .024 .949

Raw Canonical Coefficients for Set-2

w1 w2

Y1 -1.361 1.497

Y2 .186 -1.191

Y3 -.037 .376

Correlations Between the VAR Variables and Their Canonical Variables

V1 V2

x1 -0.34 0.94

x2 0.95 0.30

Correlations Between the WITH Variables and Their Canonical Variables

W1 W2

y1 0.49 -0.67

y2 -0.42 -0.39

y3 0.92 0.15

Correlations Between the VAR Variables and the Canonical Variables of the WITH Variables W1 W2

x1 -0.29 0.16

x2 0.80 0.05

Correlations Between the WITH Variables and the Canonical Variables of the VAR Variables V1 V2

y1 0.41 -0.11

y2 -0.36 -0.06

y3 0.78 0.02

根据上面结果,试回答以下问题:1、这两组经济变量间的典型相关系数分别是多少,是否显着相关(显著水平为0.05),为什么?

2、分别用原始变量表示出显著相关的典型相关变量;

3、计算第二组典型相关变量(v2)分别解释第一组原始变量和第二组原始变量的比例,即冗余度分析。

相关文档
最新文档