第5章 主成分分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章 主成分分析 一、填空题

1.主成分分析就是设法将原来众多 的指标,重新组合成一组新的 的综合指标来代替原来指标。

2.主成分分析的数学模型可简写为 ,该模型的系数要求 。

3.主成分分析中,利用 的大小来寻找主成分。

4.第k 个主成分k y 的贡献率为 ,前k 个主成分的累积贡献率为 。

5.确定主成分个数时,累积贡献率一般应达到 ,在spss 中,系统默认为 。

6.主成分的协方差矩阵为_________矩阵。

7.原始变量协方差矩阵的特征根的统计含义是________________。 8.原始数据经过标准化处理,转化为均值为__ __,方差为__ __的标准值,且其________矩阵与相关系数矩阵相等。

9.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为________。 10.SPSS 中主成分分析采用______________命令过程。 二、判断题

1.主成分分析就是设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标来代替原来指标。 ( )

2.主成分y 的协差阵为对角矩阵。 ( ) 3.p x x x ,,,21 的主成分就是以∑的特征向量为系数的一个组合,它们互不相关,其方差为

∑的特征根。 ( ) 4.原始变量i x 的信息提取率()m i V 表示这m 个主成分所能够解释第i 个原始变量变动的程度。

( )

5.在spss 中,可以直接进行主成分分析。 ( ) 6.主成分分析可用于筛选回归变量。 ( )

7.SPSS 中选取主成分的方法有两个:一种是根据特征根≥1来选取; 另一种是按照累积贡献率≥85%来选取。 ( ) 8.主成分方差的大小说明了该综合指标反映p 个原始观测变量综合变动程度的能力的大小。 ( )

9.主成分表达式的系数向量是协方差矩阵∑的特征向量。 ( )

10.主成分k y 与原始变量i x 的相关系数()i k x y ,ρ反映了第k 个公共因子对第i 个原始变量的解释程度。 ( ) 三、简答题

1.简述主成分的概念及几何意义。 2.主成分分析的基本思想是什么? 3.简述主成分分析的计算步骤。 4.主成分有哪些性质?

5.主成分主要应用在哪些方面? 四、计算题

1.假设3个变量1x 、2x 和3x 的协方差矩阵为:

⎥⎥⎥⎦

⎤⎢⎢⎢⎣⎡--=∑20

05

3

032 要求用此协差阵和相应的相关阵对这3个变量进行主成分分析,根据计算结果说明应选取多

少个主成分以代表原来的3个变量,并说明理由。

2.在一项研究中,测量了376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:

(2)计算前三个主成分各自的贡献率和累积贡献率。

(3)对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。

3.假设某商场棉鞋1x 、凉鞋2x 、布鞋3x 三种商品销售量的协方差矩阵如下:

⎥⎥⎥⎦

⎤⎢⎢⎢⎣⎡--=∑20

05

2

021 试求各主成分,并对各主成分的贡献率和各个原始观测变量的信息提取率进行讨论。

4.对某市15个大中型工业企业进行经济效益分析,经研究确定,从有关经济效益指标中选取7个指标作分析,即固定资产产值率(X1),固定资产利税率(X2),资金利润率(X3),资金利税率(X4),流动资金周转天数(X5),销售收入利税率(X6)和全员劳动生产率(X7)。数据资料如下:

根据下面SPSS 软件的输出信息,回答:

(1)这个数据的7个变量可以用几个综合变量(主成分)来表示? (2)这几个综合变量(主成分)包含有多少原来的信息? (3)写出这几个综合变量(主成分)的模型。 Total Variance Explained

Component Matrix(a)

a 2 components extracted.

五、证明题

主成分有三个重要性质: ⑴F 的协差阵为对角阵Λ; ⑵

1

1

p

p

ii

i i i σ

λ===∑∑;

⑶(),k i F X ρ=

试分别加以证明。 六、SPSS 操作题

1.下面是8个学生两门课程的成绩表:

(1)求出两个特征根及其对应的单位特征向量;

(2)求出主成分,并写出表达式;

(3)求出主成分的贡献率,并解释主成分的实际意义;

(4)求出两个主成分的样本协方差矩阵;

(5)第1个样本主成分与第2个变量样本之间的相关系数为多少

(6)求出8个学生第一主成分得分并进行排序

2.某中学十二名女生的身高x1,体重x2的数据如下:

(1)两个变量的协方差矩阵与相关系数阵;

(2)两个特征根及其对应的单位特征向量;

(3)主成分的表达式并解释各贡献率的大小意义和主成分的实际意义;(4)如果舍弃主成分y2,则哪一个原变量的信息损失量最大;

(5)画出全部样本的主成分散点图。

3.根据下列某地区11年数据

(2)求特征根及其对应的特征向量。

(3)求出主成分及每个主成分的方差贡献率;

(4)利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)。

相关文档
最新文档