第章主成分分析报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 主成分分析
一、填空题
1.主成分分析就是设法将原来众多 的指标,重新组合成一组新的 的综合指标来代替原来指标。
2.主成分分析的数学模型可简写为 ,该模型的系数要
求 。
3.主成分分析中,利用 的大小来寻找主成分。
4.第k 个主成分k y 的贡献率为 ,前k 个主成分的累积贡献率
为 。
5.确定主成分个数时,累积贡献率一般应达到 ,在spss 中,系统默认
为 。
6.主成分的协方差矩阵为_________矩阵。
7.原始变量协方差矩阵的特征根的统计含义是________________。
8.原始数据经过标准化处理,转化为均值为__ __,方差为__ __的标准值,且其________
矩阵与相关系数矩阵相等。
9.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为________。
10.SPSS 中主成分分析采用______________命令过程。
二、判断题
1.主成分分析就是设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关
的综合指标来代替原来指标。 ( )
2.主成分y 的协差阵为对角矩阵。 ( )
3.p x x x ,,,21 的主成分就是以∑的特征向量为系数的一个组合,它们互不相关,其方差为
∑的特征根。 ( )
4.原始变量i x 的信息提取率()m i V 表示这m 个主成分所能够解释第i 个原始变量变动的程度。
( )
5.在spss 中,可以直接进行主成分分析。 ( )
6.主成分分析可用于筛选回归变量。 ( )
7.SPSS 中选取主成分的方法有两个:一种是根据特征根≥1来选取; 另一种是按照累积贡
献率≥85%来选取。 ( )
8.主成分方差的大小说明了该综合指标反映p 个原始观测变量综合变动程度的能力的大小。 ( )
9.主成分表达式的系数向量是协方差矩阵∑的特征向量。 ( )
10.主成分k y 与原始变量i x 的相关系数()i k x y ,ρ反映了第k 个公共因子对第i 个原始变量
的解释程度。 ( )
三、简答题
1.简述主成分的概念及几何意义。
2.主成分分析的基本思想是什么?
3.简述主成分分析的计算步骤。
4.主成分有哪些性质?
5.主成分主要应用在哪些方面?
四、计算题
1.假设3个变量1x 、2x 和3x 的协方差矩阵为:
⎥⎥⎥⎦
⎤⎢⎢⎢⎣⎡--=∑200053
032
要求用此协差阵和相应的相关阵对这3个变量进行主成分分析,根据计算结果说明应选取多少个主成分以代表原来的3个变量,并说明理由。
(2)计算前三个主成分各自的贡献率和累积贡献率。
(3)对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。
3.假设某商场棉鞋1x 、凉鞋2x 、布鞋3x 三种商品销售量的协方差矩阵如下:
⎥⎥⎥⎦
⎤⎢⎢⎢⎣⎡--=∑200052
021
试求各主成分,并对各主成分的贡献率和各个原始观测变量的信息提取率进行讨论。
4.对某市15个大中型工业企业进行经济效益分析,经研究确定,从有关经济效益指标中选取7个指标作分析,即固定资产产值率(X1),固定资产利税率(X2),资金利润率(X3),资金利税率(X4),流动资金周转天数(X5),销售收入利税率(X6)和全员劳动生产率(X7)。数据资料如下:
根据下面SPSS 软件的输出信息,回答:
(1)这个数据的7个变量可以用几个综合变量(主成分)来表示?
(2)这几个综合变量(主成分)包含有多少原来的信息?
(3)写出这几个综合变量(主成分)的模型。
Total Variance Explained
Component Matrix(a)
a 2 components extracted.
五、证明题
主成分有三个重要性质:
⑴F 的协差阵为对角阵Λ;
⑵11p p
ii i i i σ
λ===∑∑; ⑶(),k i F X ρ=
试分别加以证明。
六、SPSS 操作题
1.下面是8个学生两门课程的成绩表:
(1)求出两个特征根及其对应的单位特征向量;
(2)求出主成分,并写出表达式;
(3)求出主成分的贡献率,并解释主成分的实际意义;
(4)求出两个主成分的样本协方差矩阵;
(5)第1个样本主成分与第2个变量样本之间的相关系数为多少
(6)求出8个学生第一主成分得分并进行排序
2.某中学十二名女生的身高x1,体重x2的数据如下:
(1)两个变量的协方差矩阵与相关系数阵;
(2)两个特征根及其对应的单位特征向量;
(3)主成分的表达式并解释各贡献率的大小意义和主成分的实际意义;(4)如果舍弃主成分y2,则哪一个原变量的信息损失量最大;
(5)画出全部样本的主成分散点图。
3.根据下列某地区11年数据
(2)求特征根及其对应的特征向量。
(3)求出主成分及每个主成分的方差贡献率;
(4)利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)。