主成分分析和因子分析习题答案
(完整word版)主成分分析练习题
主成分分析填空题1.主成分分析是通过适当的变量替换,使新变量成为原变量的___________,并寻求_________的一种方法。
2.主成分分析的基本思想是______________。
3.主成分的协方差矩阵为_________矩阵。
4.主成分表达式的系数向量是_______________的特征向量。
5.原始变量协方差矩阵的特征根的统计含义是________________。
6.原始数据经过标准化处理,转化为均值为____ ,方差为____ 的标准值,且其________矩阵与相关系数矩阵相等。
7.因子载荷量的统计含义是_____________________________。
8.样本主成分的总方差等于_____________。
9.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为________________。
10.SPSS 中主成分分析采用______________命令过程。
计算题1.设三个变量(x 1,x 2,x 3)的样本协方差矩阵为:2121002222222<<-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡r s rs r s s r s r s s试求主成分及每个主成分的方差贡献率。
解特征方程:=∑-I λ02.在一项对杨树的性状的研究中,测定了20株杨树树叶,每个叶片测定了四个变量:叶长(x 1),2/3处宽(x 2),1/3处宽(x 3),1/2处宽(x 4)。
这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:)7930.0,5513.0,2519.0,0612.0(007.0)1624.0,5589.0,7733.0,2516.0(049.0)0824.0,2695.0,0984.0,9544.0(024.1)5814.0,5577.0,5735.0,1485.0(920.244332211--='=--='=-='=---='=U U U U λλλλ(1) 写出四个主成分,计算它们的贡献率。
新疆财经大学多元统计分析题库及答案
新疆财经大学多元统计分析题库及答案一.简述题(每题10分)1.简述主成分分系方法和因子分析方法的异同?解答:不同之处:主成分的概念由KarlPearson在1901年提出;因子分析由CharlesSpearman于1904年首次提出的。
主成分分析中的主成分个数与原始变量个数是一样的.即有几个变量就有几个主成分.只不过最后我们确定了少数几个主成分而已。
而因子分析则需要事先确定要找几个成分.也称为因子(factor).然后将原始变量综合为少数的几个因子.以再现原始变量与因子之间的关系.一般来说.因子的个数会远远少于原始变量的个数。
因变量和因子个数的不一致.使得不仅在数学模型上.而且在实际求解过程中.因子分析和主成分分析都有着一定的区别.计算上因子分析更为复杂。
在对主成分和原始变量之间的关系进行描述时.如果主成分的直观意义比较模糊不易解释.主成分分析没有更好的改进方法;因子分析则额外提供了“因子旋转(factorrotation)”这样一个步骤.可以使分析结果尽可能达到易于解释且更为合理的目的。
相似之处:考察多个变量间相关性一种多元统计方法。
研究如何通过少数几个主成分(principalcomponent)来解释多个变量间的内部结构。
因子分析可以看作是主成分分析的推广和扩展.但它对问题的研究更深入、更细致一些。
实际上.主成分分析可以看作是因子分析的一个特例。
2.简述K-means聚类分析的基本步骤?解答:第1步:确定要分的类别数目K需要研究者自己确定在实际应用中.往往需要研究者根据实际问题反复尝试.得到不同的分类并进行比较.得出最后要分的类别数量。
第2步:确定K个类别的初始聚类中心要求在用于聚类的全部样本中.选择K个样本作为K个类别的初始聚类中心与确定类别数目一样.原始聚类中心的确定也需要研究者根据实际问题和经验来综合考虑.使用SPSS进行聚类时.也可以由系统自动指定初始聚类中心。
第3步:根据确定的K个初始聚类中心.依次计算每个样本到K 个聚类中心的距离欧氏距离.并根据距离最近的原则将所有的样本分到事先确定的K个类别中第4步:根据所分成的K个类别.计算出各类别中每个变量的均值.并以均值点作为新的K个类别中心。
指导应用多元统计分析资料报告习题解答_因子分析资料报告
第七章 因子分析7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.2 因子分析主要可应用于哪些方面? 答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。
目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。
具体来说,①因子分析可以用于分类。
如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。
即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。
对我们进一步研究与探讨指示方向。
在社会调查分析中十分常用。
③因子分析的另一个作用是用于时空分解。
如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。
7.3 简述因子模型中载荷矩阵A 的统计意义。
答:对于因子模型1122i i i ij j im m i X a F a F a F a F ε=++++++ 1,2,,i p =因子载荷阵为11121212221212(,,,)m m m p p pm a a a a a a A A A a a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦Ai X 与j F 的协方差为:1Cov(,)Cov(,)mi j ik k i j k X F a F F ε==+∑=1Cov(,)Cov(,)mikk j i j k aF F F ε=+∑=ij a若对i X 作标准化处理,=ij a ,因此 ij a 一方面表示i X 对j F 的依赖程度;另一方面也反映了变量iX 对公共因子jF 的相对重要性。
主成分分析和因子分析习题答案
60
60
18
90
78
78
59
72
66
19
80
100
83
53
73
70
20
58
51
67
79
91
85
21
72
89
88
77
80
83
22
64
55
50
68
68
65
23
77
89
80
73
75
70
24
72
68
77
83
92
79
25
72
67
61
92
92
88
26
73
72
70
88
86
79
27
77
81
62
85
90
87
28
61
.464
X4
.603
.498
X5
.573
.643
X6
.332
X7
.248
.610
X8
.147
.524
Extraction Method: Principal Component Analysis.
a 3 components extracted.
主成分方差贡献率表中前3个主成分的累计方差贡献率为%,虽然没有达到80%以上,但第四个主成分的特征根小于1。因此,按着主成分的选择要求,选择3个主成分比较合适。从因子载荷矩阵看,第一主成分主要解释了X2(净资产收益率)和X3(每股收益)两个变量;第二个主成分主要解释了X1(主营业务利润)、X4(总资产周转率)、X5(资产负债率)、X6(流动比率)和X8(资本积累率)这5个变量;而第三个主成分只解释了X7(主营业务收入增长率)一个变量。
应用多元统计分析习题解答 第七章讲解学习
应用多元统计分析习题解答第七章第七章 因子分析7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.2 因子分析主要可应用于哪些方面?答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。
目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。
具体来说,①因子分析可以用于分类。
如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。
即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。
对我们进一步研究与探讨指示方向。
在社会调查分析中十分常用。
③因子分析的另一个作用是用于时空分解。
如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。
7.3 简述因子模型中载荷矩阵A 的统计意义。
答:对于因子模型1122i i i ij j im m i X a F a F a F a F ε=++++++ 1,2,,i p =因子载荷阵为11121212221212(,,,)m m m p p pm a a a aa a A A A a a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦Ai X 与j F 的协方差为:1Cov(,)Cov(,)mi j ik k i j k X F a F F ε==+∑=1Cov(,)Cov(,)mik k j i j k a F F F ε=+∑=ij a若对iX作标准化处理,=ija,因此ija一方面表示iX对jF的依赖程度;另一方面也反映了变量i X对公共因子jF的相对重要性。
应用多元统计分析习题解答_因子分析
第七章 因子分析7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.2 因子分析主要可应用于哪些方面?答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。
目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。
具体来说,①因子分析可以用于分类。
如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。
即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。
对我们进一步研究与探讨指示方向。
在社会调查分析中十分常用。
③因子分析的另一个作用是用于时空分解。
如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。
7.3 简述因子模型中载荷矩阵A 的统计意义。
答:对于因子模型1122i i i ij j im m i X a F a F a F a F ε=++++++ 1,2,,i p =因子载荷阵为11121212221212(,,,)m m m p p pm a a a a a a A A A a a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦Ai X 与j F 的协方差为:1Cov(,)Cov(,)mi j ik k i j k X F a F F ε==+∑=1Cov(,)Cov(,)mikk j i j k aF F F ε=+∑=ij a若对i X 作标准化处理,=ij a ,因此 ij a 一方面表示i X 对j F 的依赖程度;另一方面也反映了变量iX对公共因子jF的相对重要性。
主成分分析和因子分析
SPSS操作:分析——描述统计——描述
第4题
朗莱曾分析美国联邦政府雇员人数(Y)与国民总产出 隐含平减指数(X1),国民总产出(X2),失业人数( X3),武装力量人数(X4),14岁及以上非慈善机构人 口数(X5),时间变量(X6)等的关系,数据如下。他 利用了美国47—62年数据(如下)做多元线性回归。现 请你重新做下朗莱的工作,判断有无多重共线性,如有 ,试用主成分法回归分析消除多重共线性。
计算各企业经济效益的综合得分
由综合得分可排出企业经济效益的名次。
九章第2题
在企业经济效益的评价中,涉及的指标往往很多.为了简化系 统结构,抓住经济效益评价中的主要问题,可利用主成分分析法进 行综合评价。在对我国部分省,市,自治区独立核算的工业企业的 经济效益评价中,涉及到9项指标,用主成分分析进行综合评价。
第一主成分的方差为3.686,第二主成分的 方差为1.237 根据成分矩阵得到两个主成分的线性方程:
计算两个主成分对应的值:
两个主成分对应值如下表:
做标准化的因变量与主成分的线性回归:
原始变量均值和标准差如下表:
第5题
经济工作者希望通过国内总产值x1,存储量x2, 消费总量x3,去预测进口总额y,为此收集了某地区 共计十一年的有关数据,利用主成分估计建立回归 方程。
第一主成分得分
2.858915 3.756416 -0.54939 -1.73507 -3.08695 0.320264
大数据CDA考试(习题卷1)
大数据CDA考试(习题卷1)第1部分:单项选择题,共47题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]在因子分析中,为了帮助解释因子,我们可以使用( )A)因子得分B)因子负载C)因子旋转D)主成分分析答案:C解析:在进行因子分析时,我们可以通过因子旋转来使得最终得到的因子更具有解释性。
2.[单选题]关于Kafka 磁盘容量不足的告警,对于可能的原因以下分析不正确的是?A)业务规划不合理导致数据分配不 均,使部分磁盘达到使用率上限B)数据保存时间配置过长,数据累计 达到磁盘使用率上限C)Broker节点故障导致D)用于存储Kafka 数据的磁盘配置 (如磁盘数目磁盘大小等),无法满 足当前业务数据流量,导致磁盘使 用率达到上限答案:C解析:3.[单选题]基于规则的分类器有Aprior、随机森林,还有()。
A)C4.5B)KNNC)Naive BayesD)ANN答案:A解析:4.[单选题]“将总体中的所有单位( )按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位”,这种抽样方法称为( )A)多阶段抽样(systematicB)分层随机抽样(stratifiedC)集群抽样(clusterD)系统抽样(systematic答案:D解析:根据定义。
5.[单选题]参照以下信息选择能够正确创建orderinfo表的语句A)createB)createC)createD)create答案:A解析:本题考查SQL语句中建表、字段约束条件以及字段数据类型相关知识。
其中建表语句结构为create table 表名(…),字段的约束条件为非空=not null、唯一=unique、主键=primary key。
定长字符串类型为char,可变长字符串类型为varchar,小数类型通常使用float,但“金额”这类对数据精度要求较高的情况,应考虑使用decimal,整数类型为int。
应用多元统计分析习题解答_因子分析
第七章 因子分析7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.2 因子分析主要可应用于哪些方面? 答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。
目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。
具体来说,①因子分析可以用于分类。
如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。
即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。
对我们进一步研究与探讨指示方向。
在社会调查分析中十分常用。
③因子分析的另一个作用是用于时空分解。
如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。
7.3 简述因子模型中载荷矩阵A 的统计意义。
答:对于因子模型1122i i i ij j im m i X a F a F a F a F ε=++++++ 1,2,,i p =因子载荷阵为11121212221212(,,,)m m m p p pm a a a a a a A A A a a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦Ai X 与j F 的协方差为:1Cov(,)Cov(,)mi j ik k i j k X F a F F ε==+∑=1Cov(,)Cov(,)mikk j i j k aF F F ε=+∑=ij a若对i X 作标准化处理,=ij a ,因此 ij a 一方面表示i X 对j F 的依赖程度;另一方面也反映了变量iX 对公共因子jF 的相对重要性。
应用多元统计分析课后习题答案详解北大高惠璇第八章习题解答
所以
Q(m)
i 1 j 1 2 ij
p
p
j m1
(
2 j i 1
p
2 2 i
)
j m 1
,
2 j
16
p
第八章 因子分析
8-5 试比较主成分分析和因子分析的 (1) 主成分分析不能作为一个模型来描述,它只 是通常的变量变换,而因子分析需要构造因子模型; (2) 主成分分析中主成分的个数和变量个数p相 同,它是将一组具有相关关系的变量变换为一组互 不相关的变量(注意应用主成分分析解决实际问题 时,一般只选取前m(m<p)个主成分),而因子分析的 目的是要用尽可能少的公共因子,以便构造一个结 构简单的因子模型;
(2) ( AA D) 1 D 1 D 1 A( I AD 1 A) 1 A1 D 1 ; (3) A( AA D) 1 ( I m AD 1 A) 1 AD 1. 解:利用分块矩阵求逆公式求以下分块矩阵的逆:
记B221 I m AD A,
17
第八章 因子分析
(3) 主成分分析是将主成分表示为原变量的线 性组合,而因子分析是将原始变量表示为公因子 和特殊因子的线性组合,用假设的公因子来“解 释”相关阵的内部依赖关系. 这两种分析方法又有一定的联系.当估计方法 采用主成分法,因子载荷阵A与主成分的系数相 差一个倍数;因子得分与主成分得分也仅相差一 个常数.这种情况下可把因子分析看成主成分分 析的推广和发展. 这两种方法都是降维的统计方法,它们都可用 来对样品或变量进行分类.
18
2 11 2 21 2 3 2 31
a 1
2 31 2 3
a11a21 0.63 a11a31 0.45 a31a21 0.35
医学统计学(高级篇)智慧树知到答案章节测试2023年山西医科大学
第一章测试1.四组均数比较的方差分析,其备择假设H1应为()。
A:至少有两个样本均数不等B:C:D:各总体均数不全相等E:任两个总体均数间有差别答案:D2.随机区组设计的方差分析中,ν配伍等于()。
A:ν总-ν处理-ν误差B:ν总-ν处理+ν误差C:ν总-ν误差D:ν总+ν处理+ν误差E:ν总-ν处理答案:A3.当自由度(ν1, ν2)及检验水准α都相同时,方差分析的界值比方差齐性检验的界值()。
A:小B:不一定C:大D:相等答案:A4.完全随机设计方差分析的检验假设是()。
A:各处理组样本均数相等B:各处理组样本均数不相等C:各处理组总体均数相等D:各处理组总体均数不相等答案:C5.关于方差分析,下列说法正确的是()。
A:只要是定量资料,均能选用方差分析B:方差分析只能用于多组定量资料均数的比较C:只要各组例数相等,定量资料均数的比较可采用随机区组设计方差分析D:方差分析的基本思想是将数据均方与自由度进行分解E:方差分析可适用于多组正态且等方差的定量资料均数比较答案:E6.当组数等于2时,对于同一资料,方差分析结果与t检验结果相比()。
A:方差分析结果更为准确B:t检验结果更为准确C:两者结果可能出现矛盾D:完全等价且答案:D7.完全随机设计、随机区组设计的SS和及自由度各分解为几部分()。
A:2,2B:2,3C:2,4D:3,3答案:B8.完全随机设计方差分析中,组间均方主要反映()。
A:处理因素的作用B:系统误差的影响C:抽样误差大小D:n个数据的离散程度E:随机误差的影响答案:A9.三组以上某实验室指标观测数据服从正态分布且满足参数检验的应用条件。
任两组分别进行多次t检验代替方差分析,将会()。
A:使均数相差更为显著B:明显增大犯I型错误的概率C:使结论更加具体D:明显增大犯II型错误的概率E:使均数的代表性更好答案:B10.在完全随机设计的方差分析中,必然有()。
A:MS组间> MS组内B:MS总 = MS组间 + MS组内C:SS总= SS组间 + SS组内D:MS组间< MS组内E:SS组内< SS组间答案:C第二章测试1.2×2析因试验设计表述正确的是()。
主成分和因子分析
主成分和因子分析一、问题介绍为评估马里地区(西非)斯卡索地区自然资源是否可以支持扩大的食物需求的安全线,一项研究得到一组调查数据,总共调查了n=20个农夫,得到了关于9个变量的观测,变量罗列如下:X:Family(家中人口数)1X:DistRd(到最近大路的距离(km))2X:Cotton(2000年种植棉花的公顷数)3X:Maize(2000年种植玉米的公顷数)4X:Sorg(2000年种植高粱的公顷数)5X: Millet(2000年种植黍子的公顷数)6X:Bull(饲养的骟牛或其他骟家畜的总头数)7X:Cattle(奶牛总数)8X:Goats(山羊总数)9数据见表2-1:表2-1 马里家庭农场数据X1 X2 X3 X4 X5 X6 X7 X8 X91 12 80 1.5 13 0.25 2 0 12 54 8 6 4 0 1 6 32 53 11 13 0.5 1 0 0 0 0 04 21 13 2 2.5 1 0 1 0 55 61 30 3 5 0 0 4 21 06 20 70 0 2 3 0 2 0 37 29 35 1.5 2 0 0 0 0 08 29 35 2 3 2 0 0 0 09 57 9 5 5 0 0 4 5 210 23 33 2 2 1 0 2 1 711 20 0 1.5 1 3 0 1 6 012 27 41 1.1 0.25 1.5 1.5 0 3 113 18 500 2 1 1.5 0.5 1 0 014 30 19 2 2 4 1 2 0 515 77 18 8 4 6 4 6 8 616 21 500 5 1 3 4 1 0 517 13 100 0.5 1.5 0 1 0 0 418 24 100 2 3 0 0.5 3 14 1019 29 90 2 1.5 1.5 1.5 2 0 220 57 90 10 7 0 1.5 7 8 7二、主成分分析1、表2-2,是描述统计表,显示了各个变量的均值、标准误差和参与计算的样品数。
应用多元统计分析章节后习题答案详解北大高惠璇八章节习题解答
第八章 因子分析
m1 lm 1 0 m 1 BB ( m1 lm1 ,, p l p ) p l 0 p p
故
j m 1
因
p
2 j
tr(BB BB ) tr(BB BB) tr[(E D)( E D)] tr[E E E D DE DD] Q(m) 0 0 ( i2 ) 2
(
i 1 2 2 2 2
p
2 2 i
)
2 2 3
Q(1) ( ) [( ) ( ) ( ) ] 2 2 0.6795 0.3672 [0.2331 0.3091 0.4943 ] 0.5966 0.3943 0.2023 2 2 2 2 2 Q(2) 3 [( 12 ) 2 ( 2 ) ( 3 ) ] 2 2 2 2 0.3672 [0.2007 0.1452 0.01131 ] 0.1348 0.06149 0.07331
18
(2) ( AA D) 1 D 1 D 1 A( I AD 1 A) 1 A1 D 1 ; (3) A( AA D) 1 ( I m AD 1 A) 1 AD 1. 解:利用分块矩阵求逆公式求以下分块矩阵的逆:
记B221 I m AD A,
1 1 1 21 A B112 B221 A D B
I m AB
A B
1 221
B
22
把B22· 1和B11· 2式代入以上各式,可得:
( D AA) 1 D 1 D 1 A( I m AD 1 A) 1 AD 1 A( D AA) 1 ( I m AD 1 A) 1 AD 1 I m A( D AA) 1 A ( I m AD 1 A) 1 (3) ( 2)
应用多元统计分析习题解答第七章
第七章因子分析7.1试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、 简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇, 将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标 变换到变异程度大的方向上为止,突出数据变异的方向, 归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因 子模型。
7.2 因子分析主要可应用于哪些方面?答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。
目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。
具体来说,①因子 分析可以用于分类。
如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对 空气的优劣予以分类等等②因子分析可以用于探索潜在因素。
即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。
对我们进一步研究与探讨指示方向。
在社会调查分析中十分常用。
③因子分析的另一个作用是用于时空分解。
如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判 断各自的影响和变化规律。
7.3简述因子模型、一 m 卜中载荷矩阵A 的统计意义。
答:对于因子模型X i =a i 1F 1 - mF ?a j F j I" a m F m•;ii =1,2,Hl , pX i 与F j 的协方差为:mCov(X i , F j ) =Cov(' a ik F k °F j )k=im= Cov(' a ik F k ,F j ) Cov(「F j )k d= a ij若对X i 作标准化处理,=a j ,因此a ij 一方面表示X i 对F j 的依赖程度;另一方面也反映了 变量X i 对公共因子F j的相对重要性。
主成分分析与因子分析法
ei
=1,即
ei2j 1 ,
j 1
其中 表示eij 向量 的e第i j个分量,也就是说
ei 为单位向量。
(三)计算主成分贡献率及累计贡献率
主成分分析是把 p 个随机变量的总方差分解为 p 个不相 关随机变量的方差之和1 + 2 +…+ P,则总方差中属于 第 i 个主成分(被第 i 个主成分所解释)的比例为
•• • • •
标准化后的分数, 右图为其散点图, 椭圆倾斜为45度。
•• •
• ••
•
• ••
•
• •
•
•
•
• •••
• •• •
•• •
• ••
x1
••
如果将坐标轴 X1 和 X2 旋转45º ,那么点在新坐标 系中的坐标(Y1,Y2)与原坐标(X1,X2)有如下的 关系:
Y1和Y2均是X1 和 X2 的线性组合
成
分zi与变量xj之间的相关系数
因子分析法 (Factor Analysis,FA)
因子分析法概述 因子分析法的模型 附:主成分分析与因子分析的区别
(一)因子分析法概述
因子分析法与主成分分析法都基于统计分析法,但两 者有较大的区别。主成分分析是通过坐标变换提取主 成分,也就是将一组具有相关性的变量变换为一组独 立的变量,将主成分表示为原始观察变量的线性组合。 而因子分析法是要构造因子模型,将原始观察变量分 解为因子的线性组合。因此因子分析法是主成分分析 法的发展。
在新坐标系中, 可以发现:虽然
x 2
散点图的形状没
有改变,但新的
•• • • •
随机变量 Y1 和 Y2 已经不再相 关。而且大部分 点沿 Y1 轴散开,
因子分析和主成分分析
贝财内容实验步骤:1. 建立数据文件。
定义变量名:分别为XI、X2、X3、X4、X5、X6、X7,按顺序输入相应数值,建立数据文件,保存为“生化检验”。
2. 选择菜单“分析一降维一因子分析”,弹岀“因子分析”对话框。
在对话框左侧的变量列表中选变量XI至X7,进入“变量”框,如图1。
3. 单击“描述”按钮,弹出“因子分析:描述统计”对话框,在“统计量”中选“单变量描述性”项,输出各变量的均数与标准差,“在相关矩阵”栏内选“系数”,计算相关系数矩阵,并选“KMO和Bartlett 的球型度检验”项,对相关系数矩阵进行统汁学检验,如图2。
统计量0单娈囲苗述性(50原始分析结果(!)相矣矩阵 呦系数©逆模型迥)□显著性水平(§)鬥再生® 「:徑鰹” ”.輕紳.””””””/@:i3衬6扁拆SS 龛画Si •闵• ••• ••••••••••• •••• ••••••••••••••• •••• ••••••••••• •••• •••• ••••••••••• •••• ••••••••••••••• •[继续J 〔取湧];帮助I图24. 单击“抽取”按钮,弹出“因子分析:抽取”对话框,选用“主成分”方法提取因子,如图3“时因子分析描述◎)•••] 抽时因子分祈:描述统计^s(y ):旋转①…] :得分(§)•••I :确定][粘贴(巳][重置迟)]帮助]图35. 单击“旋转”按钮,弹出“因子分析:旋转”对话框,在“方法”栏中选择“最大方差”进行因子正交旋转,如图4。
6. 单击“得分”按钮,弹出“因子分析:得分”对话框,选择“回归”项估计因子得分系数,如图5。
7. 单击“确泄”,得到输出结果。
图4㈱因子分折:因子得分实验结果(1)考察原有变量是否适合进行因子分析表1表1显示原有变量的相关系数矩阵,可以看岀大部分的相关系数都比较髙,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
因子分析考试题及答案
因子分析考试题及答案一、选择题(每题2分,共20分)1. 因子分析中,公共因子是指:A. 只与一个变量相关的因子B. 与多个变量相关的因子C. 只与一个变量相关的特殊因子D. 与多个变量相关的特殊因子答案:B2. 因子分析中,特殊因子是指:A. 只与一个变量相关的因子B. 与多个变量相关的因子C. 只与一个变量相关的公共因子D. 与多个变量相关的公共因子答案:A3. 因子分析中,变量的共同度是指:A. 变量方差中可以由公共因子解释的部分B. 变量方差中不能由公共因子解释的部分C. 变量方差中可以由特殊因子解释的部分D. 变量方差中不能由特殊因子解释的部分答案:A4. 因子分析中,因子载荷矩阵中的值表示:A. 变量与因子之间的相关系数B. 变量与因子之间的回归系数C. 变量与因子之间的相关系数的平方D. 变量与因子之间的回归系数的平方答案:A5. 因子分析中,旋转的目的是什么?A. 增加因子的解释性B. 减少因子的解释性C. 提高因子的稳定性D. 降低因子的稳定性答案:A6. 因子分析中,主成分分析(PCA)是一种:A. 描述性统计方法B. 推断性统计方法C. 探索性统计方法D. 预测性统计方法答案:C7. 因子分析中,最大似然法(ML)是一种:A. 描述性统计方法B. 推断性统计方法C. 探索性统计方法D. 预测性统计方法答案:B8. 因子分析中,Kaiser-Meyer-Olkin(KMO)测度是用来评估:A. 变量的共同度B. 变量的独立性C. 变量的偏度D. 变量的球形度答案:D9. 因子分析中,Bartlett的球形度检验是用来评估:A. 变量的共同度B. 变量的独立性C. 变量的偏度D. 变量的球形度答案:D10. 因子分析中,提取因子的数目通常由以下哪个指标决定:A. 特征值大于1的规则B. 累积方差解释率C. 因子载荷矩阵D. 因子旋转结果答案:A二、简答题(每题10分,共40分)1. 简述因子分析的基本步骤。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
60
60
18
90
78
78
59
72
66
19
80
100
83
53
73
70
20
58
51
67
79
91
85
21
72
89
88
77
80
83
22
64
55
50
68
68
65
23
77
89
80
73
75
70
24
72
68
77
83
92
79
25
72
67
61
92
92
88
26
73
72
70
88
86
79
27
77
81
62
85
90
87
28
61
X2
X3
X4
X5
X6
X7
X8
海油工程
中海油服
中国石化
中国石油
广聚能源
鲁润股份
海越股份
国际实业
靖远煤电
美锦能源
神火股份
金牛能源
煤气化
西山煤电
露天煤业
郑州煤电
兰花科创
黑化股份
兖州煤业
国阳新能
盘江股份
上海能源
山西焦化
恒源煤电
开滦股份
大同煤业
中国神华
潞安环能
中煤能源
国投新集
详细答案:
SPSS输出的各主成分分析结果如下表:
第11章 主成分分析和因子分析
教材习题答案
下表是2007年30家能源类上市公司的有关经营数据。其中:X1=主营业务利润;X2=净资产收益率;X3=每股收益;X4=总资产周转率;X5=资产负债率;X6=流动比率;X7=主营业务收入增长率;X8=资本积累率。进行主成分分析并确定主成分的数量。
股票简称
X1
% of Variance
Cumulative %
Total
% of Variance
Cumulative %
1
2
3
.403
4
.325
5
.204
6
.134
Extraction Method: Principal Component Analysis.
主成分载荷矩阵
Component Matrix(a)
81
87
66
50
61
66
48
98
100
96
详细答案:
SPSS输出的主成分分析结果如下表:
主成分的方差贡献率和累计方差贡献率
Total Variance Explained
Component
Initial Eigenvalues
Extraction Sums of Squared Loadings
Total
主成分的方差贡献率和累计方差贡献率
Total Variance Explained
Component
Initial Eigenvalues
Extraction Sums of Squared Loadings
Total
% of Variance
Cumulative %
Total
% of Variance
根据题的数据:(1)检验该数据是否适合进行因子分析(2)进行因子分析,并对30家上市公司的因子综合得分进行排序。详细答案:
SPSS输出的因子分析结果如下表:
(1)KMO检验和Bartlett球度检验表如下:
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy.
如果事先确定选择两个因子来代表习题中50名学生的六门课程成绩,试对该数据进行因子分析,得到的两个因子有没有合理的直观意义
详细答案:
SPSS输出的因子分析结果如下表:
旋转后的因子载荷矩阵
Rotated Component Matrix(a)
Component
1
2
数学
.821
物理
.895
化学
.737
语文
Rotation Method: Varimax with Kaiser Normalization.
a Rotation converged in 5 iterations.
因子1与X2(净资产收益率)和X3(每股收益)的载荷系数较大,这两个变量主要与上市公司盈利能力有关,因此可命名为“盈利能力”。因子2 与X5(资产负债率)、X6(流动比率)、X8(资本积累率)这3个变量的载荷系数较大,这三个变量主要涉及企业的偿债能力,因此可命名为“偿债能力因子”。因子3与X1(主营业务利润)、 X4(总资产周转率)、X7(主营业务收入增长率)这三个变量的载荷系数较大,这三个变量分别涉及了盈利能力、资产管理水平、企业成长能力等,因此,这个因子的命名比较困难。
65
81
98
94
95
29
79
95
83
89
89
79
30
81
90
79
73
85
80
31
85
77
75
52
73
59
32
68
85
70
84
89
86
33
85
91
95
63
76
66
34
91
85
100
70
65
76
35
74
74
84
61
80
69
36
88
100
85
49
71
66
37
63
82
66
89
78
80
38
87
84
100
74
81
.464
X4
.603
.498
X5
.573
.643
X6
.332
X7
.248
.610
X8
.147
.524
Extraction Method: Principal Component Analysis.
a 3 components extracted.
主成分方差贡献率表中前3个主成分的累计方差贡献率为%,虽然没有达到80%以上,但第四个主成分的特征根小于1。因此,按着主成分的选择要求,选择3个主成分比较合适。从因子载荷矩阵看,第一主成分主要解释了X2(净资产收益率)和X3(每股收益)两个变量;第二个主成分主要解释了X1(主营业务利润)、X4(总资产周转率)、X5(资产负债率)、X6(流动比率)和X8(资本积累率)这5个变量;而第三个主成分只解释了X7(主营业务收入增长率)一个变量。
76
39
81
98
84
57
65
69
40
64
79
64
72
76
74
41
60
51
60
78
74
76
42
75
84
76
65
76
73
43
59
75
81
82
77
73
44
64
59
56
71
79
67
45
64
61
49
100
99
95
46
56
48
61
85
82
80
47
62
45
67
78
76
82
48
86
78
92
87
87
77
49
66
72
79
Rotated Component Matrix(a)
Component
1
2
3
X1
.404
X2
.912
.094
X3
.940
.106
X4
.126
.850
X5
.264
.848
X6
.025
X7
.065
.707
X8
.575
.090
Extraction Method: Principal Component Analysis.
各公所的因子综合得分和排名如下:
对下表中的50名学生成绩进行主成分分析,可以选择几个综合变量来代表这些学生的六门课程成绩
学生代码
数学
物理
化学
语文
历史
英语
1
71
64
94
52
61
52
2
78
96
81
80
89
76
3
69
56
67
75
94
80
4
77
90
80
68
66
60
5
84
67
75
60
70
63
6
62
67
83
71
.554
Bartlett's Test of Sphericity
Approx. Chi-Square
df
28
Sig.
.000
从检验表中可见,Bartlett球度检验统计量为。检验的值接近0。表明8个变量之间有较强的相关关系。而KMO统计量为,小于。进行因子分析的效果不一定很好。