应用多元统计分析报告习的题目解答_因子分析报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 因子分析
7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.2 因子分析主要可应用于哪些方面? 答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。
目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。
具体来说,①因子分析可以用于分类。
如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。
即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。
对我们进一步研究与探讨指示方向。
在社会调查分析中十分常用。
③因子分析的另一个作用是用于时空分解。
如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。
7.3 简述因子模型中载荷矩阵A 的统计意义。
答:对于因子模型
1122i i i ij j im m i X a F a F a F a F ε=++
++
++ 1,2,
,i p =
因子载荷阵为1112
121
22212
12
(,,
,)m m m p p pm a a a a a a A A A a a a ⎡⎤⎢⎥⎢
⎥==⎢⎥⎢⎥⎢⎥
⎣
⎦A
i X 与j F 的协方差为:
1Cov(,)Cov(,)m
i j ik k i j k X F a F F ε==+∑
=1
Cov(
,)Cov(,)m
ik
k j i j k a
F F F ε=+∑
=ij a
若对i X 作标准化处理,=ij a ,因此 ij a 一方面表示i X 对j F 的依赖程度;另一方面也反映了
变量
i X 对公共因子j F 的相对重要性。
变量共同度221
1,2,,m
i
ij
j h a
i p ==
=∑
22
21122()()()()()i i i im m i D X a D F a D F a D F D ε=++
++22i i h σ=+ 说明变量i X 的方差由
两部分组成:第一部分为共同度2i h ,它描述了全部公共因子对变量i X 的总方差所作的贡献,反映了公共因子对变量i X 的影响程度。
第二部分为特殊因子i ε对变量i X 的方差的贡献,通常称为个性方差。
而公共因子j F 对X 的贡献2
21
1,2,,p
j
ij
i g a
j m ==
=∑
表示同一公共因子j F 对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。
7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么? 答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。
但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。
这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。
这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。
最大方差旋转法是一种正交旋转的方法,其基本思路为: ①
A
其中令*
*
*()
,
/ij p m
ij ij
i a d a h ⨯===A A Γ 2
1
1p j ij i d d p ==∑
*A 的第j 列元素平方的相对方差可定义为2
21
1()p
j ij j i V d d p ==-∑
②12m V V V V =+++
最大方差旋转法就是选择正交矩阵Γ,使得矩阵*A 所有m 个列元素平方的相对方差之和达到最大。
7.5 试分析因子分析模型与线性回归模型的区别与联系。
答:因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。
而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系, 用函数关系式表达出来。
因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。
即
1122i i i im m i X a F a F a F ε=++++,(1,2,,
i p =) 该模型可用矩阵表示为:=+X AF ε
而回归分析模型中多元线性回归方程模型为:
其中是常数项,是偏回归系数,是残差。
因子模型满足:
(1)m p ≤; (2)(,)0Cov =F ε,即公共因子与特殊因子是不相关的;
(3)101
()0
1F m D ⎡⎤⎢⎥
⎢
⎥===⎢⎥⎢⎥⎣⎦
D F I ,即各个公共因子不相关且方差为1; (4)212
2
20()0p D εσσσ⎡⎤
⎢⎥
⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦
D ε,即各个特殊因子不相关,方差不要求相等。
而回归分析模型满足(1)正态性:随机误差(即残差)e 服从均值为 0,方差为σ2
的正
态分布;(2)等方差:对于所有的自变量x ,残差e 的条件方差为σ2
,且σ为常数;(3)独立性:在给定自变量x 的条件下,残差e 的条件期望值为0(本假设又称零均值假设);(4)无自相关性:各随机误差项e 互不相关。
两种模型的联系在于都是线性的。
因子分析的过程就是一种线性变换。
7.6 设某客观现象可用X =()’来描述, 在因子分析时,从约相
关阵出发计算出特征值为
由于,所以找前两个特征值所对应的公共因子即可, 又知对应的正则化特征向量分别为(0.707,-0.316,0.632)’及(0,0.899,0.4470)’,要求:
(1)计算因子载荷矩阵A ,并建立因子模型。
(2)计算共同度。
(3)计算第一公因子对X的“贡献”。
解:(1)根据题意,A=
=
建立因子模型为
(2)
(3)因为是从约相关阵计算的特征值,所以公共因子对X的“贡献”为。
7.7 利用因子分析方法分析下列30个学生成绩的因子构成,并分析各个学生较适合学文科还是
解:令数学成绩为X1,物理为X2,化学为X3,语文为X4,历史为X5,英语为X1,用spss 分析学生成绩的因子构成的步骤如下:
1. 在SPSS窗口中选择Analyze→Data Reduction→Factor,调出因子分析主界面,并将六个变量移入Variables框中。
图7.1 因子分析主界面
2. 点击Descriptives按钮,展开相应对话框,见图7.2。
选择Initial solution复选项。
这个选项给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比。
单击Continue按钮,返回主界面。
图7.2 Descriptives子对话框
3. 点击Extraction按钮,设置因子提取的选项,见图7.3。
在Method下拉列表中选择因子提取的方法,SPSS提供了七种提取方法可供选择,一般选择默认选项,即“主成分法”。
在Analyze栏中指定用于提取因子的分析矩阵,分别为相关矩阵和协方差矩阵。
在Display 栏中指定与因子提取有关的输出项,如未旋转的因子载荷阵和因子的碎石图。
在Extract栏中指定因子提取的数目,有两种设置方法:一种是在Eigenvalues over后的框中设置提取的因子对应的特征值的范围,系统默认值为1,即要求提取那些特征值大于1的因子;第二种设置方法是直接在Number of factors后的矩形框中输入要求提取的公因子的数目。
这里我们均选择系统默认选项,单击Continue按钮,返回主界面。
图7.3 Extraction子对话框
4.点击Rotation按钮,设置因子旋转的方法。
这里选择Varimax(方差最大旋转),并选择Display栏中的Rotated solution复选框,在输出窗口中显示旋转后的因子载荷阵。
单击Continue按钮,返回主界面。
图7.4 Rotation子对话框
5.点击Scores按钮,设置因子得分的选项。
选中Save as variables复选框,将因子得分作为新变量保存在数据文件中。
选中Display factor score coefficient matrix复选框,这样在结果输出窗口中会给出因子得分系数矩阵。
单击Continue按钮返回主界面。
图7.5 Scores子对话框
6. 单击OK按钮,运行因子分析过程。
结果分析:
表7.1 旋转前因子载荷阵表7.2 旋转后因子载荷阵
从表7.1中可以看出,每个因子在不同原始变量上的载荷没有明显的差别,为了便于对因
子进行命名,需要对因子载荷阵进行旋转,得表7.2。
经过旋转后的载荷系数已经明显地两极分化了。
第一个公共因子在后三个指标上有较大载荷,说明这三个指标有较强的相关性,可以归为一类,属于文科学习能力的指标;第二个公共因子在前三个指标上有较大载荷,同样可以归为一类,这三个指标同属于理科学习能力的指标。
根据表7.3易得:
6432.05378.04332.03137.02085.01064.01X X X X X X F +++++= 6169.05073.04014.03484.02400.01439.02X X X X X X F +++++=
表7.3 因子得分系数矩阵
将每个学生的六门成绩分别代入F1、F2,比较两者的大小,F1大的适合学文,F2大的适合学理。
计算结果为学号是1、16、24的学生适合学文,其余均适合学理。
7.8 某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。
下表是抽查欧洲某汽车市场7个品牌不同
解:令价格为X1,发动机为X2,功率为X3,轴距为X4,宽为X5,长为X6,轴距为X7,燃料容量为X8,燃料效率为X9,用SPSS 找简化的指标系统的具体步骤同7.7。
此时在系统默认情况下提取因子,结果是只抽取了一个成分,从方差贡献来看,前三个成分贡献了90.9%,因此重复因子分析过程,并在第三步Extraction 子对话框中的Number of factors 后的矩形框中输入3,即为要提取的公因子的数目。
因子分析结果如下:
表7.4 旋转后的因子得分系数矩阵
其简化了指标体系为1F 、2F 、3F ,从旋转后的因子得分系数矩阵得:
9071.08186.07036.06599.05354.04305.03060.02015.01399.01X X X X X X X X X F --++++---= 9082.08221.07291.06100.05195.04344.03700.02525.01289.02X X X X X X X X X F +---+-++= 9239.08651.07494.06332.05338.04241.03409.02278.01342.03X X X X X X X X X F --+--+--=
7.9 根据人均 GDP 、第三产业从业人员占全部从业人员的比重、第三产业增加值占GDP 的比重、人均铺装道路面积、万人拥有公共汽电车、万人拥有医生、百人拥有电话机数、万人拥有高等学校在校学生人数、人均居住面积、百人拥有公共图书馆藏书、人均绿地面积等十一项指标对目前我国省会城市和计划单列市的城市化进行因子分析,并利用因子得分对其进行排序和
评价。
(数据可从《中国统计年鉴》查获) (略)
7.10 根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用因子分析法对其进行排序和分类,并与聚类分析的结果进行比较。
解:对其进行因子分析的步骤与7.7相同,结果如下:
表7.5 特征根与方差解释分析表
由表7.5可知,提取的两个因子方差贡献达到了82.75%。
表7.6 旋转后的因子得分系数矩阵
由上面的因子得分矩阵可知:
9233.08086.07057.06248.05219.04258.03167.02100.01093.01X X X X X X X X X F ++-++++--= 9
008.08169.07282.06022.05017.04097.03103.02316.01315.02X X X X X X X X X F -++-+--+=与主成分分析中计算综合得分同理,用2121F F F ∑∑+=
λ
λ
λλ进行加权,得排序:
实用标准文案
精彩文档
根据F的最终数值进行分类,由于没有给出具体的分类标准,分类具有一定的主观性,只要合理即可。
聚类分析的结果见5.11,可将两者进行比较。