多元统计分析--因子分析资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
目录 上页 下页 返回 结束
§6.1.2 因子分析的基本理论及模型
由模型(6.7)及其假设前提知,公共因子F1, F2,, Fm 相互独立 且不可测,是在原始变量的表达式中都出现的因子。公共因子 的含义,必须结合实际问题的具体意义确定。1,2 ,, p叫做特
殊因子,是向量 X 的分量 X(i i 1,2,, p )所特有的因子。各
(一)Charles Spearman提出因子分析时用到的例子
在该例中Spearman研究了33名学生在古典语(C)、法语(F)、英语(E)、 数学(M)、判别(D)和音乐(Mu)六门考试成绩之间的相关性并得到如下 相关阵:
2020/11/8
5
目录 上页 下页 返回 结束
§6.1.2 因子分析的基本理论及模型
(3)ε (1, 2 ,, p )'与 F 相互独立,且 E(ε ) 0,ε 的协方差阵Σε
是对角方阵
121
cov(ε)
Σ
222
0
0
2pp
2020/11/8
10
目录 上页 下页 返回 结束
§6.1.2 因子分析的基本理论及模型
即 的各分量之间也是相互独立的。则模型
X 1 a11F1 a12 F2 a1m Fm 1
式: X i ai1F1 ai2 F2 aimFm ei
(6.4)
F1, F2 ,, Fm 彼此独立的公共因子,均值为0,方差为1。
ei 为特殊因子,与公共因子均不相关且均值为0。
ai1, ai2 ,, aim 为对第i 门科目考试成绩的因子载荷
7
目录 上页 下页 返回 结束
§6.1.2 因子分析的基本理论及模型
2020/11/8
9
目录 上页 下页 返回 结束
§6.1.2 因子分析的基本理论及模型
如果:
(1)X (X1, X 2 ,, xp )'是可观测随机向量,且均值向量 E(X) 0,协 方差矩阵cov(X) Σ,且协方差矩阵Σ与相关阵 R相等;
(2)F (F1, F2 ,, Fm )'(m p)是不可观测的变量,其均值向 量 E(F) 0 ,协方差矩阵 cov(F) I ,即向量 F 的各分量是相互独 立的;
特殊因子之间以及特殊因子与所有公共因子之间也都是相互独 立的。矩阵 A 中的元素 aij称为因子载荷,aij的绝对值大(| aij | 1), 表明 X i与 Fj的相依程度越大,或称公共因子 Fj 对于 X i的载荷量 越大,进行因子分析的目的之一,就是要求出各个因子载荷的 值。
的考试成绩都可以看作是由一个公共因子(可以认为是一 般智力)与一个特殊因子的和。
2020/11/8
6
目录 上页 下页 返回 结束
§6.1.2 因子分析的基本理论及模型
对Spearman的例子进行推广,假定每一门科目的考试
成绩都受到 m个公共因子的影响及一个特殊因子的影
响,于是(6.1)就变成了如下因子分析模型的一般形
所以当
X
i与X
在某一公共因子上的载荷均较大时,也就表
j
明了X i与X j的相关性较强。
2020/11/8
8
目录 上页 下页 返回 结束
§6.1.2 因子分析的基本理论及模型
(二)一般因子分析模型
下面我们给出更为一般的因子分析模型:设有n个样品,每个样
品观测 p个指标,这 p个指标之间有较强的相关性(要求个指标 相关性较强的理由是很明确的,只有相关性较强才能从原始变 量中提取出“公共”因子)。为了便于研究,并消除由于观测 量纲的差异及数量级不同所造成的影响,将样本观测数据进行 标准化处理,使标准化后的变量均值为0,方差为1。为方便把 原始变量及标准化后的变量向量均用X 表示,用F1, F2,, Fm (m p) 表示标准化的公共因子。
X i ai1F1 ai2 F2 aimFm ei
(6.4)
var( X i ) ai21 ai22 ai2m var(ei ) 1 (6.5)
共同度
剩余方差
模型(6.4)还可以很容易地得到如下X i与X j相关系数的关系式:
rij ai1a j1 ai2a j2 aima jm (6.6)
因子分析的思想始于1904年Charles Spearman对学 生考试成绩的研究。
2020/11/8
2
目录 上页 下页 返回 结束
§6.1 因子分析的基本理论
§6.1.1 因子分析的基本思想 §6.1.2 因子分析的基本理论及模型
2020/11/8
3
目录 上页 下页 返回 结束
§6.1.1 因子分析的基本思想
因子分析的基本思想是根据相关性大小把原 始变量分组,使得同组内的变量之间相关性较高, 而不同组的变量间的相关性则较低。每组变量代 表一个基本结构,并用一个不可观测的综合变量 表示,这个基本结构就称为公共因子。
数学
物理
英语
语文
2020/11/8
逻辑思维
语言能力
4
目录 上页 下页 返回 结束
§6.1.2 因子分析的基本理论及模型
第六章 因子分分析
•§6.1 因子分析的基本理论 •§6.2 因子载荷的求解 •§6.3 因子分析的步骤与逻辑框图 •§6.4 因子分析的上机实现
2020/11/8
1
目录 上页 下页 返回 结束
第六章 因子分分析
因子分析(factor analysis)是一种数据简化的技 术。它通过研究众多变量之间的内部依赖关系,探 求观测数据中的基本结构,并用少数几个假想变量 来表示其基本的数据结构。这几个假想变量能够反 映原来众多变量的主要信息。原始的变量是可观测 的显在变量,而假想变量是不可观测的潜在变量, 称为因子。
XLeabharlann Baidu
2
a21F1
a22 F2
a2m Fm
2
X p a p1F1 a p2 F2 a pm Fm p
(6.7)
称为因子模型,模型(6.7)式的矩阵形式为:
X AF ε
其中
a11 a12 a1m
A
a21
a22
a2
m
a p1
ap2
a
pm
因子载荷矩阵
(6.8)
2020/11/8
Spearman注意到上面相关阵中有一定的规律, Spearman指出每一科目的考试成绩都遵从以下形式:
X i ai F ei
(6.1)
式中,Xi为第 i 门科目标准化后的考试成绩,均值为0,
方差为1。F 为公共因子,对各科考试成绩均有影响,是
i 均的值特为殊因0,子方,差F为与1。eei 相i 为互仅独对立第。也门就科是目说考,试每成一绩门有科影目响