数据分析因子分析 ppt课件
合集下载
因子分析-PPT
小或增大。所以“方差极大” 旋转就是使载荷值按照列向0,1 两极分化,同时也包含着按行向 两极分化。
因子 得分
因子分析
什么 叫因 子分
析
定义解释
因子分析就是主成分分析得推广和发展, 她就是把具有复杂关系得多个变量(或样 品)综合为少数几个因子,并给出原始变量 与综合因子之间得相关关系得多元统计 分析方法
种类
R型因子分析(对变量进行因子分析) Q型因子分析(对样品进行因子分析)
应用意义
应用范围
表示得形式不同。
因子 分析 得统 计意
义
假定因子模型中,各个变量、 公共因子、特殊因子都已经进 行了标准化处理
因子载荷矩阵得统计意义
变量共同度得统计意义
公因子方差贡献得统计意义
因子 载荷 矩阵 得估 计方
法
方法一:流
应用类型
基本思想 数学模型
因子 分析 得模
型
主成 分分 析与 因子 分析 得区
别
主成分分析就是一种数学变换 (正交变换)不能称为一种数学 模型;而因子分析需要构造数 学模型。
主成分得个数与原始数据个数 相等,就是把原始变量变换成 为相互独立得新得变量;而因 子个数一般要求小于原始数据 个数,目得在于得到一个结构 简单得因子模型。
可以互相讨论下,但要小声点
因子 旋转
含义:
因子旋转就是根据因子载荷矩阵 得不唯一性,用一个正交矩阵右乘 因子载荷矩阵,实行旋转(由线性代 数,一次正交变换,对应坐标系得一 次旋转),使旋转后得因子载荷矩阵 结构简化,以便对公共因子进行合 理得解释。
所谓结构简化就就是使得每个变 量仅在一个公共因子上有较大得 载荷,而在其她得公共因子上得载 荷比较小。
常用得方法有:
因子 得分
因子分析
什么 叫因 子分
析
定义解释
因子分析就是主成分分析得推广和发展, 她就是把具有复杂关系得多个变量(或样 品)综合为少数几个因子,并给出原始变量 与综合因子之间得相关关系得多元统计 分析方法
种类
R型因子分析(对变量进行因子分析) Q型因子分析(对样品进行因子分析)
应用意义
应用范围
表示得形式不同。
因子 分析 得统 计意
义
假定因子模型中,各个变量、 公共因子、特殊因子都已经进 行了标准化处理
因子载荷矩阵得统计意义
变量共同度得统计意义
公因子方差贡献得统计意义
因子 载荷 矩阵 得估 计方
法
方法一:流
应用类型
基本思想 数学模型
因子 分析 得模
型
主成 分分 析与 因子 分析 得区
别
主成分分析就是一种数学变换 (正交变换)不能称为一种数学 模型;而因子分析需要构造数 学模型。
主成分得个数与原始数据个数 相等,就是把原始变量变换成 为相互独立得新得变量;而因 子个数一般要求小于原始数据 个数,目得在于得到一个结构 简单得因子模型。
可以互相讨论下,但要小声点
因子 旋转
含义:
因子旋转就是根据因子载荷矩阵 得不唯一性,用一个正交矩阵右乘 因子载荷矩阵,实行旋转(由线性代 数,一次正交变换,对应坐标系得一 次旋转),使旋转后得因子载荷矩阵 结构简化,以便对公共因子进行合 理得解释。
所谓结构简化就就是使得每个变 量仅在一个公共因子上有较大得 载荷,而在其她得公共因子上得载 荷比较小。
常用得方法有:
因子分析 PPT课件
同时假定随机向量 X 满足以下模型: X 1 a11F1 a12 F2 a1m Fm 1 X a F a F a F 2 12 1 22 2 2m m 2 X p a p1 F1 a p 2 F2 a pm Fm P 则称模型(3.1)为正交因子模型。
设 X ( X1 , X 2 ,
E( F ) 0 , Cov( F ) I m (即 F 的各分量方差为 1,且互不相关) 。又设 (1, 2 , , p ) 与 F 互不相关,且
2 E ( ) 0 , Cov( ) diag(12 ,2 , 2 , p )。
之因子分析
SPSS软件
• 因子分析(Factor Analysis)是多元统计 分析中处理降维问题的一种重要方法。变 量的共线性很多是都对分析结果具有显著 的影响。所谓降维,就是独钓共线性,剩 下的,或者合并的都是线性无关的,或者 正交的,或者垂直的。
一、什么是主成分分析和因子分析?
• 主成分分析(Principal Components Analysis)也是多元统计分析中简化数据 结构(降维问题)的一种重要方法。简化 数据结构是指将某些较复杂的数据结构通 过变量变换等方法使相互依赖的变量变成 互不相关的;或把高维空间的数据投影到 低维空间,使问题得到简化而损失的信息 市的实证 设施建设情况。
案例1
• 中国统计年鉴,2005,各地区城市市政设施数据。 变量有: • City—城市名称; • X1—年末实有道路长度(公里); • X2—年末实有道路面积(万平方公里); • X3—城市桥梁(座); • X4—城市排水管道长度(公里); • X5—城市污水日处理能力(万立方米); • X6—城市路灯(盏);
因子分析方法ppt课件
10
因子分析数学模型中几个相关概念
举例说明:
11
12
因子分析的五大基本步骤
第一步:因子分析的前提条件
由于因子分析的主要任务之一是对原有变量进行浓缩,即将 原有变量中的信息重叠部分提取和综合成因子,进而最终实 现减少变量个数的目的。因此它要求原有变量之间应存在较 强的相关关系。否则,如果原有变量相互独立,相关程度很 低,不存在信息重叠,它们不可能有共同因子,那么也就无 法将其综合和浓缩,也就无需进行因子分析。本步骤正是希 望通过各种方法分析原有变量是否存在相关关系,是否适合 进行因子分析。
2
因子分析的基本模型
因子分析模型中,假定每个原始变量由两部分组成: 共同因子和唯一因子。 共同因子是各个原始变量所共有的因子,解释变 量之间的相关关系。
唯一因子顾名思义是每个原始变量所特有的因子, 表示该变量不能被共同因子解释的部分。原始变量 与因子分析时抽出的共同因子的相关关系用因子负 荷表示。
18
第四步:决定因素与命名
• 转轴后,要决定因素数目,选取较少因素 层面,获得较大的解释量。在因素命名与 结果解释上,必要时可将因素计算后之分 数存储,作为其它程序分析之输入变量。
19
第五步:计算各样本的因子得分
• 因子分析的最终目标是减少变量个数,以 便在进一步的分析中用较少的因子代替原 有变量参与数据建模。本步骤正是通过各 种方法计算各样本在各因子上的得分,为 进一步的分析奠定基础。
因子分析方法
1
因子分析的基本概念
因子分析的概念 就是在尽可能不损失信息或少损失信息的情况下,将多个变量减少为 少数几个潜在的因子。也就是用少数几个因子来描述许多指标或因素之 间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方 法 主成分分析(Principal component analysis): 是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标 变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相 关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少 变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信 息。 两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降 低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子 分析的一个特例
因子分析ppt课件
(2)因子提取 研究如何在样本数据的基础上提取综合因子。
(3)因子旋转
通过正交旋转或斜交旋转使提取出的因子具有可解 释性。
(4)计算因子得分
通过各种方法求解各样本在各因子上的得分,为进 一步分析奠定基础。
❖ 2、因子分析前提条件——相关性分析:
分析方法主要有:
(1)计算相关系数矩阵(correlation coefficients matrix)
1 2 为p的特0 征根,
标准化特征向量,则
为u对1 , 应u2 的,, up
1
Σ = U
2
U AA + D
p
u1 u2
up
1
0
1u1u1 2u2u2
0
u1 u2
p
up
mumum m1um1um1
1u1
2u2
pu p
1u1
2
u2
p
因子分析的基本理论 ❖ 3、因子分析的目的:
因子分析的目的之一,简化变量维数。即要使因素结 构简单化,希望以最少的共同因素(公共因子),能 对总变异量作最大的解释,因而抽取得因子愈少愈好, 但抽取因子的累积解释的变异量愈大愈好。
在因子分析的公共因子抽取中,应最先抽取特征值最 大的公共因子,其次是次大者,最后抽取公共因子的 特征值最小,通常会接近0。
(3)因子分析中因子载荷的不唯一性有利于对公因子进行有效解释; 而主成分分析对提取的主成分的解释能力有限。
因子分析的基本理论
❖ 5、因子分析模型: 设 Xi (i 1,2,个,变p)量p,如果表示为
X i i ai1F1 aimFm i (m p)
X1 1 11 12
或
X
2
(3)因子旋转
通过正交旋转或斜交旋转使提取出的因子具有可解 释性。
(4)计算因子得分
通过各种方法求解各样本在各因子上的得分,为进 一步分析奠定基础。
❖ 2、因子分析前提条件——相关性分析:
分析方法主要有:
(1)计算相关系数矩阵(correlation coefficients matrix)
1 2 为p的特0 征根,
标准化特征向量,则
为u对1 , 应u2 的,, up
1
Σ = U
2
U AA + D
p
u1 u2
up
1
0
1u1u1 2u2u2
0
u1 u2
p
up
mumum m1um1um1
1u1
2u2
pu p
1u1
2
u2
p
因子分析的基本理论 ❖ 3、因子分析的目的:
因子分析的目的之一,简化变量维数。即要使因素结 构简单化,希望以最少的共同因素(公共因子),能 对总变异量作最大的解释,因而抽取得因子愈少愈好, 但抽取因子的累积解释的变异量愈大愈好。
在因子分析的公共因子抽取中,应最先抽取特征值最 大的公共因子,其次是次大者,最后抽取公共因子的 特征值最小,通常会接近0。
(3)因子分析中因子载荷的不唯一性有利于对公因子进行有效解释; 而主成分分析对提取的主成分的解释能力有限。
因子分析的基本理论
❖ 5、因子分析模型: 设 Xi (i 1,2,个,变p)量p,如果表示为
X i i ai1F1 aimFm i (m p)
X1 1 11 12
或
X
2
最新因子分析法详细步骤ppt课件
六、因子得分
• Thomson法,即回归法
回归法得分是由Bayes思想导出的,得 到的因子得分是有偏的,但计算结果 误差较小。
• Bartlett法
Bartlett因子得分是极大似然估计,也是 加权最小二乘回归,得到的因子得分 是无偏的,但计算结果误差较大。
• 因子得分可用于模型诊断,也可用作 进一步分析的原始资料。
每一个公共因子的载荷系数之平方和 等于对应的特征根,即该公共因子的 方差。
p
j
ai2j
g
2 j
i1
• 极大似然法(maximum likelihood factor)
假定原变量服从正态分布,公共因 子和特殊因子也服从正态分布,构 造因子负荷和特殊方差的似然函数, 求其极大,得到唯一解。
• 主因子法(principal factor)
设原变量的相关矩阵为R=(rij),其逆 矩阵为R-1=(rij)。各变量特征方差 的初始值取为逆相关矩阵对角线元 素的倒数,δi’=1/rii。则共同度 的初始值为(hi’)2=1- δi’=1-1/rii。
以(hi’)2代替相关矩阵中的对角线上的元素, 得到约化相关矩阵。
(h1’)2 r12 … r1p
r21 (h2’)2 … r2p
R’= .
. ….
.
. ….
rp1 rp2 … (hp’)2
R’的前m个特征根及其对应的单位化特征向 量就是主因子解。
• 迭代主因子法(iterated principal factor)
主因子的解很不稳定。因此,常以估计 的共同度为初始值,构造新的约化矩 阵,再计算其特征根及其特征向量, 并由此再估计因子负荷及其各变量的 共同度和特殊方差,再由此新估计的 共同度为初始值继续迭代,直到解稳 定为止。
第八章因子分析PPT课件
9 11 5 20
11 27 17 42
Σ
5 17 52 5
20
42
5
86
则Σ可分解为
Σ=AA′+D
其中
2 1
4 0 0 0
4 3
0 2 0 0
, B
A
1 7
0 0 2 0
9 2
都称为一个因子。十项得分与这四个因子之间的关系可以描
述为如下的因子模型:
xi=μi+fi1+fi2+fi3+fi4+εi, i=1,2,⋯,10
其中f1, f2, f3, f4表示四个因子,称为公共因子(common factor)
,aij称为xi在因子fj上的载荷(loading),μi是xi的均值,εi是xi不
x*=μ*+A*f+ε*
这个模型能满足类似于前述因子模型的假定,即
第12页/共48页
E f 0
*
E
ε
0
V f I
V ε * D*
Cov f , ε * Cov f , ε C 0
D* diag( 1*2 , 2*2 ,
1.A的元素a ij
•
x i =μ i +a i1 f 1 +a i2 f 2 +⋯+a im f m +ε i
Cov xi , f j ai Cov f , f j Cov i , f j aij
m
11 27 17 42
Σ
5 17 52 5
20
42
5
86
则Σ可分解为
Σ=AA′+D
其中
2 1
4 0 0 0
4 3
0 2 0 0
, B
A
1 7
0 0 2 0
9 2
都称为一个因子。十项得分与这四个因子之间的关系可以描
述为如下的因子模型:
xi=μi+fi1+fi2+fi3+fi4+εi, i=1,2,⋯,10
其中f1, f2, f3, f4表示四个因子,称为公共因子(common factor)
,aij称为xi在因子fj上的载荷(loading),μi是xi的均值,εi是xi不
x*=μ*+A*f+ε*
这个模型能满足类似于前述因子模型的假定,即
第12页/共48页
E f 0
*
E
ε
0
V f I
V ε * D*
Cov f , ε * Cov f , ε C 0
D* diag( 1*2 , 2*2 ,
1.A的元素a ij
•
x i =μ i +a i1 f 1 +a i2 f 2 +⋯+a im f m +ε i
Cov xi , f j ai Cov f , f j Cov i , f j aij
m
因子分析ppt课件
xi ai1 f1 ai2 f2 ... ui
特殊因子(unique factor)观测变量所
特有的因子,表示
公因子(common因fa子ct负or载s)(是factor load该in变gs量):不表能示被i公个因 观测变量所共有的变因量子在,第解j个释公因子上子的所负解载释,的是部因分子。
因子抽取方法的选择一般考虑因子分 析的目的和对变量方差的了解程度:
如果因子分析的目的是用最少的因子 最大程度地解释原始数据中的方差,或特 殊因子、误差带来的方差很小,则用主 成分分析法。
如果目的是确定数据结构,但不了解 变量方差的情况,则用公因子分析法。
五、解释因子(rotation)
初始因子很难解释,大多数因子都和很多变 量有关,因子的实际意义难以理解和把握。 因子旋转使因子结构更简单、更易于理解。
当公因子间不相关时,某变量 xi 的公因子方差
h2i
a2i1
a2i2
...
a
பைடு நூலகம்
2 im
即等于与该变量有关的公因子负载的平方和。
因子贡献率(contributions) 表示每个公因子对数据的解释能力, 它等于和该因子有关的因子负载的平 方和,能衡量公因子的相对重要性。
公因子个数 ≤ 观测变量数
能代表观测变量较多信息的公因子是 研究感兴趣的;求因子解时,第一个因 子代表信息最多,随后的因子代表性逐 渐衰减。
0.6以上,差; 0.5,很差;0.5以下不能接受;
KMO 用于检测变量之间的简单相关系数和偏 相关系数的相对大小,取值在0--1间,一般认 为KMO在0.9以上很适合做因子分析,0.8以上 比较适合做因子分析;
Bartlett's 球形检验虚无假设“相关矩 阵是单位矩阵”,拒绝该假设(P<.001)表明 数据适合进行因子分析。
实用统计方法——第二讲 因子分析 PPT课件
因子分析
Factor Analysis
回顾:主成分分析的任务
• 将彼此相关的指标变量转化为彼此不相关的指 标变量;
• 将个数较多的指标变量转化为个数较少的指标
变量。
• 将意义单一的指标变量转化为意义综合的指标
变量。
主成分分析的基本原理
寻找一个适当的线性变换: • 将彼此相关的变量转变为彼此不相关的新变量;
因子分析的基本思想
根据变量间相关性的大小把变量分组, 使得同组内的变量之间的相关性(共性) 较高,并用一个因子来代表这个组的变 量,而不同组的变量相关性较低(个 性)。
因子分析可分为两种:
探索性因子分析(exploratory factor analysis) 确定性因子分析(confirmatory factor analysis)
潜在因子之间的关系,具有有效的实际意义,
因此需要进行统计检验。
第二节 探索性因子分析的基本原理
【例1】表1给出了三个指标 之间的相关系数,其中, x 1 是孩子的数学成绩,x 2 是孩子的语文成绩,x 3 是 孩子的英语成绩。求影响 表1 指标的相关系数
或支配这三个成绩指标变
量的潜在因子。
令ξ是影响这三个成绩指标变量的潜在因子。
变量的可测性
可测变量(measured variable):可以直接观察或测
量而得到的变量。 潜在变量(latent variable):不能或不易直接观测得 到的变量。这种变量往往是根据某种理论假设的, 所以也称为理论变量(theoretical variable)。
例如,在企业形象或品牌形象的研究中,消 费者可以通过一个有24个指标构成的评价体 系,评价百货商场的24个方面的优劣。 但消费者主要关心的是三个方面,即商店的 环境、商店的服务和商品的价格。因子分析 方法可以通过24个变量,找出反映商店环境、 商店服务水平和商品价格的三个潜在的因子, 对商店进行综合评价。
Factor Analysis
回顾:主成分分析的任务
• 将彼此相关的指标变量转化为彼此不相关的指 标变量;
• 将个数较多的指标变量转化为个数较少的指标
变量。
• 将意义单一的指标变量转化为意义综合的指标
变量。
主成分分析的基本原理
寻找一个适当的线性变换: • 将彼此相关的变量转变为彼此不相关的新变量;
因子分析的基本思想
根据变量间相关性的大小把变量分组, 使得同组内的变量之间的相关性(共性) 较高,并用一个因子来代表这个组的变 量,而不同组的变量相关性较低(个 性)。
因子分析可分为两种:
探索性因子分析(exploratory factor analysis) 确定性因子分析(confirmatory factor analysis)
潜在因子之间的关系,具有有效的实际意义,
因此需要进行统计检验。
第二节 探索性因子分析的基本原理
【例1】表1给出了三个指标 之间的相关系数,其中, x 1 是孩子的数学成绩,x 2 是孩子的语文成绩,x 3 是 孩子的英语成绩。求影响 表1 指标的相关系数
或支配这三个成绩指标变
量的潜在因子。
令ξ是影响这三个成绩指标变量的潜在因子。
变量的可测性
可测变量(measured variable):可以直接观察或测
量而得到的变量。 潜在变量(latent variable):不能或不易直接观测得 到的变量。这种变量往往是根据某种理论假设的, 所以也称为理论变量(theoretical variable)。
例如,在企业形象或品牌形象的研究中,消 费者可以通过一个有24个指标构成的评价体 系,评价百货商场的24个方面的优劣。 但消费者主要关心的是三个方面,即商店的 环境、商店的服务和商品的价格。因子分析 方法可以通过24个变量,找出反映商店环境、 商店服务水平和商品价格的三个潜在的因子, 对商店进行综合评价。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
V a r ( X - μ ) = A V a r ( F ) A + V a r ( ε ) Σx=A A +D A 是 因 子 模 型 的 系 数
V a r ( ε ) D d i a g (1 2 ,2 2 ,,2 p )
D的主对角线上的元素值越小,则公共因子的作用就越大。
2、模型不受计量单位的影响
X i i a i 1 F 1 a i m F m i (mp)
X1 1 11 12 或X2221 22
Xp p p1 p2
或 X μA F
1mF1 1 2mF22
pmFm p
称为 F 1,F 2, ,F m 公共因子,是不可观测的变量, 他们的系数称为因子载荷。 i 是特殊因子,是不能被
(一)为什么要旋转因子
建立了因子分析数学目的不仅仅要找出公共因子以 及对变量进行分组,更重要的要知道每个公共因子的 意义,以便进行进一步的分析,如果每个公共因子的 含义不清,则不便于进行实际背景的解释。由于因子 载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。 目的是使因子载荷阵的结构简化,使载荷矩阵每列或 行的元素平方值向0和1两极分化。有三种主要的正交 旋转法。四次方最大法、方差最大法和等量最大法。
数据分析因子分析
因子分析
§1 引言 ➢因子分析(factor analysis)是一种数据简化的技术。 ➢原理:通过研究众多变量之间的内部依赖关系,探求观 测数据中的基本结构,并用少数几个假想变量来表示其基 本的数据结构。这几个假想变量能够反映原来众多变量的 主要信息。 ➢原始的变量是可观测的显在变量,而假想变量是不可观 测的潜在变量,称为因子。
主成分分析分析与因子分析也有不同,主成 分分析仅仅是变量变换,而因子分析需要构造因 子模型。
主成分分析:原始变量的线性组合表示新的 综合变量,即主成分;
因子分析:潜在的假想变量和随机影响变 量的线性组合表示原始变量。
§ 2 因子分析模型 一、数学模型
设 X i ( i 1 ,2 , ,p )p个变量,如果表示为
co v (F *,ε*)E (F * ε* )0
3、因子载荷不是惟一的
设T为一个p×p的正交矩阵,令A*=AT,F*=T’F,
则模型可以表示为
XA*F*
且: E(TF)0 E(ε)0
V a r ( F * ) V a r ( T F ) T V a r ( F ) T I
V a r ( ε ) d i a g (1 2 ,2 2 ,,2 p )
(二)旋转方法
变换后因子的共同度
设正交矩阵,做正交变换 BA
B(bij)pp(l m 1ail lj)
hi2(B )j m 1bi2jj m 1(l m 1ail lj)2
i
子空间的转化性质好。
3、公共因子F
方差贡献的统计意义
j
因子载荷矩阵中各列元素的平方和
Sj
a p
2 ij
i1
称为所有的 F j (j 1 , ,m )对 X i 的方差贡献和。衡量 F j
的相对重要性。
§ 3 因子载荷矩阵的估计方法 (一)主成分分析法
(二) 主因子法
(三)极大似然方法
§ 4 因子旋转(正交变换)
xiFj ij (载荷矩阵中第i行,第j列的元素)反映了
第i个变量与第j个公共因子的相关重要性。绝对值越 大,相关的密切程度越高。
2、变量共同度的统计意义
定义:变量 X i 的共同度是因子载荷矩阵的第i行的元 素的平方和。记为 hi2 jm1ai2j。
统计意义:
X i a i 1 F 1 a iF m m i 两边求方差
前m个公共因子包含的部分。并且满足:
cov(F,)0, F, 即不相关;
1
D(F)
1
I
1
即 F 1,F 2, ,F m互不相关,方差为1。
2 1
D( )
2 2
2 p
即互不相关,方差不一定相等, i ~N(0,i2)。
二、因子分析模型的性质
1、原始变量X的协 方差矩阵的分解(例8.2.1) X - μ = A F + ε
而这三个公共因子可以表示为:
x i i i 1 F 1 i 2 F 2 i 3 F 3 i i1 , ,24
称 F1、F2、F3 是不可观测的潜在因子。24个变量 共享这三个因子,但是每个变量又有自己的个性, 不被包含的部分 i ,称为特殊因子。
注:
因子分析与回归分析不同,因子分析中的因 子是一个比较抽象的概念,而回归因子有非常明 确的实际意义;
将原始变量X做变换X*=CX,这里 C=diag(c1,c2,…,cn),ci>0。
C (X -μ )= C (A F + ε )
C X C μ + C A F + C ε X *C μ+ C A F + C ε
X *μ *+A *F *+ε* F* F
E(F*) 0 E(ε*) 0 Var(F*) I
例如,在企业形象或品牌形象的研究中,消 费者可以通过一个有24个指标构成的评价体 系,评价百货商场的24个方面的优劣。
消费者主要关心的是三个方面,即商店的环 境、商店的服务和商品的价格。
因子分析方法可以通过24个变量,找出反映 商店环境、商店服务水平和商品价格的三个 潜在的因子,对商店进行综合评价。
cov(F *,ε)E (F *ε)0
三、 因子载荷矩阵中的几个统计特征
1、因子载荷aij的统计意义
因子载荷 a ij 是第i个变量与第j个公共因子的相关系数
模型为 X i a i 1 F 1 a iF m m i
在上式的左右两边乘以F j ,再求数学期望
E ( X i F j ) a i 1 E ( F 1 F j ) i E ( F j j F j ) a i E ( F m m F j ) E ( i F j ) 根据公共因子的模型性质,有
V ( X i ) a a 2 i 1 V ( F 1 r ) a a 2 i V m r ( F m ) V a (
i2
j1
所有的公共因子和特殊因子对变量 X
i
m
的贡献为1。如果
a2 ij
j1
非常
靠近1,
2 非常小,则因子分析的效果好,从原变量空间到公共因
V a r ( ε ) D d i a g (1 2 ,2 2 ,,2 p )
D的主对角线上的元素值越小,则公共因子的作用就越大。
2、模型不受计量单位的影响
X i i a i 1 F 1 a i m F m i (mp)
X1 1 11 12 或X2221 22
Xp p p1 p2
或 X μA F
1mF1 1 2mF22
pmFm p
称为 F 1,F 2, ,F m 公共因子,是不可观测的变量, 他们的系数称为因子载荷。 i 是特殊因子,是不能被
(一)为什么要旋转因子
建立了因子分析数学目的不仅仅要找出公共因子以 及对变量进行分组,更重要的要知道每个公共因子的 意义,以便进行进一步的分析,如果每个公共因子的 含义不清,则不便于进行实际背景的解释。由于因子 载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。 目的是使因子载荷阵的结构简化,使载荷矩阵每列或 行的元素平方值向0和1两极分化。有三种主要的正交 旋转法。四次方最大法、方差最大法和等量最大法。
数据分析因子分析
因子分析
§1 引言 ➢因子分析(factor analysis)是一种数据简化的技术。 ➢原理:通过研究众多变量之间的内部依赖关系,探求观 测数据中的基本结构,并用少数几个假想变量来表示其基 本的数据结构。这几个假想变量能够反映原来众多变量的 主要信息。 ➢原始的变量是可观测的显在变量,而假想变量是不可观 测的潜在变量,称为因子。
主成分分析分析与因子分析也有不同,主成 分分析仅仅是变量变换,而因子分析需要构造因 子模型。
主成分分析:原始变量的线性组合表示新的 综合变量,即主成分;
因子分析:潜在的假想变量和随机影响变 量的线性组合表示原始变量。
§ 2 因子分析模型 一、数学模型
设 X i ( i 1 ,2 , ,p )p个变量,如果表示为
co v (F *,ε*)E (F * ε* )0
3、因子载荷不是惟一的
设T为一个p×p的正交矩阵,令A*=AT,F*=T’F,
则模型可以表示为
XA*F*
且: E(TF)0 E(ε)0
V a r ( F * ) V a r ( T F ) T V a r ( F ) T I
V a r ( ε ) d i a g (1 2 ,2 2 ,,2 p )
(二)旋转方法
变换后因子的共同度
设正交矩阵,做正交变换 BA
B(bij)pp(l m 1ail lj)
hi2(B )j m 1bi2jj m 1(l m 1ail lj)2
i
子空间的转化性质好。
3、公共因子F
方差贡献的统计意义
j
因子载荷矩阵中各列元素的平方和
Sj
a p
2 ij
i1
称为所有的 F j (j 1 , ,m )对 X i 的方差贡献和。衡量 F j
的相对重要性。
§ 3 因子载荷矩阵的估计方法 (一)主成分分析法
(二) 主因子法
(三)极大似然方法
§ 4 因子旋转(正交变换)
xiFj ij (载荷矩阵中第i行,第j列的元素)反映了
第i个变量与第j个公共因子的相关重要性。绝对值越 大,相关的密切程度越高。
2、变量共同度的统计意义
定义:变量 X i 的共同度是因子载荷矩阵的第i行的元 素的平方和。记为 hi2 jm1ai2j。
统计意义:
X i a i 1 F 1 a iF m m i 两边求方差
前m个公共因子包含的部分。并且满足:
cov(F,)0, F, 即不相关;
1
D(F)
1
I
1
即 F 1,F 2, ,F m互不相关,方差为1。
2 1
D( )
2 2
2 p
即互不相关,方差不一定相等, i ~N(0,i2)。
二、因子分析模型的性质
1、原始变量X的协 方差矩阵的分解(例8.2.1) X - μ = A F + ε
而这三个公共因子可以表示为:
x i i i 1 F 1 i 2 F 2 i 3 F 3 i i1 , ,24
称 F1、F2、F3 是不可观测的潜在因子。24个变量 共享这三个因子,但是每个变量又有自己的个性, 不被包含的部分 i ,称为特殊因子。
注:
因子分析与回归分析不同,因子分析中的因 子是一个比较抽象的概念,而回归因子有非常明 确的实际意义;
将原始变量X做变换X*=CX,这里 C=diag(c1,c2,…,cn),ci>0。
C (X -μ )= C (A F + ε )
C X C μ + C A F + C ε X *C μ+ C A F + C ε
X *μ *+A *F *+ε* F* F
E(F*) 0 E(ε*) 0 Var(F*) I
例如,在企业形象或品牌形象的研究中,消 费者可以通过一个有24个指标构成的评价体 系,评价百货商场的24个方面的优劣。
消费者主要关心的是三个方面,即商店的环 境、商店的服务和商品的价格。
因子分析方法可以通过24个变量,找出反映 商店环境、商店服务水平和商品价格的三个 潜在的因子,对商店进行综合评价。
cov(F *,ε)E (F *ε)0
三、 因子载荷矩阵中的几个统计特征
1、因子载荷aij的统计意义
因子载荷 a ij 是第i个变量与第j个公共因子的相关系数
模型为 X i a i 1 F 1 a iF m m i
在上式的左右两边乘以F j ,再求数学期望
E ( X i F j ) a i 1 E ( F 1 F j ) i E ( F j j F j ) a i E ( F m m F j ) E ( i F j ) 根据公共因子的模型性质,有
V ( X i ) a a 2 i 1 V ( F 1 r ) a a 2 i V m r ( F m ) V a (
i2
j1
所有的公共因子和特殊因子对变量 X
i
m
的贡献为1。如果
a2 ij
j1
非常
靠近1,
2 非常小,则因子分析的效果好,从原变量空间到公共因