数据分析因子分析 ppt课件

合集下载

因子分析-PPT

因子分析-PPT
小或增大。所以“方差极大” 旋转就是使载荷值按照列向0,1 两极分化,同时也包含着按行向 两极分化。
因子 得分
因子分析
什么 叫因 子分

定义解释
因子分析就是主成分分析得推广和发展, 她就是把具有复杂关系得多个变量(或样 品)综合为少数几个因子,并给出原始变量 与综合因子之间得相关关系得多元统计 分析方法
种类
R型因子分析(对变量进行因子分析) Q型因子分析(对样品进行因子分析)
应用意义
应用范围
表示得形式不同。
因子 分析 得统 计意

假定因子模型中,各个变量、 公共因子、特殊因子都已经进 行了标准化处理
因子载荷矩阵得统计意义
变量共同度得统计意义
公因子方差贡献得统计意义
因子 载荷 矩阵 得估 计方

方法一:流
应用类型
基本思想 数学模型
因子 分析 得模

主成 分分 析与 因子 分析 得区

主成分分析就是一种数学变换 (正交变换)不能称为一种数学 模型;而因子分析需要构造数 学模型。
主成分得个数与原始数据个数 相等,就是把原始变量变换成 为相互独立得新得变量;而因 子个数一般要求小于原始数据 个数,目得在于得到一个结构 简单得因子模型。
可以互相讨论下,但要小声点
因子 旋转
含义:
因子旋转就是根据因子载荷矩阵 得不唯一性,用一个正交矩阵右乘 因子载荷矩阵,实行旋转(由线性代 数,一次正交变换,对应坐标系得一 次旋转),使旋转后得因子载荷矩阵 结构简化,以便对公共因子进行合 理得解释。
所谓结构简化就就是使得每个变 量仅在一个公共因子上有较大得 载荷,而在其她得公共因子上得载 荷比较小。
常用得方法有:

因子分析 PPT课件

因子分析  PPT课件

同时假定随机向量 X 满足以下模型: X 1 a11F1 a12 F2 a1m Fm 1 X a F a F a F 2 12 1 22 2 2m m 2 X p a p1 F1 a p 2 F2 a pm Fm P 则称模型(3.1)为正交因子模型。
设 X ( X1 , X 2 ,
E( F ) 0 , Cov( F ) I m (即 F 的各分量方差为 1,且互不相关) 。又设 (1, 2 , , p ) 与 F 互不相关,且
2 E ( ) 0 , Cov( ) diag(12 ,2 , 2 , p )。
之因子分析
SPSS软件
• 因子分析(Factor Analysis)是多元统计 分析中处理降维问题的一种重要方法。变 量的共线性很多是都对分析结果具有显著 的影响。所谓降维,就是独钓共线性,剩 下的,或者合并的都是线性无关的,或者 正交的,或者垂直的。
一、什么是主成分分析和因子分析?
• 主成分分析(Principal Components Analysis)也是多元统计分析中简化数据 结构(降维问题)的一种重要方法。简化 数据结构是指将某些较复杂的数据结构通 过变量变换等方法使相互依赖的变量变成 互不相关的;或把高维空间的数据投影到 低维空间,使问题得到简化而损失的信息 市的实证 设施建设情况。
案例1
• 中国统计年鉴,2005,各地区城市市政设施数据。 变量有: • City—城市名称; • X1—年末实有道路长度(公里); • X2—年末实有道路面积(万平方公里); • X3—城市桥梁(座); • X4—城市排水管道长度(公里); • X5—城市污水日处理能力(万立方米); • X6—城市路灯(盏);

因子分析方法ppt课件

因子分析方法ppt课件

10
因子分析数学模型中几个相关概念
举例说明:
11
12
因子分析的五大基本步骤
第一步:因子分析的前提条件
由于因子分析的主要任务之一是对原有变量进行浓缩,即将 原有变量中的信息重叠部分提取和综合成因子,进而最终实 现减少变量个数的目的。因此它要求原有变量之间应存在较 强的相关关系。否则,如果原有变量相互独立,相关程度很 低,不存在信息重叠,它们不可能有共同因子,那么也就无 法将其综合和浓缩,也就无需进行因子分析。本步骤正是希 望通过各种方法分析原有变量是否存在相关关系,是否适合 进行因子分析。
2
因子分析的基本模型
因子分析模型中,假定每个原始变量由两部分组成: 共同因子和唯一因子。 共同因子是各个原始变量所共有的因子,解释变 量之间的相关关系。
唯一因子顾名思义是每个原始变量所特有的因子, 表示该变量不能被共同因子解释的部分。原始变量 与因子分析时抽出的共同因子的相关关系用因子负 荷表示。
18
第四步:决定因素与命名
• 转轴后,要决定因素数目,选取较少因素 层面,获得较大的解释量。在因素命名与 结果解释上,必要时可将因素计算后之分 数存储,作为其它程序分析之输入变量。
19
第五步:计算各样本的因子得分
• 因子分析的最终目标是减少变量个数,以 便在进一步的分析中用较少的因子代替原 有变量参与数据建模。本步骤正是通过各 种方法计算各样本在各因子上的得分,为 进一步的分析奠定基础。
因子分析方法
1
因子分析的基本概念
因子分析的概念 就是在尽可能不损失信息或少损失信息的情况下,将多个变量减少为 少数几个潜在的因子。也就是用少数几个因子来描述许多指标或因素之 间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方 法 主成分分析(Principal component analysis): 是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标 变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相 关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少 变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信 息。 两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降 低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子 分析的一个特例

因子分析ppt课件

因子分析ppt课件
(2)因子提取 研究如何在样本数据的基础上提取综合因子。
(3)因子旋转
通过正交旋转或斜交旋转使提取出的因子具有可解 释性。
(4)计算因子得分
通过各种方法求解各样本在各因子上的得分,为进 一步分析奠定基础。
❖ 2、因子分析前提条件——相关性分析:
分析方法主要有:
(1)计算相关系数矩阵(correlation coefficients matrix)
1 2 为p的特0 征根,
标准化特征向量,则
为u对1 , 应u2 的,, up
1
Σ = U
2
U AA + D
p
u1 u2
up
1
0
1u1u1 2u2u2
0
u1 u2
p
up
mumum m1um1um1
1u1
2u2
pu p
1u1
2
u2
p
因子分析的基本理论 ❖ 3、因子分析的目的:
因子分析的目的之一,简化变量维数。即要使因素结 构简单化,希望以最少的共同因素(公共因子),能 对总变异量作最大的解释,因而抽取得因子愈少愈好, 但抽取因子的累积解释的变异量愈大愈好。
在因子分析的公共因子抽取中,应最先抽取特征值最 大的公共因子,其次是次大者,最后抽取公共因子的 特征值最小,通常会接近0。
(3)因子分析中因子载荷的不唯一性有利于对公因子进行有效解释; 而主成分分析对提取的主成分的解释能力有限。
因子分析的基本理论
❖ 5、因子分析模型: 设 Xi (i 1,2,个,变p)量p,如果表示为
X i i ai1F1 aimFm i (m p)
X1 1 11 12

X
2

最新因子分析法详细步骤ppt课件

最新因子分析法详细步骤ppt课件

六、因子得分
• Thomson法,即回归法
回归法得分是由Bayes思想导出的,得 到的因子得分是有偏的,但计算结果 误差较小。
• Bartlett法
Bartlett因子得分是极大似然估计,也是 加权最小二乘回归,得到的因子得分 是无偏的,但计算结果误差较大。
• 因子得分可用于模型诊断,也可用作 进一步分析的原始资料。
每一个公共因子的载荷系数之平方和 等于对应的特征根,即该公共因子的 方差。
p
j
ai2j
g
2 j
i1
• 极大似然法(maximum likelihood factor)
假定原变量服从正态分布,公共因 子和特殊因子也服从正态分布,构 造因子负荷和特殊方差的似然函数, 求其极大,得到唯一解。
• 主因子法(principal factor)
设原变量的相关矩阵为R=(rij),其逆 矩阵为R-1=(rij)。各变量特征方差 的初始值取为逆相关矩阵对角线元 素的倒数,δi’=1/rii。则共同度 的初始值为(hi’)2=1- δi’=1-1/rii。
以(hi’)2代替相关矩阵中的对角线上的元素, 得到约化相关矩阵。
(h1’)2 r12 … r1p
r21 (h2’)2 … r2p
R’= .
. ….
.
. ….
rp1 rp2 … (hp’)2
R’的前m个特征根及其对应的单位化特征向 量就是主因子解。
• 迭代主因子法(iterated principal factor)
主因子的解很不稳定。因此,常以估计 的共同度为初始值,构造新的约化矩 阵,再计算其特征根及其特征向量, 并由此再估计因子负荷及其各变量的 共同度和特殊方差,再由此新估计的 共同度为初始值继续迭代,直到解稳 定为止。

第八章因子分析PPT课件

第八章因子分析PPT课件
9 11 5 20
11 27 17 42

Σ
5 17 52 5


20

42

5
86

则Σ可分解为
Σ=AA′+D
其中
2 1
4 0 0 0
4 3
0 2 0 0
, B

A
1 7
0 0 2 0




9 2
都称为一个因子。十项得分与这四个因子之间的关系可以描
述为如下的因子模型:
xi=μi+fi1+fi2+fi3+fi4+εi, i=1,2,⋯,10
其中f1, f2, f3, f4表示四个因子,称为公共因子(common factor)
,aij称为xi在因子fj上的载荷(loading),μi是xi的均值,εi是xi不
x*=μ*+A*f+ε*
这个模型能满足类似于前述因子模型的假定,即
第12页/共48页
E f 0

*
E
ε
0

V f I
V ε * D*

Cov f , ε * Cov f , ε C 0


D* diag( 1*2 , 2*2 ,
1.A的元素a ij

x i =μ i +a i1 f 1 +a i2 f 2 +⋯+a im f m +ε i
Cov xi , f j ai Cov f , f j Cov i , f j aij
m

因子分析ppt课件

因子分析ppt课件

xi ai1 f1 ai2 f2 ... ui
特殊因子(unique factor)观测变量所
特有的因子,表示
公因子(common因fa子ct负or载s)(是factor load该in变gs量):不表能示被i公个因 观测变量所共有的变因量子在,第解j个释公因子上子的所负解载释,的是部因分子。
因子抽取方法的选择一般考虑因子分 析的目的和对变量方差的了解程度:
如果因子分析的目的是用最少的因子 最大程度地解释原始数据中的方差,或特 殊因子、误差带来的方差很小,则用主 成分分析法。
如果目的是确定数据结构,但不了解 变量方差的情况,则用公因子分析法。
五、解释因子(rotation)
初始因子很难解释,大多数因子都和很多变 量有关,因子的实际意义难以理解和把握。 因子旋转使因子结构更简单、更易于理解。
当公因子间不相关时,某变量 xi 的公因子方差
h2i
a2i1
a2i2
...
a
பைடு நூலகம்
2 im
即等于与该变量有关的公因子负载的平方和。
因子贡献率(contributions) 表示每个公因子对数据的解释能力, 它等于和该因子有关的因子负载的平 方和,能衡量公因子的相对重要性。
公因子个数 ≤ 观测变量数
能代表观测变量较多信息的公因子是 研究感兴趣的;求因子解时,第一个因 子代表信息最多,随后的因子代表性逐 渐衰减。
0.6以上,差; 0.5,很差;0.5以下不能接受;
KMO 用于检测变量之间的简单相关系数和偏 相关系数的相对大小,取值在0--1间,一般认 为KMO在0.9以上很适合做因子分析,0.8以上 比较适合做因子分析;
Bartlett's 球形检验虚无假设“相关矩 阵是单位矩阵”,拒绝该假设(P<.001)表明 数据适合进行因子分析。

实用统计方法——第二讲 因子分析 PPT课件

实用统计方法——第二讲 因子分析 PPT课件
因子分析
Factor Analysis
回顾:主成分分析的任务
• 将彼此相关的指标变量转化为彼此不相关的指 标变量;
• 将个数较多的指标变量转化为个数较少的指标
变量。
• 将意义单一的指标变量转化为意义综合的指标
变量。
主成分分析的基本原理
寻找一个适当的线性变换: • 将彼此相关的变量转变为彼此不相关的新变量;
因子分析的基本思想
根据变量间相关性的大小把变量分组, 使得同组内的变量之间的相关性(共性) 较高,并用一个因子来代表这个组的变 量,而不同组的变量相关性较低(个 性)。
因子分析可分为两种:
探索性因子分析(exploratory factor analysis) 确定性因子分析(confirmatory factor analysis)
潜在因子之间的关系,具有有效的实际意义,
因此需要进行统计检验。
第二节 探索性因子分析的基本原理
【例1】表1给出了三个指标 之间的相关系数,其中, x 1 是孩子的数学成绩,x 2 是孩子的语文成绩,x 3 是 孩子的英语成绩。求影响 表1 指标的相关系数
或支配这三个成绩指标变
量的潜在因子。
令ξ是影响这三个成绩指标变量的潜在因子。
变量的可测性
可测变量(measured variable):可以直接观察或测
量而得到的变量。 潜在变量(latent variable):不能或不易直接观测得 到的变量。这种变量往往是根据某种理论假设的, 所以也称为理论变量(theoretical variable)。
例如,在企业形象或品牌形象的研究中,消 费者可以通过一个有24个指标构成的评价体 系,评价百货商场的24个方面的优劣。 但消费者主要关心的是三个方面,即商店的 环境、商店的服务和商品的价格。因子分析 方法可以通过24个变量,找出反映商店环境、 商店服务水平和商品价格的三个潜在的因子, 对商店进行综合评价。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
V a r ( X - μ ) = A V a r ( F ) A + V a r ( ε ) Σx=A A +D A 是 因 子 模 型 的 系 数
V a r ( ε ) D d i a g (1 2 ,2 2 ,,2 p )
D的主对角线上的元素值越小,则公共因子的作用就越大。
2、模型不受计量单位的影响
X i i a i 1 F 1 a i m F m i (mp)
X1 1 11 12 或X2221 22
Xp p p1 p2
或 X μA F
1mF1 1 2mF22
pmFm p
称为 F 1,F 2, ,F m 公共因子,是不可观测的变量, 他们的系数称为因子载荷。 i 是特殊因子,是不能被
(一)为什么要旋转因子
建立了因子分析数学目的不仅仅要找出公共因子以 及对变量进行分组,更重要的要知道每个公共因子的 意义,以便进行进一步的分析,如果每个公共因子的 含义不清,则不便于进行实际背景的解释。由于因子 载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。 目的是使因子载荷阵的结构简化,使载荷矩阵每列或 行的元素平方值向0和1两极分化。有三种主要的正交 旋转法。四次方最大法、方差最大法和等量最大法。
数据分析因子分析
因子分析
§1 引言 ➢因子分析(factor analysis)是一种数据简化的技术。 ➢原理:通过研究众多变量之间的内部依赖关系,探求观 测数据中的基本结构,并用少数几个假想变量来表示其基 本的数据结构。这几个假想变量能够反映原来众多变量的 主要信息。 ➢原始的变量是可观测的显在变量,而假想变量是不可观 测的潜在变量,称为因子。
主成分分析分析与因子分析也有不同,主成 分分析仅仅是变量变换,而因子分析需要构造因 子模型。
主成分分析:原始变量的线性组合表示新的 综合变量,即主成分;
因子分析:潜在的假想变量和随机影响变 量的线性组合表示原始变量。
§ 2 因子分析模型 一、数学模型
设 X i ( i 1 ,2 , ,p )p个变量,如果表示为
co v (F *,ε*)E (F * ε* )0
3、因子载荷不是惟一的
设T为一个p×p的正交矩阵,令A*=AT,F*=T’F,
则模型可以表示为
XA*F*
且: E(TF)0 E(ε)0
V a r ( F * ) V a r ( T F ) T V a r ( F ) T I
V a r ( ε ) d i a g (1 2 ,2 2 ,,2 p )
(二)旋转方法
变换后因子的共同度
设正交矩阵,做正交变换 BA
B(bij)pp(l m 1ail lj)
hi2(B )j m 1bi2jj m 1(l m 1ail lj)2
i
子空间的转化性质好。
3、公共因子F
方差贡献的统计意义
j
因子载荷矩阵中各列元素的平方和
Sj
a p
2 ij
i1
称为所有的 F j (j 1 , ,m )对 X i 的方差贡献和。衡量 F j
的相对重要性。
§ 3 因子载荷矩阵的估计方法 (一)主成分分析法
(二) 主因子法
(三)极大似然方法
§ 4 因子旋转(正交变换)
xiFj ij (载荷矩阵中第i行,第j列的元素)反映了
第i个变量与第j个公共因子的相关重要性。绝对值越 大,相关的密切程度越高。
2、变量共同度的统计意义
定义:变量 X i 的共同度是因子载荷矩阵的第i行的元 素的平方和。记为 hi2 jm1ai2j。
统计意义:
X i a i 1 F 1 a iF m m i 两边求方差
前m个公共因子包含的部分。并且满足:
cov(F,)0, F, 即不相关;
1
D(F)
1
I
1
即 F 1,F 2, ,F m互不相关,方差为1。
2 1
D( )
2 2
2 p
即互不相关,方差不一定相等, i ~N(0,i2)。
二、因子分析模型的性质
1、原始变量X的协 方差矩阵的分解(例8.2.1) X - μ = A F + ε
而这三个公共因子可以表示为:
x i i i 1 F 1 i 2 F 2 i 3 F 3 i i1 , ,24
称 F1、F2、F3 是不可观测的潜在因子。24个变量 共享这三个因子,但是每个变量又有自己的个性, 不被包含的部分 i ,称为特殊因子。
注:
因子分析与回归分析不同,因子分析中的因 子是一个比较抽象的概念,而回归因子有非常明 确的实际意义;
将原始变量X做变换X*=CX,这里 C=diag(c1,c2,…,cn),ci>0。
C (X -μ )= C (A F + ε )
C X C μ + C A F + C ε X *C μ+ C A F + C ε
X *μ *+A *F *+ε* F* F
E(F*) 0 E(ε*) 0 Var(F*) I
例如,在企业形象或品牌形象的研究中,消 费者可以通过一个有24个指标构成的评价体 系,评价百货商场的24个方面的优劣。
消费者主要关心的是三个方面,即商店的环 境、商店的服务和商品的价格。
因子分析方法可以通过24个变量,找出反映 商店环境、商店服务水平和商品价格的三个 潜在的因子,对商店进行综合评价。
cov(F *,ε)E (F *ε)0
三、 因子载荷矩阵中的几个统计特征
1、因子载荷aij的统计意义
因子载荷 a ij 是第i个变量与第j个公共因子的相关系数
模型为 X i a i 1 F 1 a iF m m i
在上式的左右两边乘以F j ,再求数学期望
E ( X i F j ) a i 1 E ( F 1 F j ) i E ( F j j F j ) a i E ( F m m F j ) E ( i F j ) 根据公共因子的模型性质,有
V ( X i ) a a 2 i 1 V ( F 1 r ) a a 2 i V m r ( F m ) V a (
i2
j1
所有的公共因子和特殊因子对变量 X
i
m
的贡献为1。如果
a2 ij
j1
非常
靠近1,
2 非常小,则因子分析的效果好,从原变量空间到公共因
相关文档
最新文档