因子分析课件_因素分析_详解_图文
合集下载
因子分析 PPT课件
同时假定随机向量 X 满足以下模型: X 1 a11F1 a12 F2 a1m Fm 1 X a F a F a F 2 12 1 22 2 2m m 2 X p a p1 F1 a p 2 F2 a pm Fm P 则称模型(3.1)为正交因子模型。
设 X ( X1 , X 2 ,
E( F ) 0 , Cov( F ) I m (即 F 的各分量方差为 1,且互不相关) 。又设 (1, 2 , , p ) 与 F 互不相关,且
2 E ( ) 0 , Cov( ) diag(12 ,2 , 2 , p )。
之因子分析
SPSS软件
• 因子分析(Factor Analysis)是多元统计 分析中处理降维问题的一种重要方法。变 量的共线性很多是都对分析结果具有显著 的影响。所谓降维,就是独钓共线性,剩 下的,或者合并的都是线性无关的,或者 正交的,或者垂直的。
一、什么是主成分分析和因子分析?
• 主成分分析(Principal Components Analysis)也是多元统计分析中简化数据 结构(降维问题)的一种重要方法。简化 数据结构是指将某些较复杂的数据结构通 过变量变换等方法使相互依赖的变量变成 互不相关的;或把高维空间的数据投影到 低维空间,使问题得到简化而损失的信息 市的实证 设施建设情况。
案例1
• 中国统计年鉴,2005,各地区城市市政设施数据。 变量有: • City—城市名称; • X1—年末实有道路长度(公里); • X2—年末实有道路面积(万平方公里); • X3—城市桥梁(座); • X4—城市排水管道长度(公里); • X5—城市污水日处理能力(万立方米); • X6—城市路灯(盏);
因子分析ppt课件
(2)因子提取 研究如何在样本数据的基础上提取综合因子。
(3)因子旋转
通过正交旋转或斜交旋转使提取出的因子具有可解 释性。
(4)计算因子得分
通过各种方法求解各样本在各因子上的得分,为进 一步分析奠定基础。
❖ 2、因子分析前提条件——相关性分析:
分析方法主要有:
(1)计算相关系数矩阵(correlation coefficients matrix)
1 2 为p的特0 征根,
标准化特征向量,则
为u对1 , 应u2 的,, up
1
Σ = U
2
U AA + D
p
u1 u2
up
1
0
1u1u1 2u2u2
0
u1 u2
p
up
mumum m1um1um1
1u1
2u2
pu p
1u1
2
u2
p
因子分析的基本理论 ❖ 3、因子分析的目的:
因子分析的目的之一,简化变量维数。即要使因素结 构简单化,希望以最少的共同因素(公共因子),能 对总变异量作最大的解释,因而抽取得因子愈少愈好, 但抽取因子的累积解释的变异量愈大愈好。
在因子分析的公共因子抽取中,应最先抽取特征值最 大的公共因子,其次是次大者,最后抽取公共因子的 特征值最小,通常会接近0。
(3)因子分析中因子载荷的不唯一性有利于对公因子进行有效解释; 而主成分分析对提取的主成分的解释能力有限。
因子分析的基本理论
❖ 5、因子分析模型: 设 Xi (i 1,2,个,变p)量p,如果表示为
X i i ai1F1 aimFm i (m p)
X1 1 11 12
或
X
2
(3)因子旋转
通过正交旋转或斜交旋转使提取出的因子具有可解 释性。
(4)计算因子得分
通过各种方法求解各样本在各因子上的得分,为进 一步分析奠定基础。
❖ 2、因子分析前提条件——相关性分析:
分析方法主要有:
(1)计算相关系数矩阵(correlation coefficients matrix)
1 2 为p的特0 征根,
标准化特征向量,则
为u对1 , 应u2 的,, up
1
Σ = U
2
U AA + D
p
u1 u2
up
1
0
1u1u1 2u2u2
0
u1 u2
p
up
mumum m1um1um1
1u1
2u2
pu p
1u1
2
u2
p
因子分析的基本理论 ❖ 3、因子分析的目的:
因子分析的目的之一,简化变量维数。即要使因素结 构简单化,希望以最少的共同因素(公共因子),能 对总变异量作最大的解释,因而抽取得因子愈少愈好, 但抽取因子的累积解释的变异量愈大愈好。
在因子分析的公共因子抽取中,应最先抽取特征值最 大的公共因子,其次是次大者,最后抽取公共因子的 特征值最小,通常会接近0。
(3)因子分析中因子载荷的不唯一性有利于对公因子进行有效解释; 而主成分分析对提取的主成分的解释能力有限。
因子分析的基本理论
❖ 5、因子分析模型: 设 Xi (i 1,2,个,变p)量p,如果表示为
X i i ai1F1 aimFm i (m p)
X1 1 11 12
或
X
2
《因子分析》PPT课件 (2)
24.12.2020
精选PPT
8
输出结果及其解释
这是用主成分分析法提取初始公因子的第1部分
结果,相关矩阵的特征值总和为4(指标数),前
2个特征值1.718252和1.093536都大于1,下面将
根据这2个较大的特征值提取2个相应的初始
公因子。
24.12.2020
精选PPT
9
含有2个公因子的初始公因子模型为:
24.12.2020
精选PPT
11
24.12.2020
精选PPT
12
经最大方差旋转法旋转后的因子模型为:
x1= 0.87226G1+0.30149G2
x2= 0.94758G1-0.08748G2 x3=-0.09851G1+0.94739G2
x4= 0.13687G1+0.35848G2 旋转后的第1和第2公因子能解释的方差 分别为1.687177和1.124611;4个标准化指标共 性之和以及它们各自的共性估计值与旋转前相 同。
精选PPT
28
(3)转轴法:正交转轴法(最大变异法,VARIMAX
ROTATION) Rotation Method:Varimax
转换矩阵
1 2
Orthogonal Transformation Matrix
1
2
0.74346
0.66878
-0.66878
0.74346
24.12.2020
精选PPT
置置所h有2i为的在h20i =与11;之间服
⑤SMC[S] 相关系数的平均。
置h2i为xi与其他指标之间全
24.12.2020
精选PPT
5
最新因子分析法详细步骤ppt课件
六、因子得分
• Thomson法,即回归法
回归法得分是由Bayes思想导出的,得 到的因子得分是有偏的,但计算结果 误差较小。
• Bartlett法
Bartlett因子得分是极大似然估计,也是 加权最小二乘回归,得到的因子得分 是无偏的,但计算结果误差较大。
• 因子得分可用于模型诊断,也可用作 进一步分析的原始资料。
每一个公共因子的载荷系数之平方和 等于对应的特征根,即该公共因子的 方差。
p
j
ai2j
g
2 j
i1
• 极大似然法(maximum likelihood factor)
假定原变量服从正态分布,公共因 子和特殊因子也服从正态分布,构 造因子负荷和特殊方差的似然函数, 求其极大,得到唯一解。
• 主因子法(principal factor)
设原变量的相关矩阵为R=(rij),其逆 矩阵为R-1=(rij)。各变量特征方差 的初始值取为逆相关矩阵对角线元 素的倒数,δi’=1/rii。则共同度 的初始值为(hi’)2=1- δi’=1-1/rii。
以(hi’)2代替相关矩阵中的对角线上的元素, 得到约化相关矩阵。
(h1’)2 r12 … r1p
r21 (h2’)2 … r2p
R’= .
. ….
.
. ….
rp1 rp2 … (hp’)2
R’的前m个特征根及其对应的单位化特征向 量就是主因子解。
• 迭代主因子法(iterated principal factor)
主因子的解很不稳定。因此,常以估计 的共同度为初始值,构造新的约化矩 阵,再计算其特征根及其特征向量, 并由此再估计因子负荷及其各变量的 共同度和特殊方差,再由此新估计的 共同度为初始值继续迭代,直到解稳 定为止。
因子分析ppt课件
xi ai1 f1 ai2 f2 ... ui
特殊因子(unique factor)观测变量所
特有的因子,表示
公因子(common因fa子ct负or载s)(是factor load该in变gs量):不表能示被i公个因 观测变量所共有的变因量子在,第解j个释公因子上子的所负解载释,的是部因分子。
因子抽取方法的选择一般考虑因子分 析的目的和对变量方差的了解程度:
如果因子分析的目的是用最少的因子 最大程度地解释原始数据中的方差,或特 殊因子、误差带来的方差很小,则用主 成分分析法。
如果目的是确定数据结构,但不了解 变量方差的情况,则用公因子分析法。
五、解释因子(rotation)
初始因子很难解释,大多数因子都和很多变 量有关,因子的实际意义难以理解和把握。 因子旋转使因子结构更简单、更易于理解。
当公因子间不相关时,某变量 xi 的公因子方差
h2i
a2i1
a2i2
...
a
பைடு நூலகம்
2 im
即等于与该变量有关的公因子负载的平方和。
因子贡献率(contributions) 表示每个公因子对数据的解释能力, 它等于和该因子有关的因子负载的平 方和,能衡量公因子的相对重要性。
公因子个数 ≤ 观测变量数
能代表观测变量较多信息的公因子是 研究感兴趣的;求因子解时,第一个因 子代表信息最多,随后的因子代表性逐 渐衰减。
0.6以上,差; 0.5,很差;0.5以下不能接受;
KMO 用于检测变量之间的简单相关系数和偏 相关系数的相对大小,取值在0--1间,一般认 为KMO在0.9以上很适合做因子分析,0.8以上 比较适合做因子分析;
Bartlett's 球形检验虚无假设“相关矩 阵是单位矩阵”,拒绝该假设(P<.001)表明 数据适合进行因子分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
① “Method”(方法)选项方框内六种因素转轴方
法:
A “None”:不需要转轴。
B “Varimax”:最大变异法。
C “Quartimax”:四次方最大值法。 正交旋转
D “Equamax”:相等最大值法。
E “Direct Oblimin”:直接斜交转轴法。 F “Promax”:Promax转轴法。
因子分析课件_因素分析_详解_图文.ppt
目录
一、案例引读 二、基本原理 三、历史渊源 四、分析步骤 五、案例详解
一、案例引读 二、基本原理 三、历史渊源 四、分析步骤 五、案例详解
我要定制衣服
身高 袖长
颜色
胸围
肩厚
腰围
肩宽
我们厂要批量制作衣服
SM L
指标一 指标二 指标三
长度 胖瘦 ……
一、案例引读 二、基本原理 三、历史渊源 四、分析步骤 五、案例详解
③ “Display”(显示)选项框 A “Unrotated factor solution”(未 旋转因子解):显示未转轴时因素负 荷量、特征值及共同性。 B “Scree plot”(陡坡图):陡坡图。
案例 1
(4)设置因素转轴:单击图1-1对话框中的“Rotation…”按钮,弹出“Factor Analyze:Rotation”(因素分析:旋转)对话框。
④ “Extract”(抽取)选项框 A “Eigenvalues over”(特征值):后面的 空格默认为1,表示因素抽取时,只抽取特征 值大于1者,使用者可随意输入0至变量总数之 间的值。 B “Number of factors”(因子个数):选取 此项时,后面的空格内输入限定的因素个数。
共变异数矩阵 相关矩阵
完全排除缺失值 成对排除观察值
用平均数置换
依据因素负荷量排序 绝对值舍弃的下限
图1-6 Factor Analyze:Options对话框
②“Coefficient Display Format”(系数显示格式)选项框:因素负荷量出现的格式。 A “Sorted by size”(依据因素负荷量排序):根据每一因素层面的因素负荷量的大小 排序。
aij叫做因子负荷(载荷),它是第i个变量在第j个主因子上的负荷,它反映了 第i个变量在第j个主因素的相对重要性。
xp 为第p个变量的标准化分数; m为所有变量共同因素的数目;
F1,F2,…,Fm彼此独立(转轴方法问题)
四、分析步骤 一、案例引读 二、基本原理 三、历史渊源
五、案例详解
xi=aiF+ei
一、案例引读 二、基本原理 三、历史渊源
四、分析步骤 五、案例详解
古典语 (C) 法语 英语 (F) 数学 (E) 判别 (M) 音乐 (D) (Mu)
4个假设:已知 2
xi=aiF+ei
1
一、案例引读 二、基本原理 三、历史渊源
四、分析步骤 五、案例详解
x1= a11F1 + a12F2 + … + a1mFm + a1є1 x2= a21F1 + a22F2 + … + a2mFm + a2є2 ……
斜交旋转
② “Display”(显示)选项框: A “Rotated solution”(转轴后的解):显示转轴 后的相关信息,正交转轴显示因素组型矩阵及因素 转换矩阵;斜交转轴则显示因素组型、因素结构矩 阵与因素相关矩阵。 B “Loading plots”(因子负荷量):绘出因素的 散步图。
不转轴 最大变异法
案例 1
(1)选择“Analyze(分析)——Data Reduction(数据缩减)——Factor(因子)…” 命令,弹出“Factor Analyze(因子分析)”对话框,将变量“x1”到“x9”选入“Variables(变 量)”框中。
描述性统计量
萃取
转轴法
分数
选项
图1-1 Factor Analyze对话框
五、案例详解
因子旋转
F’=DF
正交旋转 斜交旋转
保持F’间相互独立 不是很容易解释因子
放弃F’间相互独立 容易解释因子
五、案例详解 一、案例引读 二、基本原理 三、历史渊源 五、分析步骤
案例一
北京中等职业教育发展水平分析
案例二
详见《问卷统计与分析实务》吴明隆著;因素分析章节
案例 1
• 对北京18个区县中等职业教育发展水平的9个指标进 行因子分析,然后进行综合评价。
因子负荷 主成分法
因子旋转
F→F’ 便于解释
因子得分 样本的优劣
四、分析步骤 一、案例引读 二、基本原理 三、历史渊源
五、案例详解
因子负荷
主成分法
利用主成分分 析把前几个主成 分作为未旋转的 公共因子。
因子旋转
F→F’
F’=DF 共同度不变 每个因子的贡献度变化 因子载荷矩阵变化
四、分析步骤 一、案例引读 二、基本原理 三、历史渊源
身高
袖长
胸围
肩厚
腰围
肩宽
颜色
……
降维
第三主成分 第二主成分 第一主成分
将错综复杂的原变量归结历史渊源 四、分析步骤 五、案例详解
主成分分析特点
原始变量间相关性较大 几个主成分之间相互独立 主成分信息由大到小 原始变量数与主成分数相等
身高 袖长 肩宽
3
1
①“Missing Values”(缺失值)选项框:缺失 值的处理方式。 A “Exclude cases listwise”(完全排除缺失 值):观察值在所有变量中没有缺失值后才加 以分析。 B “Exclude cases pairwise”(成对排除观察 值):在成对相关分析中出现缺失值的观察值 舍弃。 C “Replace with mean”(用平均数置换): 以变量平均值取代缺失值。
在“Method”(方法)框中表示计算因素分数的 方法有三种:
A “Regression”:使用回归法。 B “Bartlett”:使用Bartlette法。 C “Anderson-Robin”:使用Anderson-Robin法。
因素存储变量 方法
使用回归法 使用Bartlette法
使用Anderson-Robin法 显示因素分数系数矩阵
直接斜交转轴法
四次方最大值法 相等最大值法 Promax转轴法
转轴后的解
因子负荷量 收敛最大迭代
图1-4 Factor Analyze:Rotation对话框
③ “Maximum Iterations for Convergence”:(收敛最大 迭代):
转轴时执行的迭代最多次 数,后面默认数字为25,表示 算法执行转轴时,执行步骤的 次数上限。
案例 1
(5)设置因素分数:单击图1-1对话框中的“Scores…”按钮,弹出“Factor Analyze:Scores”(因素分析:因素分数)对话框。
① “Save as variable”(因素存储变量)选项框: 勾选时可将新建立的因素分数存储至数据文件
中,并产生新的变量名称(默认为fact_1、fact_2、 fact_3、fact_4等)。
特征值是每个变量在某一共同因素之因素负荷量的平 方总和(一直行所有因素负荷量的平方和)。
方差贡献率----指公共因子对实测变量的贡献,又称变异量。
一、案例引读 二、基本原理 三、历史渊源
四、分析步骤 五、案例详解
1904年
Charles Spearman
对智力测验得分进行统计分析
古典语 (C) 法语 英语 (F) 数学 (E) 判别 (M) 音乐 (D) (Mu)
B “Initial solution”(未转轴之统计量):显示 因素分析未转轴前之共同性、特征值、变异数 百分比及累积百分比。
单变量描述性统计量 未转轴之统计量
② “Correlation Matric”(相关矩阵)选项框 A “Coefficients”(系数):显示题项的相关矩 阵
B “Significance levels”(显著水准):求出前 述相关矩阵地显著水准。
C “Determinant”(行列式):求出前述相关矩 阵地行列式值。
D “KMO and Bartlett’s test of sphericity”( KMO与Bartlett的球形检定):显示KMO抽样 适当性参数与Bartlett’s的球形检定。 E “Inverse”(倒数模式):求相关矩阵的反矩 阵。
案例 1
(3)设置对因素的抽取选项:单击图1-1对话框中的“Extraction…”按钮,弹出“Factor Analyze:Extraction”(因素分析:萃取)对话框。
① “Method”(方法)选项框:下拉式选项内 有其中抽取因素的方法:
A “Principal components”法:主成份分析 法抽取因素,此为SPSS默认方法。 B “Unweighted least squares”法:未加权 最小平方法。 C “Generalized least square”法:一般化最 小平方法。 D “Maximum likelihood”法:最大概似法。 E “Principal-axis factoring”法:主轴法。 F “Alpha factoring”法:α因素抽取法。 G “Image factoring”法:映像因素抽取法。
案例 1
(2)设置描述性统计量:单击图1-1对话框中的“Descriptives…”按钮,弹出“Factor Analyze:Descriptives”(因素分析:描述性统计量)对话框。
① “Statistics”(统计量)对话框 A “Univariate descriptives”(单变量描述性 统计量):显示每一题项的平均数、标准差。