因子分析ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因子分析
主成分分析的数学模型
因子分析
主成分分析与因子分析的公式上的区别
因子分析(m<p)
y1 a11x1 a12 x2 L a1 p x p y2 a21x1 a22 x2 L a2 p x p LL
主成分分析
y p a p1x1 a p2 x2 L a pp x p
x1 a11 f1 a12 f2 L a1m fm 1 x2 a21 f1 a22 f2 L a2m fm 2
因子分析
统计学原理 因子分析的含义
因子分析,又叫因素分析,就是通过寻找众多变量的公共因 素来简化变量中存在复杂关系的一种统计方法,它将多个变量综合 为少数几个“因子”以再现原始变量与“因子”之间的相关关系。
因子分析
因子分析
寻找基本结构
在多元统计中,经常遇到诸多变量之间存在强相关的问题,它会 对分析带来许多困难。通过因子分析,可以找出几个较少的有实际意 义的因子,反映出原来数据的基本结构。例如:调查汽车配件的价格 中,通过因子分析从20个指标中概括出原材料供应商、配件厂商、新 进入者、后市场零部件厂商、整车厂和消费者6个基本指标。从而找 出对企业配件价格起决定性作用的几个指标。
因子分析
如何从众多相关的指标中找出少数几个综合性指标来反 映原来指标所包含的主要信息,这就需要进行 因子分析 (Factor Analysis),它是用少数几个因子来描述许多指标或因 素之间的联系,即:用较少几个因子反映原始数据的大部分信 息的统计方法。
因子分析
在 SPSS 系 统 里 , 实 现 因 子 分 析 的 功 能 是 在 Data Reduction命令菜单中。
有的因素,即所谓独特因子部分。其中
叫做公共因子,
它们是在各个变量中共同出现的因子。我们可以把它们看作多维空间分布中互
相垂直的 个坐标轴。
表示影响 的独特因子,指原有变
量不能被因子变量所解释的部分,相当于回归分析中的残差部分。 叫做因子
负荷(载荷),它是第 个变量在第 个主因子上的负荷或叫做第 个变量在
注:单位阵:主对角线上的元素都是1,其余的元素都是零的 n 阶方阵,叫做 n 阶单位矩阵
4阶单位阵
因子分析
2. KMO(Kaiser-Meyer-Olkin)检验。KMO统计量用于检验变量间的偏相关性 是否足够小,是简单相关量和偏相关量的一个相对指数,由下式求得:
KMO>0.9 非常适合 0.8<KMO<0.9 适合 0.7<KMO<0.8 一般 0.6<KMO<0.7 不太适合 KMO<0.5 不适合
因子分析
—SPSS操作及其原理
因子分析
2008-4-23
在科学研究中,往往希望尽可能多地收集反映研究对象 的多个变量,以期能对问题有比较全面、完整的把握与认识。 多变量的大样本虽然能为科学研究提供大量的信息,但是在一 定程度上增加了数据采集的工作量,更重要的是在大多数情况 下,许多变量之间可能存在相关性,这意味着表面上看来彼此 不同的变量并不能从各个侧面反映事物的不同属性,而恰恰是 事物同一种属性的不同表现。
因子分析
简单相关系数:
相关系数:表示两要素之间的相关程度的统计指标。 对于两个要素x与y,如果它们的样本值分别为 xi与yi(i=1,2,...,n),它
们之间的相关系数:
因子分析
偏相关系数
在多要素构成的系统中,当研究某一个要素对另一个要素的影响或相关程度时, 把其它要素的影响视为常数,而单独研究两个要素之间的相互关系的密切程度时,称 为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。
LL
xp ap1 f1 ap2 f2 L apm fm p
因子得分
f1 11x1 12 x2 L 1p xp f2 21x1 22 x2 L 2 p xp
LL
fm m1x1 m2 x2 L mp xp
因子分析
因子分析的基本步骤
1.确定因子分析的前提条件
因子分析是从众多的原始变量中综合出少数几个具有代表性的因子,这 必定有一个前提条件,即原有变量之间具有较强的相关性。如果原有变量之间 不存在较强的相关关系,则无法找出其中的公共因子。因此,在因子分析时需 要对原有变量做相关分析。通常可采用如下几种方法:
因子分析
数据化简
通过因子分析,可以找出少数的几个因子来代替原来的 变量做回归分析、聚类分析、判别分析等。
Baidu Nhomakorabea因子分析
数学模型
因子分析可以通过下面的数学模型来表示:
独特因子 公共因素
因子分析
因子分析把每个原始变量分解成两部分:一部分是由所有变量共同具有
的少数几个因子所构成的,即所谓公共因素部分;另一部分是每个变量独自具
在第 个主因子上的权值,它反映了第 个变量在第 个主因子上的相对重要
性。
因子分析
主成分分析
主成分分析:通过对一组变量的几个线性组合来解释这组变量的方差和协方 差结构,以达到数据的压缩和数据的解释的目的。
若有一些指标 ,取综合指标即它们的线性组合F,当然有很多,我们希望 线性组合F包含很多的信息,即var(F)最大,这样得到F记为F1 ,然后再找F2 , F1与 F2无关,以此类推,我们找到了一组综合变量 F1 ,F2,… ,Fm,这组变量基本包含了 原来变量的所有信息。
因子分析
(1)计算相关系数矩阵
计算原有变量的简单相关系数矩阵。观察相关系数矩阵,如果相关系数 矩阵中的大部分相关系数值小于 0.3,则各个变量之间大多为弱相关,这就不 适合做因子分析。如果一个变量与其他变量间相关度很低,则在下一分析步骤 中可考虑剔除此变量。
因子分析
(2)进行统计检验
在因子分析过程中提供了几种检验方法来判断变量是否适合做因子分析。主要统 计方法有如下两种:
一级偏相关系数: 假设有三个要素x1、x2、x3,它们之间的偏相关系数共有三个, 即r12.3,r13.2,r23.1其计算公式分别如下:
1. 巴特利球形检验(Barlett Test of Sphericity)。它是以变量的相关系数矩阵为 出发点,零假设:相关系数矩阵是一个单位阵。如果巴特利球形检验的统计计量数 值较大,且对应的相伴概率值小于用户给定的显著性水平,则应该拒绝零假设;反 之,则不能拒绝零假设,认为相关系数矩阵可能是一个单位阵,不适合做因子分析。
主成分分析的数学模型
因子分析
主成分分析与因子分析的公式上的区别
因子分析(m<p)
y1 a11x1 a12 x2 L a1 p x p y2 a21x1 a22 x2 L a2 p x p LL
主成分分析
y p a p1x1 a p2 x2 L a pp x p
x1 a11 f1 a12 f2 L a1m fm 1 x2 a21 f1 a22 f2 L a2m fm 2
因子分析
统计学原理 因子分析的含义
因子分析,又叫因素分析,就是通过寻找众多变量的公共因 素来简化变量中存在复杂关系的一种统计方法,它将多个变量综合 为少数几个“因子”以再现原始变量与“因子”之间的相关关系。
因子分析
因子分析
寻找基本结构
在多元统计中,经常遇到诸多变量之间存在强相关的问题,它会 对分析带来许多困难。通过因子分析,可以找出几个较少的有实际意 义的因子,反映出原来数据的基本结构。例如:调查汽车配件的价格 中,通过因子分析从20个指标中概括出原材料供应商、配件厂商、新 进入者、后市场零部件厂商、整车厂和消费者6个基本指标。从而找 出对企业配件价格起决定性作用的几个指标。
因子分析
如何从众多相关的指标中找出少数几个综合性指标来反 映原来指标所包含的主要信息,这就需要进行 因子分析 (Factor Analysis),它是用少数几个因子来描述许多指标或因 素之间的联系,即:用较少几个因子反映原始数据的大部分信 息的统计方法。
因子分析
在 SPSS 系 统 里 , 实 现 因 子 分 析 的 功 能 是 在 Data Reduction命令菜单中。
有的因素,即所谓独特因子部分。其中
叫做公共因子,
它们是在各个变量中共同出现的因子。我们可以把它们看作多维空间分布中互
相垂直的 个坐标轴。
表示影响 的独特因子,指原有变
量不能被因子变量所解释的部分,相当于回归分析中的残差部分。 叫做因子
负荷(载荷),它是第 个变量在第 个主因子上的负荷或叫做第 个变量在
注:单位阵:主对角线上的元素都是1,其余的元素都是零的 n 阶方阵,叫做 n 阶单位矩阵
4阶单位阵
因子分析
2. KMO(Kaiser-Meyer-Olkin)检验。KMO统计量用于检验变量间的偏相关性 是否足够小,是简单相关量和偏相关量的一个相对指数,由下式求得:
KMO>0.9 非常适合 0.8<KMO<0.9 适合 0.7<KMO<0.8 一般 0.6<KMO<0.7 不太适合 KMO<0.5 不适合
因子分析
—SPSS操作及其原理
因子分析
2008-4-23
在科学研究中,往往希望尽可能多地收集反映研究对象 的多个变量,以期能对问题有比较全面、完整的把握与认识。 多变量的大样本虽然能为科学研究提供大量的信息,但是在一 定程度上增加了数据采集的工作量,更重要的是在大多数情况 下,许多变量之间可能存在相关性,这意味着表面上看来彼此 不同的变量并不能从各个侧面反映事物的不同属性,而恰恰是 事物同一种属性的不同表现。
因子分析
简单相关系数:
相关系数:表示两要素之间的相关程度的统计指标。 对于两个要素x与y,如果它们的样本值分别为 xi与yi(i=1,2,...,n),它
们之间的相关系数:
因子分析
偏相关系数
在多要素构成的系统中,当研究某一个要素对另一个要素的影响或相关程度时, 把其它要素的影响视为常数,而单独研究两个要素之间的相互关系的密切程度时,称 为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。
LL
xp ap1 f1 ap2 f2 L apm fm p
因子得分
f1 11x1 12 x2 L 1p xp f2 21x1 22 x2 L 2 p xp
LL
fm m1x1 m2 x2 L mp xp
因子分析
因子分析的基本步骤
1.确定因子分析的前提条件
因子分析是从众多的原始变量中综合出少数几个具有代表性的因子,这 必定有一个前提条件,即原有变量之间具有较强的相关性。如果原有变量之间 不存在较强的相关关系,则无法找出其中的公共因子。因此,在因子分析时需 要对原有变量做相关分析。通常可采用如下几种方法:
因子分析
数据化简
通过因子分析,可以找出少数的几个因子来代替原来的 变量做回归分析、聚类分析、判别分析等。
Baidu Nhomakorabea因子分析
数学模型
因子分析可以通过下面的数学模型来表示:
独特因子 公共因素
因子分析
因子分析把每个原始变量分解成两部分:一部分是由所有变量共同具有
的少数几个因子所构成的,即所谓公共因素部分;另一部分是每个变量独自具
在第 个主因子上的权值,它反映了第 个变量在第 个主因子上的相对重要
性。
因子分析
主成分分析
主成分分析:通过对一组变量的几个线性组合来解释这组变量的方差和协方 差结构,以达到数据的压缩和数据的解释的目的。
若有一些指标 ,取综合指标即它们的线性组合F,当然有很多,我们希望 线性组合F包含很多的信息,即var(F)最大,这样得到F记为F1 ,然后再找F2 , F1与 F2无关,以此类推,我们找到了一组综合变量 F1 ,F2,… ,Fm,这组变量基本包含了 原来变量的所有信息。
因子分析
(1)计算相关系数矩阵
计算原有变量的简单相关系数矩阵。观察相关系数矩阵,如果相关系数 矩阵中的大部分相关系数值小于 0.3,则各个变量之间大多为弱相关,这就不 适合做因子分析。如果一个变量与其他变量间相关度很低,则在下一分析步骤 中可考虑剔除此变量。
因子分析
(2)进行统计检验
在因子分析过程中提供了几种检验方法来判断变量是否适合做因子分析。主要统 计方法有如下两种:
一级偏相关系数: 假设有三个要素x1、x2、x3,它们之间的偏相关系数共有三个, 即r12.3,r13.2,r23.1其计算公式分别如下:
1. 巴特利球形检验(Barlett Test of Sphericity)。它是以变量的相关系数矩阵为 出发点,零假设:相关系数矩阵是一个单位阵。如果巴特利球形检验的统计计量数 值较大,且对应的相伴概率值小于用户给定的显著性水平,则应该拒绝零假设;反 之,则不能拒绝零假设,认为相关系数矩阵可能是一个单位阵,不适合做因子分析。