探索性因素分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一行(或每一列)绝对值最大的一个元 素作为该行(或该列)变量共同度的估 计。
复相关系数平方估计法
Z J变量的复相关系数的平方为:
1 SMC j 1 Rjj
其中 RJJ 为对角线元素为 1 的相关矩阵 R 的 逆矩阵中第j个变量对角线的元素,SMC 是共同度估计的下限。
公共因素个数的确定

特征值大于等于1的选为共因素,小于1
的不选。
碎石检验(screen test)
以特征值为纵坐标,以因素个数为横坐
标,按照因子被提取的顺序,画出因子 的特征值随因子个数变化的散点图,根 据图的形状来判断抽取因子的个数。从 第一个因子开始,曲线逐渐下降,然后 变得平缓,最后近似于一条直线,曲线 变平的前一点被认为是提取的最大因子 数。
对观测变量的加权系数 jk 。一般情况 下,称共因素的系数为因素载荷。即因 素分析模型中的系数。将所有的因素载 荷以矩阵的形式表示即为因素载荷以矩 阵。
公共因素方差
公 共 因 素 方 差 一 般 用 h2 表 示 , 又 称 作
“共同度”或“公共性”,公共因素方 差是指被公共因素所决定的方差在观测 变量总方差中所占的比例。 在对观测数据进行标准化的情况下,一 个观测变量的总方差Sj2为:
Q bij Max
2 i 1 j 1 k m
②方差最大法(VARIMAX)
四次方最大法的不同是它从简化因子负荷 矩阵的每一列出发,使和每个因子有关 的负荷平方的方差最大。方差最大法通 过使下式达到最大求得因子解:
V (k bij ( bij ) ) / k 2
4 2 2 j 1 i 1 i 1 m k k
因素分析中的基本概念
因素载荷(Factor loading) 公共因素方差(Communality)
唯一性方差(uniqueness )
jk
特征值(Eigenvalue)
贡献率(Explain of Variance)
因素载荷(Factor loading)
因素载荷指因素分析模型中各公共因素
③等量最大法(EQUIMAX)
等量最大法把四次方最大法和方差最大法 结合起来,取V和Q的加权平均作为简化 准则,通过使下式达到最大:
E bij ( bij ) / k
4 2 2 j 1 i 1 j 1 i 1 m k m k
权数γ 等于m/2,和因子数有关,当因子 数为2时,等量旋转法结果与方差最大 法旋转结果相同。
旋转变换
初始因子解达到了数据化简的目的。在求初 始因子这一步中,我们既确定了共因素个数, 又确定了每个变量的公因子方差。可是根据
初始因子解,往往很难解释因子的意义,大 多数因子都和很多变量相关,但是在实际研 究中,我们往往关心每个因子的实际意义是 什么。因子旋转是寻求这一实际意义的有效 工具,因子旋转的目的是通过改变坐标轴的 位置,重新分配各个因子所解释的方差的比 例,使因子结构简单并易于解释。因子旋转 不改变模型对数据的拟合程度,不改变每个 变量的公因子方差。
是指用n个新的因素来线性表示n个观测变量的因素分 析模型(m=n)。
Z j a j1F1 a j 2 F2 a jn Fn
此模型希望从一组相关观测变量中每次取得的一个 公共因素的方差在观测变量的全部方差(或剩余方 差)中所占的比例最大,这一思想也是全分量模型 确定公共因素的一种数学准则。 但在实际应用中, 人们总是只取少数几个对观测变量的方差贡献较大 的即为首的几个因素。于是得到截分量模型
Av v
则称为矩阵A的一个特征值,称v为 对应于特征值的一个特征向量。
特征值
在因素分析中,特征值表示每个因素 在所有变量上的因素负荷的平方之和 它反映某一公共因素对各观测变量的 影响程度,也说明该公共因素的重要 性。特征值越大,说明该公共因素相 对重要。
贡献率
各因素的特征值( j )在总的公共 因素方差之和中所占的比例。反映 该因素对所有观测变量变异影响的 大小。第j个共因素的方差贡献率为:
初始因素载荷矩阵求解
对于全分量模型来说,直接从变量相关矩阵 入手求解因素载荷矩阵;而对于公共因素模 型,则从约相关矩阵出发来求解因素载荷矩
阵A。目前,求解因素载荷矩阵使用较为普遍 的一种方法是主因素解法(在全分量模型中 称为主成分分析法)。它的基本思想是,考 虑第一共同因素的方差对所有变量的方差贡 献最大,第二共同因素对所有变量的方差贡 献次之,……依次将全部变量的方差分解为 各共同因素方差,最终求得因素载荷矩阵。
求因素得分涉及到用观测变量来描述因
素,第p个因子在第i个个案上的值可以 表示为: k f pi w pj Z ji
j 1
这一模型确切地说应称为截分量模型(truncated component model),但经常被称作主成分分析模 型。误差项ajej表示被忽略的几项因素之和。
公共因素模型
指所有观测变量中每个观测变量均可被表示为 m个公共 因素和一个唯一性因素的线性加权之和:
Z j a j1F1 a j 2 F2 a jmFm d j u j
(j=1,2,3, ……n m<n) 其中公共因素可以解释观测变量之间的相关,唯一性 因素则用以解释观测变量除去公共因素的影响后所剩 下的那部分方差。
公共因素模型
这一模型希望从观测变量中抽取到的因素能尽可能好 地再生观测变量之间 的相关。在这一模型中将观测 变量、公共因素和唯一性因素都假定为标准变量,平 均数为0,标准差为1,而且n个唯一因素uj之间相互 独立,每个唯一性因素与各个公共因素 Fp(p=1,2, ……,m)之间相互独立。各公共因素Fp是随 机变量。若假定各公共因素为互相独立的正态分布, 则观测变量Zj就服从多元正态分布。在实际应用公共 因素分析方法时,通常把唯一性因素看作不包括模型 误差,也就是说因素分析没有考虑抽样误差。因此, 抽样就必须足够大,以使抽样误差被忽视,样本究竟 多大合适,一般至少要大于100,或者是变量数目的 5——10倍。
因素分析模型
因素分析假定个体在某一变量上的反应由两部分组成:一
是 各 个 变 量 共 有 的 部 分 , 称 为 共 同 因 素 ( Common Factor);另一部分是各变量所特有的部分,称为独特因 素(Unique Factor),可用下式表示:
zij a j1 Fi1 a j 2 Fi 2 a jm Fim d jU ij
斜交旋转
常见的为OBLIMIN,该方法应用斜交参考轴 求解。所谓的斜交参考轴是指斜主因子轴的 垂直线。斜交因子解应使变量尽可能落在主
轴附近,变量落在主轴附近和变量在参考轴 上的投影近似为零这两个条件是相同的。 OBLIMIN方法首先求出斜交参考矩阵,斜交 因子负荷矩阵等于斜交参考阵的逆矩阵再按 行进行规范化处理,使矩阵中每一行的元素 的平方和等于1。参数δ 控制因子斜交的程度, 其取值一般小于等于零,等于零时,因子之 间的斜交程度最大,小于零时因子之间的斜 交程度减小。另外还有Promax法。
探索性因素分析
主要内容
因素分析简介 因素分析模型
因素分析中的基本概念
求共因素的主要方法 因素旋转方法
因素得分
应用因素分析应该注意的问题 因素分析应用举例
因素分析简介
行为科学和社会科学研究中多变量之间
的统计分析方法主要有: 1.将多个变量与某种称为准则变量的外 部变量联系起来进行分析。回归分析、 方差分析等。 2.不使用外部准则而同等地对待所有变 量,分析它们之间的相互关系。相关分 析、因素分析等。
截分量模型(主成分分析模型)
在实际应用中,人们总是只取少数几个对观测变
量的方差贡献较大的即为首的几个因素。有些人 把几个方差贡献较小的因素看作误差项。于是全 分量模型就成为:
Z j a j1F1 a j 2 F2 a jm Fm a j e j
(j=1,2,3, ……n m<n)
求初始因素载荷矩阵的一般方法
Principal Components Unweighted Least Squares
Generalized Least Squares
Maximum Likelihood
Principal Axis FImage Factoring
探索性因素分析
探索性因素分析(Exploratory Factor Analysis) 是一种常用的多元数据分析方法,它是从众 多可观测“变量”中,概括和推论出少数不
可观测的“潜变量”(又称因素),目的在 于用最少的因素去概括和解释大量的观测事 实,并建立起最简洁的,基本的概念系统, 以揭示事物之间的本质联系的一种统计分析 方法。这种方法的原则是在尽可能保存原有 资料信息的前提下,用较少的维度去表示原 来的数据结构。
V j j /(1 2 m )
变量共同度的估计
在全分量模型中可以直接用相关矩阵求
解因素载荷矩阵,在公共因素模型中, 由于考虑特殊因素对变量的影响,求解 因素载荷矩阵则以约相关矩阵为出发点。 估计变量的共同度是得到约相关矩阵估 计的关键,
最大相关系数估计法
最大相关系数估计法是把原相关矩阵每
zij 是第i个体在第j观测变量上的得分,(
测变量的加权系数,(Fik)是个体i在因素F k上的得分, Uij为特殊因素,dj为特殊因素对观测变量的加权系数;N 为样本容量,n为观测变量的个数,m为共因素的个数。 因素分析的模型主要有全分量模型和公因子模型两个。
j k)是因素对观
全分量模型 (主成分分析模型)
6.因子得分及应用
在公式 zij a j1 Fi1 a j 2 Fi 2 a jm Fim d jU ij
中可以将变量表示成公共因素的线性组
合。但在有些场合,需要考虑通过变量 Z的值来获得共因素指标F的值。这种由 变量的观测值来估计各公共因素值的方 法称为因素得分。
因素得分及其应用
jk
其中由公共因素决定的方差为:
h j a j1 a j 2 a jm a jp
2 2 2 2 p 1
m
2
公共因素方差在测验或特质行 为的研究方面主要有以下用途:
1. 公共因素方差能反映该测验对所要测量行 为属性的测量程度,公共因素方差越大,该 因素所能反映的行为属性程度就越强,某一
根据累计贡献率确定因子个数 以特征值是否大于等于1为标准 碎石检验
根据累积贡献率确定因子个数
将约相关矩阵(在主成分分析中,用相
关矩阵)的特征值从大到小排列,根据 前面若干个共同因素所对应的特征值之 和的百分比来确定。一般来说,这一比 例要达到 80% 以上,但根据问题的复杂 程度可做适当调整。
. 以特征值是否大于等于 1 为标
因子旋转的方式
因子旋转的方式有两种,一种是正交旋
转,另一种是斜交旋转。正交旋转是使 因子轴之间仍然保持90度角,即因子之 间是不相关的,而在斜交旋转中,因子 之间的夹角可以是任意的,即因子之间 可以相关。
正交旋转
①四次方最大法 (QUARTIMAX)
通过使因子载荷矩阵中每一行因子负荷平 方的方差达到最大求得因子解。最终的 简化准则为:
唯一性方差(uniqueness)
归因于唯一性因素的那部分方差称 为唯一性方差,唯一性方差表示 m 个公共因素对观测变量的方差不能 作出解释的部分,一部分归因于所 选变量的特殊性,称为特殊性方差; 剩余部分归因于测量的不完备性。
特征值
特征值: 对于一个n阶矩阵A,如果 存在一个n维向量v和一个常数,满足 条件
因素的方差贡献率越大,说明该因素在他所 测量的特质中,它所起的作用就越大。 2.如果在构成一个测验的诸多项目中,某些项 目构成的因素的公共方差大,说明这些项目 测定被试的个别差异的功能强,也说明该组 项目的区分度好,鉴别力高,同理公共因素 方差越小,该项目的鉴别力越低。因此项目 的公共因素方差,可用作评价项目区分度的 一种指标。
相关文档
最新文档