因素分析的步骤
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因素分析的过程就是求出该方程组的因素载荷及残差。 因素分析的过程就是求出该方程组的因素载荷及残差 。 如果在方程中残差E 的值很小,可以忽略,方程将变成齐次 齐次的 如果在方程中残差 I的值很小,可以忽略,方程将变成齐次的, 则能够产生变换方程: 则能够产生变换方程: F1= A11 X1+ A12 X 2……A1nXm F2= A21 X1+ A21 X 2……A2nXm …… Fn= Am1 X1+ Am2 X 2……AmnXm 式中的F 为主成分向量。 式中的 i 为主成分向量 。 而 Aij 所形成的矩阵称为主成分 变换矩阵。 变换矩阵。 按照各个变量对因素的方差分析情况将可以产生主成分 分析(Principal Components Analysis)的结果。 由各个变量描 的结果。 分析 的结果 述的因素将通过变量贡献的大小依次排列, 述的因素将通过变量贡献的大小依次排列,其中前几个因素就 集中了对大部分变量的载荷。因此, 集中了对大部分变量的载荷。因此,只需选用前几个因素就把 所有变量描述的主要性质包括了, 所有变量描述的主要性质包括了,剩下的因素将可以作为次要 因素而忽略。 因素而忽略。
因素分析的概念
现假定在某次研究过程中有观测变量: 现假定在某次研究过程中有观测变量: X1、 X2……Xm, 定义因素: 定义因素 : F1 、 F2……Fn 。 其关系可以用下述线性方程组表 示: X1= P11F1+ P12F2……P1nFn+E1 X2= P21 F1+ P21F2……P2nFn+E2 …… Xm= Pm1 F1+ Pm2F2……PmnFn+Em 方程中的系数P 称为因素的系数, 方程中的系数 ij (i=1…m,j=1…n)称为因素的系数, 表 , 称为因素的系数 示因素对某个变量的贡献, 因素载荷” 示因素对某个变量的贡献,即“因素载荷”。 Fi 之间彼此是 正交的,即彼此是不相关的。常数E 称为残差。 正交的,即彼此是不相关的。常数 I称为残差。 因素分析法还定义了一个表达每个因素对所有变量的总 贡献的量:特征值“ 因素载荷P 的平方和。 贡献的量: 特征值“ Eigenvaluej”。即: 因素载荷 ij的平方和。 。 2 m 通常认为,特征值“ 越大越好, 通常认为,特征值“Eigenvaluej”越大越好,当特征值低于 , 越大越好 当特征值低于1, Eigenvalue = ∑ p ij 则该因素就没有意义了。 则该因素就没有意义了。 i=1
因素分析操作步骤 因素分析操作步骤
一、主成分因素分析法 执行菜单命令: 执行菜单命令: [Analyze]、[Data Reduction]、[Factor] 、 、 指定参与因素分析的变量。 指定参与因素分析的变量。 对话框中的“ 对话框中的 “ Selection”为按照指定的变量选择满足条件 为按照指定的变量选择满足条件 的个案,按钮“ 为指定对个案的选择条件。 的个案,按钮“Value”为指定对个案的选择条件。 为指定对个案的选择条件 如果使用系绕默认值进行因素分析则运行的因素分析为主 成分分析“ 成分分析“Principal Component Analysis”。 。 下面以11名学生的 方面学习能力为分析对象。结果有: 名学生的6方面学习能力为分析对象 下面以 名学生的 方面学习能力为分析对象。结果有:
为了使因素结构特征比较明确,往往采用一种叫作“旋转” 为了使因素结构特征比较明确,往往采用一种叫作“旋转” 的方法。经过旋转后,产生的因素对变量的载荷更为集中, 的方法。经过旋转后,产生的因素对变量的载荷更为集中,而 自身仍保持正交性,这称为“正交旋转” 自身仍保持正交性,这称为“正交旋转”。而在某些特殊要求 为了使因素结构更为明确,可以不考虑因素之间的正交性, 下,为了使因素结构更为明确,可以不考虑因素之间的正交性, 而使因素与变量之间的关系更容易从理论上加以解释, 而使因素与变量之间的关系更容易从理论上加以解释,这种方 法称为“斜交旋转” 法称为“斜交旋转”。
主成分载荷矩阵Component Matrix 主成分载荷矩阵 主成分载荷矩阵表达了用两个主成分所形成的方程, 用主成分载荷矩阵表达了用两个主成分所形成的方程,方 程形式应当是: 程形式应当是:
Componentl=0.713Xl-0.728X2+0.93X3+0.881X4+0.564X5+0.827X6 Component2=-0.5Xl+0.249X2+0.284X3+0.329X4-0.684X5+ 0.448X6
百度文库
公共因素方差变化表Communalities: : 公共因素方差变化表 将各个变量在因素抽取前后所发生的方差变化列出来。 将各个变量在因素抽取前后所发生的方差变化列出来 。 为抽取之前各个变量的方差, , “Initial”为抽取之前各个变量的方差,如果一律认为是 为抽取之前各个变量的方差 如果一律认为是100%, 则抽取后各个变量的方差将变为“ 所列出的数值。 则抽取后各个变量的方差将变为 “ Extraction”所列出的数值。 所列出的数值 所列出的数值不应当小于0.5。 “Extraction”所列出的数值不应当小于 。 所列出的数值不应当小于 总方差解释表 Total Variance Explained 总方差解释表对各个变量作为主成分的特征值进行了计算。 总方差解释表对各个变量作为主成分的特征值进行了计算。 由于系统采用的方法为主成分分析法,因此, 由于系统采用的方法为主成分分析法,因此,抽取的因素就是 主成分。 主成分。 表中初始特征值“ 一项的“ 表中初始特征值“Initial Eigenvalues”一项的“Total”中可 一项的 中可 以看到,只有可能抽取两个因素作为主成分因素, 以看到,只有可能抽取两个因素作为主成分因素,因为其他初 始特征值都小于 小于1。从表中初始特征值“ 始特征值都小于 。从表中初始特征值“Initial Eigenvalues”的 的 另一项积累百分比“Cumulative %”中可以看到,当抽取两个 另一项积累百分比“ 中可以看到, 中可以看到 因素作为主成分时,它两个的积累百分比已经达到80.862%, 因素作为主成分时,它两个的积累百分比已经达到 , 这可以解释成为用两个主成分的贡献率已经达到80.862%了, 这可以解释成为用两个主成分的贡献率已经达到 了 故使用两个主成分的解释率已经非常高了。 故使用两个主成分的解释率已经非常高了。
因 素 分 析
因素分析是一种多元统计分析方法,这种统计分析方法 因素分析是一种多元统计分析方法, 是将描述某一事物的多个变量缩减成描述该事物的少数几个潜 是将描述某一事物的多个变量缩减成描述该事物的少数几个潜 变量Latant variable,即:因素,的统计方法。 因素,的统计方法。 变量 , 在许多实验研究中,为了全面探测事物的属性, 在许多实验研究中,为了全面探测事物的属性,往往利 用较多的变量来充分获取事物的信息。 用较多的变量来充分获取事物的信息。但有可能原本设计用来 描述事物的某一种性质的变量, 描述事物的某一种性质的变量,事实上它描述的却是另外一种 性质。还可能描述某种性质的一个变量不能充分反映该性质。 性质。还可能描述某种性质的一个变量不能充分反映该性质。 因此, 因此,因素分析的研究方法就是将变量与其所描述的事物属性 ----“因素”用线性方程组来表达。方程组的系数表达变量与其 因素” 因素 用线性方程组来表达。 所描述的“因素”的关系,称为:因素对变量的载荷 载荷。 所描述的“因素”的关系,称为:因素对变量的载荷。载荷的 大小将反映“因素”对变量的贡献大小。 大小将反映“因素”对变量的贡献大小。 有时,为了使变量对因素有比较集中的描述, 有时,为了使变量对因素有比较集中的描述,可以通过 坐标变换来建立“因素” 坐标变换来建立“因素”,这种变换将使变量的影响按照不同 因素区分开来,使得不同因素对应一组不同的描述变量, 因素区分开来,使得不同因素对应一组不同的描述变量,这种 方法称为旋转变换。经过旋转变换后, 方法称为旋转变换。经过旋转变换后,因素间仍然保持不相关 的称为“正交变换” 因素间具有一定的相关性的称为“ 的称为“正交变换”,因素间具有一定的相关性的称为“斜交 变换” 变换”。
⒉“Display”结果显示 结果显示 显示旋转结果。 “Rotated Solution”:显示旋转结果。在指定了旋转方法后, 显示旋转结果 在指定了旋转方法后, 对 正 交 旋 转 将 显 示 : 旋 转 成 分 矩 阵 “ Rotated Component Matrix” 和 成 分 转 换 矩 阵 “ Component Transformation Matrix”, 前者是正交旋转后产生的因素载荷矩阵,后者是正 , 前者是正交旋转后产生的因素载荷矩阵, 交旋转后因素相关矩阵。而对斜交旋转将显示:旋转后的因素 交旋转后因素相关矩阵。而对斜交旋转将显示: 模 式 矩 阵 “ Pattern Matrix” 和 因 素 结 构 矩 阵 “ Structure Matrix”,前者是在叠代到第 次时产生的因素载荷矩阵,后者 次时产生的因素载荷矩阵, ,前者是在叠代到第5次时产生的因素载荷矩阵 是在叠代完毕后产生的因素载荷矩阵。另外还将显示 成分因素相关矩阵。 “Component Correlation Matrix”成分因素相关矩阵。 成分因素相关矩阵 显示因素载荷散点图“ “Loading plot(s)”显示因素载荷散点图“Component Plot 显示因素载荷散点图 in Rotated Space”。该图形是一个双因素或三因素关于各个变 。 量的载荷散点图。每个变量在图形中为一个数据点,这些数据 量的载荷散点图。每个变量在图形中为一个数据点, 点最好能够分布在某一个坐标轴的远端,即载荷越接近1或 点最好能够分布在某一个坐标轴的远端 ,即载荷越接近 或 -1 越好,而对于另一个坐标轴则越接近0越好 即载荷越接近0越 越好, 越好,而对于另一个坐标轴则越接近 越好,即载荷越接近 越 好。 ⒊“Maximum Iteration for Convergence”最大叠代收敛次 最大叠代收敛次 数 系统默认叠代收敛次数为25次 系统默认叠代收敛次数为 次。
二、旋转法因素分析 因素分析对话窗口下方的“ 旋转)按钮 因素分析对话窗口下方的“Rotation” (旋转 按钮,有两个 旋转 按钮, 选择模块和一个单项选择。 选择模块和一个单项选择。 ⒈“Method”旋转方法 旋转方法 不进行旋转,这是系绕默认选项。 “None”: 不进行旋转,这是系绕默认选项。 方差最大旋转, “Varimax”: 方差最大旋转,为正交矩阵旋转最常用的方 法。这种方法可以尽量减少每个因素上的具有最大载荷的变量 个数。 个数。 四次方最大正交旋转。 “Quartmax”: 四次方最大正交旋转。这种方法可以尽量减 少解释每个变量的因素个数。 少解释每个变量的因素个数。 平均正交旋转。 “Equamax”: 平均正交旋转。这种方法既可以尽量减少每 个因素上的具有最大载荷的变量个数,又可以减少解释每个变 个因素上的具有最大载荷的变量个数, 量的因素个数。 量的因素个数。 “ Direct Oblimin”: 直 接 斜 交 旋 转 。 选 择 该 项 还 须 在 提示后输入一个“ 之间, “ Delta”提示后输入一个“Delta”值,该值应该在 ~ -l之间, 提示后输入一个 值 该值应该在O~ 之间 是因素映象自相关的范围。 值产生最高相关因素 值产生最高相关因素, 是因素映象自相关的范围。 0值产生最高相关因素,大负数产 生的斜交旋转的结果与正交旋转的结果接近。 生的斜交旋转的结果与正交旋转的结果接近。 斜交旋转。这种方法可以允许因素之间相关, “Promax”: 斜交旋转。这种方法可以允许因素之间相关, 其处理速度比直接斜交旋转法快,适合样本数量较大的情况。 其处理速度比直接斜交旋转法快,适合样本数量较大的情况。
由主成分载荷矩阵可以了解到主成分 “Componentl”对每 主成分载荷矩阵可以了解到主成分1 可以了解到主成分 对每 一个变量的载荷都不小,而主成分2 一个变量的载荷都不小,而主成分 “Component2”对每一个 对每一个 变量的载荷都不大。这可以理解为,主成分1可以解释所有变 变量的载荷都不大。这可以理解为,主成分 可以解释所有变 量的绝大部分,而主成分2只能解释所有变量的剩下的一小部 量的绝大部分,而主成分 只能解释所有变量的剩下的一小部 这对于理论上的解释是很困难的。因为, 分。这对于理论上的解释是很困难的。因为,我们不能说出因 素一或主成分1 涵盖了哪些变量测量的结果, 素一或主成分 “Componentl”涵盖了哪些变量测量的结果,因 涵盖了哪些变量测量的结果 涵盖了另一些变量测量的结果。 素二或主成分2 素二或主成分 “Component2”涵盖了另一些变量测量的结果。 涵盖了另一些变量测量的结果 为了使因素能够更好的解释变量, 为了使因素能够更好的解释变量,应当将不同因素所解释 的变量尽量分开 这就需要采用后面所介绍的旋转方法了。 尽量分开, 的变量尽量分开,这就需要采用后面所介绍的旋转方法了。