第9章 因子分析(王斌会)

合集下载

因子分析 PPT课件

因子分析  PPT课件

同时假定随机向量 X 满足以下模型: X 1 a11F1 a12 F2 a1m Fm 1 X a F a F a F 2 12 1 22 2 2m m 2 X p a p1 F1 a p 2 F2 a pm Fm P 则称模型(3.1)为正交因子模型。
设 X ( X1 , X 2 ,
E( F ) 0 , Cov( F ) I m (即 F 的各分量方差为 1,且互不相关) 。又设 (1, 2 , , p ) 与 F 互不相关,且
2 E ( ) 0 , Cov( ) diag(12 ,2 , 2 , p )。
之因子分析
SPSS软件
• 因子分析(Factor Analysis)是多元统计 分析中处理降维问题的一种重要方法。变 量的共线性很多是都对分析结果具有显著 的影响。所谓降维,就是独钓共线性,剩 下的,或者合并的都是线性无关的,或者 正交的,或者垂直的。
一、什么是主成分分析和因子分析?
• 主成分分析(Principal Components Analysis)也是多元统计分析中简化数据 结构(降维问题)的一种重要方法。简化 数据结构是指将某些较复杂的数据结构通 过变量变换等方法使相互依赖的变量变成 互不相关的;或把高维空间的数据投影到 低维空间,使问题得到简化而损失的信息 市的实证 设施建设情况。
案例1
• 中国统计年鉴,2005,各地区城市市政设施数据。 变量有: • City—城市名称; • X1—年末实有道路长度(公里); • X2—年末实有道路面积(万平方公里); • X3—城市桥梁(座); • X4—城市排水管道长度(公里); • X5—城市污水日处理能力(万立方米); • X6—城市路灯(盏);

因子分析方法ppt课件

因子分析方法ppt课件

10
因子分析数学模型中几个相关概念
举例说明:
11
12
因子分析的五大基本步骤
第一步:因子分析的前提条件
由于因子分析的主要任务之一是对原有变量进行浓缩,即将 原有变量中的信息重叠部分提取和综合成因子,进而最终实 现减少变量个数的目的。因此它要求原有变量之间应存在较 强的相关关系。否则,如果原有变量相互独立,相关程度很 低,不存在信息重叠,它们不可能有共同因子,那么也就无 法将其综合和浓缩,也就无需进行因子分析。本步骤正是希 望通过各种方法分析原有变量是否存在相关关系,是否适合 进行因子分析。
2
因子分析的基本模型
因子分析模型中,假定每个原始变量由两部分组成: 共同因子和唯一因子。 共同因子是各个原始变量所共有的因子,解释变 量之间的相关关系。
唯一因子顾名思义是每个原始变量所特有的因子, 表示该变量不能被共同因子解释的部分。原始变量 与因子分析时抽出的共同因子的相关关系用因子负 荷表示。
18
第四步:决定因素与命名
• 转轴后,要决定因素数目,选取较少因素 层面,获得较大的解释量。在因素命名与 结果解释上,必要时可将因素计算后之分 数存储,作为其它程序分析之输入变量。
19
第五步:计算各样本的因子得分
• 因子分析的最终目标是减少变量个数,以 便在进一步的分析中用较少的因子代替原 有变量参与数据建模。本步骤正是通过各 种方法计算各样本在各因子上的得分,为 进一步的分析奠定基础。
因子分析方法
1
因子分析的基本概念
因子分析的概念 就是在尽可能不损失信息或少损失信息的情况下,将多个变量减少为 少数几个潜在的因子。也就是用少数几个因子来描述许多指标或因素之 间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方 法 主成分分析(Principal component analysis): 是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标 变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相 关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少 变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信 息。 两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降 低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子 分析的一个特例

因子分析读书笔记

因子分析读书笔记

因子分析读书笔记第一篇:因子分析读书笔记因子分析是指研究从变量群中提取共性因子的统计技术。

最早由英国心理学家C.E.斯皮尔曼提出。

他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。

因子分析可在许多变量中找出隐藏的具有代表性的因子。

将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。

因子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量(latent variable, latent factor)。

比如,如果要测量学生的学习积极性(motivation),课堂中的积极参与,作业完成情况,以及课外阅读时间可以用来反应积极性。

而学习成绩可以用期中,期末成绩来反应。

在这里,学习积极性与学习成绩是无法直接用一个测度(比如一个问题)测准,它们必须用一组测度方法来测量,然后把测量结果结合起来,才能更准确地来把握。

换句话说,这些变量无法直接测量。

可以直接测量的可能只是它所反映的一个表征(manifest),或者是它的一部分。

在这里,表征与部分是两个不同的概念。

表征是由这个隐性变量直接决定的。

隐性变量是因,而表征是果,比如学习积极性是课堂参与程度(表征测度)的一个主要决定因素。

因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。

这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性□2估值。

在社会学研究中,因子分析常采用以主成分分析为基础的反覆法第二篇:因子分析方法因子分析法1.因子分析(Factor Analysis)因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。

医学高级统计学第九章因子分析

医学高级统计学第九章因子分析

因子分析引言
因子分析的形成和早期发展一般认为是从Charles Spearman在1904年发表的文章开始.他提出这种方 法用来解决智力测验得分的统计分析. 因子分析在 心理学、社会学、经济学等学科都取得成功的应用。
初学因子分析的人最大的困难就是理解它的模型。 我们先看几个例子。
举例1:某学校33个学生6门功课的相关矩阵
设G为一个m m正交阵,则有
X (AG)( GF )
若将GF看成公共因子,AG看成相应的因子载荷 矩阵,仍有
AA D AG AG D
用一个正交矩阵 左乘向量F 相当于旋转坐标轴系统,选择合适的旋转 将导致更易解释的矩阵载荷,这一点在实践中非常重要;另一方面, 因子载荷的非唯一性导致解的多重性.
文学 法语 英语 数学 美术
x1 x2 x3 x4 x5
音乐.
x6
文学 x1 1 法语 x2 0.83 1
这6门课的成绩 由哪些因子决定?
英语 x3 0.78 0.67 1
数学 x4 0.70 0.67 0.64 1
美术 x5 0.66 0.65 0.54 0.54 1 音乐 x6 0.63 0.57 0.51 0.51 0.40 1
xi i ai1F1 ai2F2 ai3F3 ai4F4 i , i 1, 2, ,10
其中 F1, F2, F3, F4 表示四个因子,称为公共因子,aij 称为 xi在因
子 F上j 的载荷,i是 xi的均值, i是 x不i 能被四个公共因子解
释的部分,称之为特殊因子。
因子分析的主要目的
S R 1 X X n
实际工作中,也可以计算样本相关阵, 从而得到特征值及相对应下的特征向量 并进行主成分分析
2、计算特征根与特征向量

《因子分析》PPT课件 (2)

《因子分析》PPT课件 (2)

24.12.2020
精选PPT
8
输出结果及其解释
这是用主成分分析法提取初始公因子的第1部分
结果,相关矩阵的特征值总和为4(指标数),前
2个特征值1.718252和1.093536都大于1,下面将
根据这2个较大的特征值提取2个相应的初始
公因子。
24.12.2020
精选PPT
9
含有2个公因子的初始公因子模型为:
24.12.2020
精选PPT
11
24.12.2020
精选PPT
12
经最大方差旋转法旋转后的因子模型为:
x1= 0.87226G1+0.30149G2
x2= 0.94758G1-0.08748G2 x3=-0.09851G1+0.94739G2
x4= 0.13687G1+0.35848G2 旋转后的第1和第2公因子能解释的方差 分别为1.687177和1.124611;4个标准化指标共 性之和以及它们各自的共性估计值与旋转前相 同。
精选PPT
28
(3)转轴法:正交转轴法(最大变异法,VARIMAX
ROTATION) Rotation Method:Varimax
转换矩阵
1 2
Orthogonal Transformation Matrix
1
2
0.74346
0.66878
-0.66878
0.74346
24.12.2020
精选PPT
置置所h有2i为的在h20i =与11;之间服
⑤SMC[S] 相关系数的平均。
置h2i为xi与其他指标之间全
24.12.2020
精选PPT
5

《应用多元分析》第三版(第八章 因子分析)

《应用多元分析》第三版(第八章 因子分析)
Σ=A*A*′+D
因此,因子载荷矩阵A不是惟一的,在实际应用中常常利用
这一点,通过因子的旋转(见稍后的§8.4),使得新的因子
有更好的实际意义。
三、因子载荷矩阵的统计意义

1.A的元素aij
m
2
2
h

a
❖ 2.A的行元素平方和 i
ij
j 1
p
2
2
g

a
❖ 3.A的列元素平方和 j
ij
i 1
❖ 二、正交因子模型的性质
❖ 三、因子载荷矩阵的统计意义
一、数学模型

设有p维可观测的随机向量 x ( x1 , x2 , , x p ),其均值
为 μ ( 1 , 2 , , p ),协差阵为Σ=(σij)。因子分析的
一般模型为
x1 1 a11 f1 a12 f 2 a1m f m 1
有什么实际意义的,故实践中m也不应选得过小。
2.模型不受单位的影响

将x的单位作变化,通常是作一变换x*=Cx,这里
C=diag(c1,c2,⋯,cp),ci>0,i=1,2,⋯,p,于是
x*=C μ+CAf+C ε
令μ*=C μ,A*=CA,ε*=C ε,则有
x*=μ*+A*f+ε*
这个模型能满足类似于前述因子模型的假定,即
x a f a f a f
2
2
21 1
22 2
2m m
2


x p p a p1 f1 a p 2 f 2
a pm fm p
其中f1, f2, ⋯, fm为公共因子,ε1, ε2, ⋯, εp为特殊因子,

因子分析模型

因子分析模型

企业生命周期评价模型一、 因子分析的基本思想因子分析(factor analysis )模型是主成分分析的推广。

它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。

因子模型可具体写成:式中,1f ,2f ,,m f 为主因子,分别反映某一方面信息的不可观测的潜在变量;ij a 为因子载荷系数,是第i 个指标在第j 个因子上的负荷。

二、 基本模型的建立本模型在遵循整体性、可比性、科学性、实用性等原则的基础上,参阅相关文献并结合我国企业现状,选取了具有代表性的13个指标,主要包括总资产净利润率(1X )、资产报酬率(2X )、流动资产净利润率(3X )、固定资产净利润率(4X )、净资产收益率(5X )、资本保值增值率 (6X )、资本积累率(7X )、所有者权益增长率(8X )、权益乘数(9X )、产权比率(10X )、速动比率(11X )、流动比率(12X )和资产负债率(X 13),这些指标从不同角度反映了中小企业财务状况,初步构成了中小企业状况评价指标体系。

本文选取的数据,来自汽车行业中八家上市公司的财务数据。

首先对所有指标的原始数据进行标准化,消除量纲和数量级的影响。

在因子分析之前,对数据进行相关统计检验,看数据是否满足因子分析的条件。

本文运用spss19.0 对相关数据进行KMO和巴特莱特球形检验,检验结果如下表所示:KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。

.650Bartlett 的球形度检验近似卡方1792.109 df 28 Sig. .000结果显示KMO抽样适度测定值为0.65>0.5,根据多元统计因子分析相关知识,在0.05的显著性水平下,球形检验P值为0.00,小于0.05,故应拒绝球形检验零假设,样本符合因子分析的条件。

下表反映的是标准化后的各观测变量相关系数矩阵的特征值、方差贡献率以及累计贡献率情况。

因子分析与聚类分析ppt课件

因子分析与聚类分析ppt课件

图8-6 Fac精to选rPPST课c件ores 对话框
23
(1)Save as variables 复选项,将因子得分作为 新变量保存在数据文件中。
(2) Method 栏,指定计算因子得分的方法。其中, Regression 选项为回归法,Bartlett 选项为巴特利 特法,Anderson-Rubin 选项是为了保证因子的正 交性而对Bartlett 因子得分的调整。
(3)Display factor score coefficient matrix 复
选项,选择此项将在输出窗中显示因子得分系数矩
阵,是标准化的得分系数。原始变量值进行标准化
后,可以根据该矩阵给出的系数计算各观测量的因
子得分,还显示协方差精选矩PP阵T课件。
24
8、单击“Options”按钮,进入Options对话框,可以进一 步选择各种输出项。如图8-7 所示。
数目。 (5)Maximum iterations for Convergence 参数框,
指定因子分析收敛的最大迭代次数。
精选PPT课件
20
6、单击“Rotation”按钮,展开Rotation对话框,如图8-5 所示,可以选择因子旋转方法。
精选PPT课件
21
图8-5 Rotation 对话框
(1)Method 框,选择旋转方法。其中,None 表示 不进行旋转,Varimax为方差最大旋转法,Direct Oblilmin为直接斜交旋转法,Quartmax为四次最大 正交旋转法,Equamax为平均正交旋转法,Promax 为斜交旋转法。
2、 KMO 检验
KMO检验统计量是用于比较变量间简单相关系数和偏相
关系数的指标,取值在0和1之间。值越接近于1,意味着变

第9章:因子分析

第9章:因子分析

第9章因子分析与主成份分析因子分析与因子分析过程因子分析是将多个实测变量转换为少数几个不相关的综合指标的多元统计分析方法。

线性综合指标往往是不能直接观测到的,但它更能反映事物的本质。

因子分析概念在各个领域的科学研究中往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律。

多变量大样本无疑会为科学研究提供丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性而增加了问题分析的复杂性。

由于各变量之间存在一定的相关关系,因此有可能用较少的综合指标分别综合存在于各变量中的各类信息,而综合指标之间彼此不相关,即各指标代表的信息不重叠。

这样就可以对综合指标根据专业知识和指标所反映的独特含义给予命名。

这种分析方法成为因子分析,代表各类信息的综合指标就称为因子或主成份。

根据因子分析的目的我们知道,综合指标应该比原始变量少,但包括的信息量应该相对损失较少。

原始变量:X1、X2、X3、X4……Xm主成份:Z1、Z2、Z3、Z4……Zn则各因子与原始变量之间的关系可以表示成:X1=b11Z1+b12Z2+b13Z3……+b1n Z n+e1X2=b21Z1+b22Z2+b23Z3……+b2n Z n+e2X3=b31Z1+b32Z2+b33Z3……+b3n Z n+e3……X m=b m1Z1+b m2Z2+b m3Z3……+b mn Z n+en写成矩阵形式为:X=BZ+E。

其值X为原始变量向量,B为公因子负荷系数矩阵,Z为公因子向量,E为残差向量。

公因子Z1、Z2、Z3…Zn之间彼此不相关,称为正交模型。

因子分析的任务就是求出公因子负荷系数和残差。

如果残差E的影响很小可以忽略不计,数学模型变为X=BZ。

如果Z中各分量之间彼此不相关,形成特殊形式的因子分析,称为主成分分析。

主成分分析的数学模型可以写成:Z1=a11X 1+a12X2+a13X 3……+a1m X mZ2=a21X 1+a22X2+a23X 3……+a2m X mZ3=a31X 1+a32X2+a33X 3……+a3m X m……Z n=an1X 1+an2X2+an3X 3……+anm X m写成矩阵形式为:Z=AX。

因子分析(因子评价)

因子分析(因子评价)

因子分析一.因子分析原理因子分析是根据相关性大小把原始变量进行分组,使得同组内的变量之间相关性高,而不同组的变量之间的相关性低。

每组变量代表一个基本结构(即公共因子),并用一个不可观测的综合变量来表示。

对于所研究的某一具体问题,原始变量分解为两部分之和。

一部分是少数几个不可观测的公共因子的线性函数,另一部分是与公共因子无关的特殊因子。

从全部计算过程来看作R 型因子分析与作Q 型因子分析都是一样的,只不过出发点不同,R 型从相关系数矩阵出发,Q 型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析因子模型的性质:模型不受变量量纲的影响;因子载荷不是唯一的。

二.因子分析的数学模型设有p 个指标,则因子分析数学模型为:11111221221122221122p p p pp p p pp p X r Y r Y r Y X r Y r Y r Y X r Y r Y r Y=+++⎧⎪=+++⎪⎨⎪⎪=+++⎩ 其中,12,,,p X X X 是已标准化的可观测的评价指标。

12,,,k F F F 出现在每个指标i X 的表达式中,称为公共因子,公共因子是不可观测的,其含义要根据具体问题来解释。

i ε是各个对应指标i X 所特有的因子,故称为特殊因子,它与公共因子之间彼此独立。

ij r 是指标i X 在公共因子j F 上的系数,称为因子载荷,因子载荷ij r 的统计含义是指标i X 在公共因子j F 上的相关系数,表示i X 与j F 线性相关程度。

用矩阵形式表示为:X AF ε=+其中12(,,,)p X X X X '=,12(,,,)k F F F F '=,12(,,,)p εεεε'=,111212122212m m p p pm r r r r r r A rr r ⎛⎫⎪⎪= ⎪ ⎪ ⎪⎝⎭,A 称为因子载荷矩阵。

其统计含义是:A 中的第i 行元素12,,,i i im r r r 说明了指标i X 依赖于各个公共因子的程度。

稳健因子分析方法及其医学应用

稳健因子分析方法及其医学应用

稳健因子分析方法及其医学应用
颜光宇;夏结来
【期刊名称】《中国卫生统计》
【年(卷),期】1994(011)003
【摘要】因子分析是多元统计的一种重要方法,在生物医学领域具有广泛的应用。

然而,传统的因子分析方法是建立在普通相关阵的基础上的,而普通相关阵不具稳健性,易受异常值的影响,因此,传统因子分析方法是不稳健的,个别异常值的存在将可能严重扰乱因子分析的结果,对此,本文借助投影寻踪的思想,首先求出稳健的相关阵,继而提出一种新的可抗异常值干扰的稳健因子分析方法并编制其计算机程序,将该法应用于战士身体体质研究,得到了比传
【总页数】4页(P12-15)
【作者】颜光宇;夏结来
【作者单位】不详;不详
【正文语种】中文
【中图分类】R195.1
【相关文献】
1.稳健主成分回归及其医学应用 [J], 刘伟新;郭东星
2.线性回归中多个异常点的稳健诊断及医学应用 [J], 王彤;何大卫
3.用因子分析方法探索医学生的认知能力模型 [J], 孙宝志;金魁和
4.基于分割稳健而快速的局部立体匹配及医学应用 [J], 刘天亮;罗立民
5.稳健因子分析方法的构建及比较研究 [J], 王斌会;李雄英
因版权原因,仅展示原文概要,查看原文内容请购买。

多元统计分析之因子分析(课堂PPT)

多元统计分析之因子分析(课堂PPT)

2020/4/24
13
对求得的公因子,需要观察它们在哪些变量上 有较大的载荷,再据此说明该公因子的实际含义。 但对于分析得到的初始因子模型,其因子载荷矩阵 往往比较复杂,难以对公因子F 给出一个合理的解
i
释,此时可以考虑进一步做因子旋转,以求旋转后 能得到更加合理的解释。
2020/4/24
14
因子分析得到的模型有两个特点:其一,模型不 受量纲的影响;其 二,因子载荷不是唯一的,通过 因子轴的旋转,可以得到新的因子载荷阵,使意义 更加明显。
2020/4/24
37
(6)α因子分解法:此法将变量看成是从潜在变量 空间中抽取出的样本,在计算中尽量使得变量的 α 信度达到最大。
2020/4/24
38
(7)映像因子分解:该方法把一个变量看作是其他 变量的多元回归,据此概念提取公因子。
2020/4/24
39
事实上,如果变量数和样本量都大,而且相关性 也高,则各种因子提取法的结果基本相同,区别仅 仅在于其分析思想不同。 主成分法是最常用的方法, 在多数情况下也是最佳的选择;如果样本量极大 (1500以上),则极大似然法的结果稍为更精确些; 如果数据不好(样本小,或变量少),α 因子法或映像 因子法可能更好;当对各种方法的原理不太清楚或 者适用条件不明的情况下,主成分法仍然是最好的 选择。
(2)未加权的最小平方法:该方法使实际的相关阵 和再生的相关阵之差的平方和达到最小。
2020/4/24
34
(3)广义最小二乘法:该方法实际也是使实际的相 关阵和再生的相关阵之差的平方和达到最小。但是 对相关系数要进行加权,权重为其单值的倒数,这 样单值高的变量,其权重比单值低的变量的权重小。
2020/4/24

9因子分析

9因子分析


因此我们知道,可借助因子分析法,由九 个彼此相观的变量中萃取出其背后真正影 响结果的三个主要因素:


就统计上而言,主成份分析所著重的在於如何〝转换〞原 始变项使之成为一些综合性的新指标,而其关键在『变异 数』问题。 与主成份分析不同的是,因子分析重视的是如何解变量之 间的「共变异数」(Covariance)问题,因每一位受试者的 反应变量均为一些“共同因子变量”(Common factor variate)和“唯一性变量” (Unique variate)的线性函数。 其中“共同因子变量”可产生反应变项之间的共变量(标准化 时,即为相关系数),而唯一性变量部分则只对其所属的变 项之变异数有所贡献,所以主成份分析是“变异数”导向的 方法,因子分析则是“共变异数”导向的方法。

由上表得知氣力和耐力之间有高度正相 关,而速度與協調之间也呈現高度正相 关。

因素組型(未轉軸)

由以上報表所知,第一因子解釋性較第二 因子強。而由相关矩陣得知,A、B具有高 度正相关,C、D 也具有高度正相关。我們 大致可區分成A、B一類,C、D一類,即氣 力和耐力、速度和協調分類。
因素組型(已轉軸)
以(hi’)2代替相关矩阵中的对角线上的元素,得到约化相 关矩阵。
(h1’)2 r12 r21 (h2’)2 R’= . . . . rp1 rp2 … r1p … r2p … . … . … (hp’)2
R’的前m个特征根及其对应的单位化特征向量就是主因子 解。
五、因子旋转


目的:使因子负荷两极分化,要 么接近于0,要么接近于1。 常用的旋转方法:
求样本相关系数矩阵R=(rij)p*p; 求相关系数矩阵的特征根λi (λ1,λ2,…,λp>0)和相应的标准正交的 特征向量li;

大学数理统计课件-因子分析

大学数理统计课件-因子分析
7
二、 因子载荷矩阵中的几个统计特征
1、因子载荷aij的统计意义
Cov( xi ,
yj)
Cov
m j 1
aij
yj
j,
yj
aij
因子载荷aij是第i个变量与第j个公共因子的相关 系数 ,也叫做权,表明xi依赖yj的份量。
8
2、变量共同度的统计意义
定义:变量xi的共同度是因子载荷矩阵的第i行的
元素的平方和。记为
23
奥运会十项全能运动项目 得分数据的因子分析
百米跑成绩X1; 铅球成绩X3; 400米跑成绩X5; 铁饼成绩X7; 标枪成绩X9;
跳远成绩X2; 跳高成绩X4; 百米跨栏X6; 撑杆跳远成绩X8; 1500米跑成绩X10
24
1
0.59
1
0.35 0.42 1
0.34
0.51
0.38
1
3
主成分分析与因子分析的不同:主成分分析仅 仅是变量变换,而因子分析需要构造因子模型。
主成分分析:原始变量的线性组合表示新的综 合变量,即主成分;
因子分析:潜在的假想变量和随机影响变量的 线性组合表示原始变量。
4
§ 2 因子分析模型
假设:
(1) x x1,, xp 是可观测的随机向量,各分量已经
m
B (bij ) p p ( ail lj )
l 1
p
pm
g
2 j
(B
)
bi2j
( ail lj )2
i 1
i1 l 1
pm
pmm
ai2l
2 lj
ail ait lj tj
i1 l1
i1 l1 t 1
tl

九章节因子分析

九章节因子分析

14
65
60
60
50
65
62
60
80
15
96
86
75
70
82
65
88
82
操作练习
(3) 在“Display”下选中“Unrotated factor solution”和 “Scree plot”以输出未经旋转的因子载荷矩阵、碎石图。执行之 后根据输出信息确定提取因子数,比如根据碎石图来确定;
第四步:点击“Rotation”按钮打开选择因子载荷矩阵的旋转 方法。一般使用最多的是正交旋转(选中Varimax)或斜交旋转 方法(选中Promax),其中斜交旋转速度快,所以大样本时多选 此方法。同时可选中“Rotated solution”和 “Loading plot(s)”, 以输出旋转后因子旋转矩阵、载荷散点图。
3. 公共因子的方差贡献:是某公共因子对所有原变量载荷的平方和, 它
反映该公共因子对所有原始总变异的解释能力,等于因子载荷矩阵中某 一列载荷的平方和。一个因子的方差贡献越大,说明该因子就越重要。
二、因子分析的基本步骤
1. 因子分析适合度检验
确定原有若干变量是否适合于做因子分析的基本依据是原有变 量的相关矩阵 。如果相关矩阵中的相关系数大都小于 0.3 ,而且未 达到显著性水平,则说明变量间的相关性普遍较低,它们存在潜在 共同因子的可能性较小,就不再适合于做因子分析;如果相关系数 都比较大,则可以进行因子分析。
16
16
15 SPSS过16程演示
15
17
12
19
18
18
18
16
17
15
16
16
练习题
1. 有研究者对江苏省中小学教师的心理健康状况进行了较 大样本的调查研究,涉及到五百多调查对象。在这一调查 中,包括有专门调查其心理健康水平的90个项目,请你对 这90个项目进行因子分析,看主要包括的内容有哪些?

因子分析原理

因子分析原理
10
E(F*) 0 E(ε*) 0
Var(F*) I
Var
(ε*
)

diag
(12
,
2 2
,
,
2 p
)
cov(F*,ε*) E(F*ε*) 0
11
3、因子载荷不是惟一的 设T为一个p×p的正交矩阵,令A*=AT, F*=T’F,则模型可以表示为
X* μ + A*F* + ε 且满足条件因子模型的条件 E(TF) 0 E(ε) 0
主成分分析:原始变量的线性组合表示新的 综合变量,即主成分;
因子分析:潜在的假想变量和随机影响变 量的线性组合表示原始变量。
4
§ 2 因子分析模型
一、数学模型 设 X i (i 1,2,, p) p 个变量,如果表示为
Xi i ai1F1 aimFm i (m p)
0.783 0.305 0.548
29
x1 0.569F1 0.814F2 x2 0.783F1 0.305F2 0.548F3 x3 0.783F1 0.305F2 0.548F3
可取前两个因子F1和F2为公共因子,第一公因 子F1物价就业因子,对X的贡献为1.55。第一公因子 F2为投资因子,对X的贡献为0.85。共同度分别为1, 0.706,0.706。
称为所有的 Fj ( j 1,, m)对 X i 的方差贡献和。衡量 Fj
的相对重要性。
15
§ 3 因子载荷矩阵的估计方法 (一)主成分分析法
设随机向量 x x1, x2,, xp 的均值为,协方差为,
1 2 p 0为的特征根,u1,u2 ,,up 为对应的
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

结论:因子载荷是谱分析部分,也是主成份系数。因子 模型是描述原变量X协方差阵∑结构的一种模型,每个 因子的相应系数不唯一,即因子载荷阵不是唯一的。
5 - 10
2、极大似然估计法 假设条件:公共因子F和特殊因子e服从正态分布
假定条件:变量x1,x2,…,xm来自正态总体 Np(μ,∑)的随机样本,∑=AA+D,可以不考虑D.
Factor1 0.95 0.948 -0.34 0.363 0.454 0.383 2.402 0.400 0.400 Factor2 -0.307 -0.310 -0.782 0.561 0.693 0.163 1.623 0.271 0.671 Factor3
0.517 -0.531 0.556 0.527 1.14 0.19
Xi标准差:
var(x i ) D(x i ) D( (aik Fk i ))
k 1
m
D( aik Fk ) D( i ) hij 2 ij 2 1
k 1
m
含义:表示全部公共因子对变量xi的影响。hi2大表明xi 对于每一分量F1,F2,…,Fm的共同依赖程度大。
冀东水泥 大同水泥 四川双马 牡丹江 西水股份 狮头股份 太行股份 海螺水泥 尖峰集团
问题:采用因子分析方法对水泥行业上市公司经营业 绩进行因素影响分析。
5 - 12
(1)数据标准化,计算相关系数
X=read.table("clipboard",header=T) Y=scale(X) #标准化 cor(Y) #计算相关系数
(2)因子载荷的分解:变量共同度 aij按行平方和, 即共同度hi2为:
2 2 2 2 h1 a11 a12 ... a1 m 2 2 2 2 h2 a21 a22 ... a2 m
......
2 2 2 h2 a a ... a p p1 p2 pm
结论:旋转前各综合因子代表的具体经济意义不很明显,
而旋转后各因子代表的经济意义则十分明显。因子F1代表企 业的盈利能力,反映企业投资收益的情况,因子F2代表了企 业的偿债能力。因子F3代表了企业的发展能力,是反映企业 持续经营发展能力的指标。
5 - 18
9.5 因子得分计算
基本目的:运用因子分析模型去评价每个样品在整 个模型中的地位,即进行综合评价。
问题:影响因素很多,采用什么方法寻找有限个不可 观测的隐变量解释原始变量间的相关性?而不是原始 变量的线性组合(主成份分析方法)
5-1
第9章 因子分析
9.1 9.2 9.3 9.4 9.5 9.6 9.7
5-2
因子分析思想 因子分析模型 因子载荷的估计与解释 因子旋转方法 因子得分计算 因子分析步骤 实际中如何进行因子分析
cov(x i , Fj ) cov( aik Fk i , Fj )
k 1 m m
cov( aik Fk , Fj ) cov( i , Fj ) a ij
k 1
标准化: 取值:因子载荷aij 是xi 与Fj 的协方差和相关系数
5-6
含义:表示xi依赖Fj的程度,可将aij看作第i个变量在 第j个公共因子上的权数,绝对值越大,相依程度越大, 即公共因子Fj对于xi的载荷量越大。
9.1因子分析思想
基本思想:是一种把多个变量化为少数几个综合变量 的多变量分析方法,其目的是用有限个不可观测的隐 变量来解释原始变量之间的相关关系。
主成份与因子分析区别:
主成分分析:是变量变换,原始变量的线性组合表示 新的综合变量,即主成分; 因子分析:构造因子模型,用潜在的假想变量和随机 影响变量的线性组合表示原始变量。
回归估计法(regression) 方法 Bartlett估计法(bartlett)
5 - 19
1.回归估计法
因子得分回归模型:
Fj bj 0 bj1 x1 bj 2 x2 ... bjp x p j 1, 2,...m
5-7
(3)因子载荷的分解:方差贡献
2 2 2 g1 a11 a 21 ... a 2 p1
aij按列平方和, 即方差贡献 a 2 p2
......
2 2 2 2 gm a1 a ... a m 2m pm
结论:自变量间存在相关性,可以采用因子分析 方法提取因子
5 - 13
(2)计算特征根,因子载荷和共同度 library(mvstats) (Fac=factpc(X,3)) #主成份因子分析
x1 x2 x3 x4 x5 x6 Ssloadings ProportionVar CumulativeVar Factor1 0.7829 0.7811 -0.5786 0.5951 0.6317 0.5084 2.57 0.4283 42.83 Factor2 0.5029 0.4964 0.7685 -0.699 -0.1457 0.3367 1.713 0.2855 71.38 Factor3 -0.3624 -0.3756 0.0802 -0.2415 0.6557 0.6943 1.249 0.2082
92.19
结论:3个综合因子累计贡献率为0.9219>0.8,基本 可以全面反映所有和指标信息,但各因子对各变量 贡献系数差不多,经济含义不够明晰。
5 - 14
(FA0=factanal(X,3,rot="none"))#极大似然因子分析
x1 x2 x3 x4 x5 x6 Ssloadings ProportionVar CumulativeVar
变量名 x1 x2 x3 x4 x5 x6 公共因子(旋转前) F1 F2 F3 0.95 -0.307 0.948 -0.31 -0.34 -0.782 0.517 0.363 0.561 -0.531 0.454 0.693 0.556 0.383 0.163 0.527 变量名 x1 x2 x3 x4 x5 x6 公共因子(旋转后) F1 F2 F3 0.983 0.155 0.985 0.142 -0.99 -0.124 0.127 0.844 0.293 0.953 0.21 0.631
正交旋转:最大方差正交 (Varimax) 斜交旋转:Promax法
方法
5 - 16
1、旋转方法 因子载荷矩阵:
因子载荷矩阵 与正交阵乘积:
证明得知: 载荷类标准 化和方差:
2 cij bij / hi2
总方差最大:
极值原理:
5 - 17
2.因子旋转 Fa1=factanal(X,3,rot=“varimax”)) #varimax 法旋转因子分析
5-9
(2)谱分解与因子载荷关系
cov( X ) cov( AF ) Acov(F) A' AA' u '
A (a 1 , a2 , ..., a p ) ( 1 1 , 2 2 , ..., p p )
实际:公共因子数m 小于变量个数p,当最后p-m个 特征根较小时,可省略,即:
其中:X为可观测随机向量(标准化),E(X)=0,cov(X)=∑, F为不可测向量,E(F)=0,cov(F)=I ε独立且与F独立,E(ε)=0,cov(ε)=∑为对角阵 aij为因子载荷,表示第i个变量在第j个因子上 的相关系数 矩阵形式: X AF
5-5
(1)因子载荷统计意义 已知:E(X)=0,cov(X)=∑,E(F)=0,cov(F)=I ε独立且与F独立,E(ε)=0,cov(ε)=∑为对角阵
0.861
结论:3个综合因子累计贡献率为0.861>0.8,基本可 以全面反映所有和指标信息,但由于要求数据来自 多元正态分布,效果不如主成份好。同样,各因子 对各变量贡献系数差不多,经济含义不够明晰。
5 - 15
9.4 因子旋转方法
基本目的:在共同度保持不变的条件下,使因子载 荷矩阵中因子载荷的绝对值向0和1两个方向分化, 大的载荷更大,小的载荷更小。
l 0; A
l 0 D
结论:当A’D-1A=∧(对角阵),可以得到唯一A和D估 计值,因子载荷A即为所求。极大似然估计法中对F 和 e正态分布条件较为苛刻,故估计效果较差。 511
3.实证分析
主营业务 主营业务 销售毛利 资产负债 营业利润 速动比率 收入增长 利润率 率 率 增长率 率 33.8 34.75 0.67 59.77 15.49 16.35 27.54 28.04 2.36 35.29 -20.96 -46.45 22.86 23.47 0.61 42.83 5.48 -49.22 19.05 19.95 1 48.51 -12.32 -65.99 20.84 21.17 1.08 48.45 65.09 54.81 28.14 28.84 2.51 24.52 -6.43 -15.94 30.45 31.13 1.02 46.14 6.57 -16.59 36.29 36.96 0.27 58.31 70.85 117.59 16.94 17.26 0.61 52.04 9.03 -94.05
问题提出
冀东水泥 大同水泥 四川双马 牡丹江 西水股份 狮头股份 太行股份 海螺水泥 尖峰集团 主营业务 主营业务 销售毛利 资产负债 营业利润 速动比率 收入增长 利润率 率 率 增长率 率 33.8 34.75 0.67 59.77 15.49 16.35 27.54 28.04 2.36 35.29 -20.96 -46.45 22.86 23.47 0.61 42.83 5.48 -49.22 19.05 19.95 1 48.51 -12.32 -65.99 20.84 21.17 1.08 48.45 65.09 54.81 28.14 28.84 2.51 24.52 -6.43 -15.94 30.45 31.13 1.02 46.14 6.57 -16.59 36.29 36.96 0.27 58.31 70.85 117.59 16.94 17.26 0.61 52.04 9.03 -94.05
相关文档
最新文档