第9章 因子分析(王斌会)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x1 x2 x3 x4 x5 x6 x1 1.0000 0.9992 -0.0998 0.1885 0.2010 0.2978 x2 0.9992 1.0000 -0.1042 0.1967 0.1904 0.2875 x3 -0.0998 -0.1042 1.0000 -0.8372 -0.4088 0.0152 x4 0.1885 0.1967 -0.8372 1.0000 0.2585 -0.0293 x5 0.2010 0.1904 -0.4088 0.2585 1.0000 0.5803 x6 0.2978 0.2875 0.0152 -0.0293 0.5803 1.0000
cov(x i , Fj ) cov( aik Fk i , Fj )
k 1 m m
cov( aik Fk , Fj ) cov( i , Fj ) a ij
k 1
标准化: 取值:因子载荷aij 是xi 与Fj 的协方差和相关系数
5-6
含义:表示xi依赖Fj的程度,可将aij看作第i个变量在 第j个公共因子上的权数,绝对值越大,相依程度越大, 即公共因子Fj对于xi的载荷量越大。
变量名 x1 x2 x3 x4 x5 x6 公共因子(旋转前) F1 F2 F3 0.95 -0.307 0.948 -0.31 -0.34 -0.782 0.517 0.363 0.561 -0.531 0.454 0.693 0.556 0.383 0.163 0.527 变量名 x1 x2 x3 x4 x5 x6 公共因子(旋转后) F1 F2 F3 0.983 0.155 0.985 0.142 -0.99 -0.124 0.127 0.844 0.293 0.953 0.21 0.631
问题:影响因素很多,采用什么方法寻找有限个不可 观测的隐变量解释原始变量间的相关性?而不是原始 变量的线性组合(主成份分析方法)
5-1
第9章 因子分析
9.1 9.2 9.3 9.4 9.5 9.6 9.7
5-2
因子分析思想 因子分析模型 因子载荷的估计与解释 因子旋转方法 因子得分计算 因子分析步骤 实际中如何进行因子分析
其中:X为可观测随机向量(标准化),E(X)=0,cov(X)=∑, F为不可测向量,E(F)=0,cov(F)=I ε独立且与F独立,E(ε)=0,cov(ε)=∑为对角阵 aij为因子载荷,表示第i个变量在第j个因子上 的相关系数 矩阵形式: X AF
5-5
(1)因子载荷统计意义 已知:E(X)=0,cov(X)=∑,E(F)=0,cov(F)=I ε独立且与F独立,E(ε)=0,cov(ε)=∑为对角阵
结论:旋转前各综合因子代表的具体经济意义不很明显,
而旋转后各因子代表的经济意义则十分明显。因子F1代表企 业的盈利能力,反映企业投资收益的情况,因子F2代表了企 业的偿债能力。因子F3代表了企业的发展能力,是反映企业 持续经营发展能力的指标。
5 - 18
9.5 因子得分计算
基本目的:运用因子分析模型去评价每个样品在整 个模型中的地位,即进行综合评价。
回归估计法(regression) 方法 Bartlett估计法(bartlett)
5 - 19
1.回归估计法
因子得分回归模型:
Fj bj 0 bj1 x1 bj 2 x2 ... bjp x p j 1, 2,...m
5-3
9.2 因子分析模型
模型思想:将观测变量进行分类,将相关性较高的分在 同一类,不同类变量之间相关性较低,每一类变量代表 一个基本结构,即公共因子。用最少个数的不可测公共 因子的线性函数与特殊因子之和描述原来观测每一分量。 样本间相关关系:Q型 因子分析
分类
变量间相互关系:R型 因子分析
5-4
9.1因子分析思想
基本思想:是一种把多个变量化为少数几个综合变量 的多变量分析方法,其目的是用有限个不可观测的隐 变量来解释原始变量之间的相关关系。
主成份与因子分析区别:
主成分分析:是变量变换,原始变量的线性组合表示 新的综合变量,即主成分; 因子分析:构造因子模型,用潜在的假想变量和随机 影响变量的线性组合表示原始变量。
结论:因子载荷是谱分析部分,也是主成份系数。因子 模型是描述原变量X协方差阵∑结构的一种模型,每个 因子的相应系数不唯一,即因子载荷阵不是唯一的。
5 - 10
2、极大似然估计法 假设条件:公共因子F和特殊因子e服从正态分布
假定条件:变量x1,x2,…,xm来自正态总体 Np(μ,∑)的随机样本,∑=AA+D,可以不考虑D.
冀东水泥 大同水泥 四川双马 牡丹江 西水股份 狮头股份 太行股份 海螺水泥 尖峰集团
问题:采用因子分析方法对水泥行业上市公司经营业 绩进行因素影响分析。
5 - 12
(1)数据标准化,计算相关系数
X=read.table("clipboard",header=T) Y=scalewenku.baidu.comX) #标准化 cor(Y) #计算相关系数
l 0; A
l 0 D
结论:当A’D-1A=∧(对角阵),可以得到唯一A和D估 计值,因子载荷A即为所求。极大似然估计法中对F 和 e正态分布条件较为苛刻,故估计效果较差。 511
3.实证分析
主营业务 主营业务 销售毛利 资产负债 营业利润 速动比率 收入增长 利润率 率 率 增长率 率 33.8 34.75 0.67 59.77 15.49 16.35 27.54 28.04 2.36 35.29 -20.96 -46.45 22.86 23.47 0.61 42.83 5.48 -49.22 19.05 19.95 1 48.51 -12.32 -65.99 20.84 21.17 1.08 48.45 65.09 54.81 28.14 28.84 2.51 24.52 -6.43 -15.94 30.45 31.13 1.02 46.14 6.57 -16.59 36.29 36.96 0.27 58.31 70.85 117.59 16.94 17.26 0.61 52.04 9.03 -94.05
5-7
(3)因子载荷的分解:方差贡献
2 2 2 g1 a11 a 21 ... a 2 p1
aij按列平方和, 即方差贡献gi2为:
2 2 2 g2 a12 a22 ... a 2 p2
......
2 2 2 2 gm a1 a ... a m 2m pm
R型因子分析模型结构
x1 a11 F1 a12 F2 ... a1m Fm 1 x2 a21 F1 a22 F2 ... a2 m Fm 2 ..... x p a p1 F1 a p 2 F2 ... a pm Fm p
基本结构:
Factor1 0.95 0.948 -0.34 0.363 0.454 0.383 2.402 0.400 0.400 Factor2 -0.307 -0.310 -0.782 0.561 0.693 0.163 1.623 0.271 0.671 Factor3
0.517 -0.531 0.556 0.527 1.14 0.19
Xi标准差:
var(x i ) D(x i ) D( (aik Fk i ))
k 1
m
D( aik Fk ) D( i ) hij 2 ij 2 1
k 1
m
含义:表示全部公共因子对变量xi的影响。hi2大表明xi 对于每一分量F1,F2,…,Fm的共同依赖程度大。
92.19
结论:3个综合因子累计贡献率为0.9219>0.8,基本 可以全面反映所有和指标信息,但各因子对各变量 贡献系数差不多,经济含义不够明晰。
5 - 14
(FA0=factanal(X,3,rot="none"))#极大似然因子分析
x1 x2 x3 x4 x5 x6 Ssloadings ProportionVar CumulativeVar
(2)因子载荷的分解:变量共同度 aij按行平方和, 即共同度hi2为:
2 2 2 2 h1 a11 a12 ... a1 m 2 2 2 2 h2 a21 a22 ... a2 m
......
2 2 2 h2 a a ... a p p1 p2 pm
5-9
(2)谱分解与因子载荷关系
cov( X ) cov( AF ) Acov(F) A' AA' u '
A (a 1 , a2 , ..., a p ) ( 1 1 , 2 2 , ..., p p )
实际:公共因子数m 小于变量个数p,当最后p-m个 特征根较小时,可省略,即:
问题提出
冀东水泥 大同水泥 四川双马 牡丹江 西水股份 狮头股份 太行股份 海螺水泥 尖峰集团 主营业务 主营业务 销售毛利 资产负债 营业利润 速动比率 收入增长 利润率 率 率 增长率 率 33.8 34.75 0.67 59.77 15.49 16.35 27.54 28.04 2.36 35.29 -20.96 -46.45 22.86 23.47 0.61 42.83 5.48 -49.22 19.05 19.95 1 48.51 -12.32 -65.99 20.84 21.17 1.08 48.45 65.09 54.81 28.14 28.84 2.51 24.52 -6.43 -15.94 30.45 31.13 1.02 46.14 6.57 -16.59 36.29 36.96 0.27 58.31 70.85 117.59 16.94 17.26 0.61 52.04 9.03 -94.05
0.861
结论:3个综合因子累计贡献率为0.861>0.8,基本可 以全面反映所有和指标信息,但由于要求数据来自 多元正态分布,效果不如主成份好。同样,各因子 对各变量贡献系数差不多,经济含义不够明晰。
5 - 15
9.4 因子旋转方法
基本目的:在共同度保持不变的条件下,使因子载 荷矩阵中因子载荷的绝对值向0和1两个方向分化, 大的载荷更大,小的载荷更小。
含义:表示公共因子Fj对于x的每一分量xi(i=1,2,…,p) 所提供方差的总和,gi2越大,贡献越大, 对x影响越大。
5-8
9.3 因子载荷的估计与解释
1、主因子估计法
uu '
主因子估计法 极大似然估计法
(1)X变量协方差阵∑的(正交矩阵)谱分解
其中:λ为x协方差阵∑的特征根,λ1>…λp>…>0; ∧为λ组成的对角矩阵 μ为λ对应的标准正交化特征向量 因子个数=变量个数,且特殊因子方差为0
正交旋转:最大方差正交 (Varimax) 斜交旋转:Promax法
方法
5 - 16
1、旋转方法 因子载荷矩阵:
因子载荷矩阵 与正交阵乘积:
证明得知: 载荷类标准 化和方差:
2 cij bij / hi2
总方差最大:
极值原理:
5 - 17
2.因子旋转 Fa1=factanal(X,3,rot=“varimax”)) #varimax 法旋转因子分析
结论:自变量间存在相关性,可以采用因子分析 方法提取因子
5 - 13
(2)计算特征根,因子载荷和共同度 library(mvstats) (Fac=factpc(X,3)) #主成份因子分析
x1 x2 x3 x4 x5 x6 Ssloadings ProportionVar CumulativeVar Factor1 0.7829 0.7811 -0.5786 0.5951 0.6317 0.5084 2.57 0.4283 42.83 Factor2 0.5029 0.4964 0.7685 -0.699 -0.1457 0.3367 1.713 0.2855 71.38 Factor3 -0.3624 -0.3756 0.0802 -0.2415 0.6557 0.6943 1.249 0.2082
相关文档
最新文档