第五章因子分析和主成分分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

m

* i
)
2
1
ai2k
(i = 1,…,p),
k 1
则A和D为因子模型的一个解,这个解称为主因子解。
在实际中特殊因子方差(或变量共同度)是未知的。
以上得到的解是近似解。为了得到近似程度更好的 解,常常采用迭代主因子法。即利用上面得到的
D*
=
diag(ˆ12
,...,ˆ
2 p
)
作为特殊因子方差的初始估计,重复上述步骤,直
个公共因子的相关程度。在这种意义上公共因子解
释了观测变量间的相关性。
(2) 变量共同度的统计意义
m
因子载荷矩阵第i行的元素平方和: hi2 ai2j
j 1
称为变量Xi的共同度(i = 1,2,…,p)。
对Xi = ai1F1 +…+ aimFm + εi两边求方差:
m
m
Var( X i ) Var( ait Ft i )
2. 因子分析模型中的几个统计特征
(1) 因子载荷aij的统计意义 由Xi = ai1F1 +…+ aimFm + εi,两边同乘以Fj E(XiFj)=ai1E(F1Fj)+…+aijE(FjFj)+…+aimE(FmFj)+E(εiFj)
从而有
ρij = E(XiFj) = aij
即载荷矩阵中第i行,第j列的元素aij是第i个变量与 第j个公共因子的相关系数,反映了第i个变量与第j
m um )
1 u1 ' 2 u2 '
m um '
2 1
2 2
2 p
AA' D
其中 A ( 1 u1, 2 u2 ,..., m um ) (aij ) 为pm阵, m
2 i
sii
ai2k ,即得因子模型的一个解。载荷阵A中
k 1
的第j列和X的第j个主成分的系数相差一个倍数(j =
p
q
2 j
ai2j
i 1
称为公共因子Fj对X的贡献,是衡量Fj相对重要性的 指标,qj2越大表明Fj对X的贡献越大。
ຫໍສະໝຸດ Baidu
3 金融时间序列中因子的类型 收益率时间序列
宏观经济因子:GDP , 通胀,失业率,收益率曲线的 陡峭度等(或者这些变量的意外冲击----扰动项) 基本面因子:财务分析得到的变量 Fama-French方法(1992):市场收益率,企业规模,价值 型/成长型(市场资产净值或市场资产净值/账面资产 净值) 统计因子:数学过程得到的变量,主成分分析(PCA), 主因子分析
ai2tVar(Ft )
Var(i )
hi2
2 i
t 1
t 1
显然,若因子方差hi2大,剩余方差i2必小。而
hi2大就表明Xi对公因子的共同依赖程度大。可见 hi2反映了变量Xi对公共因子F的依赖程度,故称 hi2为变量Xi的共同度。
(3) 公共因子Fj方差贡献的统计意义
因子载荷矩阵A中各列元素的平方和:
1,…,m),故这个解称为主成分解。
(2)主因子法
主因子方法是对主成分方法的修正,设R = AA' + D,
则R* = R – D = AA'称为约相关矩阵,若已知特殊因子
方差的初始估计(ˆ
* i
)
2,也就是已知变量共同度的估
计: (hi*)2 1 (ˆi*)2
则R*对角线上的元素是 hi* ,而不是1。即:
1 因子载荷矩阵的估计
给定p个相关变量X1,...,Xp的观测数据阵X, 由X = AF + ε易推出
∑ = AA' + D 其中∑ = D(X)为X的协方差阵,A = (aij)为p m的因子
载荷阵,D = diag(12,22,…,p2)为p阶对角阵。
由p个相关变量的观测数据可得到协差阵的估计, 记为S。为了建立因子模型,首先要估计因子载荷aij
a
2m
F2
2
a
pm
Fm
p
(m p)

X = AF + ε
其中F1、F2、…、Fm称为公共因子,简称因子,是不 可观测的变量;待估的系数阵A称为因子载荷阵,aij (i = 1,2,…,p;j = 1,2,…,m)称为第i个变量在第j个因
子上的载荷(简称为因子载荷);
ε称为特殊因子,是不能被前m个公共因子包含的
和特殊方差i2。常用的参数估计方法有以下三种:
主成分法,主因子法和极大似然法。
(1) 主成分法
设样本协方差阵S的特征值为λ1≥λ2≥…≥λp≥0, u1,u2,…,up,为对应的标准化特征向量,当最后p–m 个特征值较小时,S可近似地分解为:
1 S U
2
U ' D (
m
1 u1,
2 u2 ,...,
到解稳定为止。
变量共同度hi2常用的初始估计有以下几种方法: ● 取第i个变量与其他所有变量的多重相关系数的 平方;
● 取第i个变量与其他变量相关系数绝对值的最大 值;
● 取1,它等价于主成分解。
(3) 极大似然法
假定公共因子F和特殊因子ε服从正态分布,那么 可得到因子载荷阵和特殊因子方差的极大似然估计, 设p维观测向量X(1),...,X(n)为来自正态总体Np(μ,∑) 的随机样品,则样品似然函数为μ,∑的函数L(μ,∑)。
5.1 因子分析模型与应用
1. 因子分析模型
设p维可观测的随机向量X = (X1,...,Xp)'(假定Xi为 标准化变量,即E(Xi) = 0,Var(Xi) = 1,i = 1,2,…,p) 表示为
X 1 a11 a12
X
2
a21
a22
X
p
a p1
a p2
a1m F1 1
设∑= AA' + D,取μ = X ,则似然函数为A,D的函
数:(A,D),求A,D使达最大。为保证得到唯一
部分。并且满足:cov(F,ε) = 0,即F,ε不相关;
D(F) = Im,即F1、F2、…、Fm互不相关,方差为1;
D(ε) = diag(12,22,…,p2),即ε1、ε2、…、εp互不相关, 方差不一定相等,εi~N(0,i2)。
因子分析的目的就是通过模型X = AF + ε以F代替X,
由于m < p,从而达到降维的愿望。
(h1* )2
R*
r21
rp1
r12 (h2* )2
rp2
r1p
r2 p
(
h*p
)2
计算R*的特征值和特征向量,取前m个正特征值 λ1*≥λ2*≥…≥λp*> 0,相应的特征向量为u1*,u2*,…,up*, 则有近似分解式:
R* = AA'
其中 A ( 1* u1* , *2 u2* ,..., *m um* ) ,令
相关文档
最新文档