金融风险管理-主成分分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Financial Risk Management
Tools, Measurement, and Future Trends
主成份萃取的運算原理
使组合 ,在 下, Var(y)=aa最大的解a是矩阵的最大特 征值(eigenvalue)所对应的特征向量 (eigenvector) 最大特征值所对应的特征向量a是使 Var(y)=aa最大的解。 假设本范例有身高与体重两变量,为了 提高每位学生的分辨能力,要使线性组 合 的变异数愈大愈好。 在的限制下,找 、 值使
主成份解释的变异数 比例

Var y j
Var y j
p j 1

Var y j
Var xi
i 1
p

j
i
i 1
p

j
p


i 1
p
i
p
在本範例中,1.814+.186=2。
Financial Risk Management
Tools, Measurement, and Future Trends
1 1
2 1
2
2 2 2 2 2 h12i h2 i ......... hki h( k 1) i ...... h pi hi 1
3、只取同一個主成份時,所能解釋各變數的共同性總和為
i
h
i 1
p
2 ji
2 2 2 h2 j1 h j 2 ........ h jp h j j
6
一、主成份分析的基本概念(1/2)
若欲将变量减少成少数几个互相独立的 线性组合变量,亦即潜在变量或成份, 就必须使用主成份分析。 主成份分析法是考虑将资料中原有的p个 变数做线性组合得到k个新变数。通常k 比p小很多。 主成份分析法的另一项功能是能将彼此 间具有相关关系的p个变量,经过线性组 合后成为k个彼此间相关系数为0的新变 量,此过程称为萃取(Extraction)。
1 2
Financial Risk Management
Tools, Measurement, and Future Trends
共同性(Communality, h2 )
第j个主成份解释变量xi的变异数比例称为共同性,写成 h j i 在主成份分析前,初步的(Initial栏)对每一个变数皆为1,经萃取后 (Extraction栏)每一个j变量的共同性为 1 j k p) ,其中k为特征值大于1的变数。 h2 j( 2 2 2 r h 0 . 952 0.907 (第一主成份解释身高的比例) y x 11 2 0.305 2 0.093 (第二主成份解释身高的比例) ry2 x h21 1、当用来解释变异量的主成份个数取的愈多时,共同性 hi2 愈高 2、当所有主成份都取时, hi2 都等于1
主成分分析
因素分析
2
3
探索性因素分析
4
验证性因素分析
5
主成份分析與因素分析
主成份分析 (PCA) 与因素分析是利用不同的方法來减少变量 数 (Jolliffe, 2010) 参见:Jolliffe, I. T. (2010). Principal Component Analysis (2nd ed.). New York: Springer. PCA 的主要目的是将p个变量,缩减到 m个主成份(principal components),在这同时尽量保留p个变量的variation
主成份分析的特点与观念
(一)直交性。
(二)特征值就是主成份的变异数。 (三)所有主成份的变异数总和与所有变 量之变异数总 和相等。
(四)主成份解释的变异数比例。
(五)主成份负荷(loading)。
(六)共同性(Communality,h2)。
直交性
1、第j个特征向量(即系数向量)与第j-1个特 征向量直交:亦即 。 在本例中, 。 2、第j个主成份与第j-1个主成份直交:亦 即 。
Financial Risk Management
Tools, Measurement, and Future Trends
24
一、主成份分析的基本概念(2/2)
主成份分析除了用来简化变量间之关系外,可用来 缩减某一组欲进行多变量分析之变量的数目。 主成份分析也可将各变量的原始分数转为主成份分 数,以供进一步的统计分析。 主成份分析还可用来建构多种具有不同衡量单位变 量之综合指针。 主成份亦可根据其负荷量来对主成份命名。 例如:以身高与体重来建构「块頭」指标、以成长 率与市场占有率来建构「行销绩效」指标。
表:主成份分析的观念与 关系汇总比较表
表:主成份分析的共同性、特征值与主成份负荷量之关系( 用矩阵S时)表
主成份分数(Score)
经过主成份萃取后已可得到每个主成份下每个变数的系 数(权重),如此就可得到每笔数据经过主成份转换后 的主成份分数。 后续的分析将不再使用原始变量,而是主成份的综合指 标。至于要如何计算每一笔数据的主成份分数呢?SPSS 将会自动帮您计算。 第i 位资料 ( x1i , x2i ,.., x pi ) 的第 j 个主成份,其中 x i 为第i 个变数的平均数,即: yi a j1 ( x1i x1 ) a j 2 ( x2i x2 ) a jp ( x pi x p ) 如第1位学生在第一个主成份的分数为: 已标准化:0.707(-1.815-0)+0.707(-1.320-0)=-2.216
特征值就是主成份的变异数
Var ( y ) 在本例中 Var ( y ) Var (0.707 x 0.707 x ) 0.5 0.5 0.814 1.814 同理可得 Var ( y ) Var (0.707 x 0.707 x ) 0.5 0.5 0.814 0.186
以共变数矩阵来萃取主成份 通常是未知的,故以求出样本共变异矩阵S代替 。
以相关系数矩阵来萃取主成份
以相关矩阵R取代共变异数矩阵S,再求特征值、特征向量。
以S与R做主成份分析的结果可能会有很大的差别,以S做主成份 分析,容易受使用变量单位的影响。在SPSS的FACTOR程序中的 Extraction框中,尽量勾选Correlation(R)非Covariance(S)。
主成份负荷(loading)
主成份负荷指第j个主成份 称负荷)。
ry j xi a ji j si
与第i个变数
的相关系数(亦
第一主成份与身高的相关系数为 r 0.707 1.814 0.952 yx
1 1
第一主成份与体重的相关系数为 r 0.707 1.814 0.952 yx
j j
1 1 2 1
2 1 2
2
所有主成份的变异数总和与 所有变量之变异数总和相等
wenku.baidu.comar( y
j 1 p j p
) Var( xi )
i 1
在本例中 而且可得
Var ( y1 ) Var ( y 2 ) 1.814 0.186 2.000
Var ( x1 ) Var ( x 2 ) 1.000 1.000 2.000
二、主成份的萃取
(1/2)
1、计算相关矩阵或共变量矩阵估计共同 性(community,或称共通性):若是相关 矩阵则共同性设为1;若是共变量矩阵则 共同性为各变数的变异数。 2、从相关矩阵或共变数矩阵中,萃取主 成份。 3、決定因素的數目。 4、因素命名與結果解釋。
二、主成份的萃取 (2/2)
假设有p个数字变量,则可计算出p个主成份。
共同性会等于1,亦即没有误差项,故此公式不 写出误差项。 主成份分析重视的是「变异数」,因素分析重视 的则是「共变异数」。为使变异数达到最大,通 常进行主成份分析后不再转轴,而因素分析则需 要转轴。 主成份分析使观察值在这些主成份乃显示出最大 的个别差异。因素分析的目的是找出共同性。
相关文档
最新文档