主成分回归分析方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Conditi Proportion of Variation on Index Intercept x1 x2
1.00000 0.000150 78 28.2159 6 34.8040 1 54.9061 2 0.09477 0.06637 0.83872 0.000245 94 0.18137 0.48355 0.33484 0.000174 72 0.16968 0.07204 0.75811
核心程序:例16-2_1.sas
DM "log;clear;output;clear;"; ods rtf file='D:\sas2003\Àý 12.3.rtf'; PROC IMPORT OUT= exm16_2 DATAFILE= "D:\sas2003\exm16_2.xls" DBMS=EXCEL2000 REPLACE; SHEET="Sheet1"; GETNAMES=YES; RUN; proc reg data=exm16_2; model y=x1 x2 x3/tol vif collin; proc princomp data=exm16_2 out=out1 prefix=z; var x1-x3; run; proc print data=out1; title 'output:out1'; proc reg data=out1; model y=z1 z2/stb; run;quit; ods rtf close;
具体步骤: 1、用主成分分析法计算出主成分表达式和主成分 得分变量(将贡献小的主成分舍去),即求得Z=WX。 2、用回归分析法将因变量对主成分得分变量进行 回归,得到因变量关于主成分得分变量的回归模型, 即求得y=AZ。 3、将主成分的表达式代回到回归模型中,即可得 到标准化自变量与因变量的回归模型,即得到 y=AZ=A(WX)=BX 4、将标准化自变量转换为原始自变量,即可得到 原始自变量与因变量的回归模型。
核心结果:
Parameter Estimates
Variab le Label Interce Interce pt pt x1 x2 x3 x1 x2 x3
Paramet D er F Estimate
1 1 1 1
Standa rd Error
t Val Pr > | ue t| -3.62 0.002 3 2.97 0.009 0 2.33 0.033 4 1.72 0.105 1
x3 0.0002Baidu Nhomakorabea2 54 0.23098 0.55264 0.21611
Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative
1
2 3
1.76317163
0.88492781 0.35190056
0.87824382
0.53302725
0.5877
0.2950 0.1173
0.5877
0.8827 1.0000
Eigenvectors z1 z2 z3
x1
x2 x3
x1
x2 x3
0.585003
0.447445 0.676435
-.556580
0.828133 -.066442
0.589907
Varian ce Toleran Inflatio ce n . 0
-4.71489 1.30082 0.06091 0.02050 0.03563 0.01531 0.04924 0.02866
0.65229 1.53305 0.82477 1.21245 0.55760 1.79340
Collinearity Diagnostics Numbe r 1 2 3 4 Eigenval ue 3.99037 0.00501 0.00329 0.00132
2.76300 0.06312 0.31778 0.04877 -0.00510 0.06884
0.337621 -.733500
Parameter Estimates Variabl e Label Interce pt z1 z2 Interce pt Paramet D er F Estimate 1 1 1 Standa Standardize rd t Valu Pr > | d Error e t| Estimate 43.78 <.000 1 6.52 <.000 1 -0.07 0.941 9 0 0.84500 -0.00960
例:某学校20名一年级女大学生体重(公斤)、胸围(厘米)、肩宽(厘米)及 肺活量(升)实测值如表所示,试对影响女大学生肺活量的有关因素作多元回归 分析。
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 体重(公斤) 51.3 48.9 42.8 55 45.3 45.3 51.4 53.8 49 53.9 48.8 52.6 42.7 52.5 55.1 45.2 51.4 48.7 51.3 45.2 胸围(厘米) 73.6 83.9 78.3 77.1 81.7 74.8 73.7 79.4 72.6 79.5 83.8 88.4 78.2 88.3 77.2 81.6 78.3 72.5 78.2 74.7 肩宽(厘米) 36.4 34 31 31 30 32 36.5 37 30.1 37.1 33.9 38 30.9 38.1 31.1 30.2 36.5 30 36.4 32.1 肺活量(升) 2.99 3.11 1.91 2.63 2.86 1.91 2.98 3.28 2.52 3.27 3.1 3.28 1.92 3.27 2.64 2.85 3.16 2.51 3.15 1.92
主成分回归分析方法
冯跃华
参考《sas统计分析与应用,从入门到精通》,汪海波等
1、主成分分析除减少自变量的个数外,主成分 分析可以用来解决自变量共线性的问题。
2、线性回归分析要求自变量是相互独立的,但 是在实际应用中,经常会遇到自变量相关的问题。 好的可行的方法:借助于主成分分析,用主成 分回归求回归系数。即先用主成分分析法计算出 主成分表达式和主成分得分变量,而主成分得分 变量是相互独立的,因此可以将因变量对主成分 得分变量回归,然后将主成分的表达式代回到回 归模型中,即可得到标准化自变量与因变量的回 归模型,最后将标准化自变量转为原始自变量。
相关文档
最新文档