SAS基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)影响分析Cook’s D
诊断统计量 异常大,说明第i号数据对回归估计影响很大。如检查无误的,应从原始数据中剔除它。(与 对应)
2.Box-Cox变换(正态变换)
proctransregdata=g;
modelBOXCOX(y/lamda=-2 -1 -0.5 to 0.5 by 0.005 1 2
convenientparameter=2alpha=0.0001)=identity(x1-x3);
run;
也可以:
Proc transreg data=g;
Model boxcox(y/lamda=-2 to 2 by 0.005)=identity(x1-x3);
Run;
3.共线性分析
(1)散点图
也可以:
Proc reg data=g;
Model y=x1 x2 x3/collinoint;
Run;
4.岭估计
proc reg data=goutvifoutest=bridge=0 to 2 by .01;
modely=x1 x2 x3/noprint;
plot / ridgeplot;
run;
proc print data=b;
run;
5.主成分估计
procprincompdata=gout=resultprefix=z;(将主成份命名为z,输出就是z1,z2···)
varx1-x3;
run;
注:以习题5.3为例
第四章假设检验与预测
1.模型的显著性检验
2.回归系数的显著性检验
3.失拟检验
第五章回归方程(自变量)的选择
1.准则: (越小越好),Adjusted (越大越好,与前面等价), , AIC
proc reg data=sales;
model y = x1 x2 x3/selection=Adjrsq Cp Aic;
plot cp.*np./ vaxis=0 to 7 by 1 haxis=0 to 7 by 1 cmallows=blue;
run;
datab;
tquant=tinv(0.975,13);//13=n-p-1
run;
proc print data=b;
Fra Baidu bibliotekrun;
(2)DW检验
proc reg data=sales;
model y = x1 x2 x3/DW;
run;
查表,在5%显著性水平下,当回归变量个数 ,数据量 时, , , ,拒绝原假设,即误差项正相关。
procinsightdata=g;
scattery x1 x2 x3*y x1 x2 x3;
run;
(2)Collinearity Diagnostics
proc reg data=goutvif;
modely=x1 x2 x3/collin; /*noint collin*/
可以在结果中右击选择,亦可在fit-output框中选择,查看顺序:condition number→variance proportion→variance inflation (Parameter Estimates)
5.生成数据集:out=influence;
6.变量中心化和标准化:
Proc standarddata=g out=resultmean=0(中心化)std=1(标准化)print;
var x1 x2 x3;
run;
第三章多元线性回归——参数估计
1.回归诊断
(1)残差分析
残差图不均匀→方差不相等→对Y做变换,直至无任何明显趋势。
run;
2.逐步型回归
(1)向前法
proc reg data=sales;
model y = x1 x2 x3/selection=forwardsle=0.15;
run;
(2) 向后法
proc reg data=sales;
model y = x1 x2 x3/selection=backwardsls=0.15;
run;
(3)逐步法
proc reg data=sales;
model y = x1 x2 x3/selection=stepwise sle=0.15 sls=0.15;
procrsregdata=sales;
model y = x1 x2 x3/lackfit;
run;
4.异常点的检验
(1)均值漂移
查表,或者借助以下程序,在5%显著性水平下, 可以看到只有 ,拒绝原假设(无漂移),所以第17号数据为异常点。
proc reg data=sales;
model y = x1 x2 x3;
基本操作
1.连续输入多组数据:inputy x1 x2 x3 @@;
2.散点图:plot y*x;
3.带约束:restrict x2=0.75*x1, x3=0.625*x1;
4.输出结果:output R=Residuals(残差)Student=Standardized/*学生化内残差*/ Rstudent=RStudentized/*学生化外残差*/H=Hii CookD=d out=influence;
诊断统计量 异常大,说明第i号数据对回归估计影响很大。如检查无误的,应从原始数据中剔除它。(与 对应)
2.Box-Cox变换(正态变换)
proctransregdata=g;
modelBOXCOX(y/lamda=-2 -1 -0.5 to 0.5 by 0.005 1 2
convenientparameter=2alpha=0.0001)=identity(x1-x3);
run;
也可以:
Proc transreg data=g;
Model boxcox(y/lamda=-2 to 2 by 0.005)=identity(x1-x3);
Run;
3.共线性分析
(1)散点图
也可以:
Proc reg data=g;
Model y=x1 x2 x3/collinoint;
Run;
4.岭估计
proc reg data=goutvifoutest=bridge=0 to 2 by .01;
modely=x1 x2 x3/noprint;
plot / ridgeplot;
run;
proc print data=b;
run;
5.主成分估计
procprincompdata=gout=resultprefix=z;(将主成份命名为z,输出就是z1,z2···)
varx1-x3;
run;
注:以习题5.3为例
第四章假设检验与预测
1.模型的显著性检验
2.回归系数的显著性检验
3.失拟检验
第五章回归方程(自变量)的选择
1.准则: (越小越好),Adjusted (越大越好,与前面等价), , AIC
proc reg data=sales;
model y = x1 x2 x3/selection=Adjrsq Cp Aic;
plot cp.*np./ vaxis=0 to 7 by 1 haxis=0 to 7 by 1 cmallows=blue;
run;
datab;
tquant=tinv(0.975,13);//13=n-p-1
run;
proc print data=b;
Fra Baidu bibliotekrun;
(2)DW检验
proc reg data=sales;
model y = x1 x2 x3/DW;
run;
查表,在5%显著性水平下,当回归变量个数 ,数据量 时, , , ,拒绝原假设,即误差项正相关。
procinsightdata=g;
scattery x1 x2 x3*y x1 x2 x3;
run;
(2)Collinearity Diagnostics
proc reg data=goutvif;
modely=x1 x2 x3/collin; /*noint collin*/
可以在结果中右击选择,亦可在fit-output框中选择,查看顺序:condition number→variance proportion→variance inflation (Parameter Estimates)
5.生成数据集:out=influence;
6.变量中心化和标准化:
Proc standarddata=g out=resultmean=0(中心化)std=1(标准化)print;
var x1 x2 x3;
run;
第三章多元线性回归——参数估计
1.回归诊断
(1)残差分析
残差图不均匀→方差不相等→对Y做变换,直至无任何明显趋势。
run;
2.逐步型回归
(1)向前法
proc reg data=sales;
model y = x1 x2 x3/selection=forwardsle=0.15;
run;
(2) 向后法
proc reg data=sales;
model y = x1 x2 x3/selection=backwardsls=0.15;
run;
(3)逐步法
proc reg data=sales;
model y = x1 x2 x3/selection=stepwise sle=0.15 sls=0.15;
procrsregdata=sales;
model y = x1 x2 x3/lackfit;
run;
4.异常点的检验
(1)均值漂移
查表,或者借助以下程序,在5%显著性水平下, 可以看到只有 ,拒绝原假设(无漂移),所以第17号数据为异常点。
proc reg data=sales;
model y = x1 x2 x3;
基本操作
1.连续输入多组数据:inputy x1 x2 x3 @@;
2.散点图:plot y*x;
3.带约束:restrict x2=0.75*x1, x3=0.625*x1;
4.输出结果:output R=Residuals(残差)Student=Standardized/*学生化内残差*/ Rstudent=RStudentized/*学生化外残差*/H=Hii CookD=d out=influence;