上机课第7讲 回归分析过程

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12
2. RSREG过程: 建立二次响应面的回归 模型. RSREG过程分析被拟合的响应曲面, 然后确定最佳响应的因子水平,并进行岭 嵴分析以便给出最佳响应的范围.
3. ORTHOREG过程:使用GentlemanGivens算法进行回归计算. 对于病态数据, ORTHOREG可以得到比其他回归过程更 准确的参数估计.
6
Regression → Linear
功能:建立多元线性回归模型(一个响应 变量和多个解释变量). 包括模型选择方 法,要计算的统计量,共线性检验等, 很多选项类似一元线性回归模型,比如 散点图等.
7
Regression → Logistic源自文库
功能:建立多元Logistic回归模型(一个 响应变量和多个解释变量). 包括模型选 择方法,要计算的统计量,共线性检验 等,很多选项类似线性回归模型,比如 散点图等.
20
ID <variables>; ADD <variables>; DELETE <variables>; <label>: MTEST <equation …> </options>; ——对多个因变量进行检验. OUTPUT out=<SASset> keyword=names …; ——产生一些特征量,可自命名. PAINT <condition/ALLOBS> <options>; ——对散点图的某些点着色. PLOT <y*x> <=symbol> … < options>; ——画散点图. PRINT <options> …; REFIT; ——重新拟合.
(2)OUTEST=<SASset> ——输出参数估计 及所选的统计量. (3)COVOUT=<SASset> ——输出参数估计 的协方差矩阵,此项需选OUTTEST才有效. (4)OUTSSCP=<SASset> ——输出平方和叉 积矩阵(TYPE=SSCP).
23
GRAPHICS——所画图形均为图形文件.
5. 在主窗口下方按 Statistics 键, 可以选择Std. regression coefficients,Confidence limits for estimates,Correlation matrix of estimates, Covariance matrix of estimates.
30
Logistic过程
功能:(1)The LOGISTIC procedure fits linear logistic regression models for discrete response data by the method of maximum likelihood.
(2)The LOGISTIC procedure provides four effect selection methods: forward selection, backward elimination, stepwise selection, and best subset selection.
12. PLS过程:应用偏最小二乘回归法 建立回归方程式.
17
Reg过程 一、功能 (1)可处理多个Model语句; (2)提供9种模型选择的方法; (3)允许交互地改变回归模型和用于拟 合模型的数据; (4)允许对回归模型中参数附加线性方 程式的约束; (5)检验线性假设和多变量假设;
18
(6)产生共线性诊断,影响诊断和偏回归的杆 杠图;
13
4. NLIN过程: 建立非线性回归模型. 可以 使用几种不同的迭代算法.
5. TRANSREG过程:使用交替最小二乘 估计来建立最佳的线性和非线性的变量 变换. 它还可以创建一个包含变换变量 的输出数据集.
14
6. CALIS过程:线性结构方程的拟合系统 和路径分析.
7. GLM过程: 用最小二乘法拟合一般线性 模型(General linearModel). 除了许多其 它分析之外, GLM过程还能够执行一 元回归、多元回归、多项式回归和加权 回归. GLM过程具有许多与REG相同的 输入/输出功能,但没有像REG那样提 供许多诊断工具,也不允许对模型和数 据交互地改变.
回归分析过程介绍 回归分析实现的三种方法:
利用“分析员应用”系统
利用交互数据分析系统
利用REG,logistic等过程
1
利用“分析员应用”系统完成回归分 析的具体步骤:
1. 启动“分析员应用”,打开SAS数据集; (1) Solution→Analysis→Analyst (2) File →Open by SAS Name… →选数据 集 2. 在“分析员应用”菜单栏目中选择 Statistics→Regression → Simple/Linear/logistic;
26
(8)vif —输出方差膨胀因子 (9)cli —输出单个预测值的置信区间
(10)clm —输出均值预测值的置信区间
(11)influence—要求进行影响分析,输出残 差,学生化残差,dfbetas,dffits,帽子矩阵 对角线元素等
(12)r—要求进行残差分析,输出残差,标准 化残差,Cook距离等
ALL ——打印所有输出结果.
CORR ——对MODEL和VAR语句列出的变量输
出相关矩阵.
NOPRINT ——不打印输出结果. SIMPLE ——对每个变量输出… SINGULAR=n ——输入检验奇异性的调节参数, 缺省值为10-7.
24
2.(编号:)MODEL dependents=<regressors> </51 options>; 选项: (1)SELECTION=FORWARD、 BACKWARD、STEPWISE、MAXR(R2最大 增量)、MINR(R2最小增量)、RSQUARE、 ADJRSQ、CP、NONE(全回归模型).
21
RESTRICT equation …; ——对模型加约束. REWEIGH <condition …> <…>; ——重新加权. <label>: TEST equation </options>; ——假设检验.
22
三、语句说明
1.PROC REG ——有10项<options>可选:
(1)DATA=<SASset>——读取试验数据yi,xi, 可带格式TYPE=CORR.
8
利用“交互数据分析”系统进行回归分析 的优点: (1)建立一个解释变量的多项式回归时可以 动态变化,方便直观探索模型的形式. (2)方便随时添加各种统计量,统计表和统 计图. (3)可以建立多个解释变量的线性回归模型 和广义线性模型.
9
“交互数据分析”系统进行回归分析的几 点说明: (1) analyze →Fit(Y,X) (2) 选响应变量和解释变量. (3) 按钮 method :选择广义线性模型的类 型. (4) 按钮 output : 选择要输出的统计量.
(3) Influence:
Plot Influence Statistics vs variables(影响统计量对变 量)
Influence Statistics:DFFITS,Leverage(H),
Covariance Ratios Variables: predicted Y, indenpents
10
SAS中的回归分析过程 1、Reg过程
2、Logistic过程
3、CATMOD, GLM, LIFEREG, NLIN, ORTHOREG, PLS, PROBIT, RSREG和 TRANSREG过程
注:The REG procedure provides the most general analysis capabilities; the other procedures give more specialized analyses.
27
(13)outvif —当选项RIDGE= 或 PCOMIT=
被指定时输出方差膨胀因子到数据OUTEST=
指定的数据集中
(14)pcomit=list —指定删除主分量的个数 (15)ridge=list —指定岭回归参数的值
(16)cp —CP统计量
(17)aic —AIC信息准则
28
(18)bic —BIC信息准则 (19)rmse —均方根误差 (20)adjrsq —修正的R2
(2) Plot observed vs indenpent(观测值对自变量) 还可以加均值的置信限和单个预测值的置信限.
5
Residual:
(1) Plot residuals vs Variables(观测值对预测值) Residuals: ordinary,standardized,studentized Variables: predicted Y, indenpents (2) 残差的PP图和QQ图
注1:每个MODEL语句限选SELECTION中的一项, 缺省时使用NONE. 注2:上述后三个方法需配其他选项给定参数.
(2)INCLUDE=n ——前n个自变量不参与筛 选.
25
(3)best=n—指定对每种变量个数的子 集模型要求输出的最大数目. (4)sle=value—指定进入模型的显著水 平 (5)sls=value —指定剔出模型的显著水 平 (6)collin —进行共线性诊断 (7)collinoint —进行共线性诊断,不包 括截距项
4
6. 在主窗口下方按 Predictions 键, 可以选择对 哪个数据集(原来样本和新数据集)进行预测, 同时选择输出哪些量(在输出窗口|输出数据 集中输出预测值,残差,置信区间). 7. 在主窗口下方按 Plots 键,绘制各种散点图和 回归图;
Predicted:
(1) Plot observed vs predicted(观测值对预测值)
15
8. CATMOD过程: (Categorical Data Modeling)分析能够用列联表表示的数据, 该过程对响应频数的函数拟合线性模型, 且能够用于线性和Logistic回归.
9. LIFEREG过程: 对失效时间数据拟合 参数模型. 这些类型的模型一般用于生存 分析.
16
10. LOGISTIC过程:拟合Logistic回归 模型. 11. PROBIT过程:执行Probit(概率单 位)回归以及Logistic回归和有序 Logistic回归.
11
1. REG过程: 进行一般线性回归分析. 该 过程包含许多回归诊断的功能;提供9种 选择回归模型的方法;可生成原始数据和 统计量的散点图;在散点图中对个别特殊 观测可以通过加亮来识别;还允许交互地 改变回归模型和用于拟合模型的数据;可 完成岭回归和不完全的主成分分析(IPC); 并能够要求PLOT语句用高分辨率图形设 备绘图.
19
二、语句结构
PROC REG <options>;——必需的语句。 <label>: MODEL dependents=<regresses> </options>;——拟合模型所 必需的语句,可交互使用. BY <variables>(定义观察值); VAR <variables>; FREQ <variables>(定义重复试验值); WEIGHT <variables>(用于加权最小二 乘估计);
(7)把参数估计量、预测值、残差图、置信界 限及其它诊断统计量统计量存贮在一个SAS 数据集中; (8)产生原始数据和一些统计量的散点图; (9)可完成岭回归和不完全的主成分分析(IPC); (10)PROC REG 语句可使用选项GRAPHICS, 它使得你能够要求PLOT语句用高分辨率图形 设备绘图.
2
Regression → Simple
功能:简单回归部分仅能实现一个解释 变量的回归,可以建立一个解释变量的 一次,二次和三次多项式回归.
3
3. 在弹出的简单线性回归分析主窗口中分别选 择响应变量和解释变量;
4. 在主窗口中间model部分, 选择一次(Linear), 二次(Quadratic)或三次(Cubic)多项式回归模 型;
(21)p —
29
将回归过程等放在画图语句之中可以得 到很多直观的图.
ods html; ods graphics on;
proc reg data = Class; model Weight = Height; run; quit; ods graphics off; ods html close;
相关文档
最新文档