sas讲义多元线性回归
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
题目
本数据来源于2003年所做的试验,数据参考文件reg-4.xls,观 测11个水稻品种(03DH1、03DH2、03DH3、03DH 4、03DH5、 03DH6、03DH7、03DH 8、03DH9、03DH10、03DH11)的各 种性状:穗数xl、枝梗数x2、秕粒x3、200粒重y。每个水稻品种取5 株.以5株为一个单位。研究水稻200粒重y与穗数xl、枝梗数x2、秕 粒x3之间的关系,分析哪些因素对200粒重y的影响较大。
从数据中可知,通过给定数据之间的关系,采用 线性回归的方法分析过程REG.
编写程序
TITLE ‘多元线性回归分析’;
DATA AMO;
INPUT Y X1-X3;
CARDS;
5.87 14 16 59
5.58 27 13 27
5.83 31 11 94
Biblioteka Baidu
4.71 20 15 64
5.59 24 14 167
0.01下不显著。 (3)写出回归方程的表达式。
y=1.53952x1-0.94385x2 - 4.94048 (4)利用残差(实测值与预测值之差)、95%置信取间的上下限讨论预测 预报效果及预报的稳定性。
答:根据上面结果可知残差和95%置信区间的上下限的差异很大,最大 的达到7.4640.最小的达到0.2868.幅度比较大。所以稳定性也很差。
sas多元线性回归
主要内容
1
报告题目
2
编写程序
3
输出结果
4
分析及总结
报告题目
在林木生物量生产率研究中,为了了解林地施肥量(x1,kg)、 灌水量(x2,10)与生物量(Y,kg)的关系,在同一林区共进 行了20次试验,观察值见下表,试建立Y关于x1,x2的线性回归方 程。
从数据中可知,通过给定数据之间的关系,采用 线性回归的方法分析过程REG.
结果分析
(5)对本问题再求出Y关于X1、X2的二次多项式回归方程,并与线性 回归方程比较,说明优缺点。
Intercept -14.55333 0.2210
X1
1.66857 <0.0001
X2
-0.73331 0.0126
XSQ -0.00271 0.3914
由输出结果知:
二次模型在0.0001水平下是显著的,预测模型为:
y=0.00493*x1+5.82331. 综上所述:在研究影响水稻粒重的因素中,只有秕粒对它的影响 较大。
THANK YOU
y=-14.553333+1.66857x1-0.73311x2-0.00271x1*x2
线性模型在0.001水平下也是显著的,预测模型为:
Y=1.53952X1-0.94385X2-4.94048
对比来说:MODEL2复相关系数更接近1,预测值与实测值更接 近,回归效果更好,因此y与x 的关系应选用二次模型。
RUN;
MODEL2用逐步回归 分析方法
输出结果(model1)
图1
输出结果(model2)
图2
图3
结果分析
REG过程中,MODEL语句可以交互使用,本例我们建立了两 个模型,第一个MODEL没有做变量筛选,第二个MODEL指定逐 步回归方法筛选变量。并且用CLI输出预测值与预测区间。
REG过程拟合带截距项的直线回归方程,用最小二乘法估计 模型的参数,并给出模型及参数的方差分析及T检验。本例的两个 模型1检验P值大于0.05,无统计学意义。
数据 过程步
82 50 73 75 39 74 92 60 78 96 62 82 92 61 80 91 50 87 85 47 84 106 72 88 90 52 92 PROC REG; MODEL y=x1 x2/P CLI; MODEL y=x1 x2 xsq/P CLI; RUN;
输出结果(model1)
图1
图2
输出结果(model2)
图3
图4
结果分析
(1)回归模型是否显著,显著水平是多少?复相关系数是多少? 答:回归方程显著,显著水平是<0.0001。复相关系数是0.9659。
(2)回归系数的估计值是多少?显著性如何? 答:Intercept -4.94048 0.1711 X1 1.53952 <0.0001 X2 -0.94385 <0.0001 X1与X2的系数对于表达式极显著,截距项对应的系数对表达式在
编写程序
定义变量 数据
DATA ct; INPUT x1 x2 y @@; XSQ=x1*x2; CARDS; 54 29 50 61 39 51 52 26 52 70 48 54 63 42 53 79 64 60 68 45 59 65 30 65 79 51 67 76 44 70 71 36 70
3.85 19 13 340
5.52 30 13 40
5.65 29 13 90
4.97 30 14 85 5.31 41 13 120 ;
CLI表示求预测值与预 测区间
PROC REG;
MODEL y=x1 x2 x3;
MODEL Y=X1 X2 X3/SELECTION=STEPWISE CLI;
模型2为逐步回归法,只纳入了X3,由参数估计表可知,对 常数检验t值为t=615.68,Pr>|t|的值小于0.0001,远小于 0.05,说明截距项(即常数项Intercept)通过检验,估计值为 5.82331.对自变量x1分析同样可以得知,x1系数通过检验,估 计值为-0.00493. 所以回归方程为: