回归分析实验课 实验8
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验报告八实验课程:回归分析实验课
专业:统计学
年级:
姓名:
学号:
指导教师:
完成时间:
得分:
教师评语:
学生收获与思考:
实验八
含定性变量的回归模型(4学时)
一、实验目的
1.掌握含定性变量的回归模型的建模步骤
3.运用SAS计算含定性变量的各种回归模型的各参数估计及相关检验统计量
二、实验理论与方法
在实际问题的研究中,经常会遇到一些非数量型的变量。如品质变量;性别;战争与和平。我们把这些品质变量也称为定性变量,在建立回归模型的时候我们需要考虑到这些定性变量。定性变量的回归模型分为自变量含定性变量的回归模型和因变量是定性变量的回归模型。
自变量含有定性变量的时候,我们一般引进虚拟变量,将这些定性变量数量化。例如研究粮食产量问题,y为粮食产量,x为施肥量,另外考虑气候问题,分为正常年份和干旱年份两种情况,这个问题数量化方法就是引入一个0-1型变量D,令D i=1 表示正常年份,D i=0表示干旱年份,粮食产量的回归模型为:y i=β0+β1x i+β2D i+εi。
因变量是定性变量时,一般用logistic回归模型(分组数据的logistic回归模型,未分组数据的logistic回归模型,多类别的logistic回归模型),probit回归模型等。
三. 实验内容
1.用DATA步建立一个永久SAS数据集,数据集名为xt103,数据见表21;对数据集xt103,建立y 对公司规模和公司类型的回归,并对所得到的模型进行解释。
2.研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归,并解释回归方程的含义。
3.某学校对本科毕业生的去向做了一个调查,分析影响毕业去向的相关因素,结果见表23.其中毕业去向“1”=工作,“2”=读研,“3”=出国留学。性别“1”=男生,“0”=女生。用多类别的Logisitic回归分析影响毕业去向的因素。
四.实验仪器
计算机和SAS软件
五.实验步骤和结果分析
1.用DATA步建立一个永久SAS数据集,数据集名为xt103,数据见表21;对数据集xt103,建立y 对公司规模和公司类型的回归,并对所得到的模型进行解释。
R检验中R方为0.8951,可以认为回归拟合效果较好。回归方程通过F检验,说明模型是显著成立的。
由参数估计表,可以看出,全部变量都是显著的,回归方程为:
21^
06.8102.087.33x x y +-=
其中,x2是虚拟变量,当公司类型为“互助”时,x2为0,为“股份”时,x2为1。
由方程可知,x2为1,即股份制公司的保险革新措施速度y 会更大。股份制公司采取保险革新措施的积极性比互助型公司高,股份制公司建立在共同承担风险上,更愿意革新。
公司规模越大,采取保险革新措施的倾向越大:大规模公司保险制度的更新对公司的影响程度比小规模公司大。
SAS 程序:
data xt103;
input y x1 x2 ;/*引入虚拟变量,将公司类型的互助设为0,股份设为1*/ cards ; 17 151 0 26 92 0 21 175 0 30 31 0 22 104 0 0 277 0 12 210 0 19 120 0 4 290 0 16 238 0 28 164 1 15 272 1 11 295 1 38 68 1 31 85 1
21 224 1
20 166 1
13 305 1
30 124 1
14 246 1
;
run;
proc reg data=xt103;
model y=x1 x2;
run;
2.研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归,并解释回归方程的含义。
模型信息:
模型解出的是y=0的概率。
由三个检验中,统计量的P 值都小于0.05,可以认为模型是显著的。
由Wald 检验的显著性概率及其P 值,可以看出,h 变量对方程的影响是显著的。
由极大似然估计,各个参数系数也通过检验。因此模型有效。
二元logit 模型为
)98.759.14ex p(1)98.759.14ex p()0(h h y p -+-=
=
模型意义为,小球掉落高度为h ,则玻璃未破碎的概率为p,而y=0表示玻璃未破碎。
也就是说,该种新型的玻璃,用小球对其撞击,当小球的掉落高度为h 时,玻璃未破碎的概率就是
)98.759.14ex p(1)
98.759.14ex p()0(h h y p -+-=
=,那么,玻璃会破碎的概率就为1-p(y=0),这也可以看成是一种
比例,就是大量实验中,同个高度h ,玻璃会被击破的比例。
SAS程序:
data wjz;
input h y ;/*引入虚拟变量,将公司类型的互助设为0,股份设为1*/ cards;
1.50 0
1.52 0
1.54 0
1.56 0
1.58 1
1.60 0
1.62 0
1.64 0
1.66 0
1.68 1
1.70 0
1.72 0
1.74 0
1.76 1
1.78 0
1.80 1
1.82 0
1.84 0
1.86 1
1.88 1
1.90 0
1.92 1
1.94 0
1.96 1
1.98 1
2.00 1
;
run;
proc logistic data=wjz;
model y=h;
run;
proc logistic data=wjz;
class h;
model y=h/link=glogit aggregate scale=none;
run;