数据分析(梅长林)习题题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2章 习 题
一、习题
(1)回归模型
15,2,1,22110 =+++=i x x y i i i i εβββ
调用proc reg :
由此输出得到的回归方程为:
2100920.049600.045261.3X X y ++=∧
由最后一列可以看出,使用化妆品的人数X1和月收入X2对化妆品的销售数量有着显着影响。46521.30=∧
β可以理解为该化妆品作为一种
必需品每个月的销售量。当购买该化妆品的人数固定时,月收入没增加一个一个单位,改化妆品的销售数量将增加个单位。同理,当购买该化妆品的人均月收入固定时,购买该化妆品的人数每增加一千人,该化妆品的销售数量将增加个单位。
p
n SSE
-=
∧2
σ
是2σ的无偏估计,所以2σ的估计值是. (2)调用
由此可到线性回归关系显着性检验:
0至少有一个为0:2,1:1210ββββH H ↔==
的统计量/(1)/()SSR p MSR
F SSE n p MSE
-=
=-的观测值47.56790=F ,检验的p 值
0001.0)(000<>==F F p p H
另外9989.053902
53845
2===
SST SSR R ,2R 描述了由自由变量的线性关系函数值所能反映的Y 的总变化量的比例。2R 越大,表明线性关系越明显。这些结果均表明Y 与X1,X2之间的回归关系高度显着。
(3)若置信水平05.0=α,由17881.2)12(975.0=t ,利用参数估计值得
到21,0,βββ的置信区间分别为:
对,0β2942.54516.343065.21781.245216.3±=⨯±,即)7458.8,8426.1(-) 对1β:01318.049600.000605.01781.249600.0±=⨯±,即)50198.0,48282.0( 2β:0021
.000920.00009681.01781.200920.0±=⨯±,即)00113.0,0071.0(-
(4)首先检验X1对Y 是否有显着性影:
假设其约简模型为:15,2,
1,220 =++=i x y i i i εββ 由观测数据并利用proc reg 过程拟合此模型求得:
88137.484)(=R SSE 13215=-=R f 88357.56)(=F SSE 12315=-=R f
由[()()]()
()/R F F
SSE R SSE F f f F SSE F f --=
求得检验统计量的值为:
3
.9012/88357.5688357
.5688137.4840=-=
F
05.0))13,1(()(0000<>==>==F F P F F p p H
由此拒绝原假设,所以x2对Y 有显着影响。 同理检验X2对Y 是否有显着性影:
假设其约简模型为:15,2,
1,110 =++=i x y i i i εββ 由观测数据并利用proc reg 过程拟合此模型求得: 31872)(=R SSE 13215=-=R f
88357.56)(=F SSE 12315=-=R f
由[()()]()
()/R F F
SSE R SSE F f f F SSE F f --=
求得检验统计量的值为:
12/88357.5688357.56318720-=
F 05.0))13,1(()(0000<>==>==F F P F F p p H
由此拒绝原假设,所以x2对Y 有显着影响。 检验X1、x2交叉项对Y 是否有显着性影:
假设其全模型为:15,2,
1,21322110 =++++=i x x x x y i i i i i i εββββ 检验X1、X2的交互作用是否显着即检验假设0:30=βH 是否能被拒
绝。
由观测数据并利用proc reg 过程拟合此模型求得: 72.56)(=F SSE 11415=-=F f
88357.56)(=R SSE 12315=-=R f
由[()()]()
()/R F F
SSE R SSE F f f F SSE F f --=
求得检验统计量的值为:
0317.011
/72.5672
.5688357.560=-=
F
05.0138.0)0317.0)11,1(()(000>=>==>==F P F F p p H
由此接受原假设,也即X1*X2对Y 无显着影响,即模型中没有必要引进交叉项。
(5)关于Y 的预测:
对于给定的X1,X2的值(220,2500),由回归方程可以得到0y 的预测值:
573.135250000920.022049600.045261.30=⨯+⨯+=y
为了得到0y
1)(-X X T
由
0(1,220,2500)T x =, 4.74030MSE =,求得
y 的置信度为95%的置信区
间为:
0.975(12)135.5726 2.1788 2.2818135.5726 4.9716y t ±=±⨯=±
即(130.6010,140.5442)
(6)利用proc reg 过程可根据要求输出学生化残差: