应用回归分析课后习题第3章11题演示教学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用回归分析课后习题第3章11题
3.11研究货运总量y (万吨)与工业总产值1x (亿元)、农业总产值2x (亿元)、居民非商品支出3x (亿元)的关系。数据如表3-9所示。
(1)计算出y ,1x ,2x ,3x 的相关系数矩阵。
所以y ,1x ,2x ,3x 的相关系数矩阵为:
⎪⎪⎪
⎪
⎪⎭
⎫ ⎝⎛1547.0398.0724.0547.01113.0731.0398.0113.01556.0724.0731.0556.01
(2)求y 关于1x ,2x ,3x 的三元线性回归方程。
由系数表可以知道,y 关于1x ,2x ,3x 的三元线性回归方程为:
280.348447.12101.7574.3321-++=x x x y
编号
1 2 3 4 5 6 7 8 9 10 货运总量y (万吨) 160 260 210 265 240 220 275 160 275 250 工业总产值x1(亿
元)
70 75 65 74 72 68 78 66 70 65 农业总产值x2(亿
元)
35 40 40 42 38 45 42 36 44 42 居民非商品支出x3
(亿元)
1.0
2.4
2.0
3.0
1.2
1.5
4.0
2.0
3.2
3.0
(3)对所求得的方程作拟合优度检验。
由模型汇总可知,样本的决定系数为0.806,所以可以认为回归方程为样本观测值的拟合程度较好,即回归方程的显著性较高。 (4)对回归方程作显著性检验。
对方差分析表可以知道p 值为0.015<0.05 说明自变量1x ,2x ,3x 对因变量y 产生的线性影响较显著。而F=8.283>74.405.0 F 时,就拒绝原假设,认为在显著性水平0.05下,y 与1x ,2x ,3x 有显著的线性关系,即回归方程是显著的。 (5)对每一个回归系数作显著性检验。
由系数表可以知道,1x ,2x 的P 值分别为0.1和0.049说明回归系数较显著,
3x 的P 值为0.284>0.05说明3x 的回归系数不显著,应该予以剔除。
(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,作回归方程的显著性检验和回归系数的显著性检验。
由系数表可以知道,重新建立的回归方程:624.459971.8676.4211-+=x x y 由方差分析表可知,P 值为0.07说明自变量1x ,2x 对因变量y 产生的线性影响较显著。
由系数表可知,此时各个回归系数的P 值均很小,说明回归系数的显著性较高。
(7)求出每一个回归系数的置信水平为95%的置信区间。
由上表可知,1x 的系数的95%的置信区间为(0.381,8.970) 2x 的系数的95%的置信区间为(3.134,14.808) (8)求标准化回归方程。
由系数表可知,标准化后的回归方程为62110*441.6676.0479.0--+=x x y
(9)求当01x =75,02x =42,03x =3.1时的0ˆy
,给定置信水平为95%,用SPSS 软件计算精确置信区间,手工计算近似预测区间。
由上表可知,0ˆy
=267.8 0y 的置信水平为95%的置信区间为(260.05895,334.12038)
()0y E 的置信水平为95%的近似区间估计为(241.63377,298.54556)
(10)结合回归方程对问题作一些基本分析。
对于前面的分析,虽然R 方的值蛮大的,但这并不能说明回归方程显著,此时还需要通过对回归方程以及回归方程系数进行检验。
当一个回归方程通过显著性检验之后,并不能说明这个方程中所以自变量都对因变量y 有显著影响,因此还需对回归系数进行检验。