第3章 回归预测方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3章回归预测方法
思考与练习(参考答案)
1.简要论述相关分析与回归分析的区别与联系。
答:相关分析与回归分析的主要区别:
(1)相关分析的任务是确定两个变量之间相关的方向和密切程度。回归分析的任务是寻找因变量对自变量依赖关系的数学表达式。
(2)相关分析中,两个变量要求都是随机变量,并且不必区分自变量和因变量;而回归分析中自变量是普通变量,因变量是随机变量,并且必须明确哪个是因变量,哪些是自变量;
(3)相关分析中两变量是对等的,改变两者的地位,并不影响相关系数的数值,只有一个相关系数。而在回归分析中,改变两个变量的位置会得到两个不同的回归方程。
联系为:
(1)相关分析是回归分析的基础和前提。只有在相关分析确定了变量之间存在一定相关关系的基础上建立的回归方程才有意义。
(2)回归分析是相关分析的继续和深化。只有建立了回归方程才能表明变量之间的依赖关系,并进一步进行预测。
2.某行业8个企业的产品销售额和销售利润资料如下:
根据上述统计数据:
(1)计算产品销售额与利润额的相关系数;
r ,说明销售额与利润额高度相关。
解:应用Excel软件数据分析功能求得相关系数0.9934
(2)建立以销售利润为因变量的一元线性回归模型,并对回归模型进行显著性检验(取α=);
解:应用Excel 软件数据分析功能求得回归方程的参数为: 7.273,0.074a b =-=
据此,建立的线性回归方程为 ˆ7.2730.074Y
x =-+ ① 模型拟合优度的检验
由于相关系数0.9934r =,所以模型的拟合度高。 ② 回归方程的显著性检验
应用Excel 软件数据分析功能得0.05
ˆ=450.167(1,6) 5.99F F >=,说明在α=水平下回归效果显著.
③ 回归系数的显著性检验
0.025ˆ=21.22(6) 2.447t
t >=,说明在α=水平下回归效果显著. 实际上,一元线性回归模型由于自变量只有一个,因此回归方程的显著性检验与回归系数b 的显著性检验是等价的。
(3)若企业产品销售额为500万元,试预测其销售利润。
根据建立的线性回归方程 ˆ7.2730.074Y x =-+,当销售额500x =时,销售利润ˆ29.73Y
=万元。
3.某公司下属企业的设备能力和劳动生产率的统计资料如下:
该公司现计划新建一家企业,设备能力为千瓦/人,试预测其劳动生产率,并求出其95%的置信区间。
v1.0 可编辑可修改
解:绘制散点图如下:
散点图近似一条直线,计算设备能力和劳动生产率的相关系数为,故可以采用线性回归模型进行拟合。
应用Excel 软件数据分析功能求得回归方程的参数为: 3.115, 1.43a b ==
据此,建立的线性回归方程为 ˆ 3.115+1.43Y
x =,对模型进行检验如下: (1)模型拟合优度的检验
由于相关系数0.9806r =,所以模型的拟合度高。 (2)回归方程的显著性检验
应用Excel 软件数据分析功能得0.05
ˆ=300.34(1,12) 4.75F F >=,说明在α=水平下回归效果显著.
(3)回归系数的显著性检验
0.025ˆ=17.33(12) 2.1788t
t >=,说明在α=水平下回归效果显著. 当设备能力为千瓦/人时根据建立的线性回归模型ˆ 3.115+1.43Y x = ,可得劳动生产率ˆ13.41Y
=。其95%的置信区间为[,] 4.某市1977~1988 年主要百货商店营业额、在业人员总收入、当年竣工住宅面积的统计数据如下:
年份 营业额/千万元 在业人员总收入/千万元 当年竣工住宅面积/万平方米 1977 1978
根据上述统计数据:
(1)建立多元线性回归模型;
解:应用Excel 软件数据分析功能求得多元线性回归模型的参数为:
0120.2233,0.1.0.077βββ===
据此,建立的线性回归方程为 12
ˆ0.22330.10.077Y x x =++ (2)对回归模型进行拟合优度检验、F 检验、t 检验和DW检验(取α=)
解:①拟合度检验
应用Excel 软件计算得0.9808R =,接近于1,说明模型的拟合程度越高 ②F 检验
应用Excel 软件计算得ˆ113.88F =,查表得0.05(2,9) 4.26F =,故0.05
ˆ(2,9)F F > 说明在α=水平下回归效果显著。 ③t检验
应用Excel 软件计算得12ˆˆ5.188,0.849t
t ==,查表得0.025(9) 2.262t =,故10.025ˆ(9)t t >,说明在α=水平下1β显著不为0,自变量1x 对ˆY
有显著影响,而20.025ˆ(9)t t <,故接受假设20β=,
说明2x 对ˆY
无显著影响。 ④ DW 检验
通过计算得2
1
2
21
()55.31
DW 2.7919.84
n
i
i i n
i
i e e
e
-==-=
=
=∑∑ 当0.05,2,12a m n ===时,查DW 检验表,因DW 检验表中,样本容量最低是15,故取:
0.82, 1.75L U d d ==,则有4DW <4U L d d -<-之间。由此可以得出检验无结论。检验结果表
明,不能判断回归模型是否存在自相关。
(3)假定该市在业人员总收入、当年竣工住宅面积在1988 年的基础上分别增长15%、17%,请对该市1989 年主要百货商店营业额作区间估计(取α=)。
解:回归方程为12
ˆ0.22330.10.077Y x x =++。但由于2x 对Y 无显著影响,故用方程1
ˆ0.22330.1Y x =+做回归预测: 1
ˆ0.22330.10.22330.1248.5 1.1528.8Y x =+=+⨯⨯= 预测区间为: 2
00
ˆ[(1)]Y t n m S ε±--,即0.025[28.8(9) 1.4848]t ±⨯,故当 1989年在业人员总收入为 千万元时,在α=显著性水平上,营业额的区间估计为:[25.44,32.16] 千万元。
5.下表是某百货商店某年的商品销售额和商品流通费率数据,根据表中数据: (注:题中的商品销售额为分组数据,自变量取值可用其组中值)