回归分析与预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例7 运用回归分析工具进行多元线性回归分析
某研究人员试图研究社会零售商品总额的影响因素, 选取4个可能的影响因素: 人均可支配收入、国内生产 总值、固定投资总额和财政收入,对应15年间的统计 结果如下表所示,试给出零售商品总额的决定方程, 并在0.05的显著性水平下判断方程总体的显著性和哪 些因素显著,并给出自变量的残差图
20040622 0.022864
20040608
20040609 20040610 20040611 20040614 20040615
-0.01142
0.002309 -0.00807 0.004646 -0.01619 0.018801
-0.01237
-0.02317 -0.00185
20040623 0.002353
人均可支配 收入X1
1002.2 1181.4 1375.7 1510.2 1700.6 2026.6 2577.4 3496.2 4283 4838.9 5160.3 5425.1 5854 6280 6859.6
国内生产 总值X2 11962.5 14928.3 16909.2 18547.9 21617.8 26638.1 34634.4 46759.4 58478.1 67884.6 74462.6 78345.2 82067.46 89442.2 95933.3
回归参数的估计
回归分析 参数的检验 方程拟合效果评价
变量的个数
一元回归分析
多元回归分析
变量之间的形式
线性回归分析
非线性回归分析
预测则是人们根据历史的资料和现实,利用已经掌握 的知识和手段,对事物的未来值进行事前的推测和判 断,为计划或决策提供依据 点预测 根据回归方程返回自变量对应 的因变量的预测值 根据回归方程返回对应因变量 的预测区间
16个地区广告费用和销售额(万元)
地区 1 销售额Y 5600 广告费用X 450 地区 9 销售额Y 3100 广告费用X 180
2
3 4 5 6 7 8
5200
3200 4200 4750 4400 3850 5900
400
200 330 380 350 290 480
10
11 12 13 14 15 16
2004年6月22个交易日长江电力的收益率与市场收益率
日期 20040601 20040602 20040603 20040604 20040607 600900 0.018994 -0.01218 -0.00673 -0.00113 -0.01017 market -0.0062 -0.01647 0.00009 -0.01474 日期 20040617 20040618 20040621 600900 0.00692 -0.01833 -0.02917 -0.0012 market 0.004821 -0.02063 -0.00931 0.008833 0.010841 0.017149 20040616
12个销售点的销售额及广告和促销费用(万元)
销售点 1 2 3 4 5 6 7 8 9 10 11 12 销售额Y
290 320 350 420 450 500 670 720 760 800 920 1050
广告费用X1
4 5 6 6 8 10 15 14 13 15 16 25
促销费用X2
6 6 7 8 8 7 10 13 14 10 17 20
根据一组样本,可以得到样本的回归方程:
ˆ X ˆ X ... ˆX ˆ Y 1 1 2 2 n n
将回归系数写成矩阵的形式,则根据最小二乘法有:
ˆ ( XX T )1 XY T
ˆ [ , , ... ]T 其中 1 2 n
多元回归分析的拟合优度主要采用可决系数和调整 可决系数度量 可决系数为回归平方和和总平方和的比值:
国民生产总值X(万元)
1020.1 1195.5 1492.2 1691.8 1859.8 2166.2 2665.2 3465.1 4653.3 5727.7 6235.4 6925.2
例4 应用回归分析工具进行回归分析
已有研究表明一种股票的收益率同市场(market)的 收益率相关,下表给出了2004年6月间22个交易日 中长江电力(代码600900)的收益率和整个市场的收 益率数据,试运用回归分析工具得到长江电力收益 率同市场收益率的回归方程,并给出回归残差图和 线性拟合图
RSS R 1 TSS
2 2 l i i 1 2 ( Y Y ) i i 1 n n
2 R 由于 与自变量的数目有关,对于多元线性回归采 用调整 R 2 来度量拟合优度 2 2 N 1 AjustedR 1 (1 R ) N n
其中,N为观测次数,n为自变量的个数
2 ( X X ) 1 两者之间 的标准差 S 为 S s n 0 n 2 n ( X X ) i 2 ˆ (Yi Yi ) i 1 其中, s i 1 n2
在给定显著性水平 下,对应的E(Y 0| X 0 ) 的置信 ˆ t S ,Y ˆ t S ) 区间为 (Y 0 0
例3 应用回归函数进行回归分析
某年度12个地区的财政收入和国民生产总值量如下表 所示,试给出财政收入与国民生产总值的回归方程并 分析回归效果
某年度12个地区财政收入与国民生产总值
地区 1 2 3 4 5 6 7 8 9 10 11 12 财政收入Y(万元)
212.2 219.9 235.7 266.5 293.7 315.0 348.3 434.9 521.8 624.2 650.8 720.4
20040624 20040625 -0.00235 -0.00235
wk.baidu.com
-0.00896
-0.00772 -0.02208 -0.01677 0.012602 -0.00972
0.002238 20040628 0.006017 -0.02503 20040629 0.021531 -0.00703
0.018278 20040630
2 R 回归方程的显著性检验,是检验可决系数 是否
显著,对应的F统计量值为
RSS / N 1 F ESS / N n
回归系数的显著性检验是检验每个自变量是否对因 变量有显著影响,采用t检验,对应的t统计量为
tj ˆ j S ˆ
j
其中,j=1,…,n,给定显著性水平下可以通过t检验 自变量 X i 是否对 Y 有着显著的影响
预测
区间预测
1. 一元线性回归分析与预测
对应存在相关关系的两个变量X和Y,其中X为自变 量,Y为因变量,可以建立回归方程:
Yi X i
其中, 为回归方程常数项, 为回归的系数, 为随机误差项
ˆ ˆ 和 根据最小二乘法,可以得到 和 的估计值
ˆ
(X
4
5 6
300
330 350
4050
4200 4400
10
11 12
450
470 480
5600
5800 5900
2. 多元线性回归分析与预测
对于因变量Y和 X 1、X 2 ...X n 建立多元线性回归方程
Y 1 X1 ... n X n
其中, 为常数项,1、2 ...n 分别为自变量 X1、X 2 ...X n 的回归系数, 为随机误差项
15年的统计数据
年度 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 社会消费品 零售总额Y 5820 7440 8101.4 8300.1 9415.6 10993.7 12462.1 16264.7 20620 24774.1 27298.9 29152.5 31134.7 34152.6 37595.2
回归分析与预测
变量之间的关系可以分为函数关系和相关关系两类, 函数关系表示变量间一一对应的关系,而相关关系则 是变量间的某种非确定的依赖关系
相关关系虽不确定,但在大量统计资料的基础上,可 以找出相关关系变量之间的规律性,并借助相应的函 数来表达这种规律性,对应的函数称为回归函数
这种用函数的形式来描述与推断现象之间的相关关系, 称为回归分析
地区 1 2 3 4 5 6 7 8 9 10 11 12 财政收入Y(万元)
212.2 219.9 235.7 266.5 293.7 315.0 348.3 434.9 521.8 624.2 650.8 720.4
国民生产总值X(万元)
1020.1 1195.5 1492.2 1691.8 1859.8 2166.2 2665.2 3465.1 4653.3 5727.7 6235.4 6925.2
3250
4500 2800 5800 3300 4050 6100
210
360 150 470 250 300 500
例2 应用LINEST函数进行回归分析
某年度12个地区的财政收入和国民生产总值量如下表 所示,试给出财政收入与国民生产总值的回归方程并 分析回归效果
某年度12个地区财政收入与国民生产总值
i 1 n i 1
n
i
X )(Yi Y )
2 ( X X ) i
ˆX ˆ Y
其中 X 和Y 分别为变量 X 和 Y 的样本的均值
ˆX ˆ ˆ 回归的参数方程: Y i i
回归参数的显著性检验 在样本容量较小时,总体回归参数的显著性检验 通过对回归参数进行t检验实现 ˆ ˆ 0 ,对应的t统计量为 t 给定原假设 H0 : S 拟合优度检验 拟合优度又称可决系数,可以用来检验回归方程 对观测数据的拟合程度,可以度量方程总体回归 n 效果的优劣 2
ˆX ˆ ˆ X 和 Y 变量对应的一元线性回归方程为 Y 需要预测当 X X 0 时,对应的 Y 值
ˆX ˆ 为Y ˆ ˆ 若为点预测,则 X 0 对应的预测值Y 0 0 0
ˆ 为预测的 若为区间预测,则可分为对应的预测值 Y 0 的均值还是个体值
若预测的为均值,真实值为 E(Y 0| X 0 ) X 0
ˆ2 对应可决系数为 R 2
(X
i 1 n i 1
i
X)
2 ( Y Y ) i
例1 应用散点图和趋势线进行回归分析
某家电厂商需要研究广告投入的效果,从所有销售额 相似的地区中随机选取16个地区,分别统计该地区的 销售额和广告费用数据如下表所示,试应用散点图和 趋势线确定销售额和广告费用的回归方程,并给出方 程的拟合优度
2 2
若预测的为个体值,真实值为 Y0 X 0
( X 0 X )2 1 两者之间 l 的标准差 Sl 为 Sl s 1 n n 2 ( X X ) i
i 1
在给定显著性水平 下,对应的 Y0 的置信区间为
ˆ t S ,Y ˆ t S ) (Y 0 l 0 l
例6 运用LINEST函数进行多元线性回归分析
某公司为了研究某种产品的销售额与广告费用和促销 费用的关系,从销售额相近的销售点中随机抽取了12 个销售点的样本,对应12个点的销售额和广告费用、 促销费用如下表所示,试给出销售额与广告费用和促 销费用的回归方程,并在0.05的显著性水平下对方程 进行总体的显著性和回归系数的显著性进行检验
2 2
例5 一元线性预测
某家电厂商需要知道在一定的广告费用投入下对应的 销售额,从所有销售额相似的地区中随机选取12个 地区,分别统计该地区的广告费用和销售额数据如下 表所示,试预测当投入广告费用为500万元时的销售 额,并在0.05的显著性水平下给出预测区间
12个地区销售额和广告费用(万元)
地区 1 2 3 广告费用X 210 250 290 销售额Y 3100 3300 3850 地区 7 8 9 广告费用X 360 380 400 销售额Y 4500 4750 5200
固定投资 总额X3 3791.7 4753.8 4410.4 4517 5594.5 8080.1 13072.3 17042.1 20019.26 22913.55 24941.11 28406.17 29854.71 32917.73 37213.49
相关文档
最新文档