高考数学复习点拨 回归模型的残差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例 2、某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽 取 10 户进行调查,其结果如下:
月人均收入 x/元 月人均生活费 y/元
300
255
390
324
420
335
520
360
570
450
700
520
760
580
800
600
850
630
1080
750
试预测人均月收入为 1100 元和人均月收入为 1200 元的两个家庭的月人均生活费。
和 850.58 元。
新财界 http://www.xincaijie.com 峝奣尛
i 1 10
xi 2
2
10 x
0.6599.
i 1
^
y x 58.751,所以回归直线方程为 y 0.6599x 58.751. 计算相关系数得 r 0.993136 ,而查表知 r0.05 0.632 ,故月人均收入与月人均生活
费之间具有显著相关关系。 作残差图如图, 由图可知, 残差点比较均 匀地落在水 平的带状区 域中,说明 选用的模
(3)计算相关系数
将上述数据代入 r
8
xi yi 8x y
i 1
得 r 0.992704 ,查表可知
8
(xi 2
2
8x )(
8
yi2
2
8y )
i 1
i 1
r0.05 0.707 ,而 r r0.05 ,故 y 与 x 之间存在显著的相关关系。
(4)残差分析: 作残差图如图 2,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比 较合适。
解答:作出散点 分布图如图 ,由图可知, 月人均生活 费与人均收 入之间具有 线性相关
关系。
10
10
通过计算可知 x 639, y 480.4, xi2 4610300 , yi2 2540526 ,
i 1
i 1
10
10
xi yi 10x y
xi yi 3417560 ,所以 i 1
型比较合适。
计算相关指数得 R 2 =0.9863,说明城镇居民的月人均生活费的差异有 98.63%是由月人
均收入引起的。
^
由以上分析可知,我们可以利用回归方程 y 0.6599x 58.751. 来作为月生活费的预
报值。 将 x=1100 代入回归方程得 y=784.59 元;将 x=1200 代入回归方程得 y=850.58 元。 故预测月人均收入分别为 1100 元和 1200 元的两家庭的月人均生活费分别为 784.59 元
39
39
42
44
46
46
48
50
51
900 1089 1225 1369 1521 1936 2116 2500
y i2
xi yi
900 1156 1369 1521 1764 2116 2304 2601
900 1122 1295 1443 1638 2024 2208 2550
8
8
由上表可求得 x 39.25, y 40.875 , xi2 12656 , yi2 13731 ,
线性关系等);
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方 程 y=bx+a);
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机
的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。
将 x=47 和 x=55 分别代入该方程可得 y=49 和 y=57, 故预测运动员训练 47 次和 55 次的成绩分别为 49 和 57. 点评:一般地,建立回归模型的基本步骤为: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在
计算残差的方差得 2 0.884113,说明预报的精度较高。
(5)计算相关指数 R 2
计算相关指数 R 2 =0.9855.说明该运动员的成绩的差异有 98.55%是由训练次数引起的。
(6)做出预报
^
由上述分析可知,我们可用回归方程 y 1.0415x 0.00302. 作为该运动员成绩的预报值。
37
39
44
46
50
成绩/y 30
34
37
39
42
46
48
51
试预测该运动员训练 47 次以及 55 次的成绩。
解答:(1)作出该运动员训练次数 x 与成绩 y 之间的散点图,如图 1 所示,由散点图可
知,它们之间具有线性相关关系。
(2)列表计算:
次数
成绩 yi
x i2
xi
30
30
33
34
35
37
37
n
^
(yi yi )2
2、可以进一步通过相关指数 R 2 1 i1 n
来衡量回归模型的拟合效果,一般
(yi y)2
Baidu Nhomakorabeai 1
规律是 R 2 越大,残差平方和就越小,从而回归模型的拟合效果越好。
二、典例分析:
例 1、某运动员训练次数与运动成绩之间的数据关系如下:
次数/x 30
33
35
i 1
i 1
8
8
8
(xi x)( yi y)
xi yi 8x y
xi yi 13180 ,所以 i1 8
i 1
(xi x)2
i 1 8
xi 2
2
x
1.0415.
i 1
i 1
^
y x 0.00302 ,所以回归直线方程为 y 1.0415x 0.00302.
回归模型的残差分析
判断回归模型的拟合效果是回归分析的重要内容,在回归分析中,通常用残差分析来判 断回归模型的拟合效果。下面具体分析残差分析的途径及具体例子。
一、残差分析的两种方法 1、差分析的基本方法是由回归方程作出残差图,通过观测残差图,以分析和发现观测 数据中可能出现的错误以及所选用的回归模型是否恰当;在残差图中,残差点比较均匀地落 在水平区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型的拟合精 度越高,回归方程的预报精度越高。