线性回归直线方程PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这样,问题归结为:
当 a, b 为何值时Q最小?
接着经过数学上求最小值的运算,
可求得系数 a, b 的公式。
最小二乘法 :
n
• 这种通过求的 ( yi yi )2 最小值而得到回
归直线方程的方i法1 ,即求线性回归直线, 使得样本数据的点到它的距离(偏差)的平方 和最小的方法叫做最小二乘法。
(散点图) (3)选中散点,在菜单中选定“图表”中
的“添加趋势线”,弹出对话框 (4)双击回归直线,弹出“趋势线格式”对话框, (5)单击“选项”,选定“显示公式”,确定即可
回归直线是
法三:用计算器的统计功能求系数(参考教材P94)
练习:
下表是近十届奥运会男子110米栏第一名的成绩:
届次x 19
(利用系数公式)求解回归方程; ⑤通过研究回归方程,提取有用信息,
作出比较可靠的趋势预测,服务于现实生活。
布置作业:
(A)1.教材本节练习(P96)第1,2题。
(B) 2.已知复印机复印资料的份数与所用时间 具有线性相关关系, 已知如下数据:
复印资料份数x(份)
30
50
60
复印时间y(分钟)
5
6
7
课题:
2.3.2 线性回归直线方程(一)
探究讨论:
上届奥运我国金牌总数排第二,而下一届将 在首都北京举行,因此有人预测下一届奥运我 国金牌总数很可能是第一,你能利用下表数据 来对其加以评论吗?
届次x 23 24 25 26 27 28 金牌总数y 15 5 16 16 28 32
金牌数y
35
30
成绩y (秒)
13.30
届次x 24
成绩y (秒)
12.98
20 13.24 25 13.12
21 13.30 26 12.95
22 13.39 27 13.00
23 13.20 28 12.91
利用计算器求线性 回归直线, 并预测2008年北京奥运会男子110m栏成绩.
总结:
1. 最小二乘法的思想: 2.回归分析:对具有相关关系的两个变量进行统计分析 的方法叫做回归分析。 3. 运用回归分析的方法来分析、处理数据的一般步骤: ①收集数据,并制成表格; ②画出数据的散点图; ③利用散点图直观认识变量间的相关关系; ④运用科学计算器、Excel表格等现代信息技术手段
例1:我国历届奥运获得金牌数表
届次x 23 24 25 26 27 28 金牌数y 15 5 16 16 28 32
利用公式求y关于x的线性回归直线方程, (先列表, 再用计算器计算) 并据此预测第29届奥运会中国的金牌数。
法二:用Excel软件求回归方程(演示) (参考教材P93)
(1)把数据输入Excel表格, (2)选定数据后在菜单项中选择添加数据图表
25
20
15
10
5
0
22
23
24
25
26
27
28
29
届次x
总体上看x与y正相关,线性相关. 散点图中的点在一条直线附近, 这条直线称为其线性回归直线。 可以利用此直线来预测下一届金牌总数。
探究讨论:
金牌数y
35
30
25
20
15
10
5
0
22
23
24
25
26
27
28
29
届次x
怎样才能找到合适的线性回归直线?(求出其方程)
| yi yi |
可用
n
| yi yi | 来表示整体上的偏差
i 1
含多个绝对值的式子求最小值的运算很不方便。 为此改用下式来衡量n个点与回归直线整体上的偏差:
Q=
n
( yi yi )2
i 1
= ( y1 bx1 a)2 ( y2 bx2 a)2 ( yn bxn a)2
(1)(选做)直接用最小二乘法推导其线性回归直线方程, (2)利用系数公式求线性回归直线方程 (3)若要复印1000份资料,估计需要多少时间?
(C) 3. 探究:当已知数据只有两个时,用线性回归直线系数公式
得到的直线方程与过此两点的直线方程有何关系? 4. 选做:(1)查阅推导线性回归直线方程的资料
1、采用测量的方法,先画一条直线,测量出各点 到它的距离,然后移动直线,到达一个使距离之 和最小的位置,测量出此时直线的斜率和截距, 就得到回归方程。
2、在图中选取两点画直线,使得直线两侧的点的 个数基本相同。
3、在散点图中多取几个点,确定几条直线的方程, 分别求出各条直线的斜率和截距的平均数,将这 两个平均数作为回归方程的斜率和截距。
n
n
(xi x)(yi y)
xi yi nx y
b i1
n
(xi x)2
i 1
i1
n
xi 2
2
nx
i 1ቤተ መጻሕፍቲ ባይዱ
a y bx
对系数a,b的理解
a, b 分别为回归直线方程的纵截距与斜率, 当x与y正相关时b>0; 当x与y负相关时b<0.
y bx a说明线性回归直线经过 点(x, y)
上面的这些方法虽然有一定的道理,但可靠性不强, 所得的直线不只一条,且差别很大, 或者所用方法太繁杂,没有通用性。
探究讨论: 怎样才能找到合适的回归直线?
求回归直线方程的目的是什么?
(x1,y1)
(x1,y1)
yi yi
(x1,y1)
记, yi bxi a
则相应于由回归直线得出的估计值与实际值的偏差是