回归直线方程—最小二乘法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
yi bixa
(x1,y1)
(xi,yi) (xn,yn)
(x2,y2)
BG
10
Q y 1 b 1 a 2 x y 2 b 2 a 2 x y n b n a 2 x
这样通过求此式的最小值而得到回 归直线的方法,即使得样本数据的 点到回归直线的距离的平方和最小
的方法叫做最小二乘法.
根据最小二乘法公式,
利用计算机可以求出
其回归直线方程
回
归
图散
y0.577x0.48 点
直 线
BG
14
年 龄 23 27 39 41 45 49 50 53 54 56 57 58 60 61 脂 肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考:将表中的年龄作为x代入回归方程,看看得
出的数值与真实数值之间的关系,从中你体会到
了什么? y0.577x0.48
存在样本
点不在直线上
x=27时,y=15.099%
x=37时,y=20.901%
可利用回归方程
预测不同年龄段
的体内脂肪含量
的百分比。
BG
15
(2012山东临沂二模,20,12)假设关于某设备的 使用年限x和所有支出的维修费用y(万元),有如 下表的统计资料:
yi-Yi
yi-Yi=yi-(bxi+a)(i=1,2,…,n)
(x1,y1)
这样,用这n个偏差的和来刻画
“各点与此直线的整体偏差”
是比较合适的。
BG
(x2,y2)
7
(x1 ,y1)
(xi ,yi)
(x2 ,y2)
yi-(bxi+a)
因此用 y=bx+a的“整体距离”
表示各点到直线
BG
8
由于绝对值使得计算不方便,在实际应用 中人们更喜欢用
Q y 1 b 1 a 2 x y 2 b 2 a 2 x y n b n a 2 x
(x1,y1)
(xi,yi)
yi bixa
(xn,yn)
(x2,y2)
BG
9
这样,问题就归结为:当a,b取什么值时Q最小?即
点到直线 ybxa的“整体距离”最小.
Q y 1 b 1 a 2 x y 2 b 2 a 2 x y n b n a 2 x
使用年 限x
2
3
4
5
6
维修费 用y
2.2
3.8
5.5
6.5
7.0
若由资料可知y对x呈线性相关关系,试求: (1)线性回归直线方程 (2)估计使用年限为10年时,维修费用是多少?
法二
法三
1.画一条直线 1.在散点图中 2.测量出各点 多取几组点, 与它的距离 确定出几条直 3.移动直线, 线的方程 到达某一位置 2.分别求出各 使距离的和最 条直线的斜率、 小,测量出此 截距的平均数 时直线的斜率 3.将这两个平 与截距,得到 均数当成回归 回归方程。 方程的斜率与
截距。
BG
(1)求平均数
;
(2)计算 xi 与 yi 的乘积,再求
;
(3)计算
;
(4)将上述有关结果代入公式,写出回归 直线方程.
BG
13
年 龄 23 27 39 41 45 49 50 53 54 56 57 58 60 61 脂 肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6
问题:在一次对人体脂肪含量与年龄关系的研究中, 研究人员获得了一组样本数据:
年 龄 23 27 39 41 45 49 50 53 54 56 57 58 60 61
脂 肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6
图散 点
回 归 直 线
BG
1
回归直线概念:散点图中心的分布从整体上看 大致是一条直线附近,该直线称为回归直线
求出回归直线的方程
我们就可以比较清楚地了解年龄与体 内脂肪含量之间的相关性
由此可以预测相应年龄段的脂肪含量
那我们又该如何具体求这个回归方程呢?
BG
2
方法汇总
法一
1.选取两点作 直线 ps:使直线两 侧 的点的个 数基本相同。
根据有关数学原理推导,a,b的值由下列公式给出
n
n
xi x yi y
xiyi nxy
b i1 n
2
xi x
i1 n
xi2
2
nx
i1
i1
a Baidu Nhomakorabeabx
BG
11
n
Σ(yi-Yi)的最小值
i=1
n
Σ|yi-Yi|的最小值
i=1
n
Σ(yi-Yi)2的最小值
i=1
n
xi yi n x y
法四
? ? 3
上面三种方法都有一定的道理,但总让人感到 可靠性不强.
回归直线与散点图中各点的位置用数学的方法 来刻画应具有怎样的关系?
BG
4
方法汇总
法一
1.选取两点作 直线 ps:使直线两 侧 的点的个 数基本相同。
法二
法三
1.画一条直线 1.在散点图中 2.测量出各点 多取几组点, 与它的距离 确定出几条直 3.移动直线, 线的方程 到达某一位置 2.分别求出各 使距离的和最 条直线的斜率、 小,测量出此 截距的平均数 时直线的斜率 3.将这两个平 与截距,得到 均数当成回归 回归方程。 方程的斜率与
截距。
BG
法四
最 小 二 乘 法
5
求回归方程的关键
——如何使用数学方法来刻画“从整体上看,
各点到此直线的距离最小”。
假设两个具有线性相关关系的变量的一组数 据:(x1, y1),(x2, y2),...... (xn, yn)
下面讨论如何表达这些点与一条直线y=bx+a 之间的距离。
BG
6
最小二乘法的公式的探索过程如下:
b
i1
n
x i2
2
nx
i1
,
a y b x
n
( xi x)( yi y )
b
1
n
(xi x)2 1
a y b x
Q=(y1-bx1-a) 2+(y2-bx2-a) 2+…+(yn-bxn-a) 2
当a,b取什么值时,Q的值最小,即总体偏差最小
BG
12
求线性回归方程的步骤:
1.设已经得到具有线性相关关系的变量的一组数据:
(x1,y1),(x2,y2),…,(xn,yn)
2.设所求的回归直线方程为Y=bx+a,其中a,b是待 定的系数。当变量x取x1,x2,…,xn时,可以得到
Yi=bxi+a(i=1,2,…,n) y 3.它与实际收集得到的yi之间偏差是
(xi ,yi )