最小二乘法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课前探究学习
课堂讲练互动
【训练1】 某种产品的广告费x(单位:百万元)与销售额y(单 位:百万元)之间有如下对应数据:
x y (1)画出散点图; (2)判断x与y是否具有线性相关关系,若具有,求回归直线 方程,并说明回归直线方程斜率的意义. 2 30 4 40 5 60 6 50 8 70
课前探究学习
课堂讲练互动
解
(1)散点图如图所示
(2)由散点图知 x 与 y 具有线性相关关系.由题中数 据可求得- x =5,- y =50,
课前探究学习
课堂讲练互动
a=- y - b- x =50-6.5×5=17.5. 所求回归直线方程为 y=6.5x+17.5. 回归直线方程的斜率 6.5 表示广告费每增加 100 万元, 销售额平均增加 650 万元.
(x1-- x )(y1-- y )+(x2-- x )(y2-- y )+„+(xn-- x )(yn-- y) (x1-- x )2+(x2-- x )2+„+(xn-- x )2
x1y1+x2y2+„+xnyn-n- x- y = . 2 2 2 2 - x1+x2+„+xn-n x
课前探究学习 课堂讲练互动
• 最小二乘法最早称为回归分析法。由著名 的英国生物学家、统计学家道尔顿( F.Gallton)——达尔文的表弟所创。 • 早年,道尔顿致力于化学和遗传学领域的 研究。 • 他研究父亲们的身高与儿子们的身高之间 的关系时,建立了回归分析法。
课前探究学习
课堂讲练互动
名师点睛
1. 回归直线方程的应用 (1)描述两变量之间的依存关系;利用线性回归方程即可
(1)画出散点图; (2)求线性回归方程; (3)关于加工零件的个数与加工时间,你能得出什么结
论?
课前探究学习 课堂讲练互动
审题指导
解答本题应先画散点图,判断其是否线性相
关,再利用最小二乘法求其回归方程.
[解题流程] 画散点图 → 是否线性相关 → 求线性回归方程 → 预测
[规范解答](1)散点图如图所示.
从而得到回归直线方程为y=0.800+0.172x.
课前探究学习 课堂讲练互动
规律方法
用线性回归方程进行数据拟合的一般步骤
是:(1)把数据列成表格;(2)作散点图;(3)判断是否线 性相关;(4)若线性相关,求出系数b,a的值(一般也列
成表格的形式,用计算器或计算机计算);(5)写出回归
直线方程y=a+bx.
课前探究学习
课堂讲练互动
55 950-10×55×91.7 所以 b= ≈0.668, 38 500-10×552 a=- y -b- x =91.7-0.668×55=54.96. 故所求线性回归方程为 y=0.668x+54.96. 10 分 (3)由线性回归方程可以得出每多加工 10 个零件,就多花 费 6.68 小时. 12 分
课前探究学Fra Baidu bibliotek 课堂讲练互动
i xi yi
1 2
2 4
3 4
4 6
5 6 2.1
6 6 1.9
7 7 1.8
8 7 2.1
9 8 2.2
10 10 2.3
0.9 1.4 1.6 2.0
xiyi 1.8 5.6 6.4
12 12.6 11.4 12.6 14.7 17.6 23
- x =6,- y =1.83,
课前探究学习 课堂讲练互动
题型一
求线性回归的方程
【例1】 某地10户家庭的年收入和年饮食支出的统计资料如下 表: 年收入 x(万元)
2
4
4
6
6
6
7
7
8 10
年饮食支出 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3 y(万元) 根据上述数据,家庭年收入与年饮食支出之间有怎样的关 系呢?求出回归直线方程.
课前探究学习 课堂讲练互动
[思路探索] (1) 调整表中数据 → 作散点图 → 判断线性相关 (2) 计算b,a的值 → 求得线性回归方程
解
以年收入为横坐标,把年饮
食,描出如右图所示散点支出y的相
应取值作为纵坐标图. 由散点图可以看出,各散点在一条 直线附近,且年收入越高,年饮食 支出越高,说明这两个变量之间具 有线性相关关系. 对前面列表中的数据进行具体计 算,可列出以下表格:
课前探究学习
课堂讲练互动
题型二
利用线性回归方程对总体进行估计
【例2】 一个车间为了规定工时定额,需要确定加工零件所花 费的时间,为此进行了10次实验,收集数据如下:
零件数 x(个) 加工时间 y(小时) 10 20 30 40 50 60 70 80 90 100
62 68 75 81 89 95 102 108 115 122
课前探究学习
课堂讲练互动
散点 (2)应用:利用最小二乘法估计时,要先作出数据的______ 散点图 呈现出线性关系,可以用最小二乘法估 图.如果_______ 散点图 呈现出其他的曲线关 计出线性回归方程;如果_______ 系,我们就要利用其他的工具进行拟合. 线性回归方程 2.
x1+x2+„+xn y1+y2+„+yn - - 如果用 x 表示 ,用 y 表示 , n n 则可以求得 b=
定量描述两个变量间依存的数量关系. (2)利用回归方程进行预测或规定y值的变化,通过控制x的 范围来实现目标.如已经得到了空气中NO的浓度和汽车 流量间的回归方程,即可通过控制汽车流量来控制空气中 的NO的浓度. (3)注意作回归分析要有实际意义,回归分析前,最好先 作出散点图,确定合适的拟合模型.
- y -b- x. a=______
这样得到的直线方程y=a+bx称为线性回归方程,a,b是 系数 . 线性回归方程的_____ 想一想:回归直线通过样本点的中心,比照平均数与样本 数据之间的关系,你能说说回归直线与散点图中各点之间
的关系吗?
提示 对于单变量样本数据而言,平均数是样本数据的中 心, 类似地, 对于双变量样本数据, 假设样本点为(x1, y1), 1 1 - - (x2,y2),„,(xn,yn),记 x = (x1+x2+„+xn), y = (y1 n n +y2+„+yn),则(- x ,- y )为样本点的中心,回归直线一定 过这一点.
因为散点图中各点并不在一条直线的附近,所以两者不具 有线性相关关系,没有必要求回归方程.
两个变量之间具有相关关系,但是否具有线性
关系,需要用散点图来判断,只有具有线性相关关系的两 个变量,才能用回归方程来体现它们的关系.有的同学对 两个变量的相关关系不进行判断就盲目地利用回归方程来 表示,从而使问题出现了严重错误.
课前探究学习
课堂讲练互动
回归直线方程求解的方法步骤 2.
根据最小二乘法的思想和公式,利用计算器或计算机,可 以方便地求出回归方程.
求线性回归方程的步骤:
第1步:列表xi,yi,xiyi;
第 2 步:计算- x ,- y,
第3步:代入公式计算b,a的值;
第4步:写出回归方程y=a+bx.
利用回归直线对总体进行估计: 利用回归直线,我们可以进行预测.若回归方程为y=bx +a,则x=x0处的估计值为:y=bx0+a.
可以用下面的表达式来刻画这些点与直线y=a+bx的接近 程度: 2+[y -(a+bx )]2+…+[y -(a+bx )]2 [ y - ( a + bx )] 1 1 2 2 n n ______________________________________________. 最小值 的直线y=a+bx就是我们所要求的直 使得上式达到_______ 最小二乘法 . 线,这种方法称为___________
§8
【课标要求】 1.了解最小二乘法.
最小二乘估计
2.理解线性回归方程的求法.
3.掌握线性回归方程的意义. 【核心扫描】
1.线性回归方程的求法.(重点)
2.线性回归方程的意义.(易混点) 3.最小二乘法的原理.(难点)
课前探究学习
课堂讲练互动
自学导引
1.最小二乘法
(1)定义:如果有n个点:(x1,y1),(x2,y2),…,(xn,yn),
课前探究学习 课堂讲练互动
6 60 95 3 600 5 700
7 70 102 4 900 7 140
8 80 108 6 400 8 640
9 90 115
10 100 122
合计 550 917
8 100 10 000 38 500
xi y i
2 250 3 240
10 350
12 200 55 950
- x =55,- y =91.7
课前探究学习
课堂讲练互动
由散点图知二者呈线性相关关系.
4分
(2)设线性回归方程为y=bx+a.
列表并利用科学计算器进行有关计算.
i xi yi
x2 i
1 10 62 100 620
2 20 68 400 1 360
3 30 75 900
4 40 81 1 600
5 50 89 2 500 4 450
748
542
507
813
574
701
432
4 317 - - [错解] 由题中数据, 得 x =13, y= , 7
课前探究学习 课堂讲练互动
通过画散点图判断变量间的相关关系.若变 量间不存在相关关系,就没有必要求回归方程,用公式求 得的回归方程是没有意义的.
课前探究学习
课堂讲练互动
[正解] 散点图如图所示.
题后反思 用最小二乘法求出线性回归方程后,根据线性 回归方程可以说明其实际意义,并可以用于预测.
课前探究学习
课堂讲练互动
误区警示
忽视相关关系的判断而致错
【示例】 下表是某地连续七年年平均降雨量(mm)与年平均 气温(℃)的相关数据,两者具有线性相关关系吗?若具
有,求出其回归方程;若不具有,说明理由. 年平均气 温 x/ ℃ 年平均降 雨量y/mm 12.51 12.84 12.84 13.69 13.33 12.74 13.05
课前探究学习 课堂讲练互动
• 一 是物理量y与x间的函数关系已经确定 ,只有其中的常数未定(及具体形式未 定)时,根据数据点拟合出各常数的最 佳值。 • 二 是在物理量y与x间函数关系未知时, 从函数点拟合出 y 与 x 函数关系的经验公 式以及求出各个常数的最佳值。
课前探究学习 课堂讲练互动
最小二乘法产生的历史
课前探究学习 课堂讲练互动
•
在处理数据时,常要把实验获得的 一系列数据点描成曲线表反映物理量间 的关系。为了使曲线能代替数据点的分 布规律,则要求所描曲线是平滑的,既 要尽可能使各数据点对称且均匀分布在 曲线两侧。由于目测有误差,所以,同 一组数据点不同的实验者可能描成几条 不同的曲线(或直线),而且似乎都满足上 述平滑的条件。那么,究竟哪一条是最 曲线呢?这一问题就是“曲线拟合”问 题。一般来说,“曲线拟合”的任务有 两个: