求回归直线方程
求线性回归直线方程的步骤
请同学们回忆一下,我们以前是否学过 变量间的关系呢?
两个变量间的函数关系.
相关关系与函数关系的异同点:
相同点:两者均是指两 个变量间的关系. 不同点:①函数关系是一种确定的关系; 相关关系是一种 非确定的关系.事实上,函数关系是两个非 随机变量的关系,而相关关系是随机变量 与随机变量间的关系. ②函数关系是一种因果关系,而相关关系 不一定是因果关 系,也可能是伴随关系.
20
30
40
^ (4)当x=2时,y=143.063, 因此,这天大 约可以卖出143杯热饮。
小结:
(1)判断变量之间有无相关关系,简便方 法就是画散点图。 (2)当数字少时,可用人工或计算器,求 回归方程;当数字多时,用Excel求回归方 程。 (3)利用回归方程,可以进行预测。
热饮杯数 156 150 132 128 130 116 104 89 93 76 54
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一
般规律; (3)求回归方程; (4)如果某天的气温是 2 C,预测这天卖出的热饮杯数。
0
解: (1)散点图
160 150 140 130 120 110 100 90 80 70 60 50 40 -10 0
10x y
2
x
i 1
2 i
10 x
110 10 0 1 110 10 0
a y bx 0 b 0 0
∴所求回归直线方程为 ^ y=x
小结:求线性回归直线方程的步骤: 第一步:列表 x , y , x y ;
i i i i
第二步:计算
x, y, xi , xi y
脂肪含量 40 35 30 25 20 15 10 5 0 20 25 30 35 40 年龄 45 50 55 60 65
线性回归方程公式
线性回归方程公式线性回归是一种用于预测连续数值变量的统计方法。
它基于一个线性的数学模型,通过寻找最佳的拟合直线来描述自变量和因变量之间的关系。
线性回归方程公式为:Y=β0+β1X1+β2X2+...+βnXn+ε其中,Y是因变量,X1,X2,...,Xn是自变量,β0,β1,β2,...,βn是回归系数,ε是误差项。
回归系数表示自变量对因变量的影响程度。
线性回归的基本假设是:1.线性关系:自变量和因变量之间存在线性关系,即因变量的变化可以通过自变量的线性组合来解释。
2.残差独立同分布:误差项ε是独立同分布的,即误差项之间不存在相关性。
3.残差服从正态分布:误差项ε服从正态分布,即在每个自变量取值下,因变量的观测值呈正态分布。
4.残差方差齐性:在每个自变量取值下,因变量的观测值的方差是相等的。
线性回归的求解方法是最小二乘法,即通过最小化实际观测值与回归方程预测值之间的平方差来估计回归系数。
具体步骤如下:1.数据收集:收集自变量和因变量的观测数据。
2.模型设定:根据自变量和因变量之间的关系设定一个线性模型。
3.参数估计:通过最小化平方误差来估计回归系数。
4.模型检验:通过检验残差的随机性、正态性和方差齐性等假设来检验模型的合理性。
5.模型拟合:利用估计的回归系数对未知自变量的观测值进行预测。
6.模型评估:通过评估预测结果的准确性来评估模型的性能。
Y=β0+β1X1+β2X2+...+βnXn+ε其中,Y是因变量,X1,X2,...,Xn是自变量,β0,β1,β2,...,βn 是回归系数,ε是误差项。
多元线性回归方程可以更准确地描述自变量和因变量之间的关系。
除了最小二乘法,还有其他方法可以用来求解线性回归模型,如梯度下降法和最大似然估计法等。
这些方法可以在不同的情况下选择使用,以获得更好的回归模型。
线性回归是一种经典的预测分析方法,被广泛应用于各个领域,如经济学、金融学、社会科学、自然科学等。
通过建立合适的线性回归模型,可以帮助我们理解自变量和因变量之间的关系,并用于预测未来的趋势和变化。
回归直线方程
课本P90习题3.1 V1
3.1回归分析的基本思想 及其初步应用(3)
建立回归模型的基本步骤 1)确定解释变量和预报变量; 2)画出散点图; 3)确定回归方程类型; 4)求出回归方程; 5)利用相关指数或残差进行分析.
问题:一只红铃虫的产卵数y与温度x有关,现收 集了7组观测数据,试建立y与x之间的回归方程
相关程度越小.
r∈[-1,-0.75]--负相关很强; r∈[0.75,1]—正相关很强; r∈[-0.75,-0.25]--负相关一般; r∈[0.25, 0.75]—正相关一般; r∈[-0.25, 0.25]--相关性较弱;
例题1 从某大学中随机选出8名女大学生,其身 高和体重数据如下表:
编号 1
160 170 180
它的均值E(e)= 0,方差D(e)=σ2 > 0
探究:在线性回归模型中,e是一个不可观测 的量,那么应该怎样研究随机误差?如何衡量 预报的精度?
为了衡量预报的精度,需要估计的σ2值?
n
Q( , ) ( yi xi )2 i 1
随机误差ei yi bxi a(i 1, 2,....n) 其估计值为: eˆi yi yˆi yi bˆxi aˆ eˆi称为相应点(xi,yi )的残差
果这种分析工作称为残差分析
了解残差图的制作及作用。P85 坐标纵轴为残差变量,横轴可以有不同的选择; 若模型选择的正确,残差图中的点应该分布在以横轴为 心的带形区域; 对于远离横轴的点,要特别注意。身高异与常体 重
点
残 差 图
• 错误数据 • 模型问题
总偏差平方和,残差平方和,回归平方和三者的 含义与它们间的关系:
yˆ = 0.849x - 85.172
线性回归方程公式
线性回归方程公式线性回归是一种常见的统计学方法,用于建立一个预测目标变量与一个或多个自变量之间的线性关系模型。
它是一种广泛应用的回归方法,适用于各种领域,如经济学、金融学、社会学、生物学和工程学等。
线性回归模型可以表示为以下形式:Y = b0 + b1*X1 + b2*X2+ ... + bp*Xp,其中Y是目标变量,X1、X2、...、Xp是自变量,b0、b1、b2、...、bp是回归系数。
这个方程描述了目标变量Y与自变量X之间的线性关系,通过调整回归系数的值可以拟合数据并预测未知数据的值。
线性回归模型的目标是找到最佳拟合直线,使得预测值与实际观测值之间的误差最小化。
常用的误差衡量指标是残差平方和(RSS),也可以使用其他指标如平均绝对误差(MAE)和均方根误差(RMSE)。
线性回归模型的建立过程包括两个主要步骤:参数估计和模型评估。
参数估计是通过最小化误差来确定回归系数的值。
最常用的方法是最小二乘法,通过最小化残差平方和来估计回归系数。
模型评估是用来评估模型的拟合优度和预测能力,常用的指标包括决定系数(R^2)、调整决定系数(Adjusted R^2)和F统计量。
线性回归模型的假设包括线性关系、误差项的独立性、误差项的方差恒定以及误差项服从正态分布。
如果这些假设不成立,可能会导致模型的拟合效果不佳或不可靠的预测结果。
对于线性回归模型的建立,首先需要收集相关的数据,然后进行数据的处理和变量选择。
数据处理包括缺失值处理、异常值处理和变量转换等。
变量选择是通过统计方法或经验判断来选择对目标变量有影响的自变量。
常见的变量选择方法包括逐步回归、岭回归和lasso回归等。
在建立模型之后,需要对模型进行评估和验证。
评估模型的拟合优度是通过决定系数和F统计量来实现的,较高的决定系数和较小的F统计量表明模型的拟合效果较好。
验证模型的预测能力可以使用交叉验证等方法。
线性回归模型还有一些扩展形式,如多项式回归、加权回归和广义线性回归等。
回归性方程
回归性方程
回归方程是根据样本资料通过回归分析所得到的反映一个变量(因变量)对另一个或一组变量(自变量)的回归关系的数学表达式。
回归直线方程用得比较多,可以用最小二乘法求回归直线方程中的a,b,从而得到回归直线方程。
原理
对变量之间统计关系进行定量描述的一种数学表达式。
指具有相关的随机变量和固定变量之间关系的方程。
回归直线方程指在一组具有相关关系的变量的数据(x与Y)间,一条最好地反映x与y之间的关系直线。
离差作为表示Xi对应的回归直线纵坐标y与观察值Yi的差,其几何意义可用点与其在回归直线竖直方向上的投影间的距离来描述。
数学表达:Yi-y^=Yi-a-bXi.
总离差不能用n个离差之和来表示,通常是用离差的平方和,即(Yi-a-bXi)^2计算。
线性回归方程的公式为:b=(x1y1+x2y2+…xnyn-nxy)/(x1+x2+…xnNX)。
线性回归方程是数理统计中使用回归分析来确定两个或多个变量之间定量关系的统计分析方法之一。
线性回归方程公式_数学公式
线性回归方程公式_数学公式线性回归方程公式线性回归方程公式:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)。
线性回归方程公式求法:第一:用所给样本求出两个相关变量的(算术)平均值:x_=(x1+x2+x3+...+xn)/ny_=(y1+y2+y3+...+yn)/n第二:分别计算分子和分母:(两个公式任选其一)分子=(x1y1+x2y2+x3y3+...+xnyn)-nx_Y_分母=(x1^2+x2^2+x3^2+...+xn^2)-n__x_^2第三:计算b:b=分子/分母用最小二乘法估计参数b,设服从正态分布,分别求对a、b的偏导数并令它们等于零。
其中,且为观测值的样本方差.线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线.顺便指出,将来还需用到,其中为观测值的样本方差。
先求x,y的平均值X,Y再用公式代入求解:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)后把x,y的平均数X,Y代入a=Y-bX求出a并代入总的公式y=bx+a得到线性回归方程(X为xi的平均数,Y为yi的平均数)线性回归方程的应用线性回归方程是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。
这是因为线性依赖于其未知参数的模型比非线性依赖于其位置参数的模型更容易拟合,而且产生的估计的统计特性也更容易确定。
线性回归有很多实际用途。
分为以下两大类:如果目标是预测或者映射,线性回归可以用来对观测数据集的和X的值拟合出一个预测模型。
当完成这样一个模型以后,对于一个新增的X值,在没有给定与它相配对的y的情况下,可以用这个拟合过的模型预测出一个y值。
给定一个变量y和一些变量X1,...,Xp,这些变量有可能与y相关,线性回归分析可以用来量化y与Xj之间相关性的强度,评估出与y不相关的Xj,并识别出哪些Xj的子集包含了关于y的冗余信息。
直线回归法公式
直线回归法公式直线回归法公式1. 简介直线回归法是一种用于建立变量之间线性关系的统计方法。
它通过找到一条最佳拟合直线,以最小化观测值与拟合值之间的误差,来预测因变量的值。
直线回归法广泛应用于经济学、统计学和机器学习等领域。
2. 简单线性回归简单线性回归是直线回归法的最基本形式,用于建立一个自变量和一个因变量之间的线性关系。
其回归方程可以用以下公式表示:y=β0+β1x+ϵ其中,y是因变量,x是自变量,β0和β1是回归系数,ϵ是误差。
举个例子来说明简单线性回归公式的应用。
假设我们要研究一个国家的人口增长与经济增长之间的关系。
我们收集了一系列年份和对应的人口数量和GDP增长率数据。
我们可以使用简单线性回归来建立人口数量(因变量)与GDP增长率(自变量)之间的关系模型。
3. 多元线性回归多元线性回归是在简单线性回归的基础上进一步扩展,用于建立多个自变量和一个因变量之间的线性关系。
其回归方程可以用以下公式表示:y=β0+β1x1+β2x2+⋯+βp x p+ϵ其中,y是因变量,x1,x2,…,x p是自变量,β0,β1,β2,…,βp是回归系数,ϵ是误差。
举个例子来说明多元线性回归公式的应用。
假设我们要研究一个公司的销售额与广告投入、产品价格、季节性因素等变量之间的关系。
我们可以使用多元线性回归来建立销售额(因变量)与广告投入、产品价格、季节性因素等(自变量)之间的关系模型。
4. 最小二乘法最小二乘法是直线回归法中常用的参数估计方法,用于寻找最佳拟合直线。
其原理是最小化观测值与拟合值之间的误差平方和。
最小二乘法通过最小化以下目标函数来估计回归系数:nmin∑(y i−y î)2i=1其中,y i是观测值,y î是拟合值,n是观测值的数量。
使用最小二乘法可以得到最优的回归系数,使得拟合直线与观测值之间的误差最小化。
5. 总结直线回归法是一种用于建立变量之间线性关系的统计方法。
简单线性回归和多元线性回归是直线回归法的两种形式。
如何求回归直线方程
第二章 统计
1.(1)对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10),得 散点图(1);对变量 u,v 有观测数据(ui,vi)(i=1,2,…,10), 得散点图(2).由这两个散点图可以判断( C )
栏目 导引
第二章 统计
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关 解析:图(1)中的数据y随着x的增大而减小,因此变量x与变 量y负相关;图(2)中的数据v随着u的增大而增大,因此u与v 正相关.
1.两个变量之间的关系与其对应的散点图特征 (1)两个变量间的关系是函数关系时,数据点位于某曲线上. (2)两个变量间的关系是相关关系时,数据点位于某曲线附近. (3)两个变量间的关系是线性相关时,数据点位于某直线附近.
栏目 导引
第二章 统计
2.对回归直线与回归方程的理解 (1)回归方程被样本数据唯一确定,各样本点大致分布在回归 直线附近.对同一个总体,不同的样本数据对应不同的回归 直线,所以回归直线也具有随机性. (2)对于任意一组样本数据,利用最小二乘法公式都可以求得 “回归方程”,如果这组数据不具有线性相关关系,即不存在 回归直线,那么所得的“回归方程”是没有实际意义的.因此, 对一组样本数据,应先作散点图,在具有线性相关关系的前 提下再求回归方程.
3.下列关系中,有相关关系的是___②_____. ①正方形的边长与面积之间的关系; ②水稻产量与施肥量之间的关系; ③人的身高与年龄之间的关系. 解析:①正方形的边长与面积之间的关系是函数关系.②水 稻产量与施肥量之间的关系不是严格的函数关系,但是具有 相关性,因而是相关关系.③人的身高与年龄之间的关系既 不是函数关系,也不是相关关系,因为人的年龄达到一定时 期身高就不发生明显变化了,因而它们不具备相关关系.
第22讲 回归直线方程(解析版)
第22讲 回归直线方程一、必备秘籍 1.两个变量线性相关(1)散点图:将样本中n 个数据点(,)i i x y (i =1,2,…,n )描在平面直角坐标系中得到的图形. (2)正相关与负相关①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据11(,)x y ,22(,)x y ,33(,)x y (,)n n x y .②设所求回归方程为y bx a =+,其中,a b 是待定参数. ③由最小二乘法得1122211()(),()nnii i ii i nniii i xx y y x ynx yb a y bx xx xnx ====---===---∑∑∑∑其中,b 是回归方程的斜率,a 是截距. 二、例题讲解1.(2021·哈尔滨市呼兰区第一中学校高三模拟预测(文))十三届全国人大三次会议表决通过了《中华人民共和国民法典》这部法律自2021年1月1日起施行,某市相关部门进行法律宣传,某宣传小分队记录了前5周每周普及宣传的人数与时间的数据,得到下表:(2)利用(1)的回归方程,预测该宣传小分队第7周普及宣传(民法典)的人数.参考公式及数据:回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y b x x ==--=-∑∑,ˆa y bx=-,()()51430i ii x x y y =--=∑.【答案】(1)4341y x =+;(2)预测该宣传小分队第7周普及宣传《民法典》的人数为342. 【分析】(1)求出x 、y 的值,将表格中的数据代入最小二乘法公式,求出b 、a 的值,可得出y 关于x 的线性回归方程;(2)将7x =代入回归直线方程,可得出结果. 【详解】(1)由题意得()11234535x =++++=,()1901201702102601705y =++++=, ()()()()()()52222221132333435310ii x x =-=-+-+-+-+-=∑,所以()()()51521430ˆ4310iii ii x x y y bx x ==--===-∑∑,所以ˆ17043341a y bx=-=-⨯=, 所以线性回归方程为4341y x =+;(2)由(1)知4341y x =+,令7x =,解得43741342y =⨯+=, 故预测该宣传小分队第7周普及宣传《民法典》的人数为342.2.(2021·合肥市第六中学高三模拟预测(文))树木根部半径与树木的高度呈正相关,即树木根部越粗,树木的高度也就越高.某块山地上种植了A 树木,某农科所为了研究A 树木的根部半径与树木的高度之间的关系,从这些地块中用简单随机抽样的方法抽取6棵A 树木,调查得到A 树木根部半径x (单位:米)与A 树木高度y (单位:米)的相关数据如表所示:(2)对(1)中得到的回归方程进行残差分析,若某A 树木的残差为零则认为该树木“长势标准”,在此片树木中随机抽取1棵A 树木,估计这棵树木“长势标准”的概率.参考公式:回归直线方程为y bx a =+,其中()()()1122211n ni iiii i b nnixii i x y nxy x x y y xnx x ==-==---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ 20.9y x =+;(2)12【分析】(1)由最小二乘法先求样本点中心(),x y ,再代入公式求ˆ2b=,即可得到答案;(2)先计算6棵A 树木中残差为零的有3棵,占比为3162=,即可得到答案; 【详解】(1)由1(0.10.20.30.40.50.6)0.356x =⨯+++++=,1(1.1 1.3 1.6 1.5 2.0 2.1) 1.66y =⨯+++++=,610.1 1.10.2 1.30.3 1.60.4 1.50.5 2.00.6 2.1 3.71i ii x y==⨯+⨯+⨯+⨯+⨯+⨯=∑,6222222210.10.20.30.40.50.60.91ii x==+++++=∑,有62261216 3.7160.35 1.6ˆ20.9160.356i ii ii x yxybxx ==--⨯⨯===-⨯-∑∑,ˆˆ 1.6020.350.9ay bx =-=-⨯=, 故y 关于x 的回归方程为:ˆ 20.9yx =+. (2)当0.1x =时,ˆ20.10.9 1.1y=⨯+=,残差为1.1 1.10-=, 当0.2x =时,ˆ20.20.9 1.3y=⨯+=,残差为1.3 1.30-=, 当0.3x =时,ˆ20.30.9 1.5y=⨯+=,残差为1.6 1.50.1-=, 当0.4x =时,ˆ20.40.9 1.7y=⨯+=,残差为1.5 1.70.2-=-, 当0.5x =时,ˆ20.50.9 1.9y=⨯+=,残差为2.0 1.90.1-=, 当0.6x =时,ˆ20.60.9 2.1y=⨯+=,残差为2.1 2.10-=, 由这6棵A 树木中残差为零的有3棵,占比为3162=,∴这棵树木“长势标准”的概率为12.1.(2021·湖南师大附中高三月考)今年五月,某医院健康管理中心为了调查成年人体内某种自身免疫力指标,从在本院体检的人群中随机抽取了100人,按其免疫力指标分成如下五组:(10,20],(20,30],(30,40],(40,50],(50,60],其频率分布直方图如图1所示.今年六月,某医药研究所研发了一种疫苗,对提高该免疫力有显著效果.经临床检测,将自身免疫力指标比较低的成年人分为五组,各组分别按不同剂量注射疫苗后,其免疫力指标y 与疫苗注射量x 个单位具有相关关系,样本数据的散点图如图2所示.(1)健管中心从自身免疫力指标在(40,60]内的样本中随机抽取3人调查其饮食习惯,记X 表示这3人中免疫力指标在(40,50]内的人数,求X 的分布列和数学期望;(2)由于大剂量注射疫苗会对身体产生一定的副作用,医学部门设定:自身免疫力指标较低的成年人注射疫苗后,其免疫力指标不应超过普通成年人群自身免疫力指标平均值的3倍.以健管中心抽取的100人作为普通人群的样本,据此估计疫苗注射量不应超过多少个单位.附:对于一组样本数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅,其回归直线ˆybx a =+的斜率和截距的最小二乘估计值分别为()()()1122211,nniii ii i nniii i x x yy x ynxyb a y bx x xxnx ====---===---∑∑∑∑. 【答案】(1)分布列见解析,125;(2)疫苗注射量不应超过80个单位. 【分析】(1)根据频率分布直方图分别求出自身免疫力指标在(40,50]内和在(50,60]内的人数,写出X 的可能取值,求出对应概率,即可写出分布列,再根据期望公式即可求得数学期望;(2)根据最小二乘法求得回归方程,然后求出免疫力指标的平均值,根据题意列出不等式,从而可得答案. 【详解】解:(1)由直方图知,自身免疫力指标在(40,50]内的人数为0.008101008⨯⨯=,在(50,60]内的人数为0.002101002⨯⨯=,则X 的可能取值为1,2,3.其中122130828282233101010177(1),(2),(3)151515C C C C C C P X P X P X C C C =========.所以X 的分布列为()7121231515155E X =⨯+⨯+⨯=. (2)由散点图知,5组样本数据(,)x y 分别为(10,30),(30,50),(50,60),(70,70),(90,90),且x 与y 具有线性相关关系. 因为50,60x y ==,则22222210303050506070709090550607103050709055010b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯,760502510a =-⨯=,所以回归直线方程为ˆ0.725yx =+. 由直方图知,免疫力指标的平均值为26402482152535455527100100100100100⨯+⨯+⨯+⨯+⨯=. 由27381ˆy≤⨯=,得0.72581x +≤,解得80x ≤. 据此估计,疫苗注射量不应超过80个单位.2.(2021·安徽师范大学附属中学(理))根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村200名居民(未接种)的一个样本,5天内每天新接种疫苗的情况,如下统计表:(2)假设全村共计2000名居民(均未接种过疫苗),用样本估计总体来预测该村80%居民接种新冠疫苗需要几天?参考公式:回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:1221ˆi ii nii x ynxybxnx π==-=-∑∑,ˆˆay bx =-. 【答案】(1)222955y x =+;(2)7. 【分析】(1)根据公式求线性回归方程即可; (2)根据线性回归方程可设222955n a n ,求出67,S S ,与200080%1600⨯=比较即可求解. 【详解】 (1)1234535x ++++==,1015192328195y ++++==,则51522222222110305792140531922ˆ12345535i ii ii x y nxybxnx ==-++++-⨯⨯===++++-⨯-∑∑,222919355ˆa =-⨯=, 故y 关于x 的线性回归方程222955y x =+. (2)设222955na n ,数列{}n a 的前n 项和为n S ,易知数列{}n a 是等差数列, 则()12222922291155558225n n n a a S n n n n⎛⎫+++ ⎪+⎝⎭=⋅=⋅=+, 因为6127.2S ,7163.8S , 所以6101272S =,7101638S =200080%1600⨯=(人),所以预测该村80%居民接种新冠疫苗需要7天.3.(2021·九龙坡·重庆市育才中学高三月考)随着城市规模的扩大和人们生活水平的日益提高,某市近年机动车保有量逐年递增.根据机动车管理部门的统计数据,以5年为一个研究周期,得到机动车每5年纯增数据情况为:其中,时间变量i 对应的机动车纯增数据为i ,且通过数据分析得到时间变量与对应的机动车纯增数量y (单位:万辆)具有线性相关关系.(1)求机动车纯增数量y (单位:万辆)关于时间变量x 的回归方程,并预测2025~2030年间该市机动车纯增数量的值;附:回归直线方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n ni iiii i nniii i x y nx y x x y y b xnxx x ====-⋅--==--∑∑∑∑;a y bx =-.(2)该市交通管理部门为了了解市民对“单双号限行”的赞同情况,随机采访了200名市民,将他们的意见和是否拥有私家车情况进行了统计,得到如下的22⨯列联表:附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.【答案】(1) 5.7 5.1y x =-,2025~2030年间,机动车纯增数量的值约为34.8万辆;(2)没有95%的把握认为“对限行的意见与是否拥有私家车有关”. 【分析】(1)根据最小二乘法求得线性回归方程,再求估计值即可; (2)根据列联表求得卡方观测值,再对照表即可得解. 【详解】 (1)由 51132639415527237i ii x y=⨯+⨯+⨯+=⨯+⨯=∑.()12222222212375312575.755451234553ni ii ni i x y nx yb x nx==-⋅-⨯⨯====-++++-⨯-∑∑. 因为y bx a =+过点(),x y ,所以 5.7y x a =+,5.1a =-,所以 5.7 5.1y x =-.2025~2030年时,7x =,所以 5.77 5.134.8y =⨯-=, 所以2025~2030年间,机动车纯增数量的值约为34.8万辆.(2)根据列联表,由()()()()()22n ad bc K a b c d a c b d -=++++得观测值为()2220025 3.12510085251575100160084K ⨯⨯-⨯⨯=⨯⨯==,3.125 3.841<,所以没有95%的把握认为“对限行的意见与是否拥有私家车有关”.4.(2021·贵州贵阳·高三月考(理))据贵州省气候中心报,2021年6月上旬,我省降水量在15.2-170.3mm 之间,毕节市局地、遵义市北部、铜仁市局地和黔东南州东南部不足50mm ,其余均在50mmm 以上,局地超过100mm.若我省某地区2021年端午节前后3天,每一天下雨的概率均为50%.通过模拟实验的方法来估计该地区这3天中恰好有2天下雨的概率,利用计算机或计算器可以产生0到9之间取整数值的随机数x (x ∈N ,且09x ≤≤)表示是否下雨:当[]()0,x k k Z ∈∈时表示该地区下雨,当[]1,9x k ∈+时,表示该地区不下雨.因为是3天,所以每三个随机数作为一组,从随机数表中随机取得20组数如下: 332 714 740 945 593 468 491 272 073 445 992 772 951 431 169 332 435 027 898 719(1)求出k 的值,使得该地区每一天下雨的概率均为50%;并根据上述20组随机数估计该地区这3天中恰好有2天下雨的概率;(2)2016年到2020年该地区端午节当天降雨量(单位:mm )如表:回归直线方程y bt a =+.并预测该地区2022年端午节有降雨的话,降雨量约为多少?参考公式:()()()1122211nniii ii i nniii i tty y t y nt yb tttnt====---==--∑∑∑∑,a y bt =-.【答案】(1)4, 25;(2)814955y t =-+,935mm .【分析】(1)由于该地区每一天下雨的概率均为50%,所以150%10k +=,从而可求出k 的值,在所给的20组数据中找出有两天小于等于k 的数,从而利用古典概型的概率公式可求出概率,(2)直接利用所给的数据和公式求出回归直线方程。
(完整版)回归直线方程的三种推导方法
回归直线方程的三种推导方法 巴州二中母润萍回归直线方程是新课改新增内容之一,在必修数学3中对两个具有线性相关关系的变量利用回归分析的方法进行了研究,书中直接给出了回归直线方程系数的公式,在选修2-3中给出了回归直线方程的截距和斜率的最小二乘法估计公式的另一种形式的推导方法,根据所学知识,我总结了3种推导回归直线方程的方法:设x 与y 是具有线性相关关系的两个变量,且相应于样本的一组观测值的n 个点的坐标分别是:112233()()()()n n x y x y x y x y ,,,,,,,,,设所求的回归方程为i i y bx a =+,(123)i n =,,,,.显然,上面的各个偏差的符号有正、有负,如果将他们相加会相互抵消一部分,因此他们的和不能代表n 个点与回归直线的整体上的接近程度,因而采用n 个偏差的平方和Q 来表示n 个点与相应直线(回归直线)在整体上的接近程度,即Q =∑(y i −y i ̂)2ni=1=∑(y i −bx i −a )2ni=1求出当Q 取最小值时的a b ,的值,就求出了回归方程. 下面给出回归方程的推导方法一:一、先证明两个在变形中用到的公式公式(一)22211()nni ii i x x x nx ==-=-∑∑,其中12nx x x x n +++=证明:2222121()()()()ni n i x x x x x x x x =-=-+-++-∑∵22221212()2n n x x x x x x nxnxn+++=+++-+222222222212121()2()nnni i x x x nx nx x x x x nx==+++-+=+++=-∑22211()nni i i i x x x nx==-=-∑∑∴.公式(二)11()()nnii i i i i xx y y x y nx y==--=-∑∑证明:11221()()()()()()()()ni i n n i x x y y x x y y x x y y x x y y =--=--+--++--∑∵11221122()()n n n n x y x y x y x y y x x y y x x y y x nx y=+++-+++++++12121[()()]ni i n n i x y x x x y y y y x nx y==-++++++++∑12121()()n n n i i i x x x y y y x y n y x nx y n n=++++++⎡⎤=-++⎢⎥⎣⎦∑112nni i i i i i x y nxy nxy x y nxy===-+=-∑∑,11()()nni i i i i i x x y y x y nx y==--=-∑∑∴.二、推导:将Q 的表达式的各项先展开,再合并、变形 2222112233()()()()n n Q y bx a y bx a y bx a y bx a =--+--+--++--2222121122()[2()2()]n y y y y bx a y bx a =+++-+++展开222211111222n n nnni i i i ii i i i i i y b x y a y bxab x na ======--+++∑∑∑∑∑合并同类项22221111122nnii n n ni i i i i i i i i y x na na b b x b x y y nn =====⎛⎫ ⎪ ⎪=--+-+ ⎪ ⎪⎝⎭∑∑∑∑∑以a b ,的次数为标准整理22221112()2nn nii i i i i i na na y bx bxb x y y ====--+-+∑∑∑转化为平均数x y,22222111[()]()2nnnii i i i i i n a y bx n y bx bxb x y y ====----+-+∑∑∑配方法2222222111[()]22nnnii i i i i i n a y bx ny nbxy nb x bxb x y y ====---+-+-+∑∑∑展开222222111[()]()2()()nnni i i i i i i n a y bx b x nx b x y nxy y ny ====--+---++∑∑∑整理2222111[()]()2()()()nnnii i i i i i n a y bx bxx b x x y y y y ====--+----+-∑∑∑用公式(一)、(二)变形22212111()()[()]()()()ni i n ni i i nii i i x x y y n a y bx x x b y y x x ====⎡⎤--⎢⎥⎢⎥=--+--+-⎢⎥-⎢⎥⎣⎦∑∑∑∑配方22212212211111()()()()()()()()()nni i i i n n i i i i n ni i i i i x x y y x x y y n a y bx x x b y y x x x x ======⎡⎤⎡⎤----⎢⎥⎢⎥⎣⎦⎡⎤⎢⎥=--+---+-⎣⎦⎢⎥--⎢⎥⎣⎦∑∑∑∑∑∑配方法在上式中,共有四项,后两项与a b ,无关,为常数;前两项是两个非负数的和,因此要使得Q 取得最小值,当且仅当前两项的值都为0.所以b =∑(x i −x̅)(y i −y ̅)n i=1∑(x i−x̅)2n i=1 a =y ̅−bx̅ 或1221ni ii n i i x ynxyb x nx==-=-∑∑用公式(一)、(二)变形得上述推导过程是围绕着待定参数a b ,进行的,只含有i i x y ,的部分是常数或系数,用到的方法有: ① 配方法,有两次配方,分别是a 的二次三项式和b 的二次三项式; ② 形时,用到公式(一)、(二)和整体思想; ③ 用平方的非负性求最小值.④ 实际计算时,通常是分步计算:先求出x y,,再分别计算1()()nii i xx y y =--∑,21()nii xx =-∑或1ni ii x ynx y=-∑,221nii xnx=-∑的值,最后就可以计算出a b ,的值.推导方法二:Q =∑(y i −y i ̂)2ni=1=∑(y i −bx i −a )2ni=1=∑[y i −bx i −(y ̅−bx̅)+(y ̅−bx̅)−a ]2ni=1=∑{[y i −bx i −(y ̅−bx̅)]2+2[y i −bx i −(y ̅−bx̅)]∗[(y ̅−bx̅)−a ]+[(y ̅−bx̅)−a ]2}ni=1=∑[y i −bx i −(y ̅−bx̅)]2+2∑[y i −bx i −(y ̅−bx̅)]∗[(y ̅−bx̅)−a ]ni=1+n (y ̅−bx̅−a )2ni=1注意到∑[y i −bx i −(y ̅−bx̅)]∗[(y ̅−bx̅)−a ]=(y ̅−bx̅−a )∑[y i −bx i −(y ̅−bx̅)]ni=1ni=1=(y ̅−bx̅−a )[∑y i −b ∑x i −n (y ̅−bx̅)ni=1n i=1]=(y ̅−bx̅−a )[ny ̅−nbx̅−n (y ̅−bx̅)]=0因此,Q =∑[y i −bx i −(y̅−bx̅)]2+n (y ̅−bx̅−a )2n i=1 =b 2∑(x i −x̅)2ni=1−2b ∑(x i −x̅)(y i −y ̅)+∑(y i −y ̅)2ni=1ni=1+n (y ̅−bx̅−a )2=n (y ̅−bx̅−a )2+∑(x i −x̅)2[b −∑(x i −x̅)(y i −y ̅)n i=1∑(x i −x̅)2n i=1]2ni=1−[∑(x i −x̅)(y i −y ̅)n i=1]2∑(x i −x̅)2n i=1+∑(y i −y ̅)2ni=1在上式中,后面两项和a,b 无关,前两项为非负数,因此,要使Q 达到最小值,当且仅当前两项均为0,即有b =∑(x i −x̅)(y i −y ̅)n i=1∑(x i −x̅)2n i=1a =y ̅−bx̅ 总结:这种方法难想到为什么要这样处理,并且计算量很大。
如何计算回归方程
如何计算回归方程
计算回归方程的方法主要是使用最小二乘法。
最小二乘法是一种常用的回归分析方法,用于拟合一条直线或曲线与一组数据点的最佳拟合。
以简单线性回归为例,回归方程可以表示为`y = mx + b`,其中`y` 是因变量(或称为响应变量),`x` 是自变量(或称为解释变量),`m` 是斜率,`b` 是截距。
以下是计算回归方程的步骤:
1. 收集数据:收集自变量`x` 和因变量`y` 的一组数据点。
2. 计算均值:计算自变量和因变量的均值,分别记为`x_mean` 和`y_mean`。
3. 计算差值:对每个数据点,计算自变量`x` 和因变量`y` 与均值的差值,分别记为`dx` 和`dy`。
4. 计算乘积:对每个数据点,计算`dx * dy` 的乘积,记为`dx_dy`。
5. 计算平方差值:对每个数据点,计算`dx` 的平方,记为
`dx_squared`。
6. 计算斜率:计算斜率`m`,公式为`m = sum(dx_dy) / sum(dx_squared)`,其中`sum()` 表示求和。
7. 计算截距:计算截距`b`,公式为`b = y_mean - m * x_mean`。
8. 得到回归方程:将斜率`m` 和截距`b` 代入回归方程`y = mx + b`,得到最终的回归方程。
需要注意的是,以上步骤适用于简单线性回归,即自变量和因变量之间的关系可以用一条直线来拟合。
对于多元线性回归或非线性回归,计算回归方程的方法会有所不同。
另外,可以使用统计软件或编程语言的回归函数来自动计算回归方程,例如在Python中,可以使用NumPy或SciPy库的回归函数来计算回归方程。
线形回归方程公式
线形回归方程公式
线性回归方程是指对于一系列自变量与因变量之间存在线性关系
的数据,通过求解最小二乘法得到的一条直线方程,用于描述自变量
与因变量之间的关系。
其具体的数学公式为:
y = b0 + b1x1 + b2x2 + … + bnxn
其中,y表示因变量,x1 ~ xn表示n个自变量,b0 ~ bn表示
n+1个回归系数,表示自变量对因变量的影响程度。
线性回归方程就是找到一组最佳的回归系数,使得该方程最小化各数据点与该直线之间
的距离和。
线性回归方程在数据分析、金融预测、医学研究等诸多领域中都
有广泛应用。
在金融研究中,线性回归方程可用于分析股票市场中股
票价格与各种因素之间的关系,帮助投资者更准确地预测市场发展趋势。
在医学领域,线性回归方程可以用于分析药品的剂量与患者的病
情之间的关系,为医生提供更科学的治疗方案。
但是,在使用线性回归方程时,我们也需要注意到它的局限性。
例如,线性回归方程假定自变量与因变量之间存在线性关系,但在实
际应用中,许多自变量与因变量之间的关系并不满足这个条件。
此外,也需要考虑到可能存在的多重共线性问题,避免因为自变量之间存在
相关性而对回归系数的估计产生误差。
因此,在使用线性回归方程时,需要结合实际情况做出合理的分析和判断。
总之,线性回归方程是数据分析中的重要工具,能够帮助我们发
现数据中存在的关系,并为我们提供预测和决策的参考。
但在使用时,我们也需要注意它的限制和适用条件,以免误导我们的决策。
高中数学例题:回归直线方程的求解
高中数学例题:回归直线方程的求解例3.在钢铁中碳含量对于电阻的效应的研究中,得到如下表所示的一组数据:(1)画出散点图; (2)求回归方程.【解析】由散点图知能用回归直线拟合样本数据,然后,利用表中的数据,可以得到b ,a 计算公式中所需的数据,代入易得b ,a . (1)作出散点图如下图所示.(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据可求得711 3.800.54377i i x x ===≈∑,711145.420.7777i i y y ===≈∑,7212.595ii x==∑,7185.61i ii x y==∑.则7172221785.6170.54320.7712.552.59570.5437i ii i i x y x yb x x==--⨯⨯==≈-⨯-∑∑, 20.7712.550.54313.96a y bx =-=-⨯≈.所以回归方程为12.5513.96y x =+.【总结升华】 求线性回归直线方程的步骤为: 第一步:列表i i i i x y x y ,,;第二步:计算211nni i i i i x y xx y ==∑∑,, , ;第三步:代入公式计算b a ,的值; 第四步:写出直线方程. 举一反三:【变式1】 某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程中的为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元【答案】选B 【解析】4235492639543.5,4244x y ++++++==== 429.4 3.59.1a y bx ∴=-=-⨯=,∴回归方程为9.49.1y x =+,∴当6x =时,9.469.1y =⨯+=65.5,故选B .【变式2】 观察两相关变量得如下数据:求两变量间的回归方程.ˆˆy bx a =+b【答案】y x = 【解析】列表:计算得:0x =,0y =。
求回归直线方程的步骤
求回归直线方程的步骤
嘿,咱今儿就来唠唠求回归直线方程的那些事儿!你说这求回归直线方程啊,就像是搭积木,一块一块得放对地方才行呢!
先得收集一堆数据,就好像是准备一堆各种各样的积木块儿。
这些数据可重要啦,它们就像是搭积木的基础材料呢!然后呢,得计算平均数啥的,这就好比是给这些积木块找个中心位置,让它们能围绕着这个中心来搭建。
接下来就是关键的一步啦,要找到那个最合适的斜率!你想想,这斜率就像是积木塔的倾斜度,要是找不对,那整个塔可就歪啦!这可得仔细着点儿,一点点地算,一点点地琢磨。
再然后呢,根据找到的斜率和平均数这些,就能求出截距啦!这截距呀,就像是给积木塔找个稳稳的落脚点,让它能立得住。
哎呀,你说这求回归直线方程不就跟搭个漂亮的积木塔一样嘛!得精心挑选材料,找好角度,放对位置。
要是哪一步马虎了,那可就全乱套咯!
你看啊,要是数据收集得不对,那不就跟拿了些奇奇怪怪的积木块一样,怎么可能搭出好看的塔呢!要是计算平均数的时候出了错,那塔的中心位置就歪了呀,还怎么立得稳呢!还有那斜率和截距,一个不对,整个塔要么歪歪扭扭,要么直接就倒啦!
所以啊,求回归直线方程可不能小瞧了它,每一步都得认真对待,就跟对待宝贝似的。
咱得有耐心,有细心,才能求出那准确又好用的回归直线方程呀!
你说是不是这个理儿?咱可别嫌麻烦,别嫌累,好好地把这每一步都走踏实了。
等求出了准确的回归直线方程,那感觉,就像是自己搭出了一个超级棒的积木塔一样,心里可得意啦!
这就是求回归直线方程的步骤啦,虽然听起来好像有点复杂,但只要咱一步一步来,肯定能搞得定!加油吧,朋友们!让我们一起把这回归直线方程求个明明白白!。
直线回归法的公式推导
2.用行列式求二元一次方程组中a和b的解
Δ= n Σx = n Σx2-(Σx) 2
Σx Σx2 Σy Σx
Δa= Σxy Σx2 = ΣyΣx2-Σx Σxy
Δb= n Σy = nΣxy-Σx Σy
Σx Σxy
2.用行列式求二元一次方程组中a和b的解
a=
Δa Δ
ΣyΣx2-Σx Σxy = n Σx2-(Σx) 2
因而也无法据此作出判断。
二、直线回归法公式推导
第三,判断所有误差平方和是否最小。 即:Σei2 =0
这种方法既排除了正负误差的符号问 题,又避免了绝对值运算的麻烦。
因此,可以据误差的平方和是否达 到最小,来判断直线方程y=a+bx的总误差 是否达到最小。
此法又称最小二乘法或最小平方法。
二、直线回归法公式推导
主要内容
一
回归直线法的原理
二
回归直线的公式推导
一、直线回归法的原理
直线回归发的原理——微积分极值原理
y 成本(元)
y=a+bx
0
x 业务量(件)
二、直线回归法公式推导
从散布图法可以看出,我们总能设法 找到一条尽可能通过所有坐标点,也就是 所有误差最小的惟一直线y=a+bx 。
设ei为当业务量为xi时,实际值(又 称观测值)yi与计算值(a+bxi)的误差, 即
对上式求a的偏导数,得:
–2Σy +2na +2bΣx=0
整理得
Σy =na +bΣx
(1)式
1.按公式法推导a,b计算公式的过程
对Σy2–2aΣy–2bΣxy+na2+2abΣx+b2 Σx2=0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“求直线的回归方程”的教学设计
一•教学内容分析
本节课的主要内容为用最小二乘法求线性回归方程。
所以,在内容重点的侧重上,
本节课与上节课有较大的区别:上节课侧重于估算方法设计,在不同的数据处理过程中,体会回归直线作为变量相关关系代表这一概念特征;本节课侧重于估算方法评价与实际应用,在评价中使学生体会核心思想,理解核心概念。
考虑到本节课的教学侧重点与新课程标准的要求,对线性回归方程系数的计算公式,可直接给出。
由于公式的复杂性,一方面,既要通过教学设计合理体现知识发生过程,不搞“割裂”;另一方面,要充分利用计算机或计算器,简化繁琐的求解系数过程,简化过于形式化的证明说理过程。
基于上述内容分析,确定本节课的教学重点为知道最小二乘法思想,并能根据给出的线性回归方程的系数公式建立线性回归方程。
二•教学目标分析
本节课要求学生了解最小二乘法思想,掌握根据给出的线性回归方程系数公式建立线性回归方程,理解线性回归方程概念和回归思想,在以上过程中体会随机思想: 1∙能用数学符号刻画出“从整体上看,各点与此直线的点的偏差”的表达方式;
2•知道最小二乘法的思想,了解其公式的推导过程;
3•能结合具体案例,根据回归方程系数公式建立回归方程;
4•利用回归方程预测,体现用“确定关系研究相关关系”的回归思想;
三.重点,难点分析
在经历用不同估算方法描述两个变量线性相关的过程后,在学生现有知识能力范围内,如何选择一个最优方法,成为知识发展的逻辑必然。
知识发展的要求与学生能力和经验的欠缺成为本节课将会遇到的最大矛盾。
在教学中,要防止两种倾向:一是直接套用回归系数公式求解回归方程而回避说理过程;二是过多纠缠于数学刻画过程,
甚至在课堂内花大量时间对回归系数公式进行证明说理。
这两种倾向,都脱离了实际情况,前者忽略了“最小二乘法思想”,迷失了本节课的教学目标;后者人为拔高教材要求,脱离了本节课教学要求。
所以,本节课的教学难点是:如何通过数学方法刻画“从整体上看,各点与此直线的距离最小”并在此过程中了解最小二乘法思想。
通过“降次举特例说明,进行合情推理”是学生突破此难点的一个方法。
四•教学过程设计
1 •课题引入
问题1:(投影上节课探究结果)如何评价这些“直线”的优劣?理由呢?
问题2:能否从几何直观角度用文字语言叙述你的理由?
问题3: “从整体上看,各点与此直线的距离最小”中,距离等于偏差吗?作为
判断优劣的标准,可以等同吗?
设计意图:在上节课“计算预测值与实际值偏差”的经验基础上,通过学生对“从
整体上看,各点与此直线的点的距离的最小”这一新标准与旧经验的冲突和联系,对
“优劣问题”展开反思:从旧经验“单个点”到新标准“所有点”,突出“整体”二字;从
旧经验“偏差计算”到新标准“点线距离”,对比几何描述直观性和代数表达便捷性,揭示出两者是同一标准的不同表述。
师生活动:在上节课铺垫的基础上,学生不难回想到上节课比较不同“回归直线”优劣的方法一一通过计算样本点与直线对应点纵坐标差比较偏差。
在此铺垫基础上,教师可结合图形,用代数符号y、Ii标记,为下一步代数表达做好准备。
第二问更具有几何直观性,学生也易于接受此标准,达成“几何”与“代数”的转化、“距离” 与“偏差”的转化。
若学生对“距离”与“偏差”有疑问,教师可提出问题 3 ,通过
观察课本92页图2.3 - 6,简单介绍偏差处理法的优越性和等价性即可。
2.知识发展
设回归直线方程为。
-■ + ;,( X i, y)表示第i个样本点,
问题1你能用代数式来刻画“从整体上看,各点与此直线的偏差最小”吗?
问题2:偏差有正有负,我们可以怎么规避?比较绝对值处理和平方处理,我们选择哪种合适?
设计意图:几何问题代数化,为下一步探究作好准备,经历“几何直观”转化为
“代数表达”过程,体验“最小二乘法思想”。
师生活动:在引入的设问中,已经解决了转化的问题,由于上节课学生有“用具
体数据来计算偏差”的经验,学生易于抽象出各点偏差表示式y i —「i =y i—( bx+a)
(i =1, 2, , , n),进而不难得出:Q= (yι—bxι—a) +(y2—bx2 —a) +, + (y∏ —bx∏
—a)。
问题2可在投影屏上举极端例子说明,学生会发现此处理方法的局限性,学生
可能会提出多种方法,教师肯定其观点,说明去绝对值对后续研究不便,可类比“方差”处理方式,采用平方处理方法,教师投影:
Q (K_应]2+ {y2-bx2~a) J…+-bx i -a)Q
i-i
问题3:从代数上说,偏差最小既哪个量最小?当样本点的坐标(X i, y i)确定时,
上述表达式可否化为关于a、b的二次式呢?
设计意图:体会最小二乘法思想,不经历公式化简无法真正理解,而直接从∏个点的公式化简,教学要求、教学时间、学生能力都没达到这个高度。
而由具体到抽象,由特殊到一般,是学生顺利完成认知过程的一般性原则。
通过此问,让学生了解化简的结果,在此过程中,既熟悉了新符号,又通过观察展开式,能唤起学生已有认知结构中关于处理带参数的二次多项式最小值问题的数学处理方法,揭示∏个点的代数式
本质也是关于a、b的二次多项式,从而了解最小二乘法思想,突破教学难点。
师生活动:教师指出:可米用n个偏差的平方和Q= (yι—bxι—a) )+ ( y2—bx2—a) 2+, + ( y∏ - bx∩ - a) 2表示n个点与相应直线在整体上的接近程度:记
Q=二(向学生说明二的意义)。
在此基础上,给出可求出使Q为最小值时的a、b的值的线性回归方程系数公式:∑λ(∖- χ)(y i-y) ∑ X i y i-fix y b = J= ⅛J ' ∑⅛-^)2∑χi2-^2
f-l i-L
a -y-bx
问题4:这个公式不要求记忆,但要会运用这个公式进行运算,那么,要求a,b
的值,你会按怎样的顺序求呢?
设计意图:公式不要求推导,又不要求记忆,学生对这个公式缺少感性的认识, 通过这个
问题,使学生从感性的层次上对公式有所了解。
师生活动:由于这个公式比较复杂,因此在运用这个公式求
Siy I、n 、
无、
理,先求什么,再求什么,比如,我们可以按照 ' 顺序来求,再代入公式。
问题5:回归直线通过样本点中心,观察此公式,比照平均数与样本数据之间的关系线方程如何体现这点?
设计意图:在不确定问题探讨中出现的确定性性质,比较有戏剧性,能再次激发学生的探究欲望,而此问题的探究,使得学生在“回归直线是两个变量具有相关关系的代表”的理解上,上升到“ 回归直线是双变量样本点的中心”这一高度,深化对回归直线和回归思想的理解,完成学生认知结构的再次建构。
3.知识深化:
问题1:观察公式,根据表一数据,需要计算哪些新数据,才能求出线性回归方程系数?计算量大不大?我们用计算器来代替这重复的劳动,请大家一起跟我来操作人体的脂肪百分比和年龄
年龄23394550545760
脂肪9. 521 . 227. 528. 230. 230. 835. 2
设计意图:公式形式化程度高、表达复杂,通过分解,可加深对公式结构的理解。
同时,通过例题,反映数据处理的繁杂性,体现计算器处理的优越性。
a,b时,必须要有条
师生活动:可让学生观察公式,充分讨论,得出要计算: 厂五个新数据。
而后教师可偕同学生,对计算器操作方式提供示范,师生共同完 成。
问题2:利用计算器,根据表二,请同学们独立解决求出表中两变量的回归方程:
师生活动:教师利用 EXCIe 软件,示范操作,并适时给出回归直线答案,检测正
确与否。
师生活动:教师利用 Excle 软件,合并表中数据,求出此时的回归直线,比较回 归直线异同。
问题3:同样问题背景,为什么回归直线不止一条?回归方程求出后,变量间的 相关关
系是否就转变成确定关系?
问题4:若给出的样本数据相关程度较弱, 按照公式能否求出系数 a 、b ?此时的
直线方程是回归直线吗?
设计意图:明确样本点的选择影响回归直线方程,体现统计的随机思想。
同时,
明确其揭示的是相关关系而非函数的确定关系,而且最小二乘法只是某一标准下的一 种数据处理方法,使学生更全面的理解回归直线这一核心概念。
在重复求解回归直线 的过程中,使学生掌握利用计算器求回归直线的操作方法,了解计算机处理方法。
五•习题检测设计
1、下表是某小卖部6天卖出热茶的杯数与当天气温的对比表
(用计算器直接求回 归直线):
(1)画散点图;(2)从散点图中发现温度与热饮销售杯数之间关系的一般规律;
n 、
i-1
(3)求回归方程;
(4)按照回归方程,计算温度为10度时销售杯数。
为什么与表中不同?如果某
天的气温是-5C时,预测这天小卖部卖出热茶的杯数;
设计意图:通过此题,让学生完整经历求回归直线过程。
其中第4问,让学生体会到即使是相比下“最优”的所获得的回归直线,也存在着一定的误差,从中体会无论方法的优劣,统计学中随机性无法避免。
而在预测值的计算中,体现了回归直线的应用价值。
六、课堂小结设计
请你对本节课的内容进行小结,并谈谈你的收获以及课后的学习安排。
设计意图:让学生进行小结,谈谈体会,帮助他们回归反思、归纳概括。