人教版高中数学(理科)选修线性回归(一)

合集下载

人教版高中数学选修1-2知识点总结

人教版高中数学选修1-2知识点总结

人教版高中数学选修1-2知识点第一章统计案例1.线性回归方程①变量之间的两类关系:函数关系与相关关系;[来源:简单高中生(ID:jiandan100cn)]②制作散点图,判断线性相关关系;∧1nnx i y i -nx i =1y ⎪⎪③线性回归方程:y =bx +a (最小二乘法)。

其中,⎨⎪b =i =x i2-nx 2⎪⎪⎧⎩a =y -b ⎪x∑∑注意:线性回归直线经过定点(x ,y ).2.相关系数(判定两个变量线性相关性):∑nnnr =i =1i =i =11(i-x )y i -y ∑(xi-x )∑(yi-y )22(x注意:(1)r >0时,变量x ,y 正相关;r <0时,变量x ,y 负相关;(2)①|r |越接近于1,两个变量的线性相关性越强;②|r |接近于0时,两个变量之间几乎不存在线性相关关系。

3.条件概率对于任何两个事件A 和B ,在已知B 发生的条件下,A 发生的概率称为B 发生时A 发生的条件概率.记为P (A |B ),其公式为P (A |B )=P (AB )P (A )4.相互独立事件(1)一般地,对于两个事件A ,B ,如果P (AB )=P (A )P (B ),则称A 、B 相互独立.(2)如果A 1,A 2,…,A n 相互独立,则有P (A 1A 2…A n )=P (A 1)P (A 2)…P (A n ).(3)如果A ,B 相互独立,则A 与-B ,-A 与B ,-A 与-B 也相互独立.5.独立性检验(分类变量关系):[来源:简单高中生(ID:jiandan100cn)](1)2×2列联表设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1;通过观察得到下表所示数据:并将形如此表的表格称为2×2列联表(2)独立性检验根据2×2列联表中的数据判断两个变量A,B是否独立的问题叫2×2列联表的独立性检验。

高中数学线性回归方程线性回归方程公式详解

高中数学线性回归方程线性回归方程公式详解

高中数学线性回归方程线性回归方程公式详解
线性回归方程是一种用于拟合一组数据的最常见的数学模型,它可以用来预测一个因变量(例如销售额)和一个或多个自变量(例如广告费用)之间的关系。

下面是线性回归方程的公式详解:
假设有n个数据点,每个数据点包含一个因变量y和k个自变量x1,x2,...,xk。

线性回归方程可以表示为:
y = β0 + β1*x1 + β2*x2 + ... + βk*xk + ε
其中,β0, β1, β2, ..., βk是模型的系数,ε是误差项,用来表示实际数据和模型预测之间的差异。

系数β0表示当所有自变量均为0时的截距,而β1, β2, ..., βk 则表示每个自变量对因变量的影响。

当系数为正时,自变量增加时因变量也会增加;而当系数为负时,自变量增加时因变量会减少。

通常,我们使用最小二乘法来估计模型的系数。

最小二乘法就是通过最小化所有数据点与模型预测之间的距离来找到最优的系数。

具体来说,我们可以使用以下公式来计算系数:
β = (X'X)-1 X'y
其中,X是一个n×(k+1)的矩阵,第一列全为1,其余的列为自变量x1,x2,...,xk。

y是一个n×1的向量,每一行对应一个因
变量。

X'表示X的转置,-1表示X的逆矩阵,而β则是一个(k+1)×1的向量,包含所有系数。

当拟合出线性回归方程后,我们可以使用它来预测新的数据点的因变量。

具体来说,我们可以将自变量代入方程中,计算出相应的因变量值。

如果模型的系数是可靠的,我们可以相信这些预测结果是比较准确的。

人教A版高中数学选修2-3 第三章3.1第1课时线性回归模型 课件

人教A版高中数学选修2-3 第三章3.1第1课时线性回归模型 课件

2.如图所示的四个散点图中,适合用线性回归模型 拟合两个变量的是( )
A.①②
B.①③ C.②③ D.③④
解析:图①正相关线性最强,图③负相关线性最
强,散点图②④的点较分散.
答案:B
3.在一次对人体脂肪含量和年龄关系的研究中,研 究人员获得了一组样本数据:
年 龄 23 27 39 41 45 49 50 53 56 58 60 脂 肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 31.4 33.5 35.2
答案:0.8
类型 1 变量间的相关性检验(自主研析) [典例 1] 关于两个变量 x 和 y 的 7 组数据如下表所 示:
x 21 23 25 27 29 32 35 y 7 11 21 24 66 115 325 试判断 y 与 x 是否线性相关.
解:x- =17(21+23+25+27+29+32+35)≈27.4, y=17(7+11+21+24+66+115+325)≈81.3,
解析:(1)对,只有具有相关性的两个变量之间求出 的线性回归直线方程才有价值,没有相关性的两个变量 即使求出了线性回归直线方程,也没有意义.
(2)对,通过散点图,我们能够粗略判断两个变量是 否具有相关性.
(3)错,利用线性回归直线方程求出的值不是准确 值,而是预测值.
答案: (1)√ (2)√ (3)×
温馨提示 求线性回归直线方程前必须要进行相关 关系检验,散点图能帮助我们粗略判断两个变量是否线 性相关
2.线性相关关系强与弱的判断
用相关系数 r 来描述线性相关关系的强弱.
对于变量 x,y 随机抽取到的 n 对数据(x1,y1),(x2,
y2),…,(xn,yn),其相关系数

高中数学:线性回归方程

高中数学:线性回归方程

高中数学:线性回归方程线性回归是利用数理统计中的回归分析来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法,是变量间的相关关系中最重要的一部分,主要考查概率与统计知识,考察学生的阅读能力、数据处理能力及运算能力,题目难度中等,应用广泛.一线性回归方程公式二规律总结(3)回归分析是处理变量相关关系的一种数学方法.主要用来解决:①确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;②根据一组观察值,预测变量的取值及判断变量取值的变化趋势;③求线性回归方程.线性回归方程的求法1四线性回归方程的应用例2例3例4例5例6推导2个样本点的线性回归方程例7 设有两个点A(x1,y1),B(x2,y2),用最小二乘法推导其线性回归方程并进行分析。

解:由最小二乘法,设,则样本点到该直线的“距离之和”为从而可知:当时,b有最小值。

将代入“距离和”计算式中,视其为关于b的二次函数,再用配方法,可知:此时直线方程为:设AB中点为M,则上述线性回归方程为可以看出,由两个样本点推导的线性回归方程即为过这两点的直线方程。

这和我们的认识是一致的:对两个样本点,最好的拟合直线就是过这两点的直线。

上面我们是用最小二乘法对有两个样本点的线性回归直线方程进行了直接推导,主要是分别对关于a和b的二次函数进行研究,由配方法求其最值及所需条件。

实际上,由线性回归系数计算公式:可得到线性回归方程为设AB中点为M,则上述线性回归方程为。

求回归直线方程例8 在硝酸钠的溶解试验中,测得在不同温度下,溶解于100份水中的硝酸钠份数的数据如下0 4 10 15 21 29 36 51 6866.7 71.0 76.3 80.6 85.7 92.9 99.4 113.6 125.1 描出散点图并求其回归直线方程.解:建立坐标系,绘出散点图如下:由散点图可以看出:两组数据呈线性相关性。

设回归直线方程为:由回归系数计算公式:可求得:b=0.87,a=67.52,从而回归直线方程为:y=0.87x+67.52。

人教版高中数学选修(1-2)-1.1典型例题:线性回归方程

人教版高中数学选修(1-2)-1.1典型例题:线性回归方程

认识线性回归方程一、线性回归方程设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在一条直线的附近,这条直线就叫做回归直线.例1.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计资料:若由资料知y 对x 呈线性相关关系,试求: (1)线性回归方程y a bx =+;(2)估计使用年限10年时,维修费用是多少?分析:因为y 对x 呈线性相关关系,所以可以用线性相关的方法解决问题. 解:(1)制表于是有21.239054b ==-⨯,5 1.2340.08a y bx =-=-⨯=.∴线性回归方程为 1.230.08y x =+;(2)当10x =时, 1.23100.0812.38y =⨯+=(万元),即估计使用10年时维修费用约是12.38万元.评注:已知y 对x 呈线性相关关系,无须进行相关性检验,否则应首先进行相关性检验. 二、回归分析通过对有关数据的分析,作出散点图,并利用散点图直观地认识两个变量的相关关系,也可以用相关系数r 来确定两个变量的线性相关关系.例2.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.分析:先求出r 的值,r 的值越接近于1,表明两个变量的线性相关关系越强.解:(1)列出下表,并用科学计算器进行计算.1010i ix y x yr -=∑0.9998=≈。

∵0.99980.632>,∴y 与x 具有线性相关关系; (2)设所求的回归直线方程为y a bx =+,。

高中数学-线性回归方程

高中数学-线性回归方程

【变式1】 下列两个变量中具有相关关系的是________(填 写相应的序号).
①正方体的棱长和体积;②角的弧度数和它的正弦值;③ 单产为常数时,土地面积和总产量;④日照时间与水稻的亩产 量.
解析 正方体的棱长x和体积V存在着函数关系V=x3;角的 弧度数α和它的正弦值y存在着函数关系y=sin α;单产为常数a公 斤/亩土地面积x(亩)和总产量y(公斤)之间也存在着函数关系y= ax.日照时间长,则水稻的亩产量高,这只是相关关系,应选④.
性回归方程;
(3) 已 知 该 厂 技 改 前 100 吨 甲 产 品 的 生 产 能 耗 为 90 吨 标 准
i=1
i=1
∴b=1129.03--55××442×5=1.23, a=5-1.23×4=0.08. ∴所求线性回归方程为y^=1.23x+0.08.
课前探究学习
课堂讲练互动
活页规范训练
【变式2】 某商店统计了近6个月某商品的进价x与售价y(单 位:元),对应数据如下:
x 3 5 2 8 9 12 y 4 6 3 9 12 14 求y对x的回归直线方程.
是一种理想关系模型 是更为一般的情况
课前探究学习
课堂讲练互动
活页规范训练
2.回归直线方程 (1)回归直线方程的思想方法 ①回归直线:观察散点图的特征,发现各点大致分布在一
条直线的附近,就称这两个变量之间具有线性相关的关系,这
条直线叫做回归直线.
可见,根据不同的标准可画出不同的直线来近似表示这种
线性关系.比如,可以连接最左侧点和最右侧点得到一条直
课前探究学习
课堂讲练互动
活页规范训练
自学导引 1.与函数关系不同,相关关系是一种有关系,但不是

高中数学知识点:线性回归方程

高中数学知识点:线性回归方程

高中数学知识点:线性回归方程
线性回归方程是高中数学中的一个重要知识点。

其中,回归直线是指通过散点图中心的一条直线,表示两个变量之间的线性相关关系。

回归直线方程可以通过最小二乘法求得。

具体地,可以设与n个观测点(xi,yi)最接近的直线方程为
y=bx+a,其中a、b是待定系数。

然后,通过计算n个偏差的平方和来求出使Q为最小值时的a、b的值。

最终得到的直线方程即为回归直线方程。

需要注意的是,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义。

因此,在进行线性回归分析时,应先看其散点图是否成线性。

另外,求回归直线方程时,需要仔细谨慎地进行计算,避免因计算产生失误。

回归直线方程在现实生活与生产中有广泛的应用。

这种方程可以将非确定性问题转化为确定性问题,从而使“无序”变得“有序”,并对情况进行估测和补充。

因此,研究回归直线方程后,学生应更加重视其在解决相关实际问题中的应用。

注:原文已经没有格式错误和明显有问题的段落。

高中数学选修一《回归分析》课件

高中数学选修一《回归分析》课件

解:画出散点图
y/cm
x/cm
列表:
i
xi
yi
xi2
yi2
1
154 155 23 716 24 025
2
157 156 24 649 24 336
3
158 159 24 964 25 281
4
159 162 25 281 26 244
5
160 161 25 600 25 921
6
161 164 25 921 26 896
例 始祖鸟是一种已经灭绝的动物.在一次考古活动中,
科学家发现了始祖鸟的化石标本共6个,其中5个同时
保有股骨(一种腿骨)和肱骨(上臂的骨头).科学家检
查了这5个标本股骨和肱骨的长度如下:
编号
1
2
3
4
5
股骨长度x/cm 38 56 59
64
74
肱骨长度y/cm 41 63 70
72
84
(1)求出肱骨长度y对股骨长度x的线性回归方程.
得 Q(a,b) ( y1 a bx1 )2 ( y2 a bx2 )2 ( yn a bxn )2 达到最小.此时
n
n
b lxy lxx
(xi x)(yi y)
i1
n
(xi x)2
xiyi nxy
i1 n
,
x
2 i
nx 2
i1
i1
a y bx.
解(1)画散点图如下,两个变量呈现出近似的线性关
【提升总结】 线性回归方程的求解步骤:
(1)画散点图,通过图形来判断是否线性相关.
(2)求回归系数 a,b:
n
n
(xi x)(yi y)

人教A版高中数学必修3:2.3.2 线性回归直线方程(一)(平行班)

人教A版高中数学必修3:2.3.2 线性回归直线方程(一)(平行班)
课题:
2.3.2 线性回归直线方程(一)
广州二中 张和发
回忆:
什么是正相关? 什么是负相关? 什么是线性相关? 什么是回归直线?
探究讨论:
(上节中作业留下的问题) 数学成绩与物理成绩的散点图中的点在一条直 线附近,应怎样找出这一条直线?
数学成绩为99时估计相应的物理成绩是多少?
1、采用测量的方法,先画一条直线,测量出各点 到它的距离,然后移动直线,到达一个使距离之 和最小的位置,测量出此时直线的斜率和截距, 就得到回归方程。
x= -5°时, y=66
总结:
1. 最小二乘法的思想: 2.回归分析:对具有相关关系的两个变量进行统计分析 的方法叫做回归分析。 3. 运用回归分析的方法来分析、处理数据的一般步骤: ①收集数据,并制成表格; ②画出数据的散点图; ③利用散点图直观认识变量间的相关关系; ④运用科学计算器、Excel表格等现代信息技术手段
的“添加趋势线”,弹出对话框 (4)双击回归直线,弹出“趋势线格式”对话框, (5)单击“选项”,选定“显示公式”,确定即可
回归直线是

y =0.88x+11.75 当x=99时,

y =98.8估计物理成绩为99.
法三:用计算器的统计功能求系数(参考教材P94)
练习:
1、下表是某小卖部6天卖出热茶的杯数与当天气温的 对比表: 气温/℃ 26 18 13 10 4 -1 杯数 20 24 34 38 50 64 (1)将上表中的数据制成散点图. (2)求线性回归直线方程 (先用公式直接计算系数,再用统计功能验算) (3)估计某天气温为-5°时可卖多少杯热茶?
探究讨论:
怎样才能找到合适的回归直线? 求回归直线方程的目的是什么? 用什么标准来确定回归直线?

高中数学线性回归方程

高中数学线性回归方程

高中数学线性回归方程
线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一。

接下来店铺为你整理了高中数学线性回归方程相关资料,欢迎阅读。

线性回归方程的分析方法
分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。

如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

线性回归方程的例题求解
用最小二乘法估计参数b,设服从正态分布,分别求对a、b的偏导数并令它们等于零,得方程组解得。

其中,且为观测值的样本方差.线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线.顺便指出,将来还需用到,其中为观测值的样本方差。

先求x,y的平均值。

利用公式求解:b=把x,y的平均数带入a=y-bx。

求出a=是总的公式y=bx+a线性回归方程y=bx+a过定点。

(x为xi的平均数,y为yi的平均数)
线性回归方程两个重要公式。

人教版高中数学(文科)选修线性回归1ppt名师课件

人教版高中数学(文科)选修线性回归1ppt名师课件

三、讲解范例:
例1.在7块并排、形状大小相同的试验田上 进行施化肥量对水稻产量影响的试验,得数据如 下(单位:kg) 施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
1)画出散点图如下:
y 500 450 400 350 300
(
x
2 i

nx
2
)(
yi2 ny2 )
i 1
i 1
i 1
i 1
叫做变量y与x之间的样本相关系数,简 称相关系数,用它来衡量两个变量之间的线 性相关程度.
2.相关系数的性质:
r ≤1,且 r 越接近1,相关程度越大;且 r 越接近0,相关程度越小.
3.显著性水平:
显著性水平是统计假设检验中的一个概念, 它是公认的小概率事件的概率值 它必须在每一 次统计检验之前确定
b

i 1 7

xi2 7 x 2

i 1
a y bx
则回归直线方程 yˆ 4.75x 257
四、小结 :
一般情况下,在尚未断定两个变量之间是否具 有线性相关关系的情况下,应先进行相关性检验. 在确认其具有线性相关关系后,再求其回归直线方 程;由部分数据得到的回归直线,可以对两个变量 间的线性相关关系进行估计,这实际上是将非确定 性的相关关系问题转化成确定性的函数关系问题进 行研究.由于回归直线将部分观测值所反映的规律 性进行了延伸,它在情况预报、资料补充等方面有 着广泛的应用
4. 显著性检验:(相关系数检验的步骤)
1. 由显著性水平和自由度查表得出临界值,显著 出性n水是平 数一据般的取个0数.0在1和“0相.0关5,系自数由检度验为的n临-界2值,表其”中查 与 组时显数,著)r性 相0.0水 应5=平 的0相0.7.05关54或数,0临r.0界01.0及1值=自r00 .由085或7度4rn00-12;(例n为如观n测=值7

线性回归方程(高中数学)

线性回归方程(高中数学)

线性回归方程(高中数学)篇一:高中数学《线性回归方程》教案(2)线性回归方程教学目标:(1)了解非确定性关系中两个变量的统计方法;(2)掌握散点图的画法及在统计中的作用;(3)掌握回归直线方程的实际应用。

教学重点: 线性回归方程的求解。

教学难点: 回归直线方程在现实生活与生产中的应用。

教学过程:一、复习练习1.下例说法不正确的是( B )A.在线性回归分析中,x和y都是变量;B.变量之间的关系若是非确定关系,那么x不能由y唯一确定;C.由两个变量所对应的散点图,可判断变量之间有无相关关系;D.相关关系是一种非确定性关系.2.已知回归方程y??0.5x?0.81,则x=25时, y的估计值为__11.69____.,24)的线性回归方程是(D )3.三点(3,10),(7,20),(11 1.75?1.75x By??1.75?5.75x Ay1.75?5.75x Dy??1.75?1.75x C y4.我们考虑两个表示变量x与y之间的关系的模型,?为误差项,模型如下:模型1:y?6?4x:;模型2:y?6?4x?e.(1)如果x?3,e?1,分别求两个模型中y的值;(2)分别说明以上两个模型是确定性模型还是随机模型.解(1)模型1:y=6+4x=6+4×3=18;模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x值一定得到相同的y值.所以是确定性模型;模型2中相同的x值,因?不同,且?为误差项是随机的,所以模型2是随机性模型。

二、典例分析例1、一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:程.解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知: x?55,y?91.7,?xi?38500,?yi?87777,?xiyi?55950 22i?1i?1i?1101010bxy10xyiii?11010?xi2?10xi?12?55950?10?55?91.7?0.668 238500?10?55a?y?bx?91.7?0.668?55?54.96因此,所求线性回归方程为y?bx?a?0.668x?54.96例2、已知10只狗的血球体积及红血球数的测量值如下:(1)画出上表的散点图;(2)求出回归直线方程并画出图形.解:x?1(45?42?46?48?42?35?58?40?39?50)?44.50 10y?1(6.53?6.30?9.52?7.50?6.99?5.90?9.49?6.20?6.55?8.72)=7.37 10设回归直线方程为y?bx?a则b??xy?10xyiii?11010?xi?12i?10x2?0.175a?y?bx= -0.418所以所求回归直线的方程为y?0.175x?0.148例3、以下是收集到的新房屋销售价格y与房屋的大小x 的数据:上回归直线;(3)计算此时Q(a,b)和Q(2,0.2)的值,并作比较.解:(1)(2) n?5,?xi?15i?545,?109,?yi?116,?23.2, i?155?xi?152i?60952,?xiyi?12952 i?1b?5?12952?545?116?0.1962,a?23.2?0.1962?109?1.8166 25?60952?545所以,线性回归方程为y?0.1962x?1.8166(3) Q(1.8166,0.1962)?5.171,Q(2,0.2)?7.0由此可知,求得的a?1.8166,b?0.9162是函数Q(a,b)取最小值的a,b值.三、课堂练习1.为了考察两个变量x和y之间的线性相关性,甲乙两位同学各自独立做了10次和15次实验,并且利用线性回归直线分别为l1,l2,已知两人获得的实验数据中,变量x和y的数据平均值都相等,且分别为s,t那么下例说话正确的是() A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t)C.必有l1// l2 D.l1和l2与必定重合2.已知关于某设备的使用年限x与所支出的维修费用y (万元),有如下统计资料:设y对x程线性相关关系.试求:(1)线性回归方程y?bx?a的回归系数a,b;(2)估计使用年限为10年时,维修费用多少?四、回顾小结:求线性回归方程的步骤:?(1)、(2)计算xi与yi的积,求?xiyi,2(3)计算?x2,y?i,i(4)将上述有关结果代入公式,求b,a写出回归直线方程.五、课外作业:课本第82页第9题.篇二:高中数学线性回归方程讲解练习题1审阅人:2篇三:线性回归方程[高考数学总复习][高中数学课时训] 线性回归方程基础自测①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.1.下列关系中,是相关关系的为(填序号).答案①②2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x 的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号). ①直线l1,l2有交点(s,t)②直线l1,l2相交,但是交点未必是(s,t) ③直线l1,l2由于斜率相等,所以必定平行④直线l1,l2必定重合答案① 3.下列有关线性回归的说法,正确的是(填序号). ①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程答案①②③ 4.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;?x+a?,可以估计和预测变量的取值和变化趋势. ?=b?及回归系数b③通过回归直线y其中正确命题的序号是. 答案①②③=0.50x-0.81,则x=25时,y?的估计值为 . 5.已知回归方程为y答案11.69例 1 下面是水稻产量与施化肥量的一组观测数据:施化肥量水稻产量15 20 25 30 35 40 45 320 330 360 410 460 470 480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.例2 (14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归直线方程. 解(1)作出散点图:5分观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. (2)=110n7分110(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,=(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,9分 =bxyi?1nii?n?≈0.813 6,2ixi?1n2a=1.42-1.74×0.813 6≈0.004 3,13分=0.813 6x+0.004 3. ∴回归方程y14分例 3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨)标准煤的几组对照数据.(1)请画出上表数据的散点图;x+a=b;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解(1)散点图如下图:(2)=43?4?5?64=4.5,=2.5?3?4?4.54=3.5xi?14iyi=3×2.5+4×3+4×5+6×4.5=66.5. xi?12i=32+42+52+62=864=∴bxyii?14i4=2i66.5?4?3.5?4.586?4?4.52=0.7xi?142=3.5-0.7×4.5=0.35. =-b=0.7x+0.35. ∴所求的线性回归方程为y(3)现在生产100吨甲产品用煤y=0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨)标准煤.1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计.(1)试画出散点图;(2)判断两个变量是否具有相关关系. 解(1)作出散点图如图所示,(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系.2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:由资料看y与x呈线性相关,试求回归方程. 解=30,= 566.7?76.0?85.0?112.3?128.05=93.6.=bi?15i?1iyi?5?≈0.880 9.2ixa52=93.6-0.880 9×30=67.173. =-b=0.880 9x+67.173. ∴回归方程为y3.某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少?(3)假定产量为6 000件时,单位成本为多少元? 66i解(1)n=6,xi?1=21,yi?1i=426,=3.5,=71, 662xii?1=79,xyii?1i=1 481,6=bxi?16i?1iyi?6?=2i1481?6?3.5?7179?6?3.52=-1.82.xa62=71+1.82×3.5=77.37. =-bx=77.37-1.82x. =a+b回归方程为y?=-1.82<0,且产量x的计量单位是千件,所以根据回归系数b的意义有: (2)因为单位成本平均变动b产量每增加一个单位即 1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x=6,代入回归方程:y=77.37-1.82×6=66.45(元)当产量为6 000件时,单位成本为66.45元.一、填空题1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是.答案a,c,b=1.5x-15,则下列说法正确的有个. 2.回归方程y①=1.5-15 ②15是回归系数a ③1.5是回归系数a ④x=10时,y=0 答案 13.(2009.湛江模拟)某地区调查了2~9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为y=8.25x+60.13,下列叙述正确的是.①该地区一个10岁儿童的身高为142.63 cm ②该地区2~9岁的儿童每年身高约增加8.25 cm。

高中数学 选修1-2 1.线性回归模型

高中数学 选修1-2 1.线性回归模型

1.线性回归模型教学目标 班级_____姓名________1.了解回归分析的基本思想、方法及初步应用.2.掌握建立线性回归模型的方法.3.理解线性回归模型与函数模型的差异.教学过程一、回归分析的方法.1.变量与变量的关系:(1)函数关系:一种确定关系;(2)相关关系:一种非确定关系.2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法.3.回归分析的步骤:(1)确定研究对象;(2)采集数据;(3)画散点图;(4)求回归直线方程;(5)预测结果;(6)建线性回归模型,求残差,画残差图;(7)求2R ,刻画拟合效果.二、例题分析.例1:研究某大学女大学生身高与体重的关系. (例见教科书2P )1.确定研究对象:某大学女大学生身高与体重的关系.2.采集数据: (表见教科书2P )3.画散点图:(以身高为自变量x ,体重为因变量y ) (图见教科书2P ) 样本点呈带状分布,说明身高和体重有较好的线性相关关系.4.求回归直线方程:(1)求身高平均值25.165=x 、体重平均值5.54=y ,),(y x 称为样本点的中心,回归直线必过该点. (2)求回归直线a x b yˆˆˆ+=的参数b ˆ、a ˆ;解得 849.0)(...)()())((...))(())(()())((ˆ282221882211211=-++-+---++--+--=-∑--∑===x x x x x x y y x x y y x x y y x x x x y y x x b i n i i i ni 712.85ˆˆ-=-=x b y a, (3)得回归直线方程712.85849.0ˆ-=x y . 5.预测结果:将身高x 代入回归直线a x b yˆˆˆ+=,可预测体重. 身高为172cm 的女大学生,体重为316.60712.85172849.0ˆ=-⨯=y. 6.建立线性回归模型,求残差,画残差图:(1)身高与体重不是确定关系;(2)函数是一种确定关系;(3)不能用函数来描述身高与体重的关系;(4)建立线性回归模型e a x b y ++=ˆˆ.(e 称为随机误差);(5)表示体重真实值与预测值之间的误差(真实值:真实体重,如表格中样本点的体重数据;预测值:根据身高用回归直线求出的体重数值);(6)y 是由x 和e 共同确定,x 只能解释部分y 的变化.x 称为解释变量,y 称为预报变量.(7)由e a x b y ++=ˆˆ(表示真实值),a x b y ˆˆˆ+=(表示预测值)可得a x b y yy e ˆˆˆ--=-=;(8)对于每个样本点),(11y x ,都有a x b y e ii i ˆˆˆ--=; (9)i eˆ称为相应于点),(i i y x 的残差; (10)残差图:(纵坐标为残差,横坐标可选为样本编号或身高数据等)(图见教科书5P );(11)残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适;带状区域的宽度越窄,说明模型精度越高,预报越准;残差较大,可能是数据采集有错误,或其他原因造成.7.求2R ,刻画拟合效果: (1)21212)()ˆ(1y y yy R i n i i i n i -∑-∑-===(21)ˆ(i i n i y y -∑=表示残差平方和,i y 表示样本真实值,i y ˆ表示样本预测值,y 表示样本平均值)(2)2R 表示x 对于y 变化的贡献率;2R 越接近1,表示回归效果越好;(3)2R 是常用的选择模型的指标之一,在实际应用中应尽量选择2R 大的回归模型. (4)可得64.0)(...)()()ˆ(...)ˆ()ˆ()()ˆ(12822212882222112812812≈-++-+--++-+-=-∑-∑-===y y y y y y y y y y y y y y y y R i i i i i , 表明“女大学生的体重差异有0064是由身高引起的”.作业:某运动员训练次数与成绩之间的数据关系如下:(1)作出散点图;(2)求出回归方程;(3)作出残差图;(4)计算相关指数2R ;(5)试预测该运动员训练47次及55次的成绩.。

高三数学 1.6线性回归(第一课时)大纲人教版选修

高三数学 1.6线性回归(第一课时)大纲人教版选修

高三数学 1.6线性回归(第一课时)大纲人教版选修课时安排2课时从容说课本节主要是研究线性回归的概念及线性回归的回归直线.通过大家都熟悉的例子引入线性回归的概念.如在实际生活中,变量之间的关系,除了如同圆面积S=πR2这类确定性关系外,还有一类“相关”关系.例如,人的下身长与总身高这两个变量之间虽然不可能建立一个精确的解析式,但这两个变量有着密切的关系,一般说来,下身长的人长得也高.又如,中学毕业班学生毕业考试的成绩与高考成绩之间虽然不可能建立精确的解析式,但它们的关系也非常密切,一般说来,毕业考试成绩好的学生高考成绩也好.为了深入考察这一情形,可以再举一些例子加以说明,用坐标系将对应(x i,y i)的这些数组标出,从直观上看,如果所有的点都在某条直线上,那么用这条直线去代表这一组点,反映它们的变化趋势,自然是再好不过了.这时,对于这一组点,这样的一条直线具有最好的代表性.另一个极端是如果所有的点都不在某条直线上,且这条直线远远偏离这些点,我们自然会认为,用这条直线去代表这一组点,代表性极差.然后取一条直线让这些点到这条直线的距离的总和较小,但这样做比较困难,可以通过假定直线=bx+a去模拟,这条直线称为回归直线.然后再返回到实际问题,通过实际问题的求解,概括出求回归直线方程的具体步骤,这一点可由学生来完成,培养学生的概括能力是十分重要的.本节可以安排两课时.第十一课时课题§ 1.6.1线性回归(一)教学目标一、教学知识点1.理解变量之间的相关关系的概念、线性回归的概念及相关性检验等概念.2.了解线性回归的基本思想和方法.3.理解并掌握一元线性回归分析、回归直线方程.二、能力训练要求1.会用配方法来求回归直线方程.2.能灵活运用线性回归方程解决有关实际问题.三、德育渗透目标1.培养学生辩证唯物主义观点(动与静、数与形、分与合等辩证观),培养学生数形结合、函数与方程的数学思想.2.培养学生分析问题、解决问题的能力,收集信息和处理信息的能力.3.培养学生具有“学生活的知识、学生存的技能、学生命的意义”的新学生观.教学重点线性回归的基本思想和方法是本节课的重点内容,我们研究的是回归分析中最简单,也是最基本的一种类型——一元线性回归分析,它不仅有着广泛的直接应用,而且是进一步学习回归分析的基础.例如,多元线性回归分析的原理与一元线性回归分析的原理是一样的,一些非线性回归问题可以转化成线性回归问题来进行解决.教学难点回归直线方程是本节课的教学的难点.我们是用配方法来求回归直线方程的.配方法在解决一些涉及二次多项式的问题时有着重要的作用,用配方法进行这种推导虽然看上去较为复杂,但解决问题的思路却是较为清楚的.教学方法建构主义观点在高中数学课堂教学中的实践的教学方法.在学生已掌握并能灵活运用配方法研究二次函数的最值问题的背景下,我们推导回归直线方程.利用已知函数表达式的概念,建构相关关系和回归分析,初步完善学生的认知结构.教具准备幻灯机、幻灯片两张(或实物投影仪)第一张:(记作§ 1.6.1 A)问题1.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据:(单位:k g)施化肥量x15 20 25 30 35 40 45水稻产量y 330 345 365 405 445 450 455第二张:(记作§ 1.6.1 B)问题2.一个工厂在2002年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据:x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)求月总成本y与月产量x之间的回归直线方程.第三张:(记作§ 1.6.1 C)在10年期间,一城市居民的年收入与某种商品销售额之间的数据关系如下:第几年 1 2 3 4 5城市居民年32.2 31.1 32.9 35.8 37.1收入x (亿元)某商品销售25.0 30.0 34.0 37.0 39.0额y(万元)第几年 6 7 8 9 10城市居民年38.0 39.0 43.0 44.6 46.0收入x(亿元)某商品销售41.0 42.0 44.0 48.0 51.0额y(万元)(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程.教学过程Ⅰ.课题导入以前我们学过两个变量之间的关系,如正方形的面积S与边长x之间的关系S=x2就是一种确定性的关系,即对于自变量边长x的每一个确定的值,都有唯一确定的面积的值与之对应.我们学习过的函数关系就是两个变量之间的确定性关系.但我们日常生活和生产实践、科学实验中经常遇到两个变量之间的关系是属于确定性关系之外的关系,即不确定性的关系,把这种关系定义为相关关系(板书),对这样两个变量进行统计分析的方法叫做回归分析(板书).这就是我们今天学习的内容(板书课题):线性回归(一).Ⅱ.讲授新课1.讲解基本内容[师](打出幻灯片§ 1.6.1 A)我们来看看一块农田的水稻产量与施肥量之间的关系.表中是7块并排、形状大小相同的试验田,实质就是一块农田,7次不同的施肥试验.从这个表中的数据可以看出,水稻产量不仅受到施肥量的影响,还受到其他不少因素(诸如气候情况、浇水、除虫等)的影响.因此,当施肥量一定时,水稻产量在取值上带有一定的随机性.请问,什么叫做两个变量之间的相关关系?什么叫做回归分析?[生1]当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.[生2]对具有相关关系的两个变量进行统计分析的方法叫做回归分析.如上述农田的水稻产量与施肥量之间的关系,这两个量的统计分析就是回归分析.[师]在现实生活中存在着大量的相关关系.你能举出一些实例吗?(先给一定的时间,让同学们讨论,然后再回答)[生3]人的身高和年龄是一对相关关系,因为在某一个年龄上,人的身高在取值上带有一定的随机性.[生4]某公司的产品成本与生产数量是一对相关关系.因为生产数量一定时,产品的成本在取值上具有一定的随机性,这与市场上生产原料的价格、劳动力的价格是相关的,故具有随机性.[生5]期中考试数学成绩与复习时间的投入量的关系是相关关系.这是因为当复习时间投入一定量时,数学成绩的取值具有一定的随机性,如可能受到当天的身体状况、心情问题、周边环境的影响.[生6]目前各家商场都进行促销活动,商品的销售额与广告费是相关关系.当广告费一定时,商品的销售额的取值具有一定的随机性.如受到天气的限制、人流量的限制、其他商场促销活动的影响.[生7]家庭的支出与收入是相关关系.这是因为,一个家庭的经济收入状况是确定的,但支出问题是具有随意性的.例如生活用品(菜、米、面、油……即衣食住行所需要的钱)是随机的,另外,礼尚往来等礼节过程所需要的支出都是随机的.……[师]同学们举的例子都是我们日常生活中常常遇到的问题.同学们能否从这些实例中总结出规律?[生8]相关关系的定义,即当自变量取值一定时,因变量的取值带有一定的随机性,也就是说这两个变量的关系是非确定的.[师]总结得很好!其实,这些实例中的两个变量中,都是一个变量为可控制量,另一个变量为随机变量.请问,日常生活中有没有两个变量均为随机变量的呢?你能举出这样的实例吗?[生9]例如,在研究我的数学成绩与英语成绩的关系时,这两个变量都是不可控制的随机变量.[师]对!非确定性关系有两种情况,一是两个变量中,一个变量为可控制变量,另一个变量为随机变量;二是两个变量均为随机变量.现在我们再来对上述表格中的数据进行分析,你们能将表中的各对数据在平面直角坐标系中描点吗?[生10](到黑板上画,其余同学在位上画)以x值为横坐标,y值为纵坐标,作出的图象如下.图1-20[师]像图(1)中这样表示具有相关关系的两个变量的一组数据的图形叫做散点图.你们发现有什么特点吗?[生11]可以发现,图(1)中的各个点,大致分布在一条直线的附近,如图(2)所示.(这个学生走到黑板上画出一条直线,用彩色粉笔)[生12]我们还可以画出若干条直线来,不也可以吗? [师]可以,像图(2)中的直线,可以画出不止一条,那么其中哪一条直线最能代表变量x 与y 之间的关系呢?[生](众生齐声回答)用待定系数法,设出直线方程y=ax +b ,利用点到直线距离公式进行检验.[师]这个想法很好!直线是不定的,点又这么多,如何检验呢?(对这种思想方法进行改进推出一般情况)一般地,设x 与y 是具有相关关系的两个变量,且相应于n 组观测值的n 个点大致分布在一条直线的附近,我们来求在整体上与这n 个点最接近的一条直线.[生13]设所求的直线的方程为=ax +b ,其中a 、b 是待定系数.于是,当变量x 取一组数值x i (i=1,2,…,n )时,相应地求出,看y i -偏差程度,对于整体n 而言,得到n 个差值,这n 个差值有正有负或零,我们将它们相加起来即可.[师]可以,这种构造思想很好,看拟合值与真实值的差值.如果将它们相加会造成相互抵消,因此它们的和不能代表n 个点与相应直线在整体上的接近程度.为了解决“最近的问题”,我们应该采取什么方法呢?[生14]绝对值相加,即|y 1-|+|y 2-|+…+|y n -|.[生15]我是想利用平方相加,即|y 1-|2+|y 2-|2+…+|y n -|2表示n 个点与相应直线在整体上的接近程度.[师]这种思路是非常正确的,这种信息转化也是十分重要的.接下来的就是如何求得系数a 、b ,使得|y 1-|2+|y 2-|2+|y 3-|2+…+|y n -|2=Q 取得最小值. [生16]将x 1,x 2,…,x n 代入,即求,,…,换成x 1,x 2,…,x n ,然后配方求出最小值时a 、b 的值.[师]看来这种计算是很麻烦了,为了书写方便起见,我们先引进一个符号“∑”(读[′sigm ]),它表示若干个数相加.例如,可将x 1+x 2+…+x n 记作∑=ni ix1,即表示从x 1加到x n 的和.这样n 个数的平均数的公式可写成什么形式?这n 个数的平方的平均数公式又是什么呢?[生17]∑==n i i x n x 11,∑==n i i x n x 1221.[师]你能将∑=-ni ix x12)(,∑=--ni i i y y x x 1))((化简吗?[生18]∑∑==+-=-ni ni i i ix x x x x x11222)2()(∑∑∑===+-=ni ni ni i i x x x x 111222∑∑==+-=ni ni i i x n x x x 11222∑=+⋅-=ni i x n x n x x 1222∑=-=ni i x n x 122.∑=--ni i iy y x x1))((∑=+--=ni i i i i y x x y y x y x 1)(∑∑∑∑====+--=ni n i n i ni i i i i y x x y y x y x 1111)(y x n y x n y x n y x ni i i +--=∑=1∑=-=ni i i y x n y x 1.[师]正确.现在我们的问题是,求使∑='-=ni i iy yQ 12||取得最小值时a 、b 的值.上式是否可以化简呢?[生19]将y i ′=ax i +b 代入平方和式后,各项展开,再合并,得Q=∑=ni 1=1(y i 2+a 2x i 2+b 2-2ax i y i -2b y i +2x i ab )∑∑∑∑∑=====+--++ni ni n i n i ni i i i i ii x ab y b y x a nb xay 111112222222=∑∑∑===+-+---+--=ni n i ni i i i iy y x a xax a y n x a y n x a y bn nb 1112222222)()()(2∑∑∑===+-+----=ni ni ni i i i i y y x a x ax a y n x a y b n 111222222)()]([∑∑∑===+-+-+---=ni n i ni i i i iy y x a xax na x y na y n x a y b n 111222222222)]([)()(2)()]([122112222∑∑∑===-+---+--=ni i ni i i ni i y n y y x n y x a x n x a x a y b n∑∑∑===-+----+--=ni ni ni i i iiy y y y x xax xax a y b n 11122222)())((2)()]([∑∑∑∑∑∑======-+--------⋅-+--=ni i ni i ni i i n i i ni i i ni i y y x x y y x x x x y y x xa x x x a yb n 121221121122)()())((])())(([)()]([][ 在上式中,后两项与a 、b 无关,而前两项为非负数,因此要使Q 取得最小值,当且仅当前两项的值均为0,即有∑∑==---=ni ini i ix xy y x xa 121)())((,x a y b -=.这就是我们所要推导的公式.[师]他的推导过程虽然看上去较为复杂,但其解决问题的思路却较为清晰.先将字母b 看成未知数进行一次配平方,再将字母a 看成未知数进行一次配平方,最后根据非负的变量在等于0时取得最小值这一特点得出所求公式.这位同学坚忍不拔的毅力是我们大家学习的楷模.在平时学习中要培养自己的这种非智力因素.值得注意的是:在一般统计书中习惯用b 表示一次项系数,用a 表示常数项,这正好与我们所表示一次函数的习惯相反,而所求的直线方程常设为y =bx +a .于是在上面的推导过程中的a 、b 的值应该交换,即完全符合统计书上的习惯的规定.我们将所得到的方程叫做回归直线方程,相应的直线叫做回归直线,而对两个变量所进行的上述统计分析叫做线性回归分析.我们看到,求出了这种具有两个变量的回归直线后,就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解.2.课本例题[例1](教师打出幻灯片§ 1.6.1 A )求出问题1的回归直线方程.可以借助科学计算器,完成下表中的x i y i ,x ,y ,∑=712i ix ,∑=712i iy ,∑=71i iiyx 的有关计算.[生20]i 1 2 3 4 5 6 7 x i 15 20 25 30 35 40 45 y i330345 365405445450455 x i y i 4950 69009125 12150 15575 180002047530=x ,3.399=y ,∑==7127000i i x ,∑==7121132725i i y ,∑==7187175i ii yx[生21]利用公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====,,)())((1221121x b y a x n x y x n y x x x y y x x b ni ini i i n i i n i i i 可求得75.430770003.399307871752≈⨯-⨯⨯-=b ,a =399.3-4.75×30≈257,因此所求的回归直线方程是y =4.75x +257.[师]同学们,根据方程可以画出相应的回归直线,同学们自己画.根据这个回归直线方程,可以求出相应于x 的估计值y .例如当x ≈28(k g)时,y 的估计值是多少呢?[生22]y =4.75×28+257=390(k g). [例2](师打出幻灯片§ 1.6.2 B ) [师]请学生读题并分析.[生23]先在直角坐标系中画出散点图,然后按照要求只要求b 与a 的值,先求出x i y i ,x ,y ,∑=n i i x 12,∑=n i i y 12,∑=ni i i y x 1的值,再求b 与a .[师]思路完全正确,请同学们先计算,然后请两位同学到黑板写. [生24]解:(1)画出的散点图如图所示.图1-21[生25](2)列出下表,并用科学计算器进行有关计算. i 1 2 3 4 5 6 7 8 9 10 11 12 x i 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 y i2.252.372.402.552.642.752.923.033.143.263.363.50x i y i 2.43 2.654 2.856 3.264 3.590 4.07 4.643 5.090 5.652 6.096 6.653 7.245125.18=x ,8475.21217.34==y , ∑==1212808.29i ix,∑==12122081.99i i y ,∑==121243.54i i i y x .于是可得∑∑==--=121221211212i ii ii x xyx yx b215.1)125.18(12808.298475.2125.1812243.542≈⨯-⨯⨯-=, 974.0125.18215.18475.2≈⨯-=-=x b y a ,因此所求的回归直线方程是 =1.215x +0.974.[师]两位同学书写的都很规范.以后就要按这种格式来解题. Ⅲ.课堂练习[师](打出幻灯片§ 1.6.1 C )请一位同学读题并分析已知、求解及解题策略.[生26]已知x i ,y i 的值,一是要画出散点图,二是要求出有关参数如x ,y ,∑=1012i i x ,∑=1012i i y ,∑=101i i i y x 的值,最后求出a 、b 的值.[生27]解:(1)散点图如下所示:图1-22(2) i 1 2 3 4 5 6 7 8 9 10 x i 32.2 31.1 32.9 35.8 37.1 38.0 39.0 43.0 44.6 46.0 y i 25 30.0 34.037.039.041.0 42.0 44.0 48.0 51.0 x i y i8059331118.6 1324.6 1446.91558163818922140.8234697.37=x ,1.39=y ,∑==101267.14663i ix,∑==101215857i i y ,∑==1019.15202i i i y x .于是可得∑∑==--=101221011010i ii iix xyx yx b297.371067.146631.3997.37109.15202⨯-⨯⨯-=447.1461.24663.356≈=. a =y -b x =39.1-1.447×37.97 ≈-15.843.因此,所求的回归直线方程是=bx +a =1.447x -15.843.Ⅳ.课时小结本节课我们学习了线性回归的几个基本概念.两个变量之间的相关关系,回归分析,散点图,回归直线方程=bx +a ,回归直线,线性回归分析.共同探讨了已知各数据x i 、y i 如何求回归直线方程,其推导方法是利用配方法.Ⅴ.课后作业课本P 42习题1.6 第1题. 板书设计§ 1.6.1 线性回归(一) 一、几个概念 1.相关关系2.回归分析3.散点图4.线性回归方程5.回归直线6.线性回归分析二、线性回归方程=bx +a2121x n xyx n yx b ni ini ii --=∑∑==,x b y a -=.问题1的线性回归方程 b =4.75,a =257, =4.75x +257. 当x =28时,=390(k g).问题2的线性回归方程 b =1.215,a =0.974, =1.215x +0.974. 练习题答案.。

高中数学线性回归方程公式

高中数学线性回归方程公式

高中数学线性回归方程公式1. 引言在高中数学学习中,线性回归是一种重要的统计方法,用于模拟和预测两个或更多变量之间的线性关系。

线性回归方程是深入了解线性回归的基础,本文将介绍高中数学中线性回归方程的公式及其应用。

2. 线性回归方程的定义线性回归方程是一种用于描述两个变量线性关系的方程。

通常情况下,我们用x来表示自变量(输入变量),用y来表示因变量(输出变量)。

线性回归方程可以用下面的形式表示:y = ax + b,其中a和b是常数,称为回归系数。

3. 确定回归系数为了确定回归方程中的回归系数a和b,我们需要一组已知的数据点,其中包含自变量x和因变量y的取值。

通过求解回归系数,我们可以找到最佳拟合线,使得该线尽可能地接近数据点。

3.1 最小二乘法最小二乘法是一种常用的确定回归系数的方法。

其基本思想是通过最小化预测值和真实值之间的残差平方和来找到最佳拟合线。

考虑到一组包含n个数据点的数据集{(x1, y1), (x2, y2), …, (xn, yn)},回归方程的系数可以通过以下公式计算得到:a = (n∑(xi * yi) - ∑xi * ∑yi) / (n∑(xi^2) - (∑xi)^2)b = (∑yi - a * ∑xi) / n计算a和b之后,线性回归方程就可以得到。

4. 应用案例线性回归方程在实际问题中有广泛的应用。

以下是一个简单的应用案例:假设我们希望预测一个人的体重(y)与他们的身高(x)之间的关系。

收集了一组数据点如下:身高(x)(厘米):165, 170, 175, 180, 185体重(y)(千克):55, 60, 65, 70, 75使用最小二乘法计算回归系数:n = 5∑(xi * yi) = 165*55 + 170*60 + 175*65 + 180*70 + 185*75 = 169750∑xi = 165 + 170 + 175 + 180 + 185 = 875∑(xi^2) = 165^2 + 170^2 + 175^2 + 180^2 + 185^2 = 148500∑yi = 55 + 60 + 65 + 70 + 75 = 325a = (5 * 169750 - 875 * 325) / (5 * 148500 - 875^2) ≈ 0.7647b = (325 - 0.7647 * 875) / 5 ≈ -29.4118得到线性回归方程:y ≈ 0.7647x - 29.4118通过该方程,我们就可以预测其他身高对应的体重。

人教版高中数学选修1-2教案1.1.1线性回归的思想方法及应用

人教版高中数学选修1-2教案1.1.1线性回归的思想方法及应用

统计案例1.1回归分析的基本思想及初步应用1.1.1线性回归的思想方法及应用课前预习学案一、课前预习预习目标:回顾回归直线的求法,并利用回归直线进行总体估计。

二、预习内容1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。

求回归直线方程的一般步骤:①;②;③2.典型例题:研究某灌溉渠道水的流速与水深之间的关系,测得一组数据如下:水深 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10流速 1.70 1.79 1.88 1.95 2.03 2.10 2.16 2.21 (1)求对的回归直线方程;(2)预测水深为1.95时水的流速是多少?课内探究学案一、学习目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.学习重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.学习难点:解释残差变量的含义,了解偏差平方和分解的思想.二、学习过程1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.3. 典型例题:编号 1 2 3 4 5 6 7 8 165 165 157 170 175 165 155 170身高/cm体重48 57 50 54 64 61 43 59/kg求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. (分析思路→教师演示→学生整理)评注:事实上,观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不=+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地能用一次函数y bx a刻画身高和体重的关系).在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结=++,果e(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e其中残差变量e中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.4.相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.5. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.课后练习与提高1.对具有相关关系的两个变量统计分析的一种常用的方法是()A.回归分析 B.相关系数分析 C.残差分析 D.相关指数分析2.在画两个变量的散点图时,下面叙述正确的是()A.预报变量在轴上,解释变量在轴上B.解释变量在轴上,预报变量在轴上C.可以选择两个变量中任意一个变量在轴上D.可以选择两个变量中任意一个变量在轴上3.两个变量相关性越强,相关系数()A.越接近于0 B.越接近于1 C.越接近于-1 D.绝对值越接近14.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为()A.0 B.1 C.-1 D.-1或15.一位母亲记录了她儿子3到9岁的身高,数据如下表:年龄(岁) 3 4 5 6 7 8 9身高(94.8 104.2 108.7117.8 124.3 130.8 139.0由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是()A.她儿子10岁时的身高一定是145.83B.她儿子10岁时的身高在145.83以上C.她儿子10岁时的身高在145.83左右D.她儿子10岁时的身高在145.83以下统计案例1.1回归分析的基本思想及初步应用1.1.1线性回归的思想方法及应用教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.教学难点:解释残差变量的含义,了解偏差平方和分解的思想.教学过程:一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.二、讲授新课:1. 教学例题:①例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号 1 2 3 4 5 6 7 8身高165 165 157 170 175 165 155 170 /cm48 57 50 54 64 61 43 59 体重/kg求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程第三步:代值计算②提问:身高为172cm的女大学生的体重一定是60.316kg吗?不一定,但一般可以认为她的体重在60.316kg左右.③解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不能用一=+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身次函数y bx a高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e(即=++,其中残残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e差变量e中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.。

人教版高中数学(理科)选修线性回归教案

人教版高中数学(理科)选修线性回归教案

线性回归【考点透视】一、考纲指要1.了解相关系数的计算公式及其意义,会用相关系数公式进行计算.2.了解相关性检验的方法与步骤,会用相关性检验方法进行检验.3.了解相关关系、回归分析、散点图等概念,会求回归直线方程.4.了解线性回归的方法.二、命题落点1.画散点图观察线性相关性,如例1.2.通过散点图观察线性相关性,并求其回归直线方程,并对其相关性作出判断,如例2.3.求线性回归方程,如例3.【典例精析】例1:一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次实验,收集数据如下:画出散点图.解析:作出两个散点图如下图所示:例2:某省210各高中学生参加了本省举办的2004年数学冬令营,在闭营前进行一次本省的奥林匹克数学竞赛,试卷满分为10分,随机调阅了60名学生的答卷,成绩列于下表:(1)求样本的数学平均成绩和标准差(精确到0.01);(2)利用散点图判断它们的相关性, 如果相关求回归直线方程.解析:平均成绩和标准差可以直接代入公式求解,相关性问题可以代作出散点图后,由图形加以判断. (1)(465156217128393)6x ⨯+⨯+⨯+⨯+⨯+⨯=1=60,222222[6(46)15(56)21(66)12(76)3(86)s ⨯-+⨯-⨯+⨯-+⨯-+⨯-1=6023(96)] 1.5+⨯-=.(2)画出散点图如下图所示: 由散点图可得,成绩与分数不相关.例3:近10年来,某市社会商品零售总额与职工工资总额数据如下(单位:亿元):建立社会商品零售总额y 与职工工资总额x 的线性回归方程是( )A .y ˆ=2.7991x -27.2485.B .yˆ=2.7992x -23.5493.C .y ˆ=2.6992x -23.7493.D .y ˆ=2.8992x -23.7494.解析:利用计算器容易求得x -,y -,i x ,i y ,2i x ,i i x y 值如下表所示:代入公式求出245716.221041.7293.232.7992,19842.31041.72b -⨯⨯==-⨯93.23 2.799241.7223.5493a =-⨯=-,所以得方程为:y ˆ=2.7992x -23.5493. 故应选B.【常见误区】1.作散点图时,要注意坐标点选取的顺序,如本题中的横纵坐标轴的顺序变化了,就得到不同的图形.作题时应该注意坐标轴不要标注错了.2.作出的散点图可以感知其数据的线性回归性,然后用数据表计算其各个数据,直至求得其回归方程.这种先验证,再求解的思想方法是数学问题求解的通法, 即应当先确定问题求解的大方向, 然后按常规步骤求解. 【基础演练】1.下面哪些变量是相关关系 ( ) A .出租车费与行驶的里程 B .房屋面积与房屋价格C .身高与体重D .铁的大小与质量 2.利用实验数据进行拟合时,下列说法不正确的是 ( )A .数据越多,拟合效果越好B .数据的数目不同时,拟合的直线方程相同C .样本量越大所估计的直线方程越能更好地反映变量间的关系D .拟合前必须先观察数据的规律性3.设有一个回归方程为23y x =-,则变量x 增加一个单位时 ( )A .y 平均增加3个单位B .y 平均增加2个单位C .y 平均减少3个单位D .y 平均减少2个单位4.若施化肥量x 与水稻产量y 的回归直线方程为^y =5x+250,当施化肥量为80kg 时,预计的水稻产量为____________.5.施化肥量对水稻产量影响的试验数据:(1)根据上表数据,制成散点图,你能从散点图中发现施化肥量对水稻产量之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.6.影响消费水平的原因是很多的,其中重要的一项是工资收入.研究这两个变量的关系的一个方法是通过随机抽样的方法,在全国范围内收集被调查者的工资收入和他们的消费状况.下面的数据来自国家统计局分布的统计年鉴,是祖国大陆31个省、自治区、直辖市的职工平均工资与居民消费水平(单位:元).(1)根据上表数据,制成散点图,你能从散点图中发现工资收入与消费水平之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系;(3)如果一居民年平均工资收入为9300元,请估计一下该居民的消费水平.7.有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出热饮杯数与当天气温的对比表:(1)画出散点图;(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗?(3)求回归方程;(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.8.高三·一班学生每周用于数学学习的时间x(单位:h)与数学成绩y(单位:分)之间有如下对应数据:如果y与x之间具有线性相关关系,求回归直线方程. 9.下面是2005年10月一日一周内某地申领结婚证的新郎与新娘的年龄,记作(新郎的年龄y, 新娘的年龄x):(37,30),(30,27),(65,56),(45,40),(32,30),(28,26) ,(45,31),(29,24),(26,23),(28,25),(42,29),(36,33 ),(32,29),(24,22),(32,33),(31,29),(37,46),(28,25) ,(33,34),(31,23),(24,23),(49,44),(28,29),(30,30 ),(24,25),(22,23),(68,60),(25,25),(32,27),(42,37) ,(42,37),(24,24),(24,22),(28,27),(36,31),(23,24 ),(30,26);根据以上材料请你思考以下y关于x的回归问题:(1)如果每个新郎和新娘都同岁,穿过这些点的回归直线的斜率和截距等于什么?(2)如果每个新郎比他的新娘大5岁, 穿过这些点的回归直线的斜率和截距等于什么?(3)如果每个新郎比他的新娘大10%,穿过这些点的回归直线的斜率和截距等于什么?(4)对于上面的实际年龄作出回归直线;(5)从这条回归直线,你对新郎和新娘的年龄模型可得出什么结论?。

人教版高中数学(理科)选修1.6线性回归(一)

人教版高中数学(理科)选修1.6线性回归(一)

1.6线性回归〔一〕教学目的:1.了解相关关系、回归分析、散点图的概念.2.明确事物间是相互联系的,了解非确定性关系中两个变量的统计方法;掌握散点图的画法及在统计中的作用,掌握回归直线方程的求解方法.3.会求回归直线方程.教学重点:散点图的画法,回归直线方程的求解方法. 教学难点:回归直线方程的求解方法. 授课类型:新授课. 课时安排:1课时.教 具:多媒体、实物投影仪. 教学过程: 一、复习引入:客观事物是相互联系的.过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因〞,物理是“果〞,或者反过来说.事实上数学和物理成绩都是“果〞,而真正的“因〞是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系.但还存在着另一种非确定性关系——相关关系. 二、讲解新课:1.相关关系的概念当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.相关关系是非随机变量与随机变量之间的关系,函数关系是两个非随机变量之间的关系,是一种因果关系,而相关关系不一定是因果关系,所以相关关系与函数关系不同,其变量具有随机性,因此相关关系是一种非确定性关系.〔有因果关系,也有伴随关系〕.因此,相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系.不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.2.回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析.通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性.3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.4. 回归直线设所求的直线方程为a bx y +=^,其中a 、b 是待定系数. 那么),,2,1(,^n i a bx y i i =+=.于是得到各个偏差),,2,1(),(^n i a bx y y y i i i i =+-=-.显见,偏差i i y y ^-的符号有正有负,假设将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n 个偏差的平方和.2222211)()()(a bx y a bx y a bx y Q n n --++--+--=表示n 个点与相应直线在整体上的接近程度.记 ∑=--=ni iia bx y Q 12)( (向学生说明∑=ni 1的意义).上述式子展开后,是一个关于a 、b 的二次多项式,应用配方法,可求出使Q 为最小值时的a 、b 的值.即⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a xn x yx n y x x x y y x x b ni i ni ii n i i ni i i 2121121)())((, ∑==n i i x n x 11,∑==ni i y n y 11相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析.特别指出:1.对回归直线方程只要求会运用它进行具体计算a 、b ,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否那么,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.3.求回归直线方程,关键在于正确地求出系数a 、b ,由于求a 、b 的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序〞变为“有序〞,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识. 三、讲解范例:例1.10只狗的血球体积及红血球的测量值如下x 〔血球体积,mm 〕,y 〔血红球数,百万〕(1)画出上表的散点图;(2)求出回归直线并且画出图形 . 解:〔1〕见以下图x〔2〕50.45)50394058354248464245(101=+++++++++=x 37.7)72.855.620.649.990.599.650.752.930.653.6(101+++++++++=y 设回归直线为a bx y+=ˆ,45⋅6.53+42⋅6.3+46⋅9.25+48⋅7.5+42⋅6.99+35⋅5.9+58⋅9.49+40⋅6.2+39⋅6.55+50⋅7.72()-10⋅45.5⋅7.37()452+422+462+482+422+352+582+402+392+502()-10⋅45.52= 0.13即 13.02121=--=∑∑==xn xyx n y x b ni ini ii ,29.1=-=x b y a所以所求回归直线的方程为29.113.0^+=x y ,图形如下:x例2.一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间有如下组对应数据:(1)画出散点图;(2)求月总成本y 与月总产量x 之间的回归直线方程.讲解上述例题时,(1)可由学生完成;对于(2),可引导学生列表,按∑∑∑===→→→→→→→12112121212i i i i ii ii i i i y x y x y x y x y x 的顺序计算,最后得到974.0,215.1≈≈a b .即所求的回归直线方程为974.0215.1^+=x y . 四、课堂练习:1.以下两个变量之间的关系哪个不是函数关系〔 〕 A.角度和它的余弦值B.正方形边长和面积C.正n 边形的边数和它的内角和D.人的年龄和身高.答案:D .2.给出施化肥量对水稻产量影响的试验数据:(1)画出上表的散点图;(2)求出回归直线并且画出图形.解:(1)散点图〔略〕.(2)表中的数据进行具体计算,列成以下表格故可得到2573075.43.399,75.430770003.399307871752≈⨯-=≈⨯-⨯⨯-=a b从而得回归直线方程是25775.4^+=x y .(图形略).五、小结 :对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a 、b 的计算公式,算出a 、b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.求线性回归方程的步骤:计算平均数y x ,;计算i i y x 与的积,求∑ii y x ;计算∑2ix;将结果代入公式求a ;用 x a y b -=求b ;写出回归方程. 六、课后作业:在某种产品表面进行腐蚀线试验,得到腐蚀深度y 与腐蚀时间x 之间对应的一组数据: (1)画出散点图;(2)试求腐蚀深度y 对时间t 的回归直线方程 解:(1)散点图略,呈直线形.(2)经计算可得45.19,36.46==y t∑∑∑======1111112111213910,5442,36750i i i i i i iy t y t542.536.463.045.19,3.036.46113675045.1936.4611139102≈⨯-=≈⨯-⨯⨯-=a b 故所求的回归直线方程为542.53.0^+=t y . 七、板书设计〔略〕 八、课后记:。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性回归(一)
教学目的:
1 了解相关关系、回归分析、散点图的概念
2.明确事物间是相互联系的,了解非确定性关系中两个变量的统计方法;掌握散点图的画法及在统计中的作用,掌握回归直线方程的求解方法
3.会求回归直线方程
教学重点:散点图的画法,回归直线方程的求解方法 教学难点:回归直线方程的求解方法 授课类型:新授课 课时安排:1课时
教 具:多媒体、实物投影仪 教学过程: 一、复习引入:
客观事物是相互联系的过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系 二、讲解新课: 1.相关关系的概念
当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系
相关关系是非随机变量与随机变量之间的关系,函数关系是两个非随机变量之间的关系,是一种因果关系,而相关关系不一定是因果关系,所以相关关系与函数关系不同,其变量具有随机性,因此相关关系是一种非确定性关系(有因果关系,也有伴随关系).因此,相关关系与函数关系的异同点如下:
相同点:均是指两个变量的关系
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.
2.回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性
3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度粗略地看,散点分布具有一定的规律 4. 回归直线
设所求的直线方程为,^
a bx y +=,其中a 、
b 是待定系数. 则),,2,1(,^
n i a bx y i i =+= .于是得到各个偏差
),,2,1(),(^
n i a bx y y y i i i i =+-=-.
显见,偏差i i y y ^
-的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n 个偏差的平方和.
2222211)()()(a bx y a bx y a bx y Q n n --++--+--= 表示n 个点与相应直线在整体上的接近程度.
记 ∑=--=n i i i a bx y Q 1
2)( (向学生说明∑=n
i 1
的意义).
上述式子展开后,是一个关于a 、b 的二次多项式,应用配方法,可求出使Q 为最小值时的a 、b 的值.即
11
22211
()()()n n i i i i i i n n i i i i x x y y x y nxy b x x x nx a y bx
====⎧
---⎪
⎪==⎨--⎪⎪
=-⎩∑∑∑∑, ∑==n
i i x n x 11,∑==n i i y n y 11 相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析
特别指出:
1.对回归直线方程只要求会运用它进行具体计算a 、b ,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.
2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.
3.求回归直线方程,关键在于正确地求出系数a 、b ,由于求a 、b 的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.
4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识. 三、讲解范例:
例1.已知10只狗的血球体积及红血球的测量值如下
x(血球体积,mm),y(血红球数,百万) (1)画出上表的散点图;(2)求出回归直线并且画出图形 解:(1)见下图
x
(2)50.45)50394058354248464245(10
1
=+++++++++=
x 37.7)72.855.620.649.990.599.650.752.930.653.6(10
1
=+++++++++=
y 设回归直线为a bx y
+=ˆ, 45⋅6.53+42⋅6.3+46⋅9.25+48⋅7.5+42⋅6.99+35⋅5.9+58⋅9.49+40⋅6.2+39⋅6.55+50⋅7.72()-10⋅45.5⋅7.37()
452+422+462+482+422+352+582+402+392+502()-10⋅45.52
= 0.13

12
2
1
0.13n
i i
i n
i
i x y nxy
b x
nx ==-=
=-∑∑, 1.29a y bx =-=
所以所求回归直线的方程为ˆ0.13 1.29y
x =+,图形如下: x
例2.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下组对应数据:
(1)画出散点图;
(2)求月总成本y 与月总产量x 之间的回归直线方程.
讲解上述例题时,(1)可由学生完成;对于(2),可引导学生列表,按
∑∑∑===→→→→→→→12
1
121
2121
2
i i i i i
i i
i i i i y x y x y x y x 的顺序计算,最后得到
974.0,215.1≈≈
a b .
即所求的回归直线方程为974.0215.1^
+=x y . 四、课堂练习:
1 . 下列两个变量之间的关系哪个不是函数关系( ) A .角度和它的余弦值
B.正方形边长和面积
C .正n边形的边数和它的内角和 D.人的年龄和身高
答案:D
2.给出施化肥量对水稻产量影响的试验数据: (1)画出上表的散点图;(2)求出回归直线并且画出图形 解:(1)散点图(略).
(2)表中的数据进行具体计算,列成以下表格
故可得到
257
3075.43.399,75.430
770003
.399307871752≈⨯-=≈⨯-⨯⨯-=
a b 从而得回归直线方程是25775.4^
+=x y .(图形略)
五、小结 :对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a 、b 的计算公式,算出a 、b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.求线性回归方程的步骤:计算平均数y x ,;计算i i y x 与的积,求∑i i y x ;计算∑2
i x ;将结果代入公式求
a;用 x a y b -=求b;写出回归方程 六、课后作业:
在某种产品表面进行腐蚀线试验,得到腐蚀深度y 与腐蚀时间x 之间对应的一组数据:
(1)画出散点图;
(2)试求腐蚀深度y 对时间t 的回归直线方程 解:(1)散点图略,呈直线形.
(2)经计算可得
45.19,36.46==y t
∑∑∑======111
11
1
2
11
1
2
13910,5442,36750i i i i i i i
y t y t
542
.536.463.045.19,
3.036.46113675045
.1936.4611139102
≈⨯-=≈⨯-⨯⨯-=
a b 故所求的回归直线方程为542.53.0^
+=t y 七、板书设计(略) 八、课后记:。

相关文档
最新文档