2018-2019学年人教A版 选修1-2 回归分析的基本思想及其初步应用(一) 教案

合集下载

选修1-2 1.1-回归分析的基本思想及其初步应用

选修1-2  1.1-回归分析的基本思想及其初步应用

几点说明: 身高 /cm 165
第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。 如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采 48 57 50 54 64 61 43 59 体重/kg 集没有错误,则需要寻找其他的原因。 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带 预报体 54.373 54.373 47.581 58.618 62.863 54.373 45.883 58.618 状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。 重
预报体 54.373 54.373 47.581 58.618 62.863 54.373 45.883 58.618 重
残差
-6.373 2.627 2.419 -4.618 1.137 6.627 -2.883 0.382
你会计算上面的总体偏差平方和、残差平方和、回归平方和吗?
354
128.361
残差
-6.373
2.627
2.419
-4.618
1.137
6.627
-2.883
0.382
异 常 点
• 错误数据 • 模型问题
如何发现数据中的错误?如何衡量随机模型的拟合效果?
1)计算 ei y b x a ( (i=1,2,...n) i i 残差分析( 2)画残差图 ( 1)查找异常样本数据 (3)分析残差图( 2)残差点分布在以O为中心的水平带状区域,并沿 水平方向散点的分布规律相同。
R2
0.98 0.80
由图的对比可以看出,指数模拟优于线性模拟
回 归 分 析 基 本 思 想 及 其 初 步 应 用

人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。

它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。

回归分析的初步应用包括简单线性回归和多元线性回归。

1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。

其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。

独立性检验的初步应用包括卡方检验和Fisher精确检验。

第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。

演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。

两种推理方法都有其适用的场合,需要根据具体情况进行选择。

2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。

间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。

第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。

复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。

复数的引入扩充了数系,使得一些原本无解的方程可以得到解。

3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。

复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。

第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。

它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。

流程图可以帮助人们更好地理解算法或过程,从而提高效率。

4.2 结构图结构图是一种用于描述程序结构的图形表示方法。

它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。

高中数学人教A版选修1-2第一章回归分析的基本思想及其初步应用课件

高中数学人教A版选修1-2第一章回归分析的基本思想及其初步应用课件

高中数学人教A版选修1-2第一章回归 分析的 基本思 想及其 初步应 用课件 【精品 】
高中数学人教A版选修1-2第一章回归 分析的 基本思 想及其 初步应 用课件 【精品 】
残差图的制作及作用
1、坐标纵轴为残差变量,横轴可以有不同的选择; 2、若模型选择的正确,残差图中的点应该分布在以横
轴为心的带形区域; 3、对于远离横轴的点,要特别注意。
34 157 170
50 54
2.419 -4.618
5 175
64
1.137
678 165 155 170
61 43 59
6.627 -2.883 0.382
(一)我们可以利用图形来分析残差特性,作图时纵坐标为 残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出的图形称为残差图。
探索2:在这些点附近可画直线不止一条,哪条直 线最能代表x与y之间的关系呢?
探究
对于一组具有线性相关关系的数据 (x1, y1), (x2 , y2 ),..., (xn , yn ),
我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:
^
^
a y b x,......(1)
n
n
y ^
编号 1
2
身高 165 165 /cm
体重/kg 48 57
残差 -6.373 2.627
34 157 170
50 54
2.419 -4.618
5 175
64
1.137
678 165 155 170
61 43 59
6.627 -2.883 0.382
(一)我们可以利用图形来分析残差特性,作图时纵坐标为 残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出的图形称为残差图。

人教版高中数学选修1-2《回归分析的基本思想及其初步应用》

人教版高中数学选修1-2《回归分析的基本思想及其初步应用》

ˆ e
x 166.125
n
y 54
R2 1
2 ˆ ( y y ) i 2 ( y y ) i i 1 i 1 n
0.893
学以致用
关于x与y有如下数据: x 2 4 5 6 8
y
30
40
60
50
70
为了对x、y两个变量进行统计分析,现有以下两种 ˆ 6.5x 17.5 , y ˆ 7 x 17 ,试比较哪一个 线性模型: y 模型拟合的效果更好.
甲 乙
0.78
A
ˆ 0.3x 4.4 D. y
2、甲、乙、丙、丁4位同学建立变量x, y的回归模型时,பைடு நூலகம்别选择了4种

0.50

0.85
R2
0.98
哪位同学建立的回归模型的拟合效果最好? A. 甲 B.乙 C.丙 D.丁
A
1 x +1上,则这组样 2
3、在一组样本数据( x1 , y1 ), ( x2 , y2 ), L , ( xn , yn )(n 2, x1 , x2 , L , xn 不全相等)的 散点图中, 若所有样本点( xi , yi )(i 1, 2, L n)都在直线y 本的相关指数为______.
能不能用一次函数模型y=bx+a准确描述身高与 体重的关系?
建构新知
线性回归模型:y=bx+a+e, (其中a和b为模型的未知参数,e称为随机误差) 函数模型:y bx a 二者有什么区别? 回归模型:y bx a e
自变量x x 解释变量 因变量y y 预报变量
随机误差e
问题探究
课堂小结

新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》ppt课件2

新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》ppt课件2

2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系。试求:
(1)线性回归方程 yˆ bˆx aˆ 的回归系数 aˆ、bˆ ;
(2)求残差平方和;
R (3)求相关系数 2;
(4)估计使用年限为10年时,维修费用是多少?
一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解析变量,哪个变量 是预报变量。
线性关系
方案2
产卵数
400
300
200
100


0
-40 -30 -20 -10 0 -100
10 20 30 40
-200
方案2解答
平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a 就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a
温度
21
23
25
27
29
32
35
温度的平方t 441
在统计中,我们也把自变量x称为解析变量,因变 量y为预报变量。
残差
数据点和它在回归直线上相应位置的差异 称为相应于点(xi,yi ) 的残差。
ei =yi
yi
例:编号为6的女大学生,计算随机误差的效应(残差)
61 (0.849165 85.712) 6.627
残差平方和
把每一个n 残差所得的值平方后加起来,用数学符号表





体 重



• 错误数据

• 模型问题
我们可以用相关指数R2来刻画回归的效果,其计算公式是

推荐-高中数学人教A版选修1-2课件1.1 回归分析的基本思想及其初步应用(1)

推荐-高中数学人教A版选修1-2课件1.1 回归分析的基本思想及其初步应用(1)

重难聚焦
1.相关关系与函数关系的区别与联系是什么? 剖析:(1)两者之间的区别. ①相关关系是一种非确定性关系.如人的身高与年龄、商品的销 售额与广告费等都是相关关系.而函数关系中的两个变量是一种 确定性关系.如正方形的面积S与边长x之间的关系S=x2就是函数关 系,即对于边长x的每一个确定的值,面积S都有唯一确定的值与之 对应. ②函数关系是一种因果关系,而相关关系不一定是因果关系. (2)两者之间的联系. 相关关系与函数关系有着密切的联系,在一定条件下可以相互转 化.例如正方形的面积S与其边长x之间虽然是一种确定性关系,但 在每次测量时,由于测量误差等原因,其数值大小又表现出一种随 机性,而对于具有相关关系的两个变量来说,当求得其回归直线方 程后,我们又可以用一种确定的关系对这两个变量间的关系进行 估计.
=
^
������ ������
+ ^������至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点;
^ ^ ^ ^ ������
③直线������
=
������ ������
+ ������的斜率为������
=
������=∑1������������������������ -������������ ������=∑������1���������2��� -������������2
i=1
^5

������
=
������=∑1������������������������-5������ ������=∑51���������2��� -5������2
������
=
620-5×18×7.4 1 660-5×182

人教A版高中选修1-2《1.1回归分析的基本思想及其初步应用》课件

人教A版高中选修1-2《1.1回归分析的基本思想及其初步应用》课件

2 y - y i
n
=1-0=1.
1
2
3
4
5
解析
答案
4.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场, 以降低生产成本 .某白酒酿造企业市场部对该企业 9 月份的产品销量 x(单 位:千箱 ) 与单位成本 y( 单位:元 ) 的资料进行线性回归分析,结果如下:
6 6 7 2 x =2, y =71, xi =79, xiyi=1 481.则销量每增加 1 000 箱,单位成 i=1 i=1
^
a= y -b x =4-2×1.5=1, 故y=2x+1.
^
^
1
2
3
4
5
解答
回归分析的步骤
规律与方法
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系
(如是否存在线性关系等);
(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程 y=bx+a);
^ ^ ^
(4)按一定规则估计回归方程中的参数; (5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残 差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是 否合适等.
本课结束
R2=1-
i=1
2 y - y i
,R2表示 解释 变量对于 预报 变量变
化的贡献率,R2越接近于1,表示回归的效果越好
题型探究
类力x和判断力y进行统计分析,得下表
数据: x y 6 2 8 3 10 5 12 6
(1)请画出上表数据的散点图;
答案
3.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei 1 (i=1,2,…,n),且ei恒为0,则R2为_____.

最新人教版高中数学选修1-2《回归分析的基本思想及其初步应用》教材梳理

最新人教版高中数学选修1-2《回归分析的基本思想及其初步应用》教材梳理

庖丁巧解牛知识·巧学 一、回归分析回归分析是根据变量观测数据分析变量间关系的常用统计分析方法.通常把变量观测数据称为样本.1.散点图与回归方程(1)设对y 及x 做n 次观测得数据(x i ,y i )(i=1,2,…,n).以(x i ,y i )为坐标在平面直角坐标系中描点,所得到的这张图便称之为散点图.其中x 是可观测、可控制的普通变量,常称它为自变量,y 为随机变量,常称其为因变量.知识拓展 散点图是直观判断变量x 与y 是否相关的有效手段. (2)a 与回归系数b 的计算方法若散点呈直线趋势,则认为y 与x 的关系可以用一元回归模型来描述.设线性回归方程为y=a+bx+ε.其中a 、b 为未知参数,ε为随机误差,它是一个分布与x 无关的随机变量.最小二乘估计aˆ和b ˆ是未知参数a 和b 的最好估计. x b y aˆˆ-=,b ˆ=∑∑==---ni ini i ix xy y x x121)())((.深化升华 bˆ的计算还可以用公式b ˆ=∑∑==--ni ini ii x n xyx n yx 1221来计算,这时只需列表求出相关的量代入即可. 2.相关性检验如下图中的两个散点图,很难判断这些点是不是分布在某条直线附近.假如不考虑散点图,按照最小二乘估计计算a 与b ,我们可以根据一组成对数据,求出一个回归直线方程.但它不能反映这组成对数据的变化规律.为了解决上述问题,我们有必要对x 与y 作线性相关性的检验,简称相关性检验.对于变量x 与y 随机抽取到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检验统计量是样本相关系数r.r=∑∑∑∑∑∑======---=----ni i ni i ni ii ni i n i i ni i iy n y x n x yx n yx y y x x y y x x122122112121)()()()())((.r 具有以下性质:当r 大于0时,表明两个变量正相关,当r 小于0时,表明两个变量负相关;|r|≤1;|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.通常当|r|大于0.75时,认为两个变量有很强的线性相关关系.相关性检验临界值如下表所示.相关性检验的临界值表深化升华 相关性检验的步骤也可如下: (1)作统计假设:X 与Y 不具有线性相关关系.(2)根据小概率0.05与n-2在相关性检验的临界值表中查出r 的一个临界值r 0.05. (3)根据样本相关系数计算公式算出r 的值.(4)作出统计推断.如果|r|>r 0.05,表明有95%的把握认为X 与Y 之间具有线性相关关系.如果|r|≤r 0.05,我们没有理由拒绝原来的假设.这时寻找回归直线方程是没有意义的. 3.回归分析的基本概念(1)在数学上,把每个效应(观测值减去总的平均值)的平方和加起来,即用∑=-ni iy y12)(表示总的效应,称为总偏差平方和.(2)数据点和它在回归直线上相应位置的差异(y i -i yˆ)是随机误差的效应,称i e ˆ=(y i -i y ˆ)为残差.(3)分别将残差的值平方后回来,用数学符号表示为∑=-ni i iy y12)(称为残差平方和.它代表了随机误差的效应.(4)总偏差平方和与残差平方和的差称为回归平方和.(5)回归效果的刻画我们可以用相关指数R 2反映.R 2=1-∑∑==--n i ini i iy y yy1212)()ˆ(.显然,R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.4.非线性回归问题 在实际问题中,当变量之间的相关关系不是线性相关关系时,不能用线性回归方程描述它们之间的相关关系,需要进行非线性回归分析,然而非线性回归方程一般很难求,因此把非线性回归化为线性回归应该说是解决问题的好方法.首先,所研究对象的物理背景或散点图可帮助我们选择适当的非线性回归方程yˆ=μ(x;a,b).其中a及b为未知参数,为求参数a及b的估计值,往往可以先通过变量置换,把非线性回归化为线性回归,再利用线性回归的方法确定参数a及b的估计值.问题·探究问题函数关系是一种确定性关系,而对一种非确定性关系——相关关系,我们如何研究?导思:由于相关关系不是一种确定性关系,我们经常运用统计分析的方法,即回归分析,按照画散点图,求回归方程,用回归方程预报等步骤进行.探究:我们可以知道,相关关系中,由部分观测值得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性问题转化成确定性问题来研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预报、资料补充等方面有着广泛的应用,从某种意义上看,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还要使我们对函数关系的认识上升到一种新的高度.典题·热题思路解析:散点图是表示具有相关关系的两个变量的一组数据的图形.解:散点图如下:例2每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压强度(单位:kg/cm2)之间的关系有如下数据:(2)如果y与x之间具有线性相关关系,求回归直线方程.思路解析:求回归直线方程和相关系数,可以用计算器来完成.在有的较专门的计算器中,可通过直接按键得出回归直线方程的系数和相关系数,而如果要用一般的科学计算器进行计算,则要先列出相应的表格,有了表格中的那些相关数据,回归方程中的系数和相关系数就都容易求出了.解:(1)r=)6.721294.64572)(20512518600(6.722051218294322⨯-⨯-⨯⨯-≈0.999>0.75.说明变量y 与x 之间具有显著的线性正相关关系.bˆ=143004347205125186006.72205121829432=⨯-⨯⨯-≈0.304, x b y aˆˆ-==72.6-0.304×205=10.28. 于是所求的线性回归方程为yˆ=0.304x+10.28. 深化升华 为了进行相关性检验,通常将有关数据列成表格,然后借助于计算器算出各个量,为求回归直线方程扫清障碍.若由资料知y 对x 有线性相关关系.试求:(1)线性回归方程yˆ=b ˆx+a ˆ的回归系数a ˆ,b ˆ. (2)使用年限为10年时,估计维修费用是多少?思路解析:因为y 对x 有线性相关关系,所以可以用一元线性相关的方法解决问题.利用公式bˆ=∑∑==--ni i ni ii x n x yx n yx 1221,aˆ=y -b ˆx 来计算回归系数.有时为了方便常列表对应写出x i y i ,x i 2,以利于求和.解:(1)x =4,y =5,∑=ni ix12=90,∑=ni ii yx 1=112.3,于是bˆ=245905453.112⨯-⨯⨯-=1.23,aˆ=y -b ˆx =5-1.23×4=0.08. (2)回归直线方程为yˆ=1.23x+0.08.当x=10年时,y ˆ=1.23×10+0.08=12.38(万元),即估计使用10年的维修费用是12.38万元.方法归纳 知道y 与x 呈线性相关关系,就无需进行相关性检验,否则,应首先进行相关性检验.如果本身两个变量不具有相关关系,或者说,它们之间相关关系不显著,即使求出了回归方程也是毫无意义的,而且估计和预测的量也是不可信的.例4一只红铃虫的产卵数y与x有关,现收集了7组观测数据列于表中,试建立y与x之间思路解析:首先要作出散点图,根据散点图判定y与x之间是否具有线性相关关系,若具有线性相关关系,再求线性回归方程.在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系.根据已有的函数知识,可以发现样本分布在某一指数函数曲线的周围.解:散点图如下所示:由散点图可以看出:这些点分布在某一条指数函数y=pe qx(p,q为待定的参数)的周围.现在,问题变为如何估计待定的参数p和q,我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnp,b=q)周围.这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了.由下图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.经过计算得到线性回归方程为zˆ=0.272x-3.843.因此红铃虫的产卵数对温度的非线性回归方程为yˆ=e0.272x-3.843.方法归纳线性回归问题在解决前可以先画散点图,通过散点图判断是否为线性回归,如果不是线性回归,要先转换为线性回归问题.。

数学选修1-2人教新课标a版1.1回归分析的基本思想及其初步.

数学选修1-2人教新课标a版1.1回归分析的基本思想及其初步.

1.1 回归分析的基本思想及其初步应用问题导学一、求线性回归方程活动与探究1某班5名学生的数学和物理成绩如下表:(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.迁移与应用某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y(1)y与x(方程的斜率保留一位有效数字)(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.(1)求线性回归方程的基本步骤:(2)需特别注意的是,只有在散点图大致呈直线时,求出的线性回归方程才有实际意义,否则求出的回归方程毫无意义.二、线性回归分析活动与探究2(1)(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果; (4)计算R 2,并说明其含义.迁移与应用且知x 与y“相关指数R 2、残差图”在回归分析中的作用:(1)相关指数R 2是用来刻画回归效果的,由R 2=1-∑ni =1(y i -y ^i )2∑n i =1(y i -y )2可知,R 2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报的精度也越高.三、非线性回归分析活动与探究3(1)作出x 与y(2)建立x 与y 的关系,预报回归模型并计算残差; (3)利用所得模型,预报x =40时y 的值.迁移与应用试建立y 关于x非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.答案: 课前·预习导学 【预习导引】1.(1)确定性 非确定性 (2)相关(3)121()()()niii nii x x yy x x ==---∑∑ y -b ^x (x ,y ) (4)随机误差 解释变量 预报变量预习交流1 D2.y i -bx i -a y i -y ^i y i -b ^x i -a ^3.1-∑ni =1(y i -y ^i )2∑ni =1(y i -y )2 预习交流2 提示:散点图可以说明变量间有无线性相关关系,但只能粗略地说明两个变量之间关系的密切程度,而相关指数R 2能精确地描述两个变量之间的密切程度.预习交流3 提示:(1)回归方程只适用于所研究的样本的总体. (2)所建立的回归方程一般都有时间性.(3)样本取值的范围会影响回归方程的适用范围.(4)不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.课堂·合作探究 【问题导学】活动与探究1 思路分析:先画散点图,分析物理与数学成绩是否有线性相关关系,若相关,再利用线性回归模型求解预报变量.解:(1)散点图如图所示.(2)因为x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8,∑5i =1x i y i =88×78+76×65+73×71+66×64+63×61=25 054,∑5i =1x 2i =882+762+732+662+632=27 174.所以b ^=∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=25 054-5×73.2×67.827 174-5×73.22≈0.625,a ^=y -b ^x ≈67.8-0.625×73.2=22.05.所以y 对x 的回归直线方程是y ^=0.625x +22.05.(3)x =96,则y ^=0.625×96+22.05≈82,即可以预测他的物理成绩是82.迁移与应用 解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为y ^=b ^x +a ^, 由题知x =42.5,y =34,则求得b ^=∑4i =1(x i -x )(y i -y )∑4i =1(x i -x )2=-370125≈-3. a ^=y -b ^x =34-(-3)×42.5=161.5.∴y ^=-3x +161.5.(2)依题意有P =(-3x +161.5)(x -30) =-3x 2+251.5x -4 845=-3⎝⎛⎭⎫x -251.562+251.5212-4 845.∴当x =251.56≈42时,P 有最大值,约为426.即预测销售单价为42元时,能获得最大日销售利润.活动与探究2 思路分析:先画出散点图,确定是否具有线性相关关系,求出回归方程,再求出残差,确定模型的拟合效果和R 2的含义.解:(1)作出该运动员训练次数(x )与成绩(y )之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)x =39.25,y =40.875,∑i =18x 2i =12 656,∑i =18y 2i =13 731,∑i =18x i y i =13 180,∴b ^=∑8i =1(x i -x )(y i -y )∑8i =1(x i -x )2=∑i =18x i y i -8x y∑i =18x 2i -8x2≈1.041 5,a ^=y -b ^x =-0.003 875,∴线性回归方程为y ^=1.041 5x -0.003 875.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算得相关指数R 2=0.985 5,说明了该运动员成绩的差异有98.55%是由训练次数引起的.迁移与应用 解:x =15×(14+16+18+20+22)=18,y =15×(12+10+7+5+3)=7.4,∑5i =1x 2i =142+162+182+202+222=1 660, ∑5i =1y 2i =122+102+72+52+32=327, ∑5i =1x i y i =14×12+16×10+18×7+20×5+22×3=620,∴b ^=∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=620-5×18×7.41 660-5×182=-1.15.∴a ^=7.4+1.15×18=28.1,∴y 对x 的回归直线方程为y ^=-1.15x +28.1.∴∑5i =1(y i -y ^i ) 2=0.3,∑i =1(y i -y )2=53.2, R 2=1-∑5i =1(y i -y ^)2∑5i =1(y i -y )2≈0.994. ∴R 2≈0.994,拟合效果较好.活动与探究3 思路分析:先由数值表作出散点图,然后根据散点的形状模拟出近似函数,进而转化为线性函数,由数值表求出回归函数.解:(1)作出散点图如图所示,从散点图中可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y =c 1e c 2x 的周围,其中c 1,c 2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z =ln y ,则变换后的样本点应分布在直线z =bx +a ,a =ln c 1,b =c 2的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程了,数据可以转化为:求得回归直线方程为z =0.272x -3.849,∴y ^=e 0.272x -3.849.迁移与应用 解:画出散点图如图所示.根据散点图可知y 与x 近似地呈反比例函数关系,设y =k x ,令t =1x ,则y =kt ,原数据变为:由散点图可以看出y 与t 呈近似的线性相关关系.列表如下:所以t =1.55,y =7.2.所以b ^=∑5i =1t i y i -5t y∑5i =1t 2i -5t 2≈4.134 4.a ^=y -b ^t ≈0.8, 所以y ^=4.134 4t +0.8.所以y 关于x 的回归方程是y ^=4.134 4x +0.8. 当堂检测1.有下列说法:①线性回归分析就是由样本点去寻找一条直线,使它贴近这些样本点的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过回归方程=+y b ax 及其回归系数b,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验. 其中正确说法的个数是( ).A .1B .2C .3D .4答案:C 解析:①反映的正是最小二乘法思想,故正确. ②反映的是画散点图的作用,也正确.③反映的是回归模型y =bx +a +e ,其中e 为随机误差,故也正确.④是不正确的,在求回归方程之前必须进行相关性检验,以确定两变量的关系.2.在两个变量y 与x 的回归模型中,分别选择了4个不同的模型.它们的相关指数R 2如下,其中拟合效果最好的模型是( ).A .模型1的相关指数R 2为0.98B .模型2的相关指数R 2为0.80C .模型3的相关指数R 2为0.50D .模型4的相关指数R 2为0.25答案:A 解析:相关指数R 2越接近于1,则该模型的拟合效果就越好,精度越高. 3.设有一个回归方程y=2-1.5x ,则变量x 增加1个单位时,( ).A .y 平均增加1.5个单位B .y 平均增加2个单位C .y 平均减少1.5个单位D .y 平均减少2个单位答案:C 解析:∵b=-1.5<0,∴x 增加1个单位时,y 平均减少1.5个单位.4.若施肥量x (kg)与小麦产量y (kg)之间的回归直线方程为y=250+4x ,当施肥量为50 kg时,预计小麦产量为________.答案:450 kg 解析:将x =50代入回归方程得y=450 kg .5.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么1021()ii yy =-∑的值为__________.答案:2 410.6 解析:依题意有0.95=1-1021120.53()ii y y =-∑,所以1021()ii y y =-∑=2 410.6.。

1.1_回归分析的基本思想及其初步应用_教案(人教A版选修1-2)

1.1_回归分析的基本思想及其初步应用_教案(人教A版选修1-2)

统计案例明菜缶方A F 车读疵灵法”(教师用书独具)析,明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用 问题.了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的思器求线性回归直线方程参数及相关系数的方法.2.过程与方法通过收集数据作散点图,分析散点图,求回归直线方程,分析回归效果,利 用方程进行预报.3.情感、态度与价值观培养学生利用整体的观点和互相联系的观点来分析问题, 的应用意识,培养学生学好数学、用好数学的信心,加强与现实生活的联系,以 科学的态度评价两个变量的相互关系.•重点难点重点:回归分析的基本方法、随机误差 e 的认识、残差图的概念、用残差及R 2来刻画线性回归模型的拟合效果.难点:回归分析的基本方法、残差概念的理解及拟合效果的判定、非线性回新课标数学选修1— 2•三维目标1 .知识与技能通过典型案例的探究, 了解回归分析的基本思想,会对两个变量进行回归分 1. 1回归分析的基本思想及其初步应用想,了解判断刻画模型拟合效果的方法相关指数和残差分析.掌握利用计算进一步加强数学归向线性回归的转化.教学时要以残差分析为重点,突出残差表和 R 2的计算,通过举例说明相关关系与确定性关系的区别,说明回归分析的必要性及其方法.借助例题使学生掌 握作散点图、求回归直线方程的方法,通过作残差图、计算 R 2让学生掌握拟合效果的判断方法.对于非线性回归问题重点在如何转换,引导学生分析总结转化 方法和技巧,从而化解难点.(教师用书独具)•教学建议本节课建议教师采取探究式教学,把“关注知识”转向“关注学生”, 在教 学过程中,把“给出知识”的过程转变为“引起活动, 把“完成教学任务”转向“促进学生发展”, 在知识形成过程的探索,例题的解答也要由学生探讨、教师点拨,共同完成.要 注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等, 引导学生体验数学中的理性精神,加强数学形式下的思考和推理能力.•教学流程创设问题情境,引出问题,弓I 导学生探讨,从而引出回归分析、 型、刻画回归效果的有关概念及解决方法.利用填一填的形式,习本节基础知识,并反馈了解,对理解有困难的概念加以讲解.习基础知识的基础上分析回答例题1的问题,并总结规律方法,完成变式训练. 引导学生分析例题2,根据图中的数据计算系数,求出回归方程,列出残差表, 求出R 2并判断拟合效果,完成变式训练.敖歩方案设th授方珞沫程细隣冋F 數祺"让学生探究知识的过程”,让学生成为课堂上的真正主人.在 教学中,知识点可由学生通过探索“发现”, 让学生充分经历探索与发现的过程, 并引导学生积极解决探索过程中发现的问题.教学中不要以练习为主,而是定位线性回归模 使学生自主学 引导学生在学完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正. 归纳整理,进行课堂小结,整体认识本节所学知识,强调重点内容和规律方法.老师启发引导,完成例题3,并要求学生借鉴例题3的解法完成变式训练. 引 导学生分析例题3,让学生作出散点图,观察相关性,引出问题,即如何使问题 转化为相关关系并用线性回归分析二者关系.1•会用散点图分析两个变量是否存在相关关系.(重点)2.会求回归方程,掌握建立回归模型的步骤,会选择回归模型.(重点、难点)【问题导思】台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:1.在平面直角坐标系中作出散点图.【提示】yIQS'0 » 10 12 14 16 R2.从散点图中判断x 和y 之间是否具有相关关系?【提示】 有.3.若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数?【提示】 可以.根据散点图作出一条直线,求出直线方程后可预测.通过课标解读(1) 回归直线方程:y= bx+a,其中:n _ ___Z (X i- 7 则—丁)八八___ 八____ _ 1 nb= , a= y —b x , x = -S x i,n一 2 n iTZ (X i—x)1 = 1—1J y二n p i.(2) 变量样本点中心:(X , y ),回归直线过样本点的中心.(3)线性回归模型:y= bx+a+e,其中e称为随机误差,a和b是模型的未知参数,自变量x 称为解释变量,因变量y称为预报变量.ny 2Z (y i —yi )1=1 R 2= 1— ,R 2表示解释变量对预报变量变化的贡献率,n— —2 三(y i — y )i = 1R 2越接近于1,表示回归的效果越好卜例n 有下列说法:①线性回归分析就是由样本点去寻找一条直线, 使之贴近这些样本点的数学 方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系 表示;③通过回归方程y =bx +a ,可以估计和观测变量的取值和变化趋势;④因 为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检 验.其中正确命题的个数是()C . 3①反映的正是最小二乘法思想, 故正确.②反映的是画散点 ③解释的是回归方程y = bx +a 的作用,故也正确.④是不正 确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.【答案】 CI 规律方法I1.解答例1中④时,必须明确具有线性相关关系的两个变量间才能求得一个线性回归方程,否则求得的方程无实际意义.因此必须先进行线性相关性判断,相关指 数R 2靜宅互动探究硕冠:幸 3讳主互动 A "知能"IlS :^【思路探究】可借助于线性相关概念及性质逐一作出判断.【自主解答】 图的作用,也正确.后求线性回归方程.2.回归分析的过程:(1) 随机抽取样本,确定数据,形成样本点;(2) 由样本点形成散点图,判断是否具有线性相关关系; (3) 由最小二乘法确定线性回归方程; (4)由回归方程观察变量的取值及变化趋势.» 亜貳 illl 11关于变量y 与x 之间的回归直线方程叙述正确的是()表示y 与x 之间的一种确定性关系表示y 与x 之间的相关关系 表示y 与x 之间的最真实的关系回归直线方程能最大可能地反映 y 与x 之间的真实关系,故选项D 正确.【答案】►例0已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:求y 关于x 的回归直线方程,并说明回归模型拟合效果的好坏. 【思路探究】回归模型拟合效果的好坏可以通过计算 R 2来判断,其值越大,说明模型的拟合效果越好.—1【自主解答】 x = 5(14 + 16+18+20 + 22)= 18, y = 5(12 + 10+7+5+ 3)= 7.4,B .C .D . 表示y 与x 之间真实关系的一种效果最好的拟合【解析】5Z x i 2— 142+ 162+ 182 + 202 + 222 — 1 660,i — 15Z x i y i = 14X 12+ 16X 10+ 18X 7 + 20X 5 + 22X 3 = 620,丄15 _ _S x i y i — 5 X yAi — 1620— 5X 18X 7.4 所以b —V 2 口一2 Z x i — 5 Xi — 1Aa = 7.4 + 1.15X 18 = 28.1,21 660- 5X 18所以所求回归直线方程是Ay =— 1.15X + 28.1列出残差表: 5所以送i — 1TA 2Z (y i —yi )i — 12R — 1— ----------- ~ 0.994,5 —送(y i - y )2i — 1所以回归模型的拟合效果很好.I 规律方法IA A1.回归直线方程能定量地之间的变化趋势,其中b 表示X 变化一个单位时,y 的平均变化量.利用回归直A5A -- 2(y i — y i ) — 0.3,送(y i — y) — 53.2,i = 1线可以对问题进行预测,由一个变量的变化去推测另一个变量的变化.2. 线性回归分析中:(1) 残差平方和越小,预报精确度越高.(2) 相关指数R 2取值越大,说明模型的拟合效果越好.卜娈貳illl 11某运动员训练次数与运动成绩之间的数据关系如下:⑴作出散点图;(2) 求出线性回归方程;(3) 作出残差图,并说明模型的拟合效果;⑷计算R 2,并说明其含义.【解】 ⑴作出该运动员训练次数(X )与成绩(y)之间的散点图,如图所示.— — 8 2(2) 可求得 X = 39.25, y = 40.875,艺x i = 12 656,i — 18 8Z y i 2= 13 731, S X i y i = 13 180, i = 1i = 18 _ _Z X i y i — 8 X yi — 1------------- 〜1.041 5,88 _ _送(X i — X l y i — y )i — 1Ab — -------------------------8 —艺(X i - X 2i — 1Y6050 40 30 20 ]020 40P 2 C一2Z X i —8 Xi — 1A ---- A ----a—y —b X ——0.003 875,A•••线性回归方程为y—1.041 5X— 0.003 875.(3) 作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4) 相关指数R9 10—0.985 5.说明了该运动员的成绩的差异有98.55%的可能性是由训练次数引起的.卜例「下表为收集到的一组数据:(1)作出X与y的散点图,并猜测与之间的关系;9 建立X与y的关系,预报回归模型并计算残差;10 利用所得模型,预报x= 40时y的值.【思路探究】(1)画出散点图或进行相关性检验,确定两变量X、y是否线性相关.由散点图得X、y之间的回归模型.(2)进行拟合,预报回归模型,求回归方程.【自主解答】⑴作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y= C1ec2x的周围,其中C1、C2为待定的参数.r350ion250200J501005020 23 34 26 2S 30 取34 36 *(2)对两边取对数把指数关系变为线性关系,令z= In y,则有变换后的样本点应分布在直线z= bx+ a, a= In c i, b= C2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z 1.946 2.398 3.045 3.178 4.190 4.745 5.784A求得回归直线方程为z= 0.272x—3.849,Z0.272X —3.849••y= e —残差如下表:y i711212466115325z6.44311.10119.12532.95056.770128.381290.325y iz e0.557—0.101 1.875—8.9509.23—13.38134.675 z rr-u 0.272x— 3.849 . zcz⑶当x=40 时,y= e " 1 131.I规律方法I两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y = C1ec2X,我们可以通过对数变换把指数关系变为线性关系,令z= In y,则变换后样本点应该分布在直线z =bx+ a(a= In c i, b = C2)的周围.卜亜貳illl 11根据表中数据,建立与之间的回归方程.【解】由表中测得的数据可以作出散点图,如图.150 .50 . *° 5 10 15 h观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q= m h n(m, n是正的常数).两边取常用对数, 则Ig Q= Ig m+ n Ig h.令y= Ig Q, x= Ig h,那么y= nx+ Ig m,即为线性函数模型y= bx+ a的形式(其中b= n, a= Ig m).由下面的数据表,用最小二乘法可求得b~2.509 7, a = —0.707 7,所以于是所求得的回归方程为Q = 0.196 h'没有理解相关指数R2的意义而致误卜典例关于x与y有如下数据:为了对X、y两个变量进行统计分析,现有以下两种线性模型:甲模型y= 6.5x+ 17.5,乙模型y= 7x+17,试比较哪一个模型拟合的效果更好.V y 2送(y i —yi)i _ 1c _ 155【错解】'•R1 _ 1 —_ 1 —彳CM_ 0.845.5 I 000——2送(y i—y )i _ 1V y 2Z (y i —yi)i_ 12 - ____________________ 180R2_ 1 — - _ 1—1 000_ O.82.P — 2Z (y i—y )i _ 1又••84.5%>82%,二乙选用的模型拟合的效果更好.【错因分析】没有理解R2的意义是致错的根源,用相关指数R2来比较模型的拟合效果,R2越大,模型的拟合效果越好,并不是R2越小拟合效果更好.V y 2 乞(y i—yi)i = 1【防范措施】R2= 1 —--------------- ,R2越大,残差平方和越小,从而回归n —艺(y i- y fi_ 1模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R 2越接近1表示回归的效果越好(因为R 2越接近1,表示解释变量 和预报变量的线性相关性越强).从根本上理解R 2的意义和作用,就可防止此类 错误的出现.Vy 2艺(y i — yi )i =19155R 1= 1—= 1 — 1 000= O.845,P —2 S (y i — y )i - 1(y i - y i )2J 1805= 1-1 000= 0.82,P — 2无(y i — y )i = 184. 5%>82%,所以甲模型拟合效果更好.1.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据•然后,可以通过残差e i , e 2,-【正解】R 2= 1-e n来判断模型拟合的效果,判断原始数据中是否存在可疑数据. 这方面的分析工作称为残差分析.2.我们还可以用相关指数R2来反映回归的效果,其计算公式是:R2= 1-认-y i)nP — 2送(y i—y )i =1显然,R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率.1 .已知x和y之间的一组数据则y与x的线性回归方程y=bx+ a必过点(A • (2,2)3 B. (3, 0)C. (1,2)3 D.(2, 4)【解析】匚=和 + 1 + 2 + 3) = 3, 7 = 4(1 + 3+ 5+ 7) = 4,二回归方^=bx+a必过点(2,4).【答案】D2. (2013青岛高二检测)在下列各组量中:①正方体的体积与棱长; ②一块农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收入; ⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关系的是()A .①②B .②④C .③④)D .②③④【解析】①是函数关系V= a3;⑤电价是统一规定的,与用电量有一定的关系,但这种关系是确定的关系.②③④中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定;人的身高一开始随着年龄的增加而增大,之后则不变化或降低,在身高增大时,也不是均匀增大的;家庭的支出与收入有一定的关系,在一开始,会随着收入的增加而支出也增加,而当收入增大到一定的值后,家庭支出趋向于一个常数值,也不是确定关系.【答案】D3. 下列命题正确的有①在线性回归模型中,e是bx+ a预报真实值y的随机误差,它是一个可观测的量;②残差平方和越小的模型,拟合的效果越好;③用R4 5来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.【解析】对于①随机误差e是一个不可观测的量,③R2越趋于1,拟合效果越好,故①③错误.对于②残差平方和越小,拟合效果越好,同理当残差点比较均匀地落在水平的带状区域时,拟合效果越好,故②④正确.【答案】②④4. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:4 请画出上表数据的散点图;5 请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3) 已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测技改后生产100吨甲产品比技改前少消耗多少吨标准煤.(参考数值:3X 2.5 + 4X 3+ 5X 4+ 6X 4.5= 66.5)【解】(1)如下图.5 4324(2) S x i y i = 3X 2.5 + 4X 3+ 5X 4+ 6X 4.5= 66.5,i - 1— 3+4+5+ 6 — 2.5 + 3+4 + 4.5X = 4= 4.5, y = A= 3.5,4Z x 2= 32 + 42+52+ 62 = 86.i — 1y66.5— 4X 4.5X 3.5 66.5 — 63---------- ;—— — 0.7,b —86 —81 y — y —a — y —b X — 3.5— 0.7X 4.5— 0.35,因此,所求的线性回归方程为y = 0.7X + 0.35.(3)根据回归方程预测,现在生产 100吨产品消耗的标准煤的数量为 0.7X 100+ 0.35 = 70.35(吨),故耗能减少了 90 — 70.35 = 佃.65(吨标准).、选择题1 .在画两个变量的散点图时,下面叙述正确的是 ( )A .预报变量在x 轴上,解释变量在y 轴上286— 4X 4.52 課方知能检测,爭■卜-期自r 半呷;眞-农朋"B .解释变量在X 轴上,预报变量在y 轴上C .可以选择两个变量中任意一个变量在 X 轴上D .可以选择两个变量中任意一个变量在 y 轴上 【解析】 结合线性回归模型y = bx +a + e 可知,解释变量在x 轴上,预报 变量在y 轴上,故选B. 【答案】 B 2. (2013泰安高二检测)在回归分析中,相关指数R 2的值越大,说明残差平 方和()A •越大B .越小C .可能大也可能小D .以上均错nz i = 1【解析】 ••R 2= 1 — ----------- ,二当R 2越大时,V一 2壬(y i — y )i _ 1A 2(y— yi ) nA 2Z (y i —y i )2越小,即残差平方和越小.i —1【答案】 B 3•设变量y 对X 的线性回归方程为 “2 — 2.5X ,则变量x 每增加一个单位时, y 平均( )A .增加2.5个单位B .增加2个单位C .减少2.5个单位D .减少2个单位 【解析】 回归直线的斜率b = — 2.5,表示X 每增加一个单位,y 平均减少 2.5个单位. 【答案】 C4. (2012湖南高考)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(X , y i )(i = 1,2,…,n ),用最小二乘法建立【答案】 二、填空题6. 在研究身高和体重的关系时,求得相关指数 R 2-“身高解释了 64%的体重变化,而随机误差贡献了剩余的 36%”,所以身高对体重的效应比随机误差的效应大得多.的回归方程为y = 0.85X -85.71,贝U 下列结论中不正确 的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(X , y ) C. 若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg D. 若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 【解析】 由于线性回归方程中X 的系数为0.85,因此y 与X 具有正的线性 相关关系,故A 正确.又线性回归方程必过样本中心点(X , y ),因此B 正确.由 线性回归方程中系数的意义知,X 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值, 因此D 不正确. 【答案】 D 5.在判断两个变量y 与X 是否相关时,选择了 4个不同的模型,它们的相 关指数R 2分别为:模型1的相关指数R 2为0.98,模型2的相关指数R 2为0.80, 模型3的相关指数R 2为0.50,模型4的相关指数R 2为0.25.其中拟合效果最好的 A .模型1 B .模型2 C .模型3D .模型4【解析】相关指数R 2能够刻画用回归模型拟合数据的效果,相关指数R 2的值越接近于 1,说明回归模型拟合数据的效果越好.,可以叙述为Vy 2 送(y i — yi )i = 1结合相关指数的计算公式 R 2= 1 — 可知,当R 2= 0.64V一 2艺(y i — y )i _ 17. 调查了某地若干户家庭的年收入 x (单位:万元)和年饮食支出y (单位:万 元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y = 0.254X + 0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 _____________ 元.rA A【解析】 以 X + 1 代 X ,得y = 0.254(x + 1)+ 0.321,与y = 0.254x + 0.321 相 减可得,年饮食支出平均增加 0.254万元.【答案】 0.254&已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),A可得 y — 5= 1.23(x — 4),A即 y = 1.23x + 0.08. 【答案】 y _ 1.23x + 0.08 三、解答题9•某省2013年的阅卷现场有一位质检老师随机抽取 5名学生的总成绩和数学成绩(单位:分)如下表所示:(1) 作出散点图;【解析】时,身高解释了64%的体重变化.【答案】 0.64(2) 对x与y作回归分析;(3) 求数学成绩y对总成绩x的回归直线方程;(4) 如果一个学生的总成绩为500分,试预测这个学生的数学成绩. 【解】(1)散点图如图所示:珥-帥70 -60 -504030 -20 -10%恥0 3H0 4(W 420 440 4肿—2 012 —339 2 2(2) X = ~5~,y—5 ,刀i= 1xi—819 794,5 5刀尸1y2= 23 167,刀i=1x i y i = 137 760.•T =错误!错误!)=错误!〜0.989.因此可以认为y与x有很强的线性相关关系.5 ——y刀尸严一5 x y(3) ----------------------------- 回归系数b=—5 = 0.132 452,刀=1x i —5 xA ----------- A ------------a= y —bx = 14.501 315.AT回归方程为丫= 0.132 452( + 14.501 315.⑷当x= 500时,y〜81.即当一个学生的总成绩为500分时,他的数学成绩约为81分.10. (2012福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:__ ________(1) 求回归直线方程y= bx+a,其中b= —20,a= y —b x ;(2)预计在今后的销售中,销量与单价仍然服从⑴中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入—成本)—1【解】⑴由于x = 6(8 + 8.2 + 8.4 + 8.6 + 8.8 + 9) = 8.5, y = 6(90+84+83+80+75 + 68) = 80,又b= —20,--------- --------- ■ , A所以a= y —b x = 80+ 20x 8.5 = 250,从而回归直线方程为y= —20x+ 250.(2)设工厂获得的利润为L元,依题意得L = x(- 20x + 250) —4(-20x+ 250)2=—20x2+ 330x—1 0002=—20(x—8.25) + 361.25.当且仅当x= 8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.11.在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:作出散点图,并判断与是否线性相关.若线性相关,求线性回归方程;R 2~ 0.941,表明年龄解释了 94.1%的脂肪含量变化.⑶当x = 37时,y = 0.576X 37 — 0.448~ 20.9,故37岁时人的脂肪含量约为 20.9%.(教师用书独具)(2) 求相关指数R 2,并说明其含义; (3) 给出37岁时人的脂肪含量的预测值.【解】(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关 系.脂肪含朮丿IJ5 I 马 O 20 40 6080A A A设线性回归方程为y = bx + a ,AA则由计算器算得b ~0.576, a ~ = — 0.448, 所以线性回归方程为y = 0.576X — 0.448.⑵残差平方和:14 Z i = 1y 2 14 y 2e i = 2 (y i — y i ) e 37.78.i =1总偏差平方和:14£ (y i — y)丄12宀R 2=〜 R— ' 644.990.941.敖呻备限资源昼拓啟 W 捕施畝阳;0视曹”为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:⑴作出散点图并求回归方程;2(2)求出R ; (3)进行残差分析.【思路探究】(1)由表作出散点图,求出系数值,即可写出回归方程.(2) 列出残差表,计算R 2,由R 2的值判断拟合效果.⑶由⑵中残差表中数值,进行回归分析. 【自主解答】 (1)散点图如图.x = 6(5+ 10+15+20+25+ 30)= 17.5,y = 11(7.25+ 8.12+ 8.95+ 9.90+ 10.9+ 11.8)〜9.487,6Z x i y i = 1 076.2.i - 1A计算得,b ~0.183, a ~6.285,A所求线性回归方程为y = 6.285+ 0.183X.-4 20 8 4 2u TJ ]6Z x i 2= 2 275, i _ 1⑵列表如下:所以 Z (y — y i )2-0.013 18, Z (y — V)2= 14.678 4.i _ 1i _ 1m, 0.013 18 c ccc所以,R = 1 —14.678 4^0.999 1,归模型;由表中数据可以看出残差点比较均匀地落在不超过 0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高, 由以上分析可知,弹簧长度 与拉力成线性关系.I 规律方法I建立回归模型的基本步骤:(1)确定解释变量和预报变量;(2)画散点图,观察是否存在线性相关关系; (3)确定回归方程的类型,女口 y = bx + a ; (4)按最小二乘法估计回归方程中的参数;(5) 得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适.假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有关的统计 资料如下表所示.回归模型的拟合效果较好.(3)由残差表中的数值可以看出第 3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误, 如果有的话,需要纠正数据,重新建立回A A A 一 A A(1) 线性回归方程y = bx +a 的回归系数a 、b ;(2) 求相关指数R 2;(3) 估计使用年限为10年时,维修费用是多少?【解】 ⑴由已知数据制成下表.由此可得x = 4, y = 5,5——送(X i — x j(yi — y )i = 1Ab = ------------------- = 1.23,5—Z (X i - x 2i _ 1A ---- A ----a = y —b x = 5 — 1.23X 4= 0.08, A•'讨=1.23x + 0.08.5A 2送(y i —y i)i = 12(2)R = 1— ------------5_艺(y i - y 2i = 1=1—1578"0.958 7.A A(3)回归直线方程为 y = 1.23x + 0.08,当 x = 10(年)时,y = 1.23X 10 + 0.08=若由资料知y 对呈线性相关关系.试求<:12.38(万元),即估计使用10年时维修费用是12.38万元.少年智则国智,少年富则国富,少年强则国强,少年独立则国独立,少年自由则国自由,少年进步则国进步,少年胜于欧洲,则国胜于欧洲,少年雄于地球,则国雄于地球。

高中数学选修1-2《回归分析的基本思想及其初步应用》教案

高中数学选修1-2《回归分析的基本思想及其初步应用》教案

高中数学选修1-2《回归分析的基本思想及其初步应用》教案教学目标:1.了解回归分析的基本概念和方法,学会使用回归分析方法对一些实际问题作出预测和分析。

2.能够正确理解和使用回归分析的基本统计量,包括相关系数、判定系数和残差等。

3.能够理解和描述回归分析的假设条件和前提条件,掌握回归分析的模型建立过程,并能正确应用到实际问题中。

教学重点:1.回归分析的基本概念和方法。

2.回归分析的统计量及其含义。

3.回归分析的模型建立过程。

教学难点:1.应用回归分析方法对实际问题进行预测和分析。

2.掌握回归分析模型的建立方法。

教学方法:1.讲授法2.实例分析法3.互动式教学法教学内容:第一节回归分析的基本概念和方法1.回归分析的概念和意义。

2.回归分析的基本模型和方程式。

3.单变量和多变量回归分析的区别和应用。

4.回归分析的基本假设条件和前提条件。

第二节回归分析的统计量及其含义1.相关系数的概念和计算方法。

2.判定系数的定义和计算方法。

3.残差的概念和含义。

4.其他相关统计量的应用。

第三节回归分析的模型建立过程1.数据的收集和清理。

2.变量的筛选和筛选标准。

3.模型的构建和检验。

4.模型的应用和预测。

教学方式:1.讲授。

通过讲解回归分析的概念、方法、统计量和模型建立过程等内容,让学生了解回归分析的基本概念和方法,为后续的案例分析打下基础。

2.案例分析。

通过实例分析法,将回归分析的理论知识与实际问题相结合,并引导学生从实际问题中理解和掌握回归分析的方法和应用。

3.互动式教学。

引导学生在互动交流中,理解和掌握回归分析的基本概念和方法,加深对回归分析的理解和认识。

教学评估:教师根据学生在课堂上的表现和课下的练习情况,对学生进行综合评价。

主要考核内容包括:学生对回归分析的概念和方法的理解程度、学生对回归分析应用的掌握情况、学生对回归分析的模型建立和检验能力、学生的综合分析和判断能力等。

据此评价学生的成绩,并作出相应的教学反思和改进。

人教版A版高中数学选修1-2:1.1回归分析的基本思想及其初步应用第3课时(平行班)

人教版A版高中数学选修1-2:1.1回归分析的基本思想及其初步应用第3课时(平行班)

tt== xx 22 tttiiiy22i ti yi
441 529 625 729 841 1024 1225 5414
194481 279841 390625 531441 707281 1048576 1500625 4652870 3087 5819 13125 17496 55506 117760 398125 610918
27
29
32
35 192
产产卵卵数数yy //个个 77
1111
2211
2244
6666
111155 332255 556699
yˆ e yy 关关于于xx 的的指指数数回回归归方方程程 yˆ e 00..227722 xx33..884433
xx 2277..442299
yyˆˆii
3. 从散点图发现 变换后的样本 点分布在一条 直线附近,即 线性关系,可 用线性回归方 程来拟合。
回归分析的基本思想及其初步应用
编编号号
11
22
温温度度x/x°/°CC 2211
2233
产卵卵数数yy/个/个 77
111 1
zz==lnlnyy xxi2i 2 xxiizzi i
1.946 441 40.9
回归分析的基本思想及其初步应用
1度. 根不据由是样观产性外函数察卵关,数图线本散数系还关据看性点y点吗学系与作出相分图?过?温出,除哪产关布度红线些散卵,x在具铃性常点数有一虫关见图线的系的与条模怎化:温曲型样为求线产1223350505卵y?性00000数拟=y用合通/个c怎模合1两,过e样型c的种哪什说2转?x效模一么明产卵果型个数?数与更去模据温度好的拟型来关?系 100
线上,这条曲线可能是指 50

人教版A版高中数学选修1-2:1.1回归分析的基本思想及其初步应用第1课时(特色班)

人教版A版高中数学选修1-2:1.1回归分析的基本思想及其初步应用第1课时(特色班)
件中有一些含有缺点,每小时生产有缺点物件的多 少随机器运转速度而变化,用x表示运转的速(单 位:转/秒),用y表示每小时生产的有缺点物件的 个数,现观测得到(x,y)的4组值为(8,5), (12,8),(14,9),(16,11),若实际生产 中所容许的每小时最大有缺点物件数为10,则机器 的速度不得超过多少转每秒(精确到1)
回归分析的基本思想及其初步应用
小结:
1. 熟练掌握求线性回归方程的步骤;
⑴画出两个变量的散点图;
⑵判断是否线性相关;
⑶求回归直线方程(利用最小二乘法);
⑷并用回归直线方程进行预报。
2. 理解线性回归模型与一次函数的不同;
一次函数模型是线性回归模型的特殊形式,线性回归模 型是一次函数模型的一般形式.
(2)由图看出身高和体重线 60 55 性相关,求线性回归方程。 50
y = bx + a (3)用线性回归模型表示
45
40
150
155
160
165
170
175
180
y = bx + a + e
(b、a为模型的未知参数,e称为随机误差)
回归分析的基本思想及其初步应用
2. 用最小二乘法计算线性回归方程。 (1)最小二乘法定义:
求使 [ y1 - (a+bx1)]2 + [ y2 - (a+bx2)]2 + … + [ yn - (a+bxn)]2达到最小值的直线 y = bx + a,
求这一直线的方法称为最小二乘法。
回归分析的基本思想及其初步应用
编号
1
2
3
4
5
6
7
8

2018-2019学年人教A版 选修1-2 1.1 回归分析的基本思想及其初步应用(一) 教案

2018-2019学年人教A版 选修1-2  1.1 回归分析的基本思想及其初步应用(一) 教案

[核心必知]1.预习教材,问题导入根据以下提纲,预习教材P 2~P 8的内容,回答下列问题.(1)在数学《必修3》中,我们利用回归分析的方法对两个具有线性相关关系的变量进行了研究,其步骤是什么?所求出的线性回归方程是什么?提示:步骤为:画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报.线性回归方程为^y =^b x +^a .(2)所有的两个相关变量都可以求回归方程吗? 提示:不一定. 2.归纳总结,核心必记 (1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)回归直线方程方程^y =^b x +^a是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中^a ,^b是待定参数,其最小二乘估计分别为:,x其中-x =n 1x n i ,-y =n 1y n i ,(-x ,-y)称为样本点的中心. (3)线性回归模型线性回归模型用y =bx +a +e 来表示,其中a 和b 为模型的未知参数,e 称为随机误差. (4)刻画回归效果的方式(1)通过教材P 2中的例1计算出的回归方程^y=0.849x -85.712可以预报身高为172 cm 的女大学生的体重为60.316 kg.请问,身高为172 cm 的女大学生的体重一定是60.316 kg 吗?为什么?提示:不一定.从散点图可以看出,样本点散布在一条直线的附近,而不是在一条直线上,所以不能用一次函数y =bx +a 表示.(2)下列说法正确的有哪些?①在线性回归模型中,e 是bx +a 预报真实值y 的随机误差,它是一个可观测的量;②残差平方和越小的模型,拟合的效果越好;③用R 2来刻画回归效果,R 2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.提示:e 是一个不可观测的量,故①不正确;R 2越小,残差平方和越大,即模型的拟合效果越差,故③不正确;②④是正确的.[课前反思](1)回归分析的定义是什么?如何求回归直线方程?(2)线性回归模型是什么?(3)残差、残差图的定义是什么?如何作残差图?(4)残差平方和和相关指数R 2的定义是什么?它们与回归效果有什么关系?[思考] 求线性回归方程的步骤是什么? 名师指津:(1)列表表示x i ,y i ,x i y i ,x i 2; (2)计算,,x n i 2,x ni y i ; (3)代入公式计算^a ,^b的值; (4)写出线性回归方程. 讲一讲1.(链接教材P 2-例1)某种产品的广告费用支出x 与销售额y (单位:百万元)之间有如下的对应数据:(1)画出散点图; (2)求线性回归方程;(3)试预测广告费用支出为10百万元时的销售额. [尝试解答] (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:所以,=525=5,=5=50,x i =145, x 5i y i =1 380. 于是可得^b =22=145-5×521 380-5×5×50=6.5, ^a =-y -^b -x=50-6.5×5=17.5.所以所求的线性回归方程为^y=6.5x +17.5.(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时, ^y=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.(1)求线性回归方程前必须判断两个变量是否线性相关,如果两个变量本身不具备相关关系,或者它们之间的相关关系不显著,那么即使求出回归方程也是毫无意义的.(2)写出回归直线方程^y =^b x +^a,并用回归直线方程进行预测说明:当x 取x 0时,由线性回归方程可得^y0的值,从而可进行相应的判断.练一练1.某班5名学生的数学和物理成绩如下表:(1)(2)求物理成绩y 对数学成绩x 的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. 解:(1)如图所示.(2)因为=51×(88+76+73+66+63)=73.2, =51×(78+65+71+64+61)=67.8,x 5i y i =88×78+76×65+73×71+66×64+63×61 =25 054,x 5i 2=882+762+732+662+632=27 174. 所以^b =22=27 174-5×73.2225 054-5×73.2×67.8≈0.625,^a =-^b -x≈67.8-0.625×73.2=22.05. 故y 对x 的回归直线方程是^y=0.625x +22.05. (3)x =96,则^y=0.625×96+22.05≈82, 即可以预测他的物理成绩是82.[思考] 如何用残差图、残差平方和、相关指数R 2分析拟合效果?名师指津:残差图的带状区域的宽度越窄,模型拟合精度越高;残差平方和越小,模型拟合效果越好;R 2越接近于1,模型拟合效果越好.讲一讲2.假定小麦基本苗数x 与成熟期有效穗y 之间存在相关关系,今测得5组数据如下:(1)以x (2)求y 与x 之间的回归方程,对于基本苗数56.7预报有效穗; (3)计算各组残差,并计算残差平方和;(4)求R 2,并说明残差变量对有效穗的影响占百分之几? [尝试解答] (1)散点图如下.(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.设回归方程为^y =^b x +^a.=30.36,=43.5, x 5i 2=5 101.56,y 5i 2=9 511.43. -x -y=1 320.66,2=921.729 6, x 5i y i =6 746.76.则^b =22≈0.29,^a =-^b≈34.70.故所求的回归直线方程为^y=0.29x +34.70. 当x =56.7时,^y=0.29×56.7+34.70=51.143. 估计成熟期有效穗为51.143.(3)由于^y i =^b x i +^a ,可以算得^e i =y i -^y i 分别为^e 1=0.35,^e 2=0.718,^e 3=-0.5,^e4=-2.214,^e 5=1.624,残差平方和: 5^e i 2≈8.43.(4) 5(y i -)2=50.18, 故R 2=1-50.188.43≈0.832.所以解释变量小麦基本苗数对总效应约贡献了83.2%,残差变量贡献了约1-83.2%=16.8%.(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差^e 1,^e 2,…,^en 来判断模型拟合的效果.(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.练一练2.某运动员训练次数与运动成绩之间的数据关系如下:(1)作出散点图; (2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果; (4)计算R 2,并说明其含义.解:(1)作出该运动员训练次数x 与成绩y 之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)∵=39.25,=40.875,x 8i 2=12 656, y 8i 2=13 731,x 8i y i =13 180, ∴^b =8=22≈1.041 5, ^a =-^b≈-0.003 875,∴线性回归方程为^y=1.041 5x -0.003 875. (3)残差分析计算得^e 1≈-1.24,^e 2≈-0.366,^e 3≈0.551,^e 4≈0.468,^e 5≈1.385,^e 6≈0.178,^e 7≈0.095,^e 8≈-1.071.作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算相关指数R 2计算相关指数R 2≈0.985 5,说明了该运动员成绩的差异有98.55%是由训练次数引起的.讲一讲3.(链接教材P 6-例2)某地区六年来轻工业产品利润总额y 与年次x 的试验数据如下表所示:0,b 均为正数,求y 关于x 的回归方程.[思路点拨] 解答此题可根据散点图选择恰当的拟合函数,而本题已经给出,只需将其转化为线性函数,利用最小二乘法求得回归直线方程,再将其还原为非线性回归方程即可.[尝试解答] 对y =ab x e 0两边取自然对数,得ln y =ln ae 0+x ln b ,令z =ln y ,则z 与x 的数据如下表:由z =ln ae 0+x ln b 及最小二乘法公式,得 ln b ≈0.047 7,ln ae 0=2.378,即^z =2.378+0.047 7x ,故^y=10.8×1.05x .非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:练一练3.某电容器充电后,电压达到100 V ,然后开始放电,由经验知道,此后电压U 随时间t 变化的规律用公式U =A e bt (b <0)表示,现测得时间t (s)时的电压U (V)如下表:回归分析问题).解:对U =A e bt 两边取对数得ln U =ln A +bt , 令y =ln U ,a =ln A ,x =t , 则y =a +bx ,y 与x 的数据如下表:根据表中数据画出散点图,如图所示,从图中可以看出,y 与x 具有较好的线性相关关系, 由表中数据求得=5,≈3.045,由公式计算得^b ≈-0.313,^a =-^b -x=4.61, 所以y 对x 的线性回归方程为^y=-0.313x +4.61.所以ln ^U=-0.313t +4.61, 即^U=e -0.313t +4.61=e -0.313t ·e 4.61,因此电压U 对时间t 的回归方程为^U=e -0.313t ·e 4.61.————————————[课堂归纳·感悟提升]————————1.本节课的重点是线性回归方程的求法及线性回归分析,难点是残差分析和非线性回归分析问题.2.本节课要重点掌握的规律方法(1)线性回归分析,见讲1;(2)残差分析,见讲2;(3)非线性回归分析,见讲3.。

2019人教版高中数学选修1-2课件:1.1 回归分析的基本思想及其初步应用(共40张PPT)

2019人教版高中数学选修1-2课件:1.1 回归分析的基本思想及其初步应用(共40张PPT)

序号 1 2 3 4 5
总计
ui 15.0 25.8 30.0 36.6 44.4 151.8
yi
uiyi
39.4 225 591
42.9 665.64 1106.82
41.0 900 1230
43.1 1339.56 1577.46
49.2 1971.36 2184.48
215.6 5101.56 6689.76
考点类析
x 0.066 70.038 80.033 30.027 30.022 5 y 39.4 42.9 41.0 43.1 49.2
备课素材 求回归直线方程的方法技巧 [例] 某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份 2002 2004 2006 2008 2010
需求量/万吨 236 246 257 276 286 (1)利用所给数据求年需求量与年份之间的回归直线方程y^=b^x+a^; (2)利用(1)中所求出的直线方程预测该地 2012 年的粮食需求量.
考点类析
考点一 线性回归方程 例1 某设备的使用年限x和所支出的维修费 y(万元)有如下的统计资料:
x23456 y 2.2 3.8 5.5 6.5 7.0 若由资料可知,y与x之间具有线性相关关系. (1)求线性回归方程. (2)估计使用年限为10年时,维修费用为多少 万元?
解:(1)列表如下:
解:(1)该运动员训练次数(x)与成绩 (y)之间的散点图如图所示.
考点类析
例2 某运动员训练次数与运动成绩之间的 数据关系如下:
编号 1 2 3 4 5 6 7 8 次数(x) 30 33 35 37 39 44 46 50 成绩(y) 30 34 37 39 42 46 48 51 (1)作出散点图; (2)求出线性回归方程; (3)作出残差图,并说明模型的拟合效果; (4)计算R2,并说明其含义.

人教A版高中数学选修1-2课件回归分析的基本思想及其初步应用

人教A版高中数学选修1-2课件回归分析的基本思想及其初步应用

例2一只红蛉虫的产卵数y与温度x有关,现收集了7组数据,请建立y 与x建德回归方程
温度x/℃ 21 23 25 27 29 32 35 产卵数y/个 7 11 21 24 66 115 325
解 1.制作散点图

350 300 250 200 150 100
50 0 20 22 24 26 28 30 32 34 36 ℃
225.639
有了这些评估效应的方法,我们就可以利用它们来刻画总体效
应,事实上,为了将我们的计算简化,我们又引入相关指数R2
来刻画回归的效果:
n
( yi yˆ )2

R2
1
i 1 n
( yi y)2
残差平方和
i 1
总体偏差平方和
显然,当R2的值越大,说明残差所占的比例越小,回归效果 约好;反之,回归效果越差。一般的,当R2越接近于1,说明解 释变量和预报变量之间的相关性越强,如果同一个问题,采用不 同的回归方法分析,我们可以通过选择R2大的来作为回归模型
则,她们身高-体重的散点图应该在一条水平直线上:
70 65 60 55 50 45 40
150 155 160 165 170 175 180
事实上,并非如此,它们和45.5之间存在差别,这时我们就引 入随机误差,利用随机误差和解释变量共同来预报变量y
n
( yi y)2
i1
把所有的这种效应利用总体偏差平方和合并成一个数
一般方法:
1.利用散点图观察两个变量是否线性相关
2.利用残差来判断模型拟合的效果(残差分析) 利用残差图来分析数据,对可疑数据(残差较大的数据)进行 重新调查,有错误就更正,然后重新利用回归模型拟合,如 果没有错误,则需要找其他原因。

人教A版高中数学选修1-2课件回归分析的基本思想及其初步应用

人教A版高中数学选修1-2课件回归分析的基本思想及其初步应用

体重 / kg 48 57 50 54 64 61 43 59
残差eˆ 6.373 2.627 2.419 4.618 1.137 6.627 2.883 0.382
我们可以利用图形来
分析残差特性.作图时 纵坐标为残差, 横坐标 可选为样本编号, 或身 高数据, 或体重估计值 等, 这样作出的图形为 残差图 .图1.1 5是以 样本编号为横 坐标的 残差图.
40
大学生的体重不一定 150 155 160 165 170 175 180
是60.316kg,但一般可
图1.1 2
以认为她的体重接近于60.316kg.图1.1 2中的样
本点和回归直线的相互位置说明了这一点. 由于所有的样本点不共线, 而只是散布在某一条直
线的附近, 所以身高和体重的关系可用下面的线性
高中数学课件
(金戈铁骑 整理制作)
第一章 统计案例 学科网
学科网
必修3(第二章 统计)知识结构
收集数据
(随机抽样)
整理、分析数据 估计、推断
用样本估计总体 变量间的相关关系
线性回归分析
系统抽样 分层抽样 简单随机抽

用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
问题1:现实生活中两个变量间的关系有哪
70
样本点呈条状分布 ,身 高和体 重有比 较好的 线性相关关系 ,因此可 以用线 性回归方程刻
65
60
55
50
45
40
x
150 155 160 165 170 175 180
画它们之间的关系.
图1.1 1
根据线性回归方程中的系数公式, 可以得到
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、复习准备:
1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?
2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.
二、讲授新课:
1. 教学例题:
①例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
1 2 3 4 5 6 7 8


165 165 157 170 175 165 155 170 身高
/cm
体重 48 57 50 54 64 61 43 59
/kg
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.
(分析思路教师演示学生整理)
第一步:作散点图
第二步:求回归方程
第三步:代值计算
②提问:身高为172cm的女大学生的体重一定是60.316kg吗?
不一定,但一般可以认为她的体重在60.316kg左右.
③解释线性回归模型与一次函数的不同
一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.
3、小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.


教学
反思。

相关文档
最新文档