2015-2016学年高中数学 3.1.1 回归分析课件 北师大版选修2-3
高中数学3-1-1回归分析同步课件北师大版选修
y1+y2+…+yn 用 y 表示数据 y1,y2,…,yn 的平均值,即 y = n
=
1n . y i ni=1
(2)参数 a、b 的求法 n n xiyi-n x y lxy xi- x yi- y b= = i=1 = i=1 , lxx
xi- x
i=1
n
2
2 - n x x2 i i=1
809 x =7, y = , 7
7 2 xi =371, xiyi=5 i=1 i=1
7
798
xiyi-7 x y
i=1
7
b=
2 - 7 x x2 i i=1
7
809 5 798-7×7× 7 = ≈4.82, 371-7×72
809 ^ a= y -b x = -4.82×7≈81.83. 7 所以线性回归方程为 y=81.83+4.82x.
B.在平面直角坐标系中用描点的方法得到表示具有相关 关系的两个量的一组数据的图形叫做散点图 C.线性回归方程最能代表具有线性相关关系的x,y之间 的关系 D.任何一组观测值都能得到具有代表意义的线性回归方
程
解析 只有对两个变量具有线性相关性作出判断时,利用最小二
乘法求出线性方程才有意义.
答案 D
题型二 求线性回归方程
【例2】 已知某地区4岁~10岁女孩各自的平均身高数据如下: 4 100 5 106 6 112 7 116 8 121 9 124 10 130
年龄x/岁 身高y/cm
求y对x的线性回归直线方程.
[思路探索] 要求线性回归方程 → 运用最小二乘法 → 求出a,b
解 制表 i xi yi xi yi 1 4 100 400 2 5 106 530 3 6 112 672 4 7 116 812 5 8 121 968 6 9 124 1 116y -b x
2015-2016学年高中数学 第3章 1回归分析课件 北师大版选修2-3
xi- x yi- y xiyi-n x y
i=Байду номын сангаас i=1
n
n
b=
=
xi- x
i=1
n
2
2 - n x x2 i i=1
n
,a= y -b x .
3.相关系数 假设两个随机变量的数据分别为(x1,y1)、(x2,y2)、„、(xn, yn),则变量间线性相关系数 r 的计算公式如下:
第三章
§1 回归分析
1
课前自主预习
2
课堂典例探究
3
课 时 作 业
课前自主预习
1.通过收集现实问题中两个有关联变量的数据作出散点
图,并利用散点图直观认识变量间的相关关系.
2.通过求线性回归方程,探究相关性检验的基本思想. 3.通过对典型案例的探究,体会回归分析在生产实践和
日常生活中的广泛应用.
而求回直线的最好方法是“最小二乘法”,即对于线性回归模 型 y=bx+a 来说, 估计模型中的未知参数 a 和 b 的最好方法就 是用最小二乘法估计 a 和 b,其计算公式为 b= x yi-- y xiyi-n- x - y xi--
i= 1 i=1 n n
= x xi--
3.设某大学的女生体重 y(单位:kg)与身高 x(单位:cm) 具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,„,n), 用最小二乘法建立的回归方程为^ y=0.85x-85.71,则下列结论 中不正确 的是( ... )
A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心(- x ,- y) C. 若该大学某女生身高增加 1cm, 则其体重约增加 0.85kg D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg
高中数学 3.1.1 回归分析课件 北师大版选修23
3.情感、态度与价值观 (1)培养学生用整体的观点和互相联系的观点,来分析问 题. (2)进一步加强数学的应用意识,培养学生学好数学、用 好数学的信心. (3)加强与现实生活中的联系,以科学的态度评价两个变 量的相关关系.
●重点难点 重点:掌握回归分析的步骤、相关系数、建立回归模型 的步骤;体会有些非线性模型通过变换,可以转化为线性回 归模型;在解决实际问题的过程中寻找更好的建型方法. 难点:求线性回归方程的系数 a,b;相关系数;选择不 同的模型建模.
求线性回归方程的步骤:
n
n
(1)列表求出 x , y ,∑x2i ,∑xiyi;
i=1
i=1
(2)利用公式
n
∑xiyi-n x y
b=i=1n
,a= y -b x ,求出 b,a;
∑x2i -n x 2
i=1
(3)写出线性回归方程.
观察两相关量得如下数据: x -1 -2 -3 -4 -5 5 3 4 2 1 y -9 -7 -5 -3 -1 1 5 3 7 9
线性回归方程
【问题导思】 1.确定线性回归方程,只需得出哪两个量? 【提示】 确定线性回归直线方程,只需确定 a,b 两个 量即可. 2.在线性回归方程 y=a+bx 中,当一次项系数 b 为正 数时,说明两个变量有何相关关系?在散点图上如何反映?
【提示】 说明两个变量正相关,在散点图上自左向右 看这些点呈上升趋势.
1.变量之间有一定的联系,但不能完全用函数来表达.如 人的体重 y 与身高 x.一般来说,身高越高,体重越重,但不 能用一个函数来严格地表示身高与体重之间的关系.相关关 系是 非确定 性关系,因变量的取值具有一定的随机性.
2.在考虑两个变量的关系时,为了对变量之间的关系有 一个大致的了解,人们通常将变量所对应的点描出来,这些 点就组成了变量之间的一个图,通常把这种图叫作变量之间 的 散点图 .
高中数学北师大版选修2-3 回归分析 课时2 课件(28张)
的数据, 得到 y 关于 t 的线性回归方程 ˆ 2 0.367t 202.54,即 y 关于 x 的二次回归方程为 y ˆ 2 0.367x 2 202.54. 7 y
表1 5
t 441 529 y 7 11
625 21
729 24
841 1024 1225 66 115 325
从图 1.1 6中 可以看出 , y与 t 的散点图并 不分布在一条 直线的周围 ,因 此不宜用线性 回归方程来拟 合它, 即不宜用
2
350 300 250
产 200 卵 150 数 100
3.1 回归分析的基本思想
及其初步应用
(第二课时)
1 .通过典型案例的探究,进一步了解回归分析 的基本思想、方法及其初步应用. 2 .让学生经历数据处理的过程,培养他们对数 据的直观感觉,体会统计方法的特点,认识统计方 法的应用,通过使用转化后的数据,求相关指数, 运用相关指数进行数据分析、处理的方法. 3.从实际问题中发现已有知识的不足,激发好奇 心,求知欲,通过寻求有效的数据处理方法,开拓 学生的思路,培养学生的探索精神和转化能力,通 过案例的分析使学生了解回归分析在实际生活中的 应用,增强数学取之生活,用于生活的意识,提高 学习兴趣.
本节课通过例题线性相关关系知识,通过实 际问题中发现已有知识的不足,引导学生寻找 解决非线性回归问题思想与方法,培养学生化 归数学思想。通过知识的整理,通过例题讲解 掌握解决非线性回归问题。 本节内容学生内容不易掌握,通过知识整理 与比较引导学生进行区分、理解。通过对典型 案例的探究,练习进行巩固解决非线性回归基 本思想方法及初步应用.
(6)
温度
另一方面,可以认为图11-4中样本点集中在某二次曲线
高中高中数学北师大版选修2-3练习课件3.1 回归分析精选ppt课件
解:对甲模型:y=0.1x+1,
4
残差平方和 (yi-yi)2=0.0109;
i=1
4
对乙模型:残差平方和 (yi-yi)2=0.0049;
i=1
4
对丙模型:残差平方和 (yi-yi)2=0.0001406.
i=1
显然丙的残差平方和最小,故丙模型更接近于客观实 际.
课后提升训练
温馨提示:请点击按扭进入WORD文档作业
i=1
i=1
i=1
i=1
与 x 之间的回归方程为________.
n
xiyi-n x y
i=1
解析:利用公式 b=
,a= y -b x 代入数据
n
x2i -n x 2
i=1
即可求得.
答案:y=11.47+2.62x
知识点二
回归分析的基本思想
4.对两个变量x,y取得4组数据(1,1),(2,1.2), (3,1.3),(4,1.37),甲、乙、丙三人分别求得数学 模型如下:甲y=0.1x+1,乙y=-0.05x2+0.35x +0.7,丙y=-0.8·(0.5)x+1.4,试判断三人谁的 数学模型更接近于客观实际.
A.10亿 B.9亿 C.10.5亿 D.9.5亿 解析:∵x=10时,y=0.8×10+2+e=10 +e, ∵|e|≤0.5,∴y≤10.5. 答案:C
3.某化工厂为预测某产品的回收率 y,需要研究它和 原料有效成分含量 x 之间的相关关系,现取 8 对观测值,
8Hale Waihona Puke 888计算得xi=52,yi=228,x2i =478,xiyi=1849,则 y
A.y=-10x+200 B.y=10x+200 C.y=-10x-200 D.y=10x-200 解析:∵商品销售量y(件)与销售价格x(元/ 件)负相关,∴a<0,排除B、D.又∵x=0时,y≥0. 答案:A
(北师大版)数学选修2-3课件:第3章-回归分析ppt课件
北师大版高中数学选修2-3课件:3.1.1 回归分析
由散点图可以看出,两个变量之间呈现出 近似的线性关系,所以可以建立弹簧长度y 对拉力x的线性回归方程.
备课素材
[例] 弹簧长度y(cm)随拉力x(N)不同而 变化的情况如下:
x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.90 11.80
(1)求出弹簧长度y对拉力x的线性回归 方程; (2)预测当拉力为18N时,弹簧的长度 是多少.
考点类析
【变式】下表是某种产品销售收入与销售量 之间的一组数据:
销售量x(吨) 2 3 5 6 销售收入y(万元) 7 8 9 12
(3)当x=9时,y=1.1×9+4.6=14.5.
故当销售量为9吨时,估计销售收入约 为14.5万元.
(1)画出散点图; (2)求出线性回归方程; (3)根据线性回归方程估计销售量为9吨时的销 售收入.
(1)请判断y与x是否具有线性相关关系;
解:(1)画出数据的散点图如图所示, 直观判断散点分布在一条直线附近, 故具有线性相关关系.
考点类析
例3 一家保险公司为了研究营业部加班对签发 新保单的影响,做了10次试验,得数据如下:
每月 加班时 10 20 30 40 50 60 70 80 90 100 间x(h) 签发的 新保单 62 68 75 81 89 95 102 108 115 122 数y(单)
考点类析
考点类析
x
5
6
7
8
y 10 8
7
3
[答案] 6.8
考点类析
备课素材
回归分析的应用 回归分析的应用主要体现在两个方面: (1)对两个变量关系的判断,通过分析两个变量的变化关系,利用最小二乘法 可以求出对应的线性回归方程; (2)对变量值的预测,即由给定的变量值预测与其有相关关系的变量值.
北师大版高中数学选修2-3 第三章3.1.3可线性化的回归分析教学课件 (共20张ppt)
的情况.
求线性回归直线方程有哪几个量?
① lxx
② l xy
③ l yy
④ b l xy l xx
⑤a yb x ⑥ r
l xy l xx l yy
例题1.一个车间为了规定工时定额,需要确定 加工零件所花费的时间,为此进行了10次试验, 测得数据如下:
零件数 10 20 30 40 50 60 70 80 90 100
(x)个
加工时 62 68 75 81 89 95 102 108 115 122 间y
(1)y与x是否具有线性相关? (2)若y与x具有线性相关关系,求回归直线方程 (3)预测加工200个零件需花费多少时间?
引入新授问题
案例2 一只红铃虫的产卵数y和温度x有关。现
方案3
问题1 问题2
如何选取指数函数的底?
y c1ec2x 对数 变换
非线性关系
y=bx+a 线性关系
方案3解答
对数变换:在 y c1ec2x 中两边取常用对数得
ln y ln(c1ec2x ) ln c1 ln ec2x ln c1 c2 x ln e c2 x ln c1
令 z ln y, a ln c1, b c2 ,则 y c1ec2x
收集了7组观测数据列于表中:
温度xoC 21 23 25 27 29 32 35 产卵数y/个 7 11 21 24 66 115 325
(1)试建立产卵数y与温度x之间的回归方程;并 预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了 产卵数的变化?
探索新知
选变量 画散点图 选模型 估计参数 分析和预测
北师大版高中数学选修2-3课件:3.1.2 相关系数 3.1.3 可线性化的回归分析
预习探究
3.非线性回归问题可以通过换元法转化为线性回归问题来解决,常见曲线方 程的变换公式如下表:
曲线方程
换元
换元后的线性方程
y'=a+bx'
y=axb y'=ln y,x'=ln x y'=A+bx'(A=ln a)
y=a+bln x y'=y,x'=ln x
y'=a+bx'
备课素材
1.为什么要采用相关性检验?
考点类析
[小结] 对于非线性回归问题,我们可以利用已知数据画出散点图,把它与学过的 各种函数(幂函数、指数函数、对数函数等)的图像进行比较,挑选一种跟散点 图拟合得最好的函数,采用适当的变量变换,把问题化为线性回归问题,使之得 到解决.
考点类析
【拓展】为了研究某种细菌随天数x的变化 繁殖个数y的变化情况,收集数据如下:
新课导入
[导入一] 复习启发导入 上节课,我们已经学习了最小二乘法,并会求解变量之间的线性回归方程, 那么两个变量之间的线性相关程度还可以用什么来刻画呢?这就是我们本节 课所要学习的相关系数问题,进入课题.
新课导入
[导入二] 有关法律规定:香烟盒上必须印有“吸烟有害健康”的警示语,那么吸烟和健 康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?要回 答这样的问题,我们一起来学习本节的知识.
考点类析
考点一 变量相关关系的判断
例1 对变量x,y由观测数据(xi,yi)(i=1,2,…,10)得散点图3-1-2(1);对变量u,v由观测数据 (ui,vi)(i=1,2,…,10),得散点图3-1-2(2).由这两个散点图可以判断 ( ) A.变量x与y正相关,u与v正相关
高中数学 3.1回归分析(一)教案 北师大选修2-3
3.1 回归分析教学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程 一.问题情境1. 情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当根据《数学(必修)》中的有关内容,解决这个问题的方法是: 先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间x 与位置观测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()ni i i nii x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为22.6287y =2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗?二.学生活动思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x 与y 之间的关系,y 的值不能由x 完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型的定义:我们将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型.说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计a ,b ? 2.探求线性回归系数的最佳估计值:对于问题②,设有n 对观测数据(,)i i x y (1,2,3,,)i n =,根据线性回归模型,对于每一个i x ,对应的随机误差项()i i i y a bx ε=-+,我们希望总误差越小越好,即要使21nii ε=∑越小越好.所以,只要求出使21(,)()niii Q y x αββα==--∑取得最小值时的α,β值作为a ,b 的估计值,记为a ,b .注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离. 用什么方法求a ,b ?回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求a ,b 的方法:最小二乘法.利用最小二乘法可以得到a ,b 的计算公式为1122211()()()()n ni i i i i i n ni ii i x x y y x y nx y b x x x n x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑, 其中11n i i x x n ==∑,11ni i y y n ==∑由此得到的直线y a bx =+就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中a ,b 分别为a ,b 的估计值,a 称为回归截距,b 称为回归系数,y 称为回归值.在前面质点运动的线性回归方程 3.5361 2.1214y x =+中, 3.5361a =, 2.1214b =. 3. 线性回归方程y a bx =+中a ,b 的意义是:以a 为基数,x 每增加1个单位,y 相应地平均增加b 个单位;4. 化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1)b y a x =+,令'y y =,1'x x=,则有''y a bx =+. (2)b y ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+. (3)bx y ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+. (4)b xy ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.四.数学运用 1.例题:例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.解:为了简化数据,先将年份减去1949,并将所得值用x 表示,对应人口数用y表示,作出11个点(),x y 构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系.根据公式(1)可得14.453,527.591.b a ⎧≈⎪⎨≈⎪⎩ 这里的,a b 分别为,a b 的估 计值,因此线性回归方程 为527.59114.453y x =+由于2004年对应的55x =,代入线性回归方程527.59114.453y x =+可得1322.506y =(百万),即2004年的人口总数估计为13.23亿. 例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本x (万元)与人均产出y (万元)的数据:(1)设y 与x 之间具有近似关系b y ax ≈(,a b 为常数),试根据表中数据估计a 和b 的值; (2)估计企业人均资本为16万元时的人均产出(精确到0.01).分析:根据x ,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对b y ax ≈的两边取对数,就能将其转化为线性关系.解(1)在b y ax ≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,lg x X =,则z A bX ≈+.相关数据计算如图327--所示.仿照问题情境可得A ,b 的估计值A ,b 分别为0.2155,1.5677,A b ⎧=-⎪⎨=⎪⎩由lg 0.2155a =-可得0.6088a ≈,即a ,b 的估计值分别为0.6088和1.5677.(2)由(1)知1.56770.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P页)当16x =时, 1.56770.60881647.01y =⨯≈(万元),故当企业人均资本为16万元时,人均产值约为47.01万元.2.练习:104P 练习第1题. 五.回顾小结:1. 线性回归模型y a bx ε=++与确定性函数y a bx =+相比,它表示y 与x 之间是统计相关关系(非确定性关系)其中的随机误差ε提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a ,b 的工具;2. 线性回归方程y a bx =+中a ,b 的意义是:以a 为基数,x 每增加1个单位,y 相应地平均增加b 个单位; 3.求线性回归方程的基本步骤. 六.课外作业:106P 第2题.回归分析(2)教学目标(1)通过实例了解相关系数的概念和性质,感受相关性检验的作用; (2)能对相关系数进行显著性检验,并解决简单的回归分析问题; (3)进一步了解回归的基本思想、方法及初步应用. 教学重点,难点相关系数的性质及其显著性检验的基本思想、操作步骤. 教学过程 一.问题情境1.情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?2.问题:思考、讨论:求得的线性回归方程是否有实际意义. 二.学生活动对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需要对变量x 与y 的线性相关性进行检验(简称相关性检验).三.建构数学1.相关系数的计算公式:对于x ,y 随机取到的n 对数据(,)i i x y (1,2,3,,)i n =,样本相关系数r 的计算公式为()()nniii ix x y y x y nx yr ---==∑∑.()22.相关系数r 的性质: (1)||1r ≤;(2)||r 越接近与1,x ,y 的线性相关程度越强; (3)||r 越接近与0,x ,y 的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 3.对相关系数r 进行显著性检验的步骤:相关系数r 的绝对值与1接近到什么程度才表明利用线性回归模型比较合理呢?这需要对相关系数r 进行显著性检验.对此,在统计上有明确的检验方法,基本步骤是: (1)提出统计假设0H :变量x ,y 不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在附录2(教材P111)中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); (3)计算样本相关系数r ;(4)作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系.说明:1.对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%. 2.这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.3.这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释. 4.对于上节课的例1,可按下面的过程进行检验: (1)作统计假设0H :x 与y 不具有线性相关关系;(2)由检验水平0.05与29n -=在附录2中查得0.050.602r =; (3)根据公式()2得相关系数0.998r =;(4)因为0.9980.602r =>,即0.05r r >,所以有95﹪的把握认为x 与y 之间具有线性相关关系,线性回归方程为527.59114.453y x =+是有意义的. 四.数学运用 1.例题:例1.下表是随机抽取的8对母女的身高数据,试根据这些数据探讨y 与x 之间的关系.解:所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近,因为()1541571638159.25x =+++÷=,()1551561668161y =+++÷=,()82222218()1541638159.2559.5ii xx =-=++-⨯=∑, ()82222218()1551668161116ii yy =-=++-⨯=∑,()8181541551631668159.2516180iii x y x y =-⨯++⨯-⨯⨯=∑,所以963.01165.5980≈⨯=r ,由检验水平0.05及26n -=,在附录2中查得707.005.0=r ,因为0.9630.707>,所以可以认为x 与y 之间具有较强的线性相关关系.线性回归模型y a bx ε=++中,a b 的估计值,a b 分别为()8182218 1.345,8i ii ii x y x yb xx==-=≈-∑∑ 53.191a y bx =-≈-,故y 对x 的线性回归方程为x y 345.1191.53+-=.例2.要分析学生高中入学的数学成绩对高一年级数学学习的影响,在高一年级学生中随10(2)如果x 与y 之间具有线性相关关系,求线性回归方程;(3)若某学生入学数学成绩为80分,试估计他高一期末数学考试成绩.解:(1)因为()16367767010x =⨯+++=,()16578757610y =⨯+++=, 101()()1894xy i i i L x x y y ==--=∑,2101()2474xx i i L x x ==-=∑,1021()2056yy i i L y y ==-=∑.因此求得相关系数为10()()0.840iix x y y L r --===∑.结果说明这两组数据的相关程度是比较高的;小结解决这类问题的解题步骤:(1)作出散点图,直观判断散点是否在一条直线附近; (2)求相关系数r ;(3)由检验水平和2n -的值在附录中查出临界值,判断y 与x 是否具有较强的线性相关关系;(4)计算a ,b ,写出线性回归方程. 2.练习:104P 练习第1题. 五.回顾小结:1.相关系数的计算公式与回归系数b 计算公式的比较; 2.相关系数的性质;3.探讨相关关系的基本步骤.P习题3.2第1题.六.课外作业:106。
3.1《回归分析》课件(北师大版选修2-3)
5.下表是某厂~4月份用水量(单位:百吨)的一组数据,
由某散点图可知,用水量y与月份x之间有较好的线性相关关系,
并且其线性回归方程是y=-0.7x+a,则a=_____.
【解题提示】由 a=y-b x 即可求得a的值.
【解析】x=2.5,y=3.5, b=-0.7,
∴a=3.5-(-0.7)×2.5=5.25.
题精析
知能巩固提升
一、选择题(每题5分,共15分) 1.下列变量之间的关系是相关关系的是( )
(A)某家庭一个月的电费与用电量
(B)小麦的产量与施肥量 (C)圆的面积与半径
(D)角的余弦值与它的弧度数
答案:5.25
三、解答题(6题12分,7题13分,共25分) 6.有人统计了同一个省的6个城市某一年的人均国内生产总值 (即人均GDP)和这一年各城市患白血病的儿童数量,如下表:
(1)画出散点图;
(2)求y对x的线性回归方程;
(3)如果这个省的某一城市同时期年人均GDP为12万元,估计 这个城市一年患白血病的儿童数目.
≈381,估计这个城市一年患白血病的儿童数目约为381.
7.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录 的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数 据
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,求出y关于x的线性回归方程
y=a+bx; (3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤; 试根据(2)求出的线性回归方程,预测生产100吨甲产品的 生产能耗比技术改造前降低多少吨标准煤?
产品的生产能耗比技术改造前降低19.65吨标准煤.
1.(5分)(2010·湖南高考)某商品销售量y(件)与销售价 格x(元/件)负相关,则其回归方程可能是( (A)ˆ =-10x+200 y
2015-2016学年高中数学 3.1.3 可线性化的回归分析课件 北师大版选修2-3
身高 x/cm 120 130 140 150 160 170 体重 y/kg 20.92 26.86 31.11 38.85 47.25 55.05
(1)画出散点图. (2)能否建立恰当的函数模型使它能比较近似地反映这个地区未成年
男性体重 y kg 与身高 x cm 的函数关系?试写出这个函数模型的解析式. (3)若体重超过相同身高男性体重平均值的 1.2 倍为偏胖,低于 0.8 倍为
x1
2 3 5 10
y 10.15 5.52 4.08 2.85 2.11
x 20 30 50 100 200 y 1.62 1.41 1.30 1.21 1.15
检验每册书的成本费 y 与印刷册数的倒数1������之间是否具有线性相关关系;如 有,求出 y 对 x 的回归方程.
分析:本题是非线性回归问题,要通过变量置换,把非线性回归问题转化 为线性回归问题,然后利用解决线性回归问题的方法处理.
反应速度 y/(g/min)
6 8 30 27 70 205 65 350
-22-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
1234
解:根据收集的数据作散点图如图所示:
根据样本点分布情况,可选用两种曲线来进行拟合. (1)可认为样本点集中在某二次曲线 y=c1x2+c2的附近.令 t=x2,则变换后 样本点应该分布在直线 y=bt+a(b=c1,a=c2)的周围.
偏瘦,那么这个地区一名身高为 175 cm,体重为 78 kg 的在校男生的体重是 否正常?
-14-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
题型一
题型二
解:(1)作散点图如图所示.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-16-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
1234
1 对具有线性相关关系的两个变量建立的线性回归方程 y=a+bx 中,回 归系数 b( )
A.可以小于 0
x/(0.01%) 104 180 190 177 147 134 150 191 204 121
y/min
100 200 210 185 155 135 170 205 235 125
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗? (2)求回归直线方程. (3)预测当钢水含碳量为 160 时,应冶炼多少分钟?
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
题型 求线性回归方程
【例 1】 在关于人体的脂肪含量(百分比)和年龄关系的研究中,研究人员获 得了一组数据:
年龄 x
23 27 39 41 45 49 50
脂肪含量 y 9.5 17.8 21.2 25.9 27.5 26.3 28.2
-20-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
1234
解:(1)以 x 轴表示含碳量,y 轴表示冶炼时间,可作散点图如图所示.
从图中可以看出,各点散布在一条直线附近,即它们线性相关.
-21-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
1234
B.只能大于 0
C.可能等于 0
D.只能小于 0
解析:b 可能大于 0,也可能小于 0,但当 b=0 时,x,y 不具有线性相关关系.
答案:A
-17-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
1234
2 下列两个变量间的关系不是函数关系的是( ) A.正方体的棱长与体积 B.角的弧度数与它的正弦值 C.单产为常数时,土地面积与粮食总产量 D.日照时间与水稻亩产量 答案:D
(2)联系. 相关关系与函数关系也是有联系的.由于客观上常会出现观察或测量 上的误差等原因,函数关系在实际问题中往往通过相关关系表现出来.当人 们对某些现象内部规律有较深刻的认识时,相关关系可能变为函数关系.为 此,在研究相关关系时,又常常使用函数关系作为工具,用函数关系表现相关 关系的数量联系.
-10-
析是寻找相关关系中非确定性关系的某种确定性. 如果散点图中样本点的分布从整体上看大致在一条直线附近,我们称
这两个变量之间具有线性相关关系,这条直线叫线性回归直线,从整体上看 各点与此直线的距离平方之和最小,即该直线最贴近已知的样本点,最能代 表变量 x 与 y 之间的关系.
-5-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
12 58 33.5 3 364 1 943
13 60 35.2 3 600 2 112
14 61 34.6 3 721 2 110.6 ∑ 673 381.7 34 181 19 403.2
-12-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
由此可得,������≈48.07,������≈27.26, b=19 43043.128-114-1×44×84.087.0×7227.26≈0.58, a=������-b������≈-0.62. 所以线性回归方程为 y=0.58x-0.62. (2)当 x=37 时,y≈20.84. 所以 37 岁人的脂肪含量的预测值为 20.84%.
(2)根据已知列出下表,并用科学计算器进行计算:
i xi
yi
xi2
xiyi
1 104 100 10 816 10 400
2 180 200 32 400 36 000
3 190 210 36 100 39 900
4 177 185 31 329 32 745
5 147 155 21 609 22 785
5 45 27.5 2 025 1 237.5
6 49 26.3 2 401 1 288.7
7 50 28.2 2 500 1 410
8 53 29.6 2 809 1 568.8
9 54 30.2 2 916 1 630.8
10 56 31.4 3 136 1 758.4
11 57 30.8 3 249 1 755.6
6 134 135 17 956 18 090
7 150 170 22 500 25 500
8 191 205 36 481 39 155
9 204 235 41 616 47 940
10 121 125 14 641 15 125 ∑ 1 598 1 720 265 448 287 640
-18-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
1234
3 已知两个变量 x 和 y 之间具有线性相关性, 甲、乙两个同学各自独立 地做了 10 次和 15 次试验,并且利用线性回归的方法求得回归直线分别为 l1 和 l2,已知两个人在试验中发现对变量 x 的观测数据的平均数都为 s,对变量 y 的观测数据的平均数都是 t,则下列说法正确的是( ) A.l1 与 l2 一定有公共点(s,t) B.l1 与 l2 相交,但交点一定不是(s,t) C.l1 与 l2 必定平行 D.l1 与 l2 必定重合 答案:A
第三章 统计案例
-1-
§1 回归分析
-2-
1.1 回归分析
-3-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
1.通过实例掌握回归分析的基本思想方法. 2.利用最小二乘法会求线性回归直线方程,并能用线性回归直线方程进行 预报.
-4-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
-19-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
1234
4 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的
长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时, 钢水的含碳量 x 与冶炼时间 y(从炼料熔化完毕到出钢的时间)的一列数据, 如下表所示:
������ =1
5
���∑���=1���������2��� =882+762+732+662+632=27 174,
-15-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
5
∴b=������∑=������∑=15���1���������������������2������ ���-���-55������������2������ = 252075147-54×-57×37.23×.2627.8≈0.625. a=������-b������=67.8-0.625×73.2=22.05.
-11-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
解:(1)设线性回归方程为 y=a+bx,根据已知列表如下:
i xi yi
xi2
xiyi
1 23 9.5 529 218.5
2 27 17.8 729 480.6
3 39 21.2 1 521 826.8
4 41 25.9 1 681 1 061.9
假设样本点为(x1,y1),(x2,y2),…,(xn,yn),设线性回归方程为 y=a+bx,要使这 n 个点与直线 y=a+bx 的“距离”平方之和最小,即使得 Q(a,b)=(y1-a-bx1)2+(y2-a-bx2)2+…+(yn-a-bxn)2 达到最小,a,b 需满足
������
b=������∑=������∑=1���������1���������������������2������������--nn������������2������,a=������-b ������. 对两个变量之间的相关关系进行统计分析的方法叫回归分析.回归分
1120.3=1.23,a=������-b������=5-1.23×4=0.08.
(2)由(1)知线性回归方程为 y=1.23x+0.08.当 x=10 时,y=1.23×10+0.08=12.38, 即估计使用年限为 10 年时维修费用为 12.38 万元.
-8-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
-13-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
【例 2】 某 5 名学生的数学和化学成绩如下表:
学生 学科成绩
A B CDE
数学成绩 x 88 76 73 66 63 化学成绩 y 78 65 71 64 61
(1)画出散点图; (2)求化学成绩 y 对数学成绩 x 的线性回归方程.
使用年限 x/年 2 3 4 5 6 维修费用 y/万元 2.2 3.8 5.5 6.5 7.0 若由资料知,y 与 x 呈线性相关关系.试求: (1)线性回归方程 y=bx+a 的回归系数 a,b; (2)估计使用年限为 10 年时,维修费用是多少?
-7-
学习目标导航 基础知识梳理 重点难点突破 典型例题剖析 随堂练习巩固
【做一做 1】 随机抽样中得到四个样本点分别为(1,2),(2,3),(3,4),(4,5),
则 y 与 x 之间的回归直线方程为( )
A.y=x+1
B.y=x+2
C.y=2x+1 D.y=x-1
答案:A