数学:232两个变量之间的线性关系
20191819第2章23231 变量间的相关关系232 两个变量的线性相关语文.doc
2.3 变量的相关性 2.3.1 变量间的相关关系 2.3.2 两个变量的线性相关学习目标:1.理解两个变量的相关关系的概念.(重点)2.会画散点图,并利用散点图判断两个变量是否具有相关关系.(重点)3.理解最小二乘法原理,会求回归直线方程.(难点)[自 主 预 习·探 新 知]一、变量间的相关关系 1.两个变量的关系2.将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.二、两个变量的线性相关 1.最小二乘法设x 、Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx .当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q = i =1n(y i -a -bx i )2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.2.回归直线方程的系数计算公式1.思考辨析(1)回归直线方程中,由x的值得出的y值是准确值.()(2)回归直线方程一定过样本点的中心.()(3)回归直线方程一定过样本中的某一个点.()(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.()[答案](1)×(2)√(3)×(4) ×2.过(3,10),(7,20),(11,24)三点的回归直线方程是()A.y^=1.75+5.75xB.y^=-1.75+5.75xC.y^=5.75+1.75xD.y^=5.75-1.75xC[代入系数公式得b^=1.75,a^=5.75.代入直线方程,求得y^=5.75+1.75x.故选C.]3.如图2-3-1所示的两个变量不具有相关关系的有________.图2-3-1①④[①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.]4.若施肥量x(kg)与水稻产量y(kg)的线性回归方程为y^=5x+250,当施肥量为80 kg时,预计水稻产量约为________kg.650[把x=80代入回归方程得其预测值y^=5×80+250=650(kg).][合作探究·攻重难]相关关系的判断(1)下列两个变量之间的关系,哪个不是函数关系()A.正方体的棱长和体积B.圆半径和圆的面积C.正n边形的边数和内角度数之和D.人的年龄和身高(2)对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()图2-3-2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关[思路探究]结合相关关系,函数关系的定义及正负相关的定义分别对四个选项作出判断.(1)D(2)C[(1)A、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以有不同的身高,∴选D. (2)由图象知,变量x与y呈负相关关系;u与v呈正相关关系.][跟踪训练]1.某公司2009~2019年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:A.B.利润中位数是18,x与y有负线性相关关系C.利润中位数是17,x与y有正线性相关关系D.利润中位数是17,x与y有负线性相关关系C[由表知,利润中位数是12(16+18)=17,且y随x的增大而增大,故选C.]求回归直线方程[探究问题]1.怎样判断一组数据是否具有线性相关关系?[提示]画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.2.最小二乘法的实质是什么?任何一组数据都可以由最小二乘法得出回归直线方程吗?[提示]实际上,最小二乘法就是从整体上看,使各点与回归直线的距离最小.用最小二乘法求回归直线方程的前提是所给数据是线性相关的,不是线性相关的数据,求出回归直线方程是无意义的.3.回归系数b^的含义是什么?[提示]b^代表x每增加一个单位,y的平均增加单位数.当b^>0时,两变量呈正相关;当b^<0时,两变量呈负相关.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(2)如果y与x具有线性相关关系,求y关于x的回归直线方程.[思路探究]画散点图→确定相关关系→求回归直线系数→写回归直线方程[解](1)画散点图如下:由上图可知y与x具有线性相关关系.(2)列表、计算:b^=∑i=110x i y i-10x y∑i=110x2i-10x2=55 950-10×55×91.738 500-10×552≈0.668,a^=y-b^x=91.7-0.668×55=54.96.即所求的回归直线方程为:y^=0.668x+54.96.下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(1)(2)请根据上表提供的数据,用最小二乘法求出回归直线方程y ^=bx +a ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【导学号:31892019】[思路探究] (1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数b ^,a ^的值;(3)实际上就是求当x =100时,对应的v 的值. [解] (1)散点图,如图所示:(2)由题意,得∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∑i =14x 2i =32+42+52+62=86,∴b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a^=y -b ^x =3.5-0.7×4.5=0.35,故线性回归直线方程为y ^=0.7x +0.35.(3)根据回归直线方程的预测,现在生产100吨产品消耗的标准煤为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨)标准煤.2.某种产品的广告费支出y (百万元)与销售额x (百万元)之间的关系如下表所示.(1)假定y (2)若广告费支出不少于60百万元,则实际销售额应不少于多少?[解] (1)设回归直线方程为y ^=bx +a ,则b ^=438-412.5660-625=25.535=5170,a ^=y -b ^x=5+8+9+114-5170×8+12+14+164=334-5170×252=-67,则所求回归直线方程为y ^=5170x -67.(2)由y ^=5170x -67≥60,得x ≥4 26051≈84,所以实际销售额不少于84百万元.[当 堂 达 标·固 双 基]1.设一个回归方程y ^=3+1.2x ,则变量x 增加一个单位时( ) A .y 平均增加1.2个单位 B .y 平均增加3个单位 C .y 平均减少1.2个单位 D .y 平均减少3个单位 A [由b^=1.2>0,故选A.]2.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C .回归直线方程最能代表观测值x 、y 之间的线性关系D .任何一组观测值都能得到具有代表意义的回归直线D[只有数据点整体上分布在一条直线附近时,才能得到具有代表意义的回归直线.]3.已知变量x,y之间具有线性相关关系,其散点图如图2-3-3所示,则其回归方程可能为()A.y^=1.5x+2B.y^=-1.5x+2C.y^=1.5x-2D.y^=-1.5x-2图2-3-3B[由散点图知,变量x、y呈负相关,且回归直线在y轴上的截距大于0,故b^<0,a^>0.因此回归方程可能为y^=-1.5x+2.]4.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是()A.y^=0.4x+2.3B.y^=2x-2.4C.y^=-2x+9.5D.y^=-0.3x+4.4A[因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B,故选A.]5.对具有线性相关关系的变量x和y,测得一组数据如下表所示.[解]由题意可知x=2+4+5+6+85=5,y=30+40+60+50+705=50,即样本中心为(5,50),设回归直线方程为y^=6.5x+a,∵回归直线过样本中心(5,50),^,即a^=17.5,∴50=6.5×5+a^=6.5x+17.5.∴回归直线方程为y第 11 页。
最新-2018高中数学 第2章232两个变量的线性相关课件 新人教A版必修3 精品
x =3+4+4 5+6=4.5,
y
=2.5+ 3+ 4+ 4
4.5= 3.5,
4
x2i =32+42+52+62=86.
i= 1
∴b=66.58-6-4×4×4.45.×52 3.5=6866.5--8613=0.7,
a= y -b x =3.5-0.7×4.5=0.35.
故线性回归方程为^y =0.7x+0.35. (3)根据回归方程预测现在生产 100 吨产品消耗 的标准煤的数量为 0.7×100+0.35=70.35(吨), 故生产能耗减少了 90-70.35=19.65(吨).
知新益能
1.相关关系:与函数关系不同,相关关系是一 种_非__确__定____性关系. 2.从散点图上看,点散布在从左下角到右上角 的区域内,两个变量的这种相关关系称为正__相__关__; 点散布在从左上角到右下角的区域内,两个变量 的相关关系为__负__相__关_____.
3.从散点图上看,如果这些点从整体上看大 致分布在通过散点图中心的一条直线附近,我 们就称这两个变量之间具有_线__性__相__关__关__系___, 这条直线叫做__回__归__直__线___.
解:(1)设年收入为 x 元,年支出为 y 元,由条件知 x =88000 元, y =50000 元,b=0.6,则 a= y - b x =50000-0.6×88000=-2800.故支出对于收 入的回归方程为^y = 0.6x- 2800.
(2)平均年收入每增加 100 元,平均年消费支出约增 加 60 元.
例3 2011年元旦前夕,某市统计局统计了该 市2010年10户家庭的年收入和年饮食支出的统 计资料如下表:
(1)如果已知 y 与 x 是线性相关的,求回归方程; (2)若某家庭年收入为 9 万元,预测其年饮食支 出.
2020版人教A数学必修3 课件:2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关
x (0.01%)
104
180 190 177
147
134
150
191
204
121
学霸经验分享区 (1)回归分析是对具有相关关系的两个变量进行统计分析的方法,两 个变量具有相关关系是回归分析的前提. (2)散点图是定义在具有相关关系的两个变量基础上的,对于关系不 明确的两组数据,可先作散点图,在图上看它们有无相关关系,然后再 进行相关回归分析. (3)通过对散点图的观察,一般地,若图中数据大致分布在一条直线附 近,那么这两个变量近似成线性相关关系. (4)求线性回归方程,应注意到,只有大部分点分布在某条直线附近, 求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无 意义.
名师点津 对回归直线方程的几点说明 (1)a,b的上方加“^ ”,表示是由观察值按最小二乘法求得的估计值.
(2)(xi,yi)(i=1,2,…,n)的( x , y )在回归直线上.
(3)由回归直线方程知 x 处的估计值为 yˆ = aˆ + bˆ x.
(4)回归直线使得样本数据中的点到它的距离的平方和最小. (5)求回归直线方程,计算量大,一般应学会使用计算器求解. (6)利用回归直线方程可以对总体进行估计.
解:散点图分别如图(1)(2)所示.
从图中可以看出两图中的点各自分布在一条直线附近,因此两对变量 都具有相关关系. 图(1)中A的值由小变大时,B的值却是由大变小,即A和B成负相关; 图(2)中C的值由小变大时,D的值也是由小变大,即C和D成正相关.
2.3.2变量之间的线性相关
例2:有一个同学家开了一个小卖部,他为了研究气温
对热饮销售的影响,经过统计,得到一个卖出的热饮杯
数与当天气温的对比表:
摄氏温度 -5
0
4
7
12 15 19 23 27 31 36
热饮杯数 156 150 132 128 130 116 104 89 93 76 54 (1)画出散点图; (2)从散点图中发现气温与热饮销售杯数之间关系的一 般规律; (3)求回归方程; 从散点图可以看出,这些点大致分布在一条直线附近。
如果散点图散布在从左下角到右上角的区域,称它们成正 相关;如果散点图散布在从左上角到右下角的区域内,称它们 成负相关.
4. 线性相关
如果所有的样本点都落在某一直线附近,变量之间就有线 性相关关系。
人的脂肪百分比和年龄散点图
从散点图我们可以看出,年 龄越大,体内脂肪含量越高. 那么, 这两个变量之间具有什么样的 相关关系呢?
求两变量间的回归方程 列表:
i 1
i
2
3
4
5
6
7
8
9
10
x y
i
-5
-9
i
-4
-7 28
-3
-5 15
-2
-3 6
-1
-1 1
1
1 1
3
5 15
2
3 6
4
7 28
5
9 45
xy
i
45
列表:
i 1
i
2 -4 -7 28
3 -3 -5 15
4 -2 -3 6
10
5 -1 -1 1
6 1 1 1
2 i
7 3 5 15
0
变量之间的相关关系232两个变量的线性相关
热饮杯数
180
160
140
120
100
80
60
40
20
0
-10
0
10
20
30
40
y = -2.3517x + 147.767
温度
当x=2时,y=143.063.
求样本数据的线性回归方程,可按下列步骤进行:
x 第一步,计算平均数 ,y ,
第二步,求和 n xi2 , n xi yi ,
i 1
i 1
2.在中学校园里,有这样一种说法:“如果你的数学成绩 好,那么你的物理学习就不会有什么大问题.” 我们把数 学成绩和物理成绩看成是两个变量,那么这两个变量之间 的关系是函数关系吗? 不是
相关关系 自变量取值一定时,因变量的取值带有一定随机性的两 个变量之间的关系,叫做相关关系.
在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了 一组样本数据:
35
30
25
20
15Βιβλιοθήκη 10500
50
正相关
100
150
面积 /平方米
脂肪含量
年龄和人体脂肪含量的样本数据的散点图中的点的分
布有什么特点?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
这些点大致分布在一条直线附近.
我们再观察它的图象发现这些点大致分布在一条直线附 近,像这样,如果散点图中点的分布从整体上看大致在一 条直线附近,我们就称这两个变量之间具有线性相关关 系,这条直线叫做回归直线,该直线所对应的方程叫回归 方程。 那么,我们该怎样来求出这个回归方程? 请同学们展开讨论,能得出哪些具体的方案?
【优选整合】人教A版高中数学必修三232两个变量的线性相关学案.doc
§2.3《变量间的线性相关》导学案【学习目标】1、通过收集现实问题中两个有关联变量的数据作击散点图,并利用散点图直观认识变量间的相关关系.2、了解最小二乘法的含义.3、若两个变量具有线性相关时,会求线性回归方程,并会用线性回归方程进行预测.4、了解相关系数的大小与两个变量间的相关程度的强弱关系。
【重点】会求线性回归方程,并会用线性回归方程进行预测.【难点】会判断相关系数的大小与两个变量间的相关程度的强弱关系【使用方法与学法指•导】1.用15分钟左右的时间阅读课本基础知识,从中了解变量间的线性相关问题,通过自主高效的预习,提升自己的阅读理解能力。
2.完成教材助读设置的问题,然后结合课本的基础知识和例题,完成预习自测题。
3.将预习中不能解决的问题标出来,并写到后面的“我的疑惑”处。
【预习案】一、预习练习:1、在下列两个变量的关系中,哪些是相关关系?(1)作文水平与课外阅读量之间的关系;(2)降雪量与交通事故的发生率之间的关系;(3)光照时间和果树亩产量。
2、课本P85-86(1)如何画散点图?(2)两个变量是否具有相关关系,它的散点图有什么特点?(3)两个变量的相关关系有正相关和负相关,它们在散点图上各有什么特点?你能举出一些生活中的变量成正相关和负相关的例子吗?正相关是指:________________________________________________________________ ;负相关是指:________________________________________________________________ O (4)线性相关的两个变量,其散点图有什么特点?【探究案】探究点一:1、引入问题:观察人体的脂肪含量百■分比和年龄的样木数据的散点图,这两个相关变量成正相关•我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?2^在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?3、课本P87,什么叫回归直线? _______________________________________________________ ;什么叫回归方程?______________________________________________________ ;冋归直线的特点:_________________________________________________________回归直线与散点图中各点的位置应具有怎样的关系?________________________ 。
232变量之间的相关关系综述PPT课件
i
i
i1
由于含有绝对值,运算不方便,于是改用为
Q ( y 1 b x 1 a ) 2 ( y 2 b x 2 a ) 2 ( y n b x n a ) 2 来刻画 n 个点与回归直线在整体上的偏差 所以,当Q 取最小值时,总体偏差最小。
回归方程
回归方程 yˆ bxa的斜率与截距的一般公式:
数据 (x 1 ,y 1 ),(x 2,y 2), ,(x n,y n)
且所求回归方程是 yˆ bxa(其中a,b是待定参数.) a,b
问题:如何刻画从整体上看各数据点与此直线的距离最小?
假设已经得到两个具有线形相关关系的变量的一组
数据 (x 1 ,y 1 ),(x 2,y 2), ,(x n,y n)
例1、假设关于某设备的使用年限x和所支出的维修费用
y(万元)有如下的统计资料
使用年限x 2
3
4
5
6
维修费用y 2.2 3.8 5.5 6.5 7.0
若由资料知y对x呈线性相关关系,试求
(1)线性回归方程 yˆ bxa的回归系数a,b
i 1 2 3 4 5合
解:制表:
计
xi 2 3 4 5 6 20
2.3 变量间的相关关系
思考:在日常生活中,经常能发现,若一位同学的 数学成绩好,则他的物理成绩一般也不差。那么是否 物理成绩与数学成绩之间存在着一种相关关系?这种 说法有没有根据呢?
数学成绩
物理成绩
学习时间
其他因素
学习兴趣
结论:物理成绩和数学成绩之间是一种不确定的关系
问题1:能否再举出几个现实生活中相关关系的例子?
即估计使用10年时维修费用是12.38万元
例2、有一个同学家开了一个小卖部,他为了研究 气温对热饮销售的影响,经过统计,得到一个卖出 的热饮杯数与当天气温的对比表:
【创新设计】高考数学 232变量之间的相关关系两个变量的线性相关配套课件 新人教A必修3
方法,即使得样本数据的点到回归直线的距离的
_平__方__和__最__小__的方法叫做最小二乘法.
回归直线通过样本点的中心,对照平均数与样本数据 之间的关系,你能说说回归直线与散点图中各点之间的关 系吗? 提示 假设样本点为(x1,y1)(x2,y2),…,(xn,yn),记 x =
n1i=n1xi, y =n1i=n1yi,则( x , y )为样本点的中心,回归直线一
∴降低19.65吨标准煤.
(12分)
【变式3】假设关于某设备的使用年限x(年)和所支出的维修费 用y(万元),有如下的统计资料:
使用年限x 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0
由资料可知 y 与 x 具有相关关系. (1)求线性回归方程y^=b^x+a^的回归系数a^,b^; (2)估计使用年限为 10 年时维修费用是多少?
解析
题号
判断
原因分析
①
函数关系
正方体的棱长与体积的关系为 V=a3,确定性关系
②
不是相关关系
身高与视力无关,不具有函数 关系,也不具有相关关系
③
不是函数关系, 自由落体的物体的质量与落地 也不是相关关系 时间无关,不具有相关关系
④
相关关系
降雪量越大,交通事故发生率 越高,不确定性的关系
答案 ④
规律方法 (1)函数关系是一种确定性关系,如匀速直线 运动中路程s与时间t的关系;相关关系是一种非确定性关 系,如一块农田的水稻产量与施肥量之间的关系. (2)判断两个变量是否是相关关系的关键是看这两个变量 之间是否具有不确定性.
x2 100 400 900 1 600 2 500 3 600 4 900 6 400 8 100 10 000 38 500
2017学年数学必修三231变量之间的相关关系~232 两个变量的线性相关
【解题探究】1.典例1中样本中心点( , )与回归直线有什么关系?
x xy y x y nxy i i y 提示:典例1中回归直线必过样本中心点( , ),即点(3,3.5)在
ii
i1 i1 回归直线上.
x
2.从总体上看,典例2中每小时生产的有缺点的零件数随机器转速的增加是增加还是减少?
b n 提示:随转速的增加而减少.
ii
算得样本平均数 =3, =3.5,则由该观测数据算得的线性回归方
i1 程可能是 ( )
b A. =0.4x+2.3 C. =-2x+9.5
n x B. =2x-2.4
2
D. =-0.3x+4.4
x x x
ix
x
i1 x
i1 n
xi2
2
nx
.
i1
a
n
n y bx a
2.一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的
x x x nx i
i
i1
i1
6
120
2
.
a
n
n y bx a
【解题探究】1.典例1中判断两个变量之间具有相关关系的关键是什么?
x xy y x y nxy i i 提示:关键是看它们之间的关系是否带有相关性.
ii
2.典例2中利用散点图判断两个变量是否具有相关关系的依据是什么?
i1 i1 提示:散点图形象地体现了数据的密切程度,因此可用散点图来判断两个变量有没有线性关系.
i1 i1 (2)画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者使点的坐标在坐标系中画不准,使图形
b . n 失真,导致得出错误结论.
【课件】新课标人教A版数学必修3:2.3 两个变量的线性相关
.
预习引入:
1、现实生活中存在许多相关关系:商品销售与 广告、粮食生产与施肥量、人体的脂肪量与年 龄等等的相关关系.
2、通过收集大量的数据,进行统计,对数据 分析,找出其中的规律,对其相关关系作出 一定判断. 3、由于变量之间相关关系的广泛性和不确定 性,所以样本数据应较大,和有代表性.才能对 它们之间的关系作出正确的判断.
那么,我们该怎样来求出这个回归方程?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
脂肪含量
. 方案1、先画出一条直线,测量出各点与它
的距离,再移动直线,到达一个使距离的和最 小时,测出它的斜率和截距,得回归方程。
如图 :
脂肪含量 40
35 30
25 20 15 10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
.
方案2、在图中选两点作直线,使直线 两侧 的点的个数基本相同。
脂肪含量 40
35 30
25 20 15 35 40 45 50 55 60 65
方案3、如果多取几对点,确定多条直线,再 求出这些直线的斜率和截距的平均值作为回归直 线的斜率和截距。而得回归方程。 如图:
脂肪含量
观察人体的脂肪含量百分比和年龄的样本数 据的散点图,这两个相关变量成正相关.
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
如高原含氧量与海拔高度
的相关关系,海平面以上,
海拔高度越高,含氧量越
少。
含氧量
高中数学 第二章 统计 2.3.1-2.3.2 变量之间的相关关系 两个变量的线性相关课件 新人教
A .1 B .1 C .1 D .1 1 6 8 4 2
35
【思路导引】利用回归直线方程必过样本点的中心求解.
【解析】选B.依题意可知样本点的中心为 ( 3 , ,3 )
48
则3
8
= 1×
3
+3
4
,a 解得
=a .
1 8Βιβλιοθήκη 36【拓展延伸】相关关系的强弱
(1)若相应于变量x的取值xi,变量y的观测值为yi(1≤i≤n),称r=
6
(2)你能举例说明你对正相关与负相关的理解吗? 提示:随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性 的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少 变多. 随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关 关系,我们称为负相关.例如,汽车越重,每消耗1 L汽油所行驶的平均路程就 越短.
n
n
x i2,
xi y,i
i1
i1
30
(5)代入公式计算
b ,a,公式为
n
x iyi n x y
b
i1
n
x
2 i
n
x
2
i1
,
a y b x .
(6)写出回归直线方程 = x+ .
yb a
31
【跟踪训练】 已知变量x,y有如下对应数据:
x1234 y1345
(1)作出散点图. (2)用最小二乘法求关于x,y的回归直线方程.
42
【思路导引】(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标, 在平面直角坐标系内画散点图. (2)应用计算公式求得线性相关系数 bˆ , aˆ 的值. (3)实际上就是求当x=100时,对应的 yˆ 的值.
232两个变量的线性相关
用方程 yˆ bx a
在一般统计书中习惯用b表示一次项 系数,用a表示常数项,这正好与我们表示的 一次函数习惯相反.
最小二乘法:
n
求 ( yi a bxi )2 i 1
为最小的方法.
利用配方法求得:
n
n
y bˆ
(xi
i1 n
x)(yi (xi x)2
y)
xi
i1
n
xi2
i 1
∴所求回归直线方程为 y^=x
小结:求线性回归直线方程的步骤:
第一步:列表
xi
,
y i
,
xi
y i
;
n
n
第二步:计算
x,
y,
x2, i
xi
y i
;
i 1
i 1
第三步:代入公式计算b,a的值;
第四步:写出直线方程。
例2:有一个同学家开了一个小卖部,他为了研究气温对热 饮销售的影响,经过统计,得到一个卖出的热饮杯数与当 天气温的对比表:
35
30
25
如图:
20 15
10 5
O
脂肪含量 20 25 30 35 40
年龄 45 50 55 60 65
具有相关关系 不具有相关关系
从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位 置散布在从左下角到右上角的区域。称它们成正相关。但有的 两个变量的相关,如下图所示:
如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越 少。
从上表发现,对某个人不一定有此规律,但对很多个体放在一起,
就体现出“人体脂肪随年龄增长而增加”这一规律.而表中各年龄 对应的脂肪数是这个年龄人群的样本平均数.我们也可以对它们作 统计图、表,对这两个变量有一个直观上的印象和判断.
7示范教案(232两个变量的线性相关第2课时)
第2课时导入新课思路1思路2某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数个问题我们接着学习两个变量的线性相关——回归直线及其方程.推进新课新知探究提出问题〔1〕作散点图的步骤和方法〔2〕正、负相关的概念〔3〕什么是线性相关〔4〕看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢〔5〕什么叫做回归直线〔6〕如何求回归直线的方程什么是最小二乘法它有什么样的思想〔7〕利用计算机如何求回归直线的方程〔8〕利用计算器如何求回归直线的方程活动:学生回忆,再思考或讨论,教师及时提示指导.讨论结果:〔1〕建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.〔a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系〕〔2〕如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.〔3〕如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.〔4〕大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.〔5〕如以下列图:从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.〔6〕从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.那么,我们应当如何具体求出这个回归方程呢有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数根本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距.同学们不妨去实践一下,看看这些方法是不是真的可行〔学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或根本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.〕教师:分别分析各方法的可靠性.如以下列图:上面这些方法虽然有一定的道理,但总让人感到可靠性不强.实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小〞.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式其中,b是回归方程的斜率,a是截距.推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理.假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n),且所求回归方程是^y=bx+a,其中a、b是待定参数.当变量x取x i(i=1,2,…,n)时可以得到^y=bx i+a(i=1,2,…,n),它与实际收集到的y i之间的偏差是y i-^y=y i-(bx i+a)(i=1,2,…,n).这样,用这n个偏差的和来刻画“各点与此直线的整体偏差〞是比较适宜的.由于〔y i-^y〕可正可负,为了防止相互抵消,可以考虑用∑=-niiiyy1^||来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(y n-bx n-a)2②来刻画n个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b取什么值时Q最小,即总体偏差最小.经过数学上求最小值的运算,a,b的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法〔method of least square〕.〔7〕利用计算机求回归直线的方程.根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程.以Excel软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:①在Excel中选定表示人体的脂肪含量与年龄的相关关系的散点图〔如以下列图〕,在菜单中选定“图表〞中的“添加趋势线〞选项,弹出“添加趋势线〞对话框.〔8〕利用计算器求回归直线的方程.用计算器求这个回归方程的过程如下:所以回归方程为^y=0.577x-0.448.正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的.直线回归方程的应用:①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系.②利用回归方程进行预测;把预报因子〔即自变量x〕代入回归方程对预报量〔即因变量Y〕进行估计,即可得到个体Y值的容许区间.③利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标.如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度.应用例如思路1例1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的比照表:〔1〕画出散点图;〔2〕从散点图中发现气温与热饮销售杯数之间关系的一般规律;〔3〕求回归方程;〔4〕如果某天的气温是2 ℃,预测这天卖出的热饮杯数.解:〔1〕散点图如以下列图所示:〔2〕从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.〔3〕从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归方程的系数.利用计算器容易求得回归方程^y=-2.352x+147.767.(4)当x=2时,^y=143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮.思考气温为2 ℃时,小卖部一定能够卖出143杯左右热饮吗为什么这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下:1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点〔x,y〕落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=^y+e.这里e是随机变量,预报值^y与实际值y的接近程度由随机变量e的标准差所决定.一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮〞作为结论呢这是因为这个结论出现的可能性最大.具体地说,假设我们规定可以选择连续的3个非负整数作为可能的预测结果,那么我们选择142,143和144能够保证预测成功〔即实际卖出的杯数是这3个数之一〕的概率最大.(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;(2)如果具有线性相关关系,求出线性回归方程. 解:〔1〕在直角坐标系中画出数据的散点图,如以下列图. 直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:∑=81i ix=1 031,∑=81i iy=71.6,∑=812i ix=137 835,∑=81i ii yx=9 611.7.将它们代入公式计算得b≈0.077 4,a=-1.024 1, 所以,所求线性回归方程为=0.077 4x-1.024 1.思路2例1 给出施化肥量对水稻产量影响的试验数据: (2)求出回归直线的方程. 解:(1)散点图如以下列图.故可得到 b=230770003.39930787175⨯-⨯⨯-≈4.75,a=399.3-4.75×30≈257.从而得回归直线方程是^y =4.75x+257.例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程. 解:在直角坐标系中画出数据的散点图,如以下列图.直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:∑===1012,7.91,55i ix y x =38 500,∑=1012i iy =87 777,∑=101i i i y x =55 950.b=2210121015510385007.915510559501010⨯-⨯⨯-=--∑∑==x xyx yx i ii ii≈0.668. a=x b y -=91.7-0.668×55≈54.96.因此,所求线性回归方程为^y =bx+a=0.668x+54.96. 例3 10条狗的血球体积及红血球数的测量值如下:〔1〕画出上表的散点图; 〔2〕求出回归直线的方程. 解:〔1〕散点图如下. 〔2〕101=x (45+42+46+48+42+35+58+40+39+50)=44.50, 101=y (6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 设回归直线方程为^y =bx+a,那么b=210121011010x xyx yx i ii ii --∑∑===0.175,a=x b y -=-0.418,所以所求回归直线的方程为^y =0.175x-0.148.点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b 的计算公式,算出a,b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数y x ,;计算x i 与y i 的积,求∑x i y i ;计算∑x i 2;将结果代入公式求b ;用a=x b y -求a ;写出回归直线方程. 知能训练1.以下两个变量之间的关系哪个不是函数关系〔 〕 A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高 答案:D2.三点(3,10),(7,20),(11,24)的线性回归方程是〔 〕A.^yB.^y =1.75+5.75x C.^y D.^y =5.75+1.75x 答案:D设y 对x 呈线性相关关系.试求: 〔1〕线性回归方程^y =bx+a 的回归系数a,b ;〔2〕估计使用年限为10年时,维修费用是多少 答案:〔1〕b=1.23,a=0.08;〔2〕12.38.4.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下: 模型1:y=6+4x ;模型2:y=6+4x+e .〔1〕如果x=3,e=1,分别求两个模型中y 的值;〔2〕分别说明以上两个模型是确定性模型还是随机模型. 解:〔1〕模型1:y=6+4x=6+4×3=18; 模型2:y=6+4x+e=6+4×3+1=19.〔2〕模型1中相同的x 值一定得到相同的y 值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y 值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.〔1〕画出数据的散点图;〔2〕用最小二乘法估计求线性回归方程. 解:〔1〕散点图如以下列图. 〔2〕n=5,∑=51i ix=545,x =109,∑=51i iy=116,y =23.2,∑=512i ix=60 952,∑=51i ii yx =12 952,b=2545609525116545129525-⨯⨯-⨯≈0.199,a=23.2-0.199×109≈1.509,所以,线性回归方程为y=0.199x+1.509. 拓展提升要求估计利润〔Y i 〕对科研费用支出〔X i 〕的线性回归模型. 解:设线性回归模型直线方程为:i i X Y 1^0^^ββ+=,因为:630==∑nX x i=5,6180==∑nYY i=30,现求解参数β0、β1的估计值: 方法一:3006009001200540060003020061803010006)(2221^=--=-⨯⨯-⨯=--=∑∑∑∑i i ii i X X n Y Y X n β=2, x Y 1^0^ββ-==30-2×5=20.方法二:501005620030561000)(2221^=⨯-⨯⨯-=--=∑∑x n X Y x n Y X ii i β=2, x Y 1^0^ββ-==30-2×5=20.方法三:50100)())((21^=---=∑∑x X Y Y x X ii iβ=2,x Y 1^0^ββ-==30-2×5=20.所以利润〔Y i 〕对科研费用支出〔X i 〕的线性回归模型直线方程为:i Y ^=20+2X i . 课堂小结1.求线性回归方程的步骤: 〔1〕计算平均数y x ,; (2)计算x i 与y i 的积,求∑x i y i ; (3)计算∑x i 2,∑y i 2,(4)将上述有关结果代入公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a x n x yx n yx x x y y x x b n i i ni ii ni i ni i i ,)())((1221121求b,a,写出回归直线方程.2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 作业习题2.3A 组3、4,B 组1、2.设计感想本节课在上节课的根底上,利用实例分析了散点图的分布规律,推导出了线性回归直线的方程的求法,并利用回归直线的方程估计可能的结果,本节课讲得较为详细,实例较多,便于同学们分析比较.思路1和思路2的例题对知识进行了稳固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度,树立时间观,培养勤奋、刻苦的精神.。
人教版数学必修三第二章2.3.2 两个变量之间的线性相关 教学课件(共22张PPT)
如高原含氧量与海拔高度
的相关关系,海平面以上, 海拔高度越高,含氧量越少。
作出散点图发现,它
们散布在从左上角到右下角
的区域内。又如汽车的载重
和汽车每消耗1升汽油所行
使的平均路程,称它们成负
相关.
O
思考:课本P86的思考题.
正、负相关、线性相关 概念探究
• 请同学们观察这4幅图,看有什么特点?
脂肪含量 40
两个变量的线性相关
一、创设情境 导入新课 :
世界是一个普遍联系的整 体,任何事 物都与其它事物相联系。
• 我们曾经研究过两个变量之间的函数关 系:一个自变量对应着唯一的一个函数 值,这两者之间是一种确定关系。生活 中的任何两个变量之间是不是只有确定 关系呢?请同学们举例说明
• 数学的理解世界
★数学学习与物理学习 ★商业销售收入与广告之间 ★粮食产量与施肥量之间 ★人体脂肪含量与年龄之间
35
30
25
20
15
10
5
0
图1
0 5 10 15 20 25 30 35 40 45 50 55 60 65
年龄
1000 800 600 400 200 0 0
图1
10
09
80
70
60
50
40
30
20
10
00
4
5
6
7
8
9
0
0图 0 30 0
0
1.2
1
0.8
0.6
0.4
0.2
0
-0.2
0
11 0
50
如上的一组数据,你能分析人体的脂肪 含量与年龄之间有怎样的关系吗?
人教B版高中数学必修三232两个变量的线性相关学案
2.3.2两个变量的线性相关教学目标:1.明确事物间的相互联系。
认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。
2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.教学重点:1.利用散点图直观认识两个变量之间的线性关系.2.根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:1.作散点图和理解两个变量的正相关和负相关。
2.理解最小二乘法的思想教学过程:一、复习准备:1. 人的身高和体重之间的关系?2. 学生设计一个统计问题,并指出问题涉及的总体是什么,所涉及的变量是什么.二、讲授新课:1. 教学散点图①出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:据的图形,这样的图形叫做散点图。
正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关。
如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。
④讨论:你能举出一些生活中的变量成正相关或负相关的例子吗?⑤练习:一个工厂为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次调查,收集数据如下:2. 指出是正相关还是负相关。
3. 关于加工零件的个数与加工时间,你能得出什么结论? ⑥ 小结:1.散点图的画法。
2.正相关与负相关的概念。
三、回归方程1. 教学回归直线概念:① 从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线。
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这这两个变量之间具有线形相关关系,直线叫回归直线。
②提问:从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线。
那么,怎样确定这条直线呢? 2. 教学最小二乘法:①求回归方程的关键是如何用数学的方法刻画“从整体上看,各点与此直线的距离最小”.如果直线的方程为αβ+=x y ,用()i ,,βαρ表示第i 个样本点()i i y x ,与直线之间的距离,则从总体上看各点与此直线的距离可以用所有样本点与回归直线的距离来表示,即用下面的公式()()∑==ni i Q 1,,,βαρβα来表示.注意到上面的等式对于任何实数α和β都有定义,因此可把()βα,Q 看成二元函数.这样,“从整体上看,各点与此直线的距离最小”的含义是回归方程的截距a 和斜率b 构成的点()b a ,应该是函数()βα,Q 的最小值点.特别地,当()()2,,i i i x y i αββαρ--=时,()b a ,应该使函数()()()()2222211,αβαβαββα--++--+--=n n x y x y x y Q 达到极小值,即a 和b 由公式①给出。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
脂肪含量
思考1:回归直线与散点图中各点的位置 应具有怎样的关系?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
整体上最接近
脂肪含量
思考2:对于求回归直线方程,你有哪 些想法?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
个变量之间具有线性相关关系,这条直
线叫做回归直线.对具有线性相关关系的
两个变量,其回归直线一定通过样本点
的中心吗?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
脂肪含量
脂肪含量
思考4:对一组具有线性相关关系的样本 数据,你认为其回归直线是一条还是几 条?
ks5u精品课件
脂肪含量
思考5:在样本数据的散点图中,能否 用直尺准确画出回归直线?借助计算机 怎样画出回归直线?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
知识探究(二):回归方程
在直角坐标系中,任何一条直线都有相 应的方程,回归直线的方程称为回归方 程.对一组具有线性相关关系的样本数 据,如果能够求出它的回归方程,那么 我们就可以比较具体、清楚地了解两个 相关变量的内在联系,并根据回归方程 对总体进行估计.
思考5:根据有关数学原理分析,当
n
n
(xi x )( yi y )
xi yi nx y
b i1 n
(xi x )2
i1 n
, a y bx
xi2 nx 2
i1
时,总体偏差
Q
n
i 1
(yi yˆi )2 为最小,这样
i1
就得到了回归方程,这种求回归方程的 方法叫做最小二乘法.回归方程 yÙ = bx + a 中,a,b的几何意义分别是什么?
i1 n
,a y bx
(xi x)2
xi2 nx 2
i1
i1
第四步,写出回归方程 yÙ = bx + a
作业:
P94习题2.3 A组:2,3. B组:1.
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
2020年9月将率先推出英语能力证书,中国教育电视台栏目运营总监应乾,张有训,赵风云,邓详达共同启动《国学少年强》栏目正式开机仪式,合作方负责人刘胜表示要以此次校企合作签约为起点, 搭建更多互通的桥梁,发挥各自优势,为中国国际邮轮旅游产业发展战略提供人才支撑,jus https:///jus,当天上午,还举行了黄炎培文化广场落成剪彩仪式,培养受益一生的能力5月24日, 著名儿童文学作家张之路走进作业帮名家讲堂,与学员们分享想象的力量,根据调查结果,制定了贯穿本书故事主题的框架,以叙述故事的方式呈现
理论迁移
例 有一个同学家开了一个小卖部, 他为了研究气温对热饮销售的影响,经 过统计,得到一个卖出的饮料杯数与当 天气温的对比表:
摄氏温 -5
0
4
7
12
度(℃)
热饮杯 156 150
132
128
130
数
15
19
23
27
31
36
116 104
89
93
76
54
摄氏温 -5
0
4
7
12ቤተ መጻሕፍቲ ባይዱ
度(℃)
热饮杯 156 150
其中 yÙi = bxi + a .
思考4:为了从整体上反映n个样本数 据与回归直线的接近程度,你认为选 用哪个数量关系来刻画比较合适?
(x1, y1)
(xi,yi)
(xn,yn)
(x2,y2)
n
Q (yi yˆi )2 i1 ( y1 bx1 a)2 ( y2 bx2 a)2 L ( yn bxn a)2
问题提出
1. 两个变量之间的相关关系的含义如 何?成正相关和负相关的两个相关变量 的散点图分别有什么特点? 自变量取值一定时,因变量的取值带有 一定随机性的两个变量之间的关系.
正相关的散点图中的点散布在从左下角 到右上角的区域,负相关的散点图中的 点散布在从左上角到右下角的区域
知识探究(一):回归直线
思考1:一组样本数据的平均数是样本数 据的中心,那么散点图中样本点的中心 如何确定?它一定是散点图中的点吗?
脂肪含量
40
35
30
25
20
15 10
(x, y )
5
0 20 25 30 35 40 45 50 55 60 65 年龄
思考3:如果散点图中的点的分布,从整
体上看大致在一条直线附近,则称这两
132
128
130
数
15
19
23
27
31
36
116 104
89
93
76
54
(1)画出散点图; (2)从散点图中发现气温与热饮杯数之 间关系的一般规律; (3)求回归方程; (4)如果某天的气温是2℃,预测这天卖 出的热饮杯数.
热饮杯数
180
160
140
120
100
80
60
40
20
0
-10
0
10
20
30
y = -2.3517x + 147.77
40 温度
当x=2时,y=143.063.
小结作业
1.求样本数据的线性回归方程,可按 下列步骤进行:
第一步,计算平均数 x , y
n
n
第二步,求和 xi yi , xi2
i1 n
i 1
n
(xi x)(yi y) xi yi nx y
第三步,计算 b i1 n
思考6:利用计算器或计算机可求得年龄和 人体脂肪含量的样本数据的回归方程为
yÙ = 0.577x - 0.448,由此我们可以根据
一个人个年龄预测其体内脂肪含量的百分 比的回归值.若某人37岁,则其体内脂肪含 量的百分比约为多少?
脂肪含量
20.9%
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
思考3:对一组具有线性相关关系的样
本yn)数,据设:其(回x1归,方y1)程,为(x2,y2)yÙ,=…b可x,以+(xan,
用哪些数量关系来刻画各样本点与回
归直线的接近程度?
(xi,yi)
(x1, y1)
(xn,yn)
(x2,y2)
可以用 | yi - yÙi | 或 (yi - yÙi )2 ,