232两个变量的线性关系
20191819第2章23231 变量间的相关关系232 两个变量的线性相关语文.doc
2.3 变量的相关性 2.3.1 变量间的相关关系 2.3.2 两个变量的线性相关学习目标:1.理解两个变量的相关关系的概念.(重点)2.会画散点图,并利用散点图判断两个变量是否具有相关关系.(重点)3.理解最小二乘法原理,会求回归直线方程.(难点)[自 主 预 习·探 新 知]一、变量间的相关关系 1.两个变量的关系2.将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.二、两个变量的线性相关 1.最小二乘法设x 、Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx .当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q = i =1n(y i -a -bx i )2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.2.回归直线方程的系数计算公式1.思考辨析(1)回归直线方程中,由x的值得出的y值是准确值.()(2)回归直线方程一定过样本点的中心.()(3)回归直线方程一定过样本中的某一个点.()(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.()[答案](1)×(2)√(3)×(4) ×2.过(3,10),(7,20),(11,24)三点的回归直线方程是()A.y^=1.75+5.75xB.y^=-1.75+5.75xC.y^=5.75+1.75xD.y^=5.75-1.75xC[代入系数公式得b^=1.75,a^=5.75.代入直线方程,求得y^=5.75+1.75x.故选C.]3.如图2-3-1所示的两个变量不具有相关关系的有________.图2-3-1①④[①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.]4.若施肥量x(kg)与水稻产量y(kg)的线性回归方程为y^=5x+250,当施肥量为80 kg时,预计水稻产量约为________kg.650[把x=80代入回归方程得其预测值y^=5×80+250=650(kg).][合作探究·攻重难]相关关系的判断(1)下列两个变量之间的关系,哪个不是函数关系()A.正方体的棱长和体积B.圆半径和圆的面积C.正n边形的边数和内角度数之和D.人的年龄和身高(2)对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()图2-3-2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关[思路探究]结合相关关系,函数关系的定义及正负相关的定义分别对四个选项作出判断.(1)D(2)C[(1)A、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以有不同的身高,∴选D. (2)由图象知,变量x与y呈负相关关系;u与v呈正相关关系.][跟踪训练]1.某公司2009~2019年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:A.B.利润中位数是18,x与y有负线性相关关系C.利润中位数是17,x与y有正线性相关关系D.利润中位数是17,x与y有负线性相关关系C[由表知,利润中位数是12(16+18)=17,且y随x的增大而增大,故选C.]求回归直线方程[探究问题]1.怎样判断一组数据是否具有线性相关关系?[提示]画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.2.最小二乘法的实质是什么?任何一组数据都可以由最小二乘法得出回归直线方程吗?[提示]实际上,最小二乘法就是从整体上看,使各点与回归直线的距离最小.用最小二乘法求回归直线方程的前提是所给数据是线性相关的,不是线性相关的数据,求出回归直线方程是无意义的.3.回归系数b^的含义是什么?[提示]b^代表x每增加一个单位,y的平均增加单位数.当b^>0时,两变量呈正相关;当b^<0时,两变量呈负相关.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(2)如果y与x具有线性相关关系,求y关于x的回归直线方程.[思路探究]画散点图→确定相关关系→求回归直线系数→写回归直线方程[解](1)画散点图如下:由上图可知y与x具有线性相关关系.(2)列表、计算:b^=∑i=110x i y i-10x y∑i=110x2i-10x2=55 950-10×55×91.738 500-10×552≈0.668,a^=y-b^x=91.7-0.668×55=54.96.即所求的回归直线方程为:y^=0.668x+54.96.下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(1)(2)请根据上表提供的数据,用最小二乘法求出回归直线方程y ^=bx +a ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【导学号:31892019】[思路探究] (1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数b ^,a ^的值;(3)实际上就是求当x =100时,对应的v 的值. [解] (1)散点图,如图所示:(2)由题意,得∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∑i =14x 2i =32+42+52+62=86,∴b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a^=y -b ^x =3.5-0.7×4.5=0.35,故线性回归直线方程为y ^=0.7x +0.35.(3)根据回归直线方程的预测,现在生产100吨产品消耗的标准煤为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨)标准煤.2.某种产品的广告费支出y (百万元)与销售额x (百万元)之间的关系如下表所示.(1)假定y (2)若广告费支出不少于60百万元,则实际销售额应不少于多少?[解] (1)设回归直线方程为y ^=bx +a ,则b ^=438-412.5660-625=25.535=5170,a ^=y -b ^x=5+8+9+114-5170×8+12+14+164=334-5170×252=-67,则所求回归直线方程为y ^=5170x -67.(2)由y ^=5170x -67≥60,得x ≥4 26051≈84,所以实际销售额不少于84百万元.[当 堂 达 标·固 双 基]1.设一个回归方程y ^=3+1.2x ,则变量x 增加一个单位时( ) A .y 平均增加1.2个单位 B .y 平均增加3个单位 C .y 平均减少1.2个单位 D .y 平均减少3个单位 A [由b^=1.2>0,故选A.]2.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C .回归直线方程最能代表观测值x 、y 之间的线性关系D .任何一组观测值都能得到具有代表意义的回归直线D[只有数据点整体上分布在一条直线附近时,才能得到具有代表意义的回归直线.]3.已知变量x,y之间具有线性相关关系,其散点图如图2-3-3所示,则其回归方程可能为()A.y^=1.5x+2B.y^=-1.5x+2C.y^=1.5x-2D.y^=-1.5x-2图2-3-3B[由散点图知,变量x、y呈负相关,且回归直线在y轴上的截距大于0,故b^<0,a^>0.因此回归方程可能为y^=-1.5x+2.]4.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是()A.y^=0.4x+2.3B.y^=2x-2.4C.y^=-2x+9.5D.y^=-0.3x+4.4A[因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B,故选A.]5.对具有线性相关关系的变量x和y,测得一组数据如下表所示.[解]由题意可知x=2+4+5+6+85=5,y=30+40+60+50+705=50,即样本中心为(5,50),设回归直线方程为y^=6.5x+a,∵回归直线过样本中心(5,50),^,即a^=17.5,∴50=6.5×5+a^=6.5x+17.5.∴回归直线方程为y第 11 页。
最新-2018高中数学 第2章232两个变量的线性相关课件 新人教A版必修3 精品
x =3+4+4 5+6=4.5,
y
=2.5+ 3+ 4+ 4
4.5= 3.5,
4
x2i =32+42+52+62=86.
i= 1
∴b=66.58-6-4×4×4.45.×52 3.5=6866.5--8613=0.7,
a= y -b x =3.5-0.7×4.5=0.35.
故线性回归方程为^y =0.7x+0.35. (3)根据回归方程预测现在生产 100 吨产品消耗 的标准煤的数量为 0.7×100+0.35=70.35(吨), 故生产能耗减少了 90-70.35=19.65(吨).
知新益能
1.相关关系:与函数关系不同,相关关系是一 种_非__确__定____性关系. 2.从散点图上看,点散布在从左下角到右上角 的区域内,两个变量的这种相关关系称为正__相__关__; 点散布在从左上角到右下角的区域内,两个变量 的相关关系为__负__相__关_____.
3.从散点图上看,如果这些点从整体上看大 致分布在通过散点图中心的一条直线附近,我 们就称这两个变量之间具有_线__性__相__关__关__系___, 这条直线叫做__回__归__直__线___.
解:(1)设年收入为 x 元,年支出为 y 元,由条件知 x =88000 元, y =50000 元,b=0.6,则 a= y - b x =50000-0.6×88000=-2800.故支出对于收 入的回归方程为^y = 0.6x- 2800.
(2)平均年收入每增加 100 元,平均年消费支出约增 加 60 元.
例3 2011年元旦前夕,某市统计局统计了该 市2010年10户家庭的年收入和年饮食支出的统 计资料如下表:
(1)如果已知 y 与 x 是线性相关的,求回归方程; (2)若某家庭年收入为 9 万元,预测其年饮食支 出.
2.3.2变量之间的线性相关
例2:有一个同学家开了一个小卖部,他为了研究气温
对热饮销售的影响,经过统计,得到一个卖出的热饮杯
数与当天气温的对比表:
摄氏温度 -5
0
4
7
12 15 19 23 27 31 36
热饮杯数 156 150 132 128 130 116 104 89 93 76 54 (1)画出散点图; (2)从散点图中发现气温与热饮销售杯数之间关系的一 般规律; (3)求回归方程; 从散点图可以看出,这些点大致分布在一条直线附近。
如果散点图散布在从左下角到右上角的区域,称它们成正 相关;如果散点图散布在从左上角到右下角的区域内,称它们 成负相关.
4. 线性相关
如果所有的样本点都落在某一直线附近,变量之间就有线 性相关关系。
人的脂肪百分比和年龄散点图
从散点图我们可以看出,年 龄越大,体内脂肪含量越高. 那么, 这两个变量之间具有什么样的 相关关系呢?
求两变量间的回归方程 列表:
i 1
i
2
3
4
5
6
7
8
9
10
x y
i
-5
-9
i
-4
-7 28
-3
-5 15
-2
-3 6
-1
-1 1
1
1 1
3
5 15
2
3 6
4
7 28
5
9 45
xy
i
45
列表:
i 1
i
2 -4 -7 28
3 -3 -5 15
4 -2 -3 6
10
5 -1 -1 1
6 1 1 1
2 i
7 3 5 15
0
变量之间的相关关系232两个变量的线性相关
热饮杯数
180
160
140
120
100
80
60
40
20
0
-10
0
10
20
30
40
y = -2.3517x + 147.767
温度
当x=2时,y=143.063.
求样本数据的线性回归方程,可按下列步骤进行:
x 第一步,计算平均数 ,y ,
第二步,求和 n xi2 , n xi yi ,
i 1
i 1
2.在中学校园里,有这样一种说法:“如果你的数学成绩 好,那么你的物理学习就不会有什么大问题.” 我们把数 学成绩和物理成绩看成是两个变量,那么这两个变量之间 的关系是函数关系吗? 不是
相关关系 自变量取值一定时,因变量的取值带有一定随机性的两 个变量之间的关系,叫做相关关系.
在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了 一组样本数据:
35
30
25
20
15Βιβλιοθήκη 10500
50
正相关
100
150
面积 /平方米
脂肪含量
年龄和人体脂肪含量的样本数据的散点图中的点的分
布有什么特点?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
这些点大致分布在一条直线附近.
我们再观察它的图象发现这些点大致分布在一条直线附 近,像这样,如果散点图中点的分布从整体上看大致在一 条直线附近,我们就称这两个变量之间具有线性相关关 系,这条直线叫做回归直线,该直线所对应的方程叫回归 方程。 那么,我们该怎样来求出这个回归方程? 请同学们展开讨论,能得出哪些具体的方案?
【优选整合】人教A版高中数学必修三232两个变量的线性相关学案.doc
§2.3《变量间的线性相关》导学案【学习目标】1、通过收集现实问题中两个有关联变量的数据作击散点图,并利用散点图直观认识变量间的相关关系.2、了解最小二乘法的含义.3、若两个变量具有线性相关时,会求线性回归方程,并会用线性回归方程进行预测.4、了解相关系数的大小与两个变量间的相关程度的强弱关系。
【重点】会求线性回归方程,并会用线性回归方程进行预测.【难点】会判断相关系数的大小与两个变量间的相关程度的强弱关系【使用方法与学法指•导】1.用15分钟左右的时间阅读课本基础知识,从中了解变量间的线性相关问题,通过自主高效的预习,提升自己的阅读理解能力。
2.完成教材助读设置的问题,然后结合课本的基础知识和例题,完成预习自测题。
3.将预习中不能解决的问题标出来,并写到后面的“我的疑惑”处。
【预习案】一、预习练习:1、在下列两个变量的关系中,哪些是相关关系?(1)作文水平与课外阅读量之间的关系;(2)降雪量与交通事故的发生率之间的关系;(3)光照时间和果树亩产量。
2、课本P85-86(1)如何画散点图?(2)两个变量是否具有相关关系,它的散点图有什么特点?(3)两个变量的相关关系有正相关和负相关,它们在散点图上各有什么特点?你能举出一些生活中的变量成正相关和负相关的例子吗?正相关是指:________________________________________________________________ ;负相关是指:________________________________________________________________ O (4)线性相关的两个变量,其散点图有什么特点?【探究案】探究点一:1、引入问题:观察人体的脂肪含量百■分比和年龄的样木数据的散点图,这两个相关变量成正相关•我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?2^在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?3、课本P87,什么叫回归直线? _______________________________________________________ ;什么叫回归方程?______________________________________________________ ;冋归直线的特点:_________________________________________________________回归直线与散点图中各点的位置应具有怎样的关系?________________________ 。
232变量之间的相关关系综述PPT课件
i
i
i1
由于含有绝对值,运算不方便,于是改用为
Q ( y 1 b x 1 a ) 2 ( y 2 b x 2 a ) 2 ( y n b x n a ) 2 来刻画 n 个点与回归直线在整体上的偏差 所以,当Q 取最小值时,总体偏差最小。
回归方程
回归方程 yˆ bxa的斜率与截距的一般公式:
数据 (x 1 ,y 1 ),(x 2,y 2), ,(x n,y n)
且所求回归方程是 yˆ bxa(其中a,b是待定参数.) a,b
问题:如何刻画从整体上看各数据点与此直线的距离最小?
假设已经得到两个具有线形相关关系的变量的一组
数据 (x 1 ,y 1 ),(x 2,y 2), ,(x n,y n)
例1、假设关于某设备的使用年限x和所支出的维修费用
y(万元)有如下的统计资料
使用年限x 2
3
4
5
6
维修费用y 2.2 3.8 5.5 6.5 7.0
若由资料知y对x呈线性相关关系,试求
(1)线性回归方程 yˆ bxa的回归系数a,b
i 1 2 3 4 5合
解:制表:
计
xi 2 3 4 5 6 20
2.3 变量间的相关关系
思考:在日常生活中,经常能发现,若一位同学的 数学成绩好,则他的物理成绩一般也不差。那么是否 物理成绩与数学成绩之间存在着一种相关关系?这种 说法有没有根据呢?
数学成绩
物理成绩
学习时间
其他因素
学习兴趣
结论:物理成绩和数学成绩之间是一种不确定的关系
问题1:能否再举出几个现实生活中相关关系的例子?
即估计使用10年时维修费用是12.38万元
例2、有一个同学家开了一个小卖部,他为了研究 气温对热饮销售的影响,经过统计,得到一个卖出 的热饮杯数与当天气温的对比表:
【创新设计】高考数学 232变量之间的相关关系两个变量的线性相关配套课件 新人教A必修3
方法,即使得样本数据的点到回归直线的距离的
_平__方__和__最__小__的方法叫做最小二乘法.
回归直线通过样本点的中心,对照平均数与样本数据 之间的关系,你能说说回归直线与散点图中各点之间的关 系吗? 提示 假设样本点为(x1,y1)(x2,y2),…,(xn,yn),记 x =
n1i=n1xi, y =n1i=n1yi,则( x , y )为样本点的中心,回归直线一
∴降低19.65吨标准煤.
(12分)
【变式3】假设关于某设备的使用年限x(年)和所支出的维修费 用y(万元),有如下的统计资料:
使用年限x 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0
由资料可知 y 与 x 具有相关关系. (1)求线性回归方程y^=b^x+a^的回归系数a^,b^; (2)估计使用年限为 10 年时维修费用是多少?
解析
题号
判断
原因分析
①
函数关系
正方体的棱长与体积的关系为 V=a3,确定性关系
②
不是相关关系
身高与视力无关,不具有函数 关系,也不具有相关关系
③
不是函数关系, 自由落体的物体的质量与落地 也不是相关关系 时间无关,不具有相关关系
④
相关关系
降雪量越大,交通事故发生率 越高,不确定性的关系
答案 ④
规律方法 (1)函数关系是一种确定性关系,如匀速直线 运动中路程s与时间t的关系;相关关系是一种非确定性关 系,如一块农田的水稻产量与施肥量之间的关系. (2)判断两个变量是否是相关关系的关键是看这两个变量 之间是否具有不确定性.
x2 100 400 900 1 600 2 500 3 600 4 900 6 400 8 100 10 000 38 500
最新高中数学A版2.3.2-两个变量的线性关系优秀课件ppt课件
年龄
0 20 25 30 35 40 45 50 55 60 65
通过分析、观察可以看到:随着年龄的增长, 人体脂肪含量越高,这源自明两个变量之间的确存 在一定的关系。
脂肪含量 40
35 30
25 20 15 10 5
递增我们叫它 们正相关
递减我们叫它 们负相关
年龄
0 20 25 30 35 40 45 50 55 60 65
分之百的保证对应于x,预报值 yˆ 能够等于
实际值y。事实上,y=bx+a+e=y ˆ+e,这里的
e是随机值,预报值 yˆ 与实际值y的平均接近
程度有随机值e的标准差所决定。
2.数据的热点散图为:
从这个热点图中可以看出,鸟的种类数与海拔高 度应该为正相关(事实上相关系数为0.793)。但是 从热点分布特点来看,它们之间线性相关性不强。
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关
解析:
本题主要考查两个变量的线性相关性, 由图①可看出离散点分布在一条斜率为负 的直线周围,所以变量x,y成负相关;而图 ②的离散点分布在一条斜率为正的直线周 围,所以变量u,v成正相关。
B .y ˆ1.755.75x C .y ˆ1.755.75x D .y ˆ5.751.75x
习题答案
1.当x=0时,yˆ =147.767 ,这个值与实际卖出
的热饮杯数150不符,原因是:线性回归方程 中的截距和斜率都是通过样本估计的,存在随 机误差,这种误差可以导致预测结果的偏差; 即使截距和斜率的估计没有误差,也不可能百
33
2017学年数学必修三231变量之间的相关关系~232 两个变量的线性相关
【解题探究】1.典例1中样本中心点( , )与回归直线有什么关系?
x xy y x y nxy i i y 提示:典例1中回归直线必过样本中心点( , ),即点(3,3.5)在
ii
i1 i1 回归直线上.
x
2.从总体上看,典例2中每小时生产的有缺点的零件数随机器转速的增加是增加还是减少?
b n 提示:随转速的增加而减少.
ii
算得样本平均数 =3, =3.5,则由该观测数据算得的线性回归方
i1 程可能是 ( )
b A. =0.4x+2.3 C. =-2x+9.5
n x B. =2x-2.4
2
D. =-0.3x+4.4
x x x
ix
x
i1 x
i1 n
xi2
2
nx
.
i1
a
n
n y bx a
2.一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的
x x x nx i
i
i1
i1
6
120
2
.
a
n
n y bx a
【解题探究】1.典例1中判断两个变量之间具有相关关系的关键是什么?
x xy y x y nxy i i 提示:关键是看它们之间的关系是否带有相关性.
ii
2.典例2中利用散点图判断两个变量是否具有相关关系的依据是什么?
i1 i1 提示:散点图形象地体现了数据的密切程度,因此可用散点图来判断两个变量有没有线性关系.
i1 i1 (2)画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者使点的坐标在坐标系中画不准,使图形
b . n 失真,导致得出错误结论.
【课件】新课标人教A版数学必修3:2.3 两个变量的线性相关
.
预习引入:
1、现实生活中存在许多相关关系:商品销售与 广告、粮食生产与施肥量、人体的脂肪量与年 龄等等的相关关系.
2、通过收集大量的数据,进行统计,对数据 分析,找出其中的规律,对其相关关系作出 一定判断. 3、由于变量之间相关关系的广泛性和不确定 性,所以样本数据应较大,和有代表性.才能对 它们之间的关系作出正确的判断.
那么,我们该怎样来求出这个回归方程?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
脂肪含量
. 方案1、先画出一条直线,测量出各点与它
的距离,再移动直线,到达一个使距离的和最 小时,测出它的斜率和截距,得回归方程。
如图 :
脂肪含量 40
35 30
25 20 15 10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
.
方案2、在图中选两点作直线,使直线 两侧 的点的个数基本相同。
脂肪含量 40
35 30
25 20 15 35 40 45 50 55 60 65
方案3、如果多取几对点,确定多条直线,再 求出这些直线的斜率和截距的平均值作为回归直 线的斜率和截距。而得回归方程。 如图:
脂肪含量
观察人体的脂肪含量百分比和年龄的样本数 据的散点图,这两个相关变量成正相关.
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
如高原含氧量与海拔高度
的相关关系,海平面以上,
海拔高度越高,含氧量越
少。
含氧量
2.3.1 变量之间的相关关系;2.3.2 两个变量的线性相关
2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关
5.正常情况下,年龄在 18 岁到 38 岁的人,体重 y(kg)对身高 x(cm)的回归方程为y=0.72x-58.2,张红同学(20 岁)身高 178 cm,她的体重应该在________kg 左右.
^
答案
69.96
^
解析 用回归方程对身高为 178 cm 的人的体重进行预 测,当 x=178 时,y=0.72×178-58.2=69.96(kg).
^ ^
(
B.y =10x+200 D.y =10x-200
^ ^
)
答案 A 解析 ∵y 与 x 负相关,∴排除 B、D,
又∵C 项中 x>0 时y <0 不合题意,∴C 错.
^
预习导学
课堂讲义
当堂检测
当堂检测
2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关
3.设有一个回归方程为y =-1.5x+2,则变量 x 增加一个单 位时 ( )
πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以 有不同的身高,∴选D.
预习导学
课堂讲义
当堂检测
课堂讲义
2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关
要点二 散点图
例2 (1)如图是两个变量统计数据的散点图,判断两个变量 之间是否具有相关关系?
预习导学
课堂讲义
当堂检测
预习导学
课堂讲义
当堂检测
当堂检测
2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关
(2)用公式计算a、b的值时,要先算出b,然后才能算出a. 3.利用回归方程,我们可以进行估计和预测.若回归直线方程 为y=bx+a,则 x=x0 处的估计值为y0=bx0+a.
232两个变量的线性相关
用方程 yˆ bx a
在一般统计书中习惯用b表示一次项 系数,用a表示常数项,这正好与我们表示的 一次函数习惯相反.
最小二乘法:
n
求 ( yi a bxi )2 i 1
为最小的方法.
利用配方法求得:
n
n
y bˆ
(xi
i1 n
x)(yi (xi x)2
y)
xi
i1
n
xi2
i 1
∴所求回归直线方程为 y^=x
小结:求线性回归直线方程的步骤:
第一步:列表
xi
,
y i
,
xi
y i
;
n
n
第二步:计算
x,
y,
x2, i
xi
y i
;
i 1
i 1
第三步:代入公式计算b,a的值;
第四步:写出直线方程。
例2:有一个同学家开了一个小卖部,他为了研究气温对热 饮销售的影响,经过统计,得到一个卖出的热饮杯数与当 天气温的对比表:
35
30
25
如图:
20 15
10 5
O
脂肪含量 20 25 30 35 40
年龄 45 50 55 60 65
具有相关关系 不具有相关关系
从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位 置散布在从左下角到右上角的区域。称它们成正相关。但有的 两个变量的相关,如下图所示:
如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越 少。
从上表发现,对某个人不一定有此规律,但对很多个体放在一起,
就体现出“人体脂肪随年龄增长而增加”这一规律.而表中各年龄 对应的脂肪数是这个年龄人群的样本平均数.我们也可以对它们作 统计图、表,对这两个变量有一个直观上的印象和判断.
7示范教案(232两个变量的线性相关第2课时)
第2课时导入新课思路1思路2某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数个问题我们接着学习两个变量的线性相关——回归直线及其方程.推进新课新知探究提出问题〔1〕作散点图的步骤和方法〔2〕正、负相关的概念〔3〕什么是线性相关〔4〕看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢〔5〕什么叫做回归直线〔6〕如何求回归直线的方程什么是最小二乘法它有什么样的思想〔7〕利用计算机如何求回归直线的方程〔8〕利用计算器如何求回归直线的方程活动:学生回忆,再思考或讨论,教师及时提示指导.讨论结果:〔1〕建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.〔a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系〕〔2〕如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.〔3〕如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.〔4〕大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.〔5〕如以下列图:从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.〔6〕从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.那么,我们应当如何具体求出这个回归方程呢有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数根本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距.同学们不妨去实践一下,看看这些方法是不是真的可行〔学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或根本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.〕教师:分别分析各方法的可靠性.如以下列图:上面这些方法虽然有一定的道理,但总让人感到可靠性不强.实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小〞.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式其中,b是回归方程的斜率,a是截距.推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理.假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n),且所求回归方程是^y=bx+a,其中a、b是待定参数.当变量x取x i(i=1,2,…,n)时可以得到^y=bx i+a(i=1,2,…,n),它与实际收集到的y i之间的偏差是y i-^y=y i-(bx i+a)(i=1,2,…,n).这样,用这n个偏差的和来刻画“各点与此直线的整体偏差〞是比较适宜的.由于〔y i-^y〕可正可负,为了防止相互抵消,可以考虑用∑=-niiiyy1^||来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(y n-bx n-a)2②来刻画n个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b取什么值时Q最小,即总体偏差最小.经过数学上求最小值的运算,a,b的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法〔method of least square〕.〔7〕利用计算机求回归直线的方程.根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程.以Excel软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:①在Excel中选定表示人体的脂肪含量与年龄的相关关系的散点图〔如以下列图〕,在菜单中选定“图表〞中的“添加趋势线〞选项,弹出“添加趋势线〞对话框.〔8〕利用计算器求回归直线的方程.用计算器求这个回归方程的过程如下:所以回归方程为^y=0.577x-0.448.正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的.直线回归方程的应用:①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系.②利用回归方程进行预测;把预报因子〔即自变量x〕代入回归方程对预报量〔即因变量Y〕进行估计,即可得到个体Y值的容许区间.③利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标.如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度.应用例如思路1例1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的比照表:〔1〕画出散点图;〔2〕从散点图中发现气温与热饮销售杯数之间关系的一般规律;〔3〕求回归方程;〔4〕如果某天的气温是2 ℃,预测这天卖出的热饮杯数.解:〔1〕散点图如以下列图所示:〔2〕从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.〔3〕从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归方程的系数.利用计算器容易求得回归方程^y=-2.352x+147.767.(4)当x=2时,^y=143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮.思考气温为2 ℃时,小卖部一定能够卖出143杯左右热饮吗为什么这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下:1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点〔x,y〕落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=^y+e.这里e是随机变量,预报值^y与实际值y的接近程度由随机变量e的标准差所决定.一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮〞作为结论呢这是因为这个结论出现的可能性最大.具体地说,假设我们规定可以选择连续的3个非负整数作为可能的预测结果,那么我们选择142,143和144能够保证预测成功〔即实际卖出的杯数是这3个数之一〕的概率最大.(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;(2)如果具有线性相关关系,求出线性回归方程. 解:〔1〕在直角坐标系中画出数据的散点图,如以下列图. 直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:∑=81i ix=1 031,∑=81i iy=71.6,∑=812i ix=137 835,∑=81i ii yx=9 611.7.将它们代入公式计算得b≈0.077 4,a=-1.024 1, 所以,所求线性回归方程为=0.077 4x-1.024 1.思路2例1 给出施化肥量对水稻产量影响的试验数据: (2)求出回归直线的方程. 解:(1)散点图如以下列图.故可得到 b=230770003.39930787175⨯-⨯⨯-≈4.75,a=399.3-4.75×30≈257.从而得回归直线方程是^y =4.75x+257.例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程. 解:在直角坐标系中画出数据的散点图,如以下列图.直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:∑===1012,7.91,55i ix y x =38 500,∑=1012i iy =87 777,∑=101i i i y x =55 950.b=2210121015510385007.915510559501010⨯-⨯⨯-=--∑∑==x xyx yx i ii ii≈0.668. a=x b y -=91.7-0.668×55≈54.96.因此,所求线性回归方程为^y =bx+a=0.668x+54.96. 例3 10条狗的血球体积及红血球数的测量值如下:〔1〕画出上表的散点图; 〔2〕求出回归直线的方程. 解:〔1〕散点图如下. 〔2〕101=x (45+42+46+48+42+35+58+40+39+50)=44.50, 101=y (6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 设回归直线方程为^y =bx+a,那么b=210121011010x xyx yx i ii ii --∑∑===0.175,a=x b y -=-0.418,所以所求回归直线的方程为^y =0.175x-0.148.点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b 的计算公式,算出a,b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数y x ,;计算x i 与y i 的积,求∑x i y i ;计算∑x i 2;将结果代入公式求b ;用a=x b y -求a ;写出回归直线方程. 知能训练1.以下两个变量之间的关系哪个不是函数关系〔 〕 A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高 答案:D2.三点(3,10),(7,20),(11,24)的线性回归方程是〔 〕A.^yB.^y =1.75+5.75x C.^y D.^y =5.75+1.75x 答案:D设y 对x 呈线性相关关系.试求: 〔1〕线性回归方程^y =bx+a 的回归系数a,b ;〔2〕估计使用年限为10年时,维修费用是多少 答案:〔1〕b=1.23,a=0.08;〔2〕12.38.4.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下: 模型1:y=6+4x ;模型2:y=6+4x+e .〔1〕如果x=3,e=1,分别求两个模型中y 的值;〔2〕分别说明以上两个模型是确定性模型还是随机模型. 解:〔1〕模型1:y=6+4x=6+4×3=18; 模型2:y=6+4x+e=6+4×3+1=19.〔2〕模型1中相同的x 值一定得到相同的y 值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y 值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.〔1〕画出数据的散点图;〔2〕用最小二乘法估计求线性回归方程. 解:〔1〕散点图如以下列图. 〔2〕n=5,∑=51i ix=545,x =109,∑=51i iy=116,y =23.2,∑=512i ix=60 952,∑=51i ii yx =12 952,b=2545609525116545129525-⨯⨯-⨯≈0.199,a=23.2-0.199×109≈1.509,所以,线性回归方程为y=0.199x+1.509. 拓展提升要求估计利润〔Y i 〕对科研费用支出〔X i 〕的线性回归模型. 解:设线性回归模型直线方程为:i i X Y 1^0^^ββ+=,因为:630==∑nX x i=5,6180==∑nYY i=30,现求解参数β0、β1的估计值: 方法一:3006009001200540060003020061803010006)(2221^=--=-⨯⨯-⨯=--=∑∑∑∑i i ii i X X n Y Y X n β=2, x Y 1^0^ββ-==30-2×5=20.方法二:501005620030561000)(2221^=⨯-⨯⨯-=--=∑∑x n X Y x n Y X ii i β=2, x Y 1^0^ββ-==30-2×5=20.方法三:50100)())((21^=---=∑∑x X Y Y x X ii iβ=2,x Y 1^0^ββ-==30-2×5=20.所以利润〔Y i 〕对科研费用支出〔X i 〕的线性回归模型直线方程为:i Y ^=20+2X i . 课堂小结1.求线性回归方程的步骤: 〔1〕计算平均数y x ,; (2)计算x i 与y i 的积,求∑x i y i ; (3)计算∑x i 2,∑y i 2,(4)将上述有关结果代入公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a x n x yx n yx x x y y x x b n i i ni ii ni i ni i i ,)())((1221121求b,a,写出回归直线方程.2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 作业习题2.3A 组3、4,B 组1、2.设计感想本节课在上节课的根底上,利用实例分析了散点图的分布规律,推导出了线性回归直线的方程的求法,并利用回归直线的方程估计可能的结果,本节课讲得较为详细,实例较多,便于同学们分析比较.思路1和思路2的例题对知识进行了稳固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度,树立时间观,培养勤奋、刻苦的精神.。
人教B版高中数学必修三232两个变量的线性相关学案
2.3.2两个变量的线性相关教学目标:1.明确事物间的相互联系。
认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。
2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.教学重点:1.利用散点图直观认识两个变量之间的线性关系.2.根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:1.作散点图和理解两个变量的正相关和负相关。
2.理解最小二乘法的思想教学过程:一、复习准备:1. 人的身高和体重之间的关系?2. 学生设计一个统计问题,并指出问题涉及的总体是什么,所涉及的变量是什么.二、讲授新课:1. 教学散点图①出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:据的图形,这样的图形叫做散点图。
正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关。
如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。
④讨论:你能举出一些生活中的变量成正相关或负相关的例子吗?⑤练习:一个工厂为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次调查,收集数据如下:2. 指出是正相关还是负相关。
3. 关于加工零件的个数与加工时间,你能得出什么结论? ⑥ 小结:1.散点图的画法。
2.正相关与负相关的概念。
三、回归方程1. 教学回归直线概念:① 从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线。
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这这两个变量之间具有线形相关关系,直线叫回归直线。
②提问:从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线。
那么,怎样确定这条直线呢? 2. 教学最小二乘法:①求回归方程的关键是如何用数学的方法刻画“从整体上看,各点与此直线的距离最小”.如果直线的方程为αβ+=x y ,用()i ,,βαρ表示第i 个样本点()i i y x ,与直线之间的距离,则从总体上看各点与此直线的距离可以用所有样本点与回归直线的距离来表示,即用下面的公式()()∑==ni i Q 1,,,βαρβα来表示.注意到上面的等式对于任何实数α和β都有定义,因此可把()βα,Q 看成二元函数.这样,“从整体上看,各点与此直线的距离最小”的含义是回归方程的截距a 和斜率b 构成的点()b a ,应该是函数()βα,Q 的最小值点.特别地,当()()2,,i i i x y i αββαρ--=时,()b a ,应该使函数()()()()2222211,αβαβαββα--++--+--=n n x y x y x y Q 达到极小值,即a 和b 由公式①给出。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4. 由于变量之间相关关系的广泛性和不确定性,所以 样本数据应较大和有代表性 ,才能对它们之间的关系 作出正确的判断。
教学目标
知识与技能
1.最小二乘法; 2.建立线性回归方程; 3.理解变量之间的相关关系。
怎样求线性回归方程呢?
想一想
方法
1. 测量法:移动直线 l使所有点到它的距离之和最小
2.两点确定法 :选取两点作直线 ,使其两边点个数 一样
3.分组法:将点进行分组点 ,分别求其斜率和截距 , 求平均值
如何用你熟悉的数学知识来刻画“从整体上 看各点与此直线距离最短”呢?
人们经过长期的实践与研究,已经找到了 计算回归方程的斜率与截距的一般公式 :
脂肪含量 40
35 30
25 20 15 10 5
年龄
0 20 25 30 35 40 45 50 55 60 65
通过分析、观察可以看到:随着年龄的增长, 人体脂肪含量越高,这表明两个变量之间的确存 在一定的关系。
脂肪含量 40
35 30
25 20 15 10 5
递增我们叫它 们正相关
递减我们叫它 们负相关
A.变量x与y正相关, u与v正相关 B.变量 x与y正相关, u与v负相关 C.变量x与y负相关, u与v正相关 D.变量x与y负相关, u与v负相关
解析:
本题主要考查两个变量的线性相关性, 由图①可看出离散点分布在一条斜率为负 的直线周围,所以变量 x,y成负相关;而图 ②的离散点分布在一条斜率为正的直线周 围,所以变量 u,v成正相关。
(1)试用最小二乘法求出线性回归方程; (2)如果某天的气温是 -3℃,请预测这天可能会卖 出热茶多少杯 ?
解: (1)作散点图如图所示
由散点图知两个变量是线性相关的,计算各 种数据如下表:
分步计算 减少出错
?
于是:x
?
35 , 3
?
y
?
115 3
35 115
1910 ? 6? ?
则: b ?
A. y? ? 5.75 ? 1.75 x
B. y? ? 1.75 ? 5.75 x C. y? ? 1.75 ? 5.75 x D. y? ? 5.75 ? 1.75 x
习题答案
年龄
0 20 25 30 35 40 45 50 55 60 65
知识要 点
回归直线
从散点图可以看出:所有的点大致在一 条直线附近波动,我们称这两个变量间存在 线性相关关系,这条直线叫做 回归直线 (regression line) 。
如果可以求出这条直线的方程 (回归方程 ), 那么我们就可以比较清楚的了解年龄与体内脂肪 含量的相关性 .这条直线就可以作为两个变量具 有线性相关关系的代表
随堂练习
1. 球的体积和球的半径具有( A )
A. 函数关系
B. 相关关系
C. 不确定关系
D. 无任何关系
2. 下列两个变量之间的关系不是函数关系的是( D)
A.角的度数和正弦值 B. 速度一定时,距离和时间的关系
C. 正方体的棱长和体积 D. 日照时间和水稻的亩产量
3.三点(3,10),(7,20),(11,24)的线性回归方程是 ( D )
最小二乘法。
知识要 点
最小二乘法
即各点到该直线的距离的平方和最小, 这一方法叫 最小二乘法 。
最小二乘法的计算公式:
n
n
?
(xi?
x)( y ? i
y)
?
x
i
y i
?
nx
y)
b ? i?1 n
2
?
i?1
(
x
i
?
x
)
? x ? n x ? i?1 n
2
, 2
i?1 i
a ? y ? bx
下表是某小卖部 6天卖出热茶的杯数 (y)与当天 气温 (x)的对比表:
33 1286 ? 6? 35 ? 35
? ? 1.648a ? 57.557
33
于是,线性回归方程为 y=57.557-1.648x
(2)由回归方程知,当某天的气温是 -3℃时, 卖出的热茶杯数为
57.557-1.648 ×(-3)≈63(杯)
课堂小结
1. 回归直线
从散点图可以看出:所有的点大致在一 条直线附近波动,我们称这两个变量间存在 线性相关关系,这条直线叫做 回归直线 (regression line) 。
过程与方法
在解决统计问题的过程中,逐步体 会用变量间相关关系,理解数形结合的 数学思想和逻辑推理的数学方法。
情感态度与价值观
会用变量之间的相关关系解决一些简单的 实际问题,认识统计的作用,能够辨证地理解 数学知识与现实世界的联系。
C
教学重难点
重点
1.了解最小二乘法的思想; 2.根据给出的线性回归方程的系数公式建立线 性回归方程,变量之间相关关系的理解。
2. 最小二乘法法
即各点到该直线的距离的平方和最小, 这一方法叫 最小二乘法 。
3. 最小二乘法法的步骤
1.首先要作出数据的散点图,利用散点图观 察数据是否具有线性关系;
2.散点图呈现线性关系时,利用最小二乘公 式求出回归方程;
3.求出相应的解。
高考链接
1(2009宁夏、海南)对变量 x,y有观测数据( xi,yi) (i=1,2,…,10), 得散点图①;对变量 u,v有观测数据 (ui,vi)(i=1,2,….,10),得散点图②。由这两个 散点图可以判断( C )
难点
回归思想的建立; 对对人体脂肪含量和年龄的关系研究 中,研究人员获得了一份样本数据 :
说明:各个年龄阶段的脂肪数据是这个年龄样本的平均数 根据上述数据 ,人体的脂肪含量与年龄之间有
什么样的关系 ?
分析:从总体上看随着年龄的增长 ,脂肪含量也 在增加,为了确定这一关系的细节 ,我们需要对数据 进行分析 ,我们可以通过前面的做统计图表的方法 分析,我们可以对两个变量间的关系有一个直观上 的影响和判断 .我们也可以通过下面的图 (散点图 (scatter plot)) 来分析:
导入新课
1. 变量之间的相互关系
两个变量之间的关系,可能是确定关系或非确 定关系。当自变量却只一定,因变量的取值带有一 定随机性时,两个变量之间的关系成为 相关关系 。 相关关系是一种不确定性关系。
2. 前面我们学习了现实生活中存在许多相关关系: 商品销售与广告、粮食生产与施肥量、人体的脂肪量 与年龄等等的相关关系。