高中数学2.3变量间的相关关系导学案新人教A版必修3
高中数学23变量间的相关关系一二全册精品教案新人教A版必修3教案
高中数学23变量间的相关关系一二全册精品教案新人教A版必修3教案教案名称:高中数学23变量间的相关关系一、二全册精品教案教材版本:新人教A版必修3教学目标:1.掌握变量之间的相关关系的概念;2.理解相关系数的含义和计算方法;3.能够应用相关关系解决实际问题;4.培养学生分析和解决问题的能力。
教学重点:1.相关系数的计算方法;2.相关关系的实际应用。
教学难点:1.相关系数的计算和解释;2.相关关系在实际问题中的应用。
教学准备:1.教师准备板书工具,包括黑板、彩色粉笔等;2.教师准备教学用具,如教学课件、实验仪器等。
教学过程:第一课时:1.导入(5分钟)教师通过引入相关关系在日常生活中的例子,引起学生的思考和兴趣,如“你有没有觉得吃得越多睡得越香?”、“你觉得天气越热人们购买冷饮的数量会有什么变化?”等。
2.引入(10分钟)教师通过示意图和简单的计算,引导学生理解变量之间的相关关系,并介绍相关系数的定义和计算方法。
3.基础知识讲解(25分钟)3.1相关系数的含义和计算方法:教师通过示例和公式解释相关系数的含义和计算方法,让学生掌握相关系数的计算公式。
3.2相关系数的性质和意义:教师讲解相关系数的性质和意义,引导学生理解相关系数与变量之间的线性关系程度的关系。
4.练习(10分钟)教师布置一些相关系数的计算练习题,让学生进行个人或小组练习。
第二课时:5.复习(5分钟)回顾上节课学习的内容,教师提问学生相关系数的计算方法及其含义,并解答学生疑惑。
6.拓展(15分钟)6.1相关系数的解读:教师通过实例和图表解释如何解读相关系数的大小和正负号。
6.2相关系数的应用:教师介绍相关系数在实际问题中的应用,如市场调研、经济预测等。
7.实验(20分钟)教师组织学生进行相关系数实验,通过观察和数据统计,让学生进一步理解相关系数的计算方法和含义。
8.总结归纳(10分钟)教师引导学生总结相关系数的计算方法、含义和应用,并与学生一起完成相关关系的概念思维导图。
高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3
解:(1)画出散点图.
(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是 负相关?
解:(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小 变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.
方法技巧 两个随机变量x和y是否具有相关关系的确定方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断 (如本题); (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
4
4
解:(2)由表中的数据得: xi yi =52.5, x =3.5, y =3.5, xi2 =54,
i 1
i 1
n
所以 b =
xi yi n x y
i 1
n
xi2
2Hale Waihona Puke nx=52.5 4 3.5 3.5 54 4 3.52
=0.7,
i 1
a = y - b x =3.5-0.7×3.5=1.05,
年份x
储蓄存款 y(千亿元)
2013 5
2014 6
2015 7
2016 8
2017 10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5 得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
5
5
解:(1) t =3, z =2.2, ti zi=45, ti2 =55,
知识探究
1.相关关系与函数关系不同 函数关系中的两个变量间是一种确定性关系,相关关系是一种不确定性关系. 2.正相关和负相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关 关系,我们就称它为正相关. (2)负相关 在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关 关系,我们就称它为负相关.
高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)
总费用y/万元 2.2 3.8 5.5 6.5 7.0
(1)根据表格数据,画出散点图;
(2)求线性回归方程y^=b^x+a^的系数a^,b^; (3)估计使用年限为 10 年时,车的使用总费用是多少?
【解题探究】(1)利用描点法作出散点图; (2)把数据代入公式,可得回归方程的系数; (3)把x=10代入回归方程得y值,即为总费用的估计 值.
【答案】A 【解析】在A中,若b确定,则a,b,c都是常数,Δ= b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数 关系;一般来说,光照时间越长,果树亩产量越高;降雪量越 大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所 以B,C,D是相关关系.故选A.
两个变量x与y相关关系的判断方法 1.散点图法:通过散点图,观察它们的分布是否存在 一定规律,直观地判断.如果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量就是线性相关的,注意不要受 个别点的位置的影响. 2.表格、关系式法:结合表格或关系式进行判断. 3.经验法:借助积累的经验进行分析判断.
变量之间的相关关系的判断
【 例 1】 下 列 变 量 之 间 的 关 系 不 是 相 关 关 系 的 是 ()
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b 为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
【解题探究】判断两个变量之间具有相关关系的关键是 什么?
①反映^y与 x 之间的函数关系;
②反映 y 与 x 之间的函数关系;
③表示^y与 x 之间的不确定关系;
④表示最接近 y 与 x 之间真实关系的一条直线.
A.①②
【创新设计14-2015学年高中数学 2.3.1 变量之间的相关关系;2.3.2 两个变量的线性相关课件 新人教A版必修3
^
(
)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg D.若该大学某女生身高为170 cm,则可断定其体重必为 58.79 kg
答案 D ^ 解析 当 x=170 时,y =0.85×170-85.71=58.79,
体重的估计值为 58.79 kg.
5.正常情况下,年龄在 18 岁到 38 岁的人,体重 y(kg)对身高 x(cm)的回归方程为y=0.72x-58.2,张红同学(20 岁)身高 178 cm,她的体重应该在________kg 左右.
跟踪演练1
下列两个变量之间的关系,哪个不是函数关系 ( )
A.正方体的棱长和体积 B.圆半径和圆的面积 C.正n边形的边数和内角度数之和 D.人的年龄和身高 答案 D
解析
A、B、C都是函数关系,对于A,V=a3;对于B,S=
πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以 有不同的身高,∴选D.
(2)正相关与负相关:
右上角 的 左下角 到_______ ①正相关:散点图中的点散布在从_______ 区域.
左上角 到_______ 右下角 的 ②负相关:散点图中的点散布在从_______
区域.
2.回归直线的方程 (1)回归直线:如果散点图中点的分布从整体上看大致在 一条直线 附近,就称这两个变量之间具有_________ 线性相关 关 _________
^
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
答案 解析 C
D.y平均减少2个单位
∵两个变量线性负相关,∴变量x增加一个单位,y
平均减少1.5个单位.
4.(2013· 滨州高一检测)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i = 1,2,…,n),用最小二乘法建立的回归方程为y = 0.85x - 85.71,则下列结论中不正确的是 A. y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心(x, y)
【随堂优化训练】2014年高中数学 2.3 变量间的相关关系配套课件 新人教A版必修3
解:(1)由所给数据,需求量与年份之间的关系是近似直线 上升,为此对数据处理如下表: 年份-2010 -4 -2 0 0 2 19 4 29
需求量-257 -21 -11 对处理后的数据计算,得
1 n 1 n x =n xi =0, y =n yi =3.2. i 1 i 1 ^= b
8 i 1 8 i
70 102 7140 4900
80 108 8640 6400
x2 i
1600 2500 3600
i
x y
^= x =45, y =85,b
8x y
x
i 1
2 i
^=- ^ x ≈55 8 x ≈0.667,a y -b
2
所以 y 关于 x 的回归方程为^ y=0.667x+55.
(3)回归直线方程: 定义:如果散点图中点的分布从整体上看大致在一条直线 线性相关关系 ,这 附近,那么我们就称这两个变量之间具有______________ 回归直线 条直线叫做____________.
对一组具有线性相关关系的样本数据: (x1, y1), (x2, y2), „, ^x+a ^,其中 (xn,yn),设其回归方程为^ y =b n n xi- x yi- y xiyi-n x y i=1 i=1 ^= = , b n n 2 2 2 x - n x x - x i i i=1 i= 1 ^= y -b ^x. a
i 1 n
叫做最小二乘法.
【问题探究】
回归直线方程的预测值^ y与实际值 y 为什么会产生误差?
答案:(1)回归直线方程中的截距与斜率都是通过样本估计 出来的,存在随机误差. ^x+a ^+e=^ (2)实际上,y=b y+e,这里的 e 是随机变量,而
2020版人教A数学必修3 课件:2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关
x (0.01%)
104
180 190 177
147
134
150
191
204
121
学霸经验分享区 (1)回归分析是对具有相关关系的两个变量进行统计分析的方法,两 个变量具有相关关系是回归分析的前提. (2)散点图是定义在具有相关关系的两个变量基础上的,对于关系不 明确的两组数据,可先作散点图,在图上看它们有无相关关系,然后再 进行相关回归分析. (3)通过对散点图的观察,一般地,若图中数据大致分布在一条直线附 近,那么这两个变量近似成线性相关关系. (4)求线性回归方程,应注意到,只有大部分点分布在某条直线附近, 求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无 意义.
名师点津 对回归直线方程的几点说明 (1)a,b的上方加“^ ”,表示是由观察值按最小二乘法求得的估计值.
(2)(xi,yi)(i=1,2,…,n)的( x , y )在回归直线上.
(3)由回归直线方程知 x 处的估计值为 yˆ = aˆ + bˆ x.
(4)回归直线使得样本数据中的点到它的距离的平方和最小. (5)求回归直线方程,计算量大,一般应学会使用计算器求解. (6)利用回归直线方程可以对总体进行估计.
解:散点图分别如图(1)(2)所示.
从图中可以看出两图中的点各自分布在一条直线附近,因此两对变量 都具有相关关系. 图(1)中A的值由小变大时,B的值却是由大变小,即A和B成负相关; 图(2)中C的值由小变大时,D的值也是由小变大,即C和D成正相关.
高中数学 2.3变量间的相关关系导学案 新人教A版必修3
§2.3变量间的相关关系学习目标(1)通过具体示例引导学生考察变量之间的关系,在讨论的过程中认识现实世界中存在着不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.(2) 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.会作散点图,并对变量间的正相关或负相关关系作出直观判断.(3) 在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解统计的作用.重点难点重点:利用散点图直观认识变量间的相关关系. 难点:理解变量间的相关关系.学法指导在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
问题探究复习回顾: 函数的定义 二、情景设置:客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗? 二、探究新知: 知识探究(一):变量之间的相关关系 思考1:考察下列问题中两个变量之间的关系: (1)商品销售收入与广告支出经费; (2)粮食产量与施肥量; (3)人体内的脂肪含量与年龄.这些问题中两个变量之间的关系是函数关系吗?思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?思考4:相关关系与函数关系的异同点:总结:对相关关系的理解应当注意以下几点: 其一是相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.其二是函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.其三是在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断.(对具有相关关系的两个变量进行统计分析的方法叫回归分析.)知识探究(二):散点图【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:……课本85页的探究。
2014高中数学 2.3 变量间的相关关系课件(2)新人教A版必修3
诱思探究1
一组样本数据的平均数是样本数据的中心,那 么散点图中样本点的中心如何确定?它一定是散点 图中的点吗?
脂肪含量
40 35 30 25 20 15 10 5 0 20 25 30 35 40 45 50 55 60 65 年龄
样本点的中心的 坐标为样本数据 的平均数; 它不一定是散点 图中的点。
n
i
nx y nx
2
ˆx ˆ y b a
( x x)
x
i 1
2
i
2 ˆ Q ( y y ) i i 为最小,这样就得到了 时,总体偏差 i 1
回归方程,这种求回归方程的方法叫做最小二乘 ˆx a 法.回归方程 y ˆ b ˆ ˆ 分别表示回归方程的斜率,截距。 中,a ˆ, b
40 35 30 25 20 15 10 5 0 20 25 30 35 40 45 50 55 60 65 年龄
在直角坐标系中,任何一条直线都有相应的方程, 回归直线的方程称为回归方程.对一组具有线性相关 关系的样本数据,如果能够求出它的回归方程,那么 我们就可以比较具体、清楚地了解两个相关变量的内 在联系,并根据回归方程对总体进行估计.
1 1 (5 0 36) 169 15.367 11 11
xi (5)2 02 362 4335
2 i 1
11
11
x y
i 1 i
11
i
5 156 0 150 36 54 14828
i i
ˆ b
x y 11x y
温故知新
一.变量之间的相关关系: 1.变量间相关关系的定义:自变量取值一定时,因变 量的取值带有一定随机性的两个变量之间的关系,叫 做相关关系. 2.相关关系与函数关系的异同点: (1)相同点:两者均是指两个变量间的关系。 (2)不同点:①函数关系是一种确定的关系;相关关系 是一种非确定的关系. 函数关系是两个非随机变量的 关系,而相关关系是非随机变量与随机变量间的关系. ②函数关系是一种因果关系,而相关关系不一定是因果 关系,也可能是伴随关系.
高一数学人教A版必修3课件:2.3变量间的相关关系(第二课时)
求回归方程的关键是如何用数学的方法来刻画 “从整体上看,各点与直线的距离最小”。 思考6:对一组具有线性相关关系的样本数据: (x1,y1),(x2,y2),„,(xn,yn),设其回归 方程为 可以用哪些数量关系来刻画各 样本点与回归直线的接近程度?
回归直线
实际上,求回归直线的关键是如何用数学的方 法来刻画“从整体上看,各点到此直线的距离最 小”.
b
( x x)( y y) x y n x y
i 1 i i
n
n
( x x)
i 1 i
n
i 1 n
i
i
2
x nx
i 1 2 i
,
2
a y bx
以上公式的推导较复杂,故不作推导,但它的原 理较为简单:即各点到该直线的距离的平方和最 小,这一方法叫最小二乘法。
3、回归直线方程 (1)回归直线:观察散点图的特征,如果各点大致分 布在一条直线的附近,就称两个变量之间具有线性相关的 关系,这条直线叫做回归直线。 (2)最小二乘法
n n
b
( x x )( y y ) x y nx y
年龄 23
脂肪 9.5 年龄 53
27
54
39
56
41
57
45
58
49
60
50
61
17.8 21.2 25.9 27.5 26.3 28.2
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考2:为了确定年龄和人体脂肪含量之间的 更明确的关系,我们需要对数据进行分析, 通过作图可以对两个变量之间的关系有一个 直观的印象.以x轴表示年龄,y轴表示脂肪含 量,你能在直角坐标系中描出样本数据对应 的图形吗?
高中数学 2.3.1变量之间的相关关系优秀学生寒假必做作业练习一 新人教A版必修3
变量之间的相关关系 专项测试题一、 选择题1、 下列两个变量之间的关系哪个不是函数关系?( )A 、角度和它的余弦值B 、正方形边长和面积C 、正n 边形的边数和顶点角度之和D 、人的年龄和身高2、下列变量之间的关系是函数关系的是( )A 、 已知二次函数,2c bx ax y ++=其中a,c 是已知常数,取b 为自变量,自变量和这个函数的判别式ac b 42-=∆B 、 光照时间和果树亩产量C 、 降雪量和交通事故发生率D 、 每亩施用肥料量和粮食亩产量3、 近十年来,某市社会商品零售总额与职工工资总额数据如下(单位:亿元):建立社会商品零售总额y 与职工工资总额x 的线性回归方程是( )A 、 y=2.7991x —23.5494B 、 y=2.7992x —23.5493C 、 y=2.6962x —23.7493D 、 y=2.8992x —23.74944、对于回归分析,下列说法错误的是( )A 、 在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B 、 线性相关系数可以是正的或负的C 、 回归分析中,如果2r =1或2r =±1,说明x 与y 之间完全线性相关D 、 样本相关系数r ∈(-1,+1)5、有一组观测值有22组,则与显著性水平0、05相应的相关系数临界值为()A、0、404B、0、515C、0、423D、0、5376、下列说法中正确的是()A.任何两个变量都具有相关关系B.人的知识与其年龄具有相关关系C.散点图中的各点是分散的没有规律D.根据散点图求得的回归直线方程都是有意义的7、变量y与x之间的回归方程()A.表示y与x之间的函数关系B.表示y和x之间的不确定关系C.反映y和x之间真实关系的形式D.反映y与x之间的真实关系达到最大限度的吻合8、若用水量x与某种产品的产量y的回归直线方程是ˆy=2x+1250,若用水量为 50kg 时,预计的某种产品的产量是()A.1350 kg B.大于 1350 kg C.小于1350kg D.以上都不对9、“回归”一词是在研究子女身高与父母的身高之间的遗传关系时,由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y与父亲的身高x的回归大程ˆy=a+bx中,b(C)(A)在(-1,0)内(B)等于0(C)在(0,1)内(D)在[1,+∞)内二、填空题10、自变量取值一定时,因变量的取值两个变量之间的关系叫做相关关系。
人教A版高中数学必修三变量之间的相关关系教案(1)(1)
2.3.1变量之间的相关关系教学目标:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
教学重点:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
教学过程:案例分析:一般说来,一个人的身高越高,他的人就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系。
为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表。
(1)根据上表中的数据,制成散点图。
你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系。
(3)如果一个学生的身高是188cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下。
从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的。
那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)二点确定一条直线。
同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同。
同学3:多取几组点对,确定几条直线方程。
再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。
同学4:我从左端点开始,取两条直线,如下图。
再取这两条直线的“中间位置”作一条直线。
同学5:我先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多。
1015202530150155160165170175180185190195同学6:我先将所有的点分成两部分,一部分是身高在170 cm 以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线。
广东省佛山市顺德区罗定邦中学高中数学《2.3.1 变量之间的相关关系》课件 新人教A版必修3
ˆ ˆ a y bx
求回归直线方程的步骤:
(1)计算平均数x,y (2)计算xi ,yi的积,求 xi yi
i 1 n
(3)计算 xi
i 1
n
2
ˆ ˆ ˆ ˆ ˆ (4)计算b,a,写出回归直线方程y=bx+a
时间:15分钟 展示 例1: 例2 : 例3: 例4: 第1组 第5组 3 第7组 点评 第2组 第6组 4 8
下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作
出各个点,称该图为散点图。
(2),从左下角到右上角,成正相关
(3)零件数越多,加工时间越长
例3(07广东高考真题):
下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)
与相应的生产能耗(吨标准煤)的几组对
x y 3 2.5 4 3 5 4 6 4.5
1.下列关系中,是带有随机性相关关系的是 ② ③ ④ .
①正方形的边长与面积的关系;
②水稻产量与施肥量之间的关系; ③人的身高与年龄之间的关系;
④降雪量与交通事故发生之间的关系.
2.下列两个变量之间的关系哪个不是函数关系( D ) A.角度和它的余弦值 B. 正方形边长和面积
C.正n边形的边数和它定额,需要确定加工零件所花费的时
间,为此进行了10次调查,收集数据如下:
零件 数 加工 时间
10
20
30
40
50
60
70
80
90
100
62
68
75
81
89
95
102
108
115
122
1.画出散点图。 2.指出是正相关还是负相关。
3.关于加工零件的个数与加工时间,你能得出什么结论?
高中数学 第二章 统计 2.3.1-2.3.2 变量之间的相关关系 两个变量的线性相关课件 新人教
A .1 B .1 C .1 D .1 1 6 8 4 2
35
【思路导引】利用回归直线方程必过样本点的中心求解.
【解析】选B.依题意可知样本点的中心为 ( 3 , ,3 )
48
则3
8
= 1×
3
+3
4
,a 解得
=a .
1 8Βιβλιοθήκη 36【拓展延伸】相关关系的强弱
(1)若相应于变量x的取值xi,变量y的观测值为yi(1≤i≤n),称r=
6
(2)你能举例说明你对正相关与负相关的理解吗? 提示:随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性 的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少 变多. 随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关 关系,我们称为负相关.例如,汽车越重,每消耗1 L汽油所行驶的平均路程就 越短.
n
n
x i2,
xi y,i
i1
i1
30
(5)代入公式计算
b ,a,公式为
n
x iyi n x y
b
i1
n
x
2 i
n
x
2
i1
,
a y b x .
(6)写出回归直线方程 = x+ .
yb a
31
【跟踪训练】 已知变量x,y有如下对应数据:
x1234 y1345
(1)作出散点图. (2)用最小二乘法求关于x,y的回归直线方程.
42
【思路导引】(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标, 在平面直角坐标系内画散点图. (2)应用计算公式求得线性相关系数 bˆ , aˆ 的值. (3)实际上就是求当x=100时,对应的 yˆ 的值.
课标人教A版必修3全套课件第二章变量间的相关关系2.3 变量间的相关关系
英国科学家探险家和人类测量学家。 英国科学家探险家和人类测量学家。1822年2月16日生于伯明 年 月 日生于伯明 日卒于伦敦附近的萨里。 翰,1911年1月17日卒于伦敦附近的萨里。C.R.达尔文的表弟 年 月 日卒于伦敦附近的萨里 达尔文的表弟 高尔顿和 首先发现回归现象的是英国生物学家高尔顿 首先发现回归现象的是英国生物学家高尔顿和皮尔 他们分别在遗传学研究中发现, 逊,他们分别在遗传学研究中发现,生物后代的属 性与其父母有关, 性与其父母有关,这种关系仅仅在平均程度上有所 差别。他们发现, 差别。他们发现,高个子父母的子代平均高度比较 矮个子父母的子代平均高度比较低, 高,矮个子父母的子代平均高度比较低,进一步的 研究又发现, 研究又发现,高个子子代的平均高度要比父代的高 度低,而矮个子子代的平均高度要比父代的高度高, 度低,而矮个子子代的平均高度要比父代的高度高, 形成向种族平均高度靠拢的趋势, 形成向种族平均高度靠拢的趋势,高尔顿将这种现 象称作为“回归” 象称作为“回归”。 回归分析的目的就是确定变量之间数量关系的可能 形式,并用一个数学模型来表示这种关系形式。 形式,并用一个数学模型来表示这种关系形式。
在一次对人体脂肪含量和年龄的关系研究中,研究人员获得 在一次对人体脂肪含量和年龄的关系研究中 研究人员获得 了一份样本数据: 了一份样本数据
说明:各个年龄阶段的脂肪数据是这个年龄样本的平均数 说明 各个年龄阶段的脂肪数据是这个年龄样本的平均数
根据上述数据,人体的脂肪含量与年龄之间有什么样的关系 根据上述数据 人体的脂肪含量与年龄之间有什么样的关系? 人体的脂肪含量与年龄之间有什么样的关系
x y 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50
2017-2018学年高中数学人教A版必修3教学案:第二章 2.3 变量间的相关关系
变量间的相关关系(1)函数关系与相关关系的区别与联系是什么?(2)如何判断两个变量之间是否具备相关关系?(3)什么是正相关、负相关?与散点图有什么关系?[新知初探]1.相关关系如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.2.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.3.正相关和负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域.(2)负相关:散点图中的点散布在从左上角到右下角的区域.[点睛]对正相关和负相关的理解(1)正相关随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少变多.(2)负相关随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关关系,我们称为负相关.例如,汽车越重,每消耗1 L 汽油所行驶的平均路程就越短.4.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).②设所求回归方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数. ③由最小二乘法得⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y ∑i =1n x 2i-n x 2a ^=y -b ^x其中:b ^是回归方程的斜率,a ^是截距.[小试身手]1.下列命题正确的是( ) ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A .①③④B .②③④C .③④⑤D .②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关. 3.若施肥量x (kg)与水稻产量y (kg)的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.解析:把x =80代入回归方程可得其预测值y ^=5×80+250=650(kg). 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8 y3040605070若已求得它们回归直线的方程为______________________.解析:由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50).设回归直线方程为y ^=6.5x +a ^, ∵回归直线过样本中心(x ,y ), ∴50=6.5×5+a ^,即a ^=17.5, ∴回归直线方程为y ^=6.5x +17.5 答案:y ^=6.5x +17.5相关关系的判断①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系.(2)某个男孩的年龄与身高的统计数据如下表所示.年龄x(岁)12345 6身高y(cm)788798108115120①画出散点图;②判断y与x是否具有线性相关关系.[解析](1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:③由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.求回归直线方程的步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i . (5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1n x i y i -n x y∑i =1n x 2i-n x2,a ^=y -b ^x .(6)写出回归直线方程y ^=b ^x +a ^. [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.(2)x =1+2+3+44=52,y =1+3+4+54=134, ∑i =14x i y i =1+6+12+20=39.∑i =14x 2i =1+4+9+16=30,b ^=39-4×52×13430-4×⎝⎛⎭⎫522=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求的回归直线方程.利用线性回归方程对总体进行估计[典例] 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:(2)x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,∑i =14x 2i =32+42+52+62=86, 所以b ^=∑i =14x i y i -4x y ∑i =14x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35. 所以所求的线性回归方程为y ^=0.7x +0.35.(3)当x =100时,y ^=0.7×100+0.35=70.35(吨标准煤),90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:i t i y i t 2i t i y i 1 2 3 4 51 2 3 4 55 6 7 8 101 4 9 16 255 12 21 32 50这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1ny i =365=7.2.∑i =1nt 2i -n t -2=55-5×32=10,∑i =1nt i y i -n t -y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( ) A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C. 2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为A.y ^=1.5x +2 B.y ^=-1.5x +2 C.y ^=1.5x -2 D.y ^=-1.5x -2解析:选B 设回归方程为y ^=b ^x +a ^,由散点图可知变量x ,y 之间负相关,回归直线在y 轴上的截距为正数,所以b ^<0,a ^>0,因此方程可能为y ^=-1.5x +2.3.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( )A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误.4.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .不能小于0 B .不能大于0 C .不能等于0D .只能小于0解析:选C 当b ^=0时,r =0,这时不具有线性相关关系,但b ^能大于0,也能小于0. 5.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)解:依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b ^=∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.17,a ^=y -b ^x =0.81,∴y ^=0.17x +0.81. ∴所求的回归方程为y ^=0.17x +0.81.(2)当x =9时,y ^=0.17×9+0.81=2.34(万元).可估计年收入为9万元的家庭每年饮食支出约为2.34万元.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( )A .确定性关系B .相关关系C .函数关系D .无任何关系解析:选B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.2.农民工月工资y (元)依劳动生产率x (千元)变化的回归直线方程为y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元解析:选B 由回归直线方程y ^=50+80x 知,x 每增加1,y 增加80,但要注意x 的单位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:父亲身高x (cm) 174 176 176 176 178 儿子身高y (cm)175175176177177则y 对x 的线性回归方程为( ) A .y =x -1 B .y =x +1 C .y =88+12xD .y =176解析:选C 计算得,x =174+176+176+176+1785=176,y =175+175+176+177+1775=176,根据回归直线经过样本中心(x ,y )检验知,C 符合.4.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.y ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.y ^<b ′,a ^<a ′解析:选C 由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2,a ′=0-2×1=-2.求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136, ∑i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57, a ^=136-57×3.5=136-52=-13,∴b ^<b ′,a ^>a ′.5.正常情况下,年龄在18岁到38岁的人,体重y (kg)对身高x (cm)的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右.解析:用回归方程对身高为178 cm 的人的体重进行预测,当x =178时,y ^=0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y =-4x +a ,则a =________. 解析:x =4+5+6+7+8+96=132,y =92+82+80+80+78+686=80,由回归方程过样本中心点(x ,y ) 得80=-4×132+a ^.即a ^=80+4×132=106.答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y 具备线性相关关系,回归方程为y ^=10.47-1.3x ,估计该台机器最为划算的使用年限为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x ,(1)若两艘船的吨位相差1 000,求船员平均相差的人数; (2)估计吨位最大的船和最小的船的船员人数. 解:(1)设两艘船的吨位分别为x 1,x 2,则 y ^1-y ^2=9.5+0.006 2x 1-(9.5+0.006 2x 2) =0.006 2×1 000≈6, 即船员平均相差6人.(2)当x =192时,y ^=9.5+0.006 2×192≈11, 当x =3 246时,y ^=9.5+0.006 2×3 246≈30.即估计吨位最大和最小的船的船员数分别为30人和11人.9.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:(1)求x ,y ;(2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件? (提示:∑i =17x 2i =280,∑i =17y 2i =45 309,∑i =17x i y i =3 487)解:(1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917≈79.86.(2)∵b ^=3 487-7×6×79.86280-7×62≈4.75,a ^=79.86-4.75×6=51.36,∴纯利与每天销售件数x 之间的回归直线方程为y ^=51.36+4.75x . (3)当y ^=200时,200=4.75x +51.36,所以x ≈31.29.因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190解析:选B 1 000×n200+1 200+1 000=80,求得n =192.4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.5.设有两组数据x 1,x 2,…,x n 与y 1,y 2,…,y n ,它们的平均数分别是x 和y ,则新的一组数据2x 1-3y 1+1,2x 2-3y 2+1,…,2x n -3y n +1的平均数是( )A .2x -3yB .2x -3y +1C .4x -9yD .4x -9y +1解析:选B 设z i =2x i -3y i +1(i =1,2,…,n ),则z =1n (z 1+z 2+…+z n )=2n (x 1+x 2+…+x n )-3n (y 1+y 2+…+y n )+⎝⎛⎭⎫1+1+…+1n =2x -3y +1.6.有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( ) A.211 B.13 C.12D.23解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7+3=22,故总体中大于或等于31.5的数据约占2266=13.7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90解析:选C ∵得85分的人数最多为4人, ∴众数为85,中位数为85,平均数为110(100+95+90×2+85×4+80+75)=87.8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3解析:选B5×0+20×1+10×2+10×3+5×450=1.8.9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4 用水量y4.5432.5用水量y 与月份x 之间具有线性相关关系,其线性回归方程为y ^=-0.7x +a ,则a 的值为( )A .5.25B .5C .2.5D .3.5解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4解析:选C 去掉一个最高分95,去掉一个最低分77,平均数为80+15(5+3+6+5+6)=85,方差为15[(85-85)2+(85-83)2+(85-86)2+(85-85)2+(85-86)2]=1.2,因此选C.11.如果数据x 1,x 2,x 3,…,x n 的平均数是x ,方差是s 2,则3x 1+2,3x 2+2,…,3x n +2的平均数和方差分别是( )A.x 和s 2 B .3x 和9s 2 C .3x +2和9s 2D .3x +2和12s 2+4解析:选C 3x 1+2,3x 2+2,…,3x n +2的平均数是3x +2,由于数据x 1,x 2,…x n的方差为s2,所以3x1+2,3x2+2,…,3x n+2的方差为9s2.12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是()A.x=9B.y=8C.乙的成绩的中位数为26D.乙的成绩的方差小于甲的成绩的方差解析:选B因为甲的成绩的极差为31,所以其最高成绩为39,所以x=9;因为乙的成绩的平均值为24,所以y=24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小.二、填空题(本大题共4小题,每小题5分,共20分)13.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.解析:由平均数为10,得(x+y+10+11+9)×15=10,则x+y=20;又方差为2,∴[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×15=2,得x2+y2=208,2xy=192,∴|x-y|=(x-y)2=x2+y2-2xy=4.答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.解析:抽取的男运动员的人数为2148+36×48=12.答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 解析:选出的三位数分别为331,572,455,068,877,047,447,…,其中572,877均大于500,将其去掉,剩下的前5个编号为331,455,068,047,447.答案:331 455 068 047 44716.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1, ∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人, 则x100=0.030×10,解得x =30.同理,y =20,z =10. 故从[140,150]的学生中选取的人数为1030+20+10×18=3.答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) 17.(本小题满分10分)为调查某班学生的平均身高,从50名学生中抽取110,应如何抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样?解:从50名学生中抽取110,即抽取5人,采用简单随机抽样法(抽签法或随机数法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示.(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?解:(1)样本均值为17+19+20+21+25+306=1326=22.(2)由(1)知样本中优秀工人所占比例为26=13,故推断该车间12名工人中有12×13=4名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人); 四川籍的有15+10+5+5+5=40(人).设四川籍的驾驶人员应抽取x 人,依题意得5100=x 40,解得x =2,即四川籍的应抽取2人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110. (1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定? 解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样. (2)x 甲=17(102+101+99+98+103+98+99)=100,x 乙=17(110+115+90+85+75+115+110)=100,s 2甲=17(4+1+1+4+9+4+1)≈3.43,s 2乙=17(100+225+100+225+625+225+100)=228.57, ∴s 2甲<s 2乙,故甲车间产品比较稳定.21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 频率是0.25知, 10M =0.25,所以M =40. 因为频数之和为40,所以10+25+m +2=40,解得m =3. 故p =340=0.075.因为a 是对应分组[15,20)的频率与组距的商, 所以a =2540×5=0.125.(2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.解:(1)由题意知n =10,x =1n ∑i =1n x i =8010=8, y =1n ∑i =1n y i =2010=2, 又∑i =110x 2i -10x 2=720-10×82=80,∑i =110x i y i -10x y =184-10×8×2=24,由此得b ^=∑i =110x i y i -10x y∑i =110x 2i -10x 2=2480=0.3, a ^=y -b ^x =2-0.3×8=-0.4,故所求回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
人教A版高中数学必修三新课标两个变量的相关性导学案(1)
授课
时间
第周星期第节
课型
新授课
主备课人
学习
目标
1.了解非确定性关系中两个变量的统计方法;掌握散点图的画法及在统计中的作用;
能根据散点图判断变量间是否为线性相关.
2.若两个变量为线性相关,告诉一个变量的值,能估计出与其对应另一变量的值.
重点难点
重点:变量之间相关关系的理解,利用散点图直观认识两个变量之间的线性关系;
难点:作散点图及理解两个变量的正相关和负相关.
学习
过程
与方
法
自主学习
1.变量之间的散点图指:
2.两个变量之间的相关关系是什么?有几种?
新知探究:
1.正相关与负相关的概念是?
2.两个变量之间的相关关系的判断方法是什么?
精讲互动
课本例1
小结:
1.下列关系中,带有相关关系的是( )
1正方形的边长与面积之间的关系;②水稻产量与施肥量之间的关系;
③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.
小结:
达标训练
1.在现实生活中,请你举出几个两个量之间存在明确函数关系的例子.
2.请在现实生活中举出两个变量不满足函数关系,但二者确实有关系的例子.
7 1、2题
学习小结/教学
反思
人教A版高中数学必修三新课标两个变量的相关性导学案
上节课我们讨论了人的身高与右手一拃长之间的线性关系,用了很多种方法来刻画这种线性关系,但是这些方法都缺少数学思想依据。
问题1、用什么样的线性关系刻画会更好一些?
问题2、用什么样的方法刻画点与直线的距离会方便有效?
1.什么叫回归直线?
2.如何求回归直线的方程?什么是最小二乘法?
精讲互动
1.例1
§2.3.2两个变量的相关性1
授课
时间
第周星期第节
课型
新授课
主备课人
学习
目标
1.掌握最小二乘法的思想
2.能根据给出的线性回归方程系数公式建立线性回归方程
重点难点
重点:最小二乘法的思想
难点:线性回归方程系数公式的应用
学习
过程
与方
法
自主学习
复习回顾:
1.画散点图的步骤是:
2.正、负相关的的概念是什么?
3.什么是线性相关?
求线性回归方程的方法:
2.利用实验数据进行拟合时的影响因素及有效的处理方法:
达标训练
1.已知x,y之间的一组数据如下表,则y与x的线性回归方程y=a+bx必经过点
x
0
1
2
3
y
1
3
5
7
(A)(2,2)(B)(1.5,0)(C)(1,2)(D)(1.5,4)
2.某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:
商店名称
A
B
CHale Waihona Puke DE销售额(x)/千万元
3
5
6
7
9
利润额(y)/百万元
2
3
3
4
5
(1)画出销售额和利润额的散点图;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《2.3变量间的相关关系》
【学习目标】
1.了解相关关系、线性相关、回归直线、最小二乘法的定义.
2.会作散点图,并能利用散点图和定义判断两个变量之间是否具有相关关系. 3.会求回归直线方程,并能用回归直线方程解决有关问题. 【学习重点】变量间的相关性与回归直线方程 课前预习案 【知识链接】
问题1:在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?
好 中 差 你的数学成绩 你的物理成绩
问题2: 某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性? 【知识梳理】 1.相关关系
(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的______性,那么这两个变量之间的关系,叫做相关关系.
(2)两类特殊的相关关系:如果散点图中点的分布是从______角到______角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从______角到______角的区域,那么这两个变量的相关关系称为负相关. 2.线性相关
(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条______附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做__________.
(2)最小二乘法:求线性回归直线方程y ^ =b ^x +a ^
时,使得样本数据的点到它的______________最小的方法叫做最小二乘法,其中a ^,b ^
的值由以下公式给出: 其中,b ^是回归方程的____________,a ^
是回归方程在y 轴上的______.
小结:
线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程.因此在学习过程中,要重视信息技术的应用. 自主小测
1、下列图形中具有相关关系的两个变量是( )
2、某单位为了解用电量y(千瓦时)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温/℃
18
13
10
-1
用电量/千瓦时
24
34
38
64
由表中数据得线性回归方程y ^ =b ^x +a ^中b ^≈-2,则a ^
≈__________.
课 上 导 学 案 教师点拨1:
两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系. 教师点拨2:①相关关系与函数关系的异同 相同点:两者均是指两个变量的关系.
不同点:函数关系是一种确定的关系.如匀速直线运动中时间t 与路程s 的关系;相关关系是一种非确定的关系.如一块农田的水稻产量与施肥量之间的关系.
函数关系是一种因果关系,而相关关系不一定是因果关系,可能是伴随关系. ②线性回归直线方程的性质
(1)回归直线过样本数据的中心.
所谓样本数据的中心,对于单变量样本数据而言,平均数是样本数据的中心;对于以(xn ,yn)为样本数据而言,(x ,y )为样本点的中心,根据最小二乘法原理,回归直线一定过样本点的中心.
(2)回归直线的单调性与样本数据的相关性.
如果样本数据对应的点具有线性相关关系,从回归直线方程来看,当系数b >0时,直线单调递增,此时这两个变量正相关;当b <0时,直线单调递减,此时这两个变量负相关. 【例题讲解】
【例题1】 设对变量x ,y 有如下观察的数据: x 151 152 153 154
156
157
158
159 160 162 163 164 y
40
41
41
41.5 42
42.5 43
44
45
45
46
45.5
(1)画出散点图.
(2)判断变量x ,y 是否具有相关关系?如果具有相关关系,那么是正相关还是负相关? 【例题2】 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x 3 4 5 6 y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^ =b ^x +a ^
; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
【例题3】 下列变量之间的关系属于相关关系的是( ) A .圆的周长和它的半径之间的关系
B .价格不变的条件下,商品销售额与销售量之间的关系
C .家庭收入愈多,其消费支出也有增长的趋势
D .正方形面积和它的边长之间的关系
【当堂检测】
1.已知x
从散点图可以看出y 与x 线性相关,且回归方程为y =0.95x +a ,则a =( )
A .3.25
B .2.6
C .2.2
D .0
2.某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y 与x 具有相关关系,回归方程为y =0.66x +1.562.若某城市居民人均工资为9 000元,则其居民人均消费水平为__________千元.
3
则x =________,y =________,6
2
1
i
i x
=∑=__________,
6
1
i
i
i x
y
=∑=__________,回归直线
方程为__________.
4(1)线性回归方程y =bx a +的回归系数b 与a ; (2)估计使用年限为10年时,维修费用是多少? 【问题与收获】
基础知识答案:1.(1)随机 (2)左下 右上 左上 右下
2.(1)直线 回归直线 (2)距离的平方和 y -b ^
x 斜率 截距
自主小测答案:
1、 C A 项中显然任给一个x 都有唯一确定的y 和它对应,是一种函数关系;B 项也是一种函数关系;C 项中从散点图可以看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关关系;D 项中所有的点在散点图中没有显示任何关系,因此变量间是不相关的.
2、60 x =
18+13+10-14=10,y =24+34+38+64
4
=40,
则a ^=y -b ^
x ≈40+2×10=60.
例题答案:
【例题1】 解:(1)画出散点图.
(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x 的值由小变大时,另一个变量y 的值也由小变大,所以它们具有正相关关系. 【例题2】 解:(1)散点图,如图所示.
(2)由题意,得∑4
i =1xiyi =3×2.5+4×3+5×4+6×4.5=66.5, x =3+4+5+6
4=4.5, y =
2.5+3+4+4.5
4
=3.5,
∑4i =1x2
i =32+42+52+62=86, 则b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,
a ^=y -
b ^
x =3.5-0.7×4.5=0.35, 故线性回归方程为y ^
=0.7x +0.35.
(3)根据线性回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,
故消耗能源减少了90-70.35=19.65(吨).
【例题3】 正解:因选项A ,B ,D 中的两个变量间都有唯一确定的关系,因而它们都是函数关系;而选项C 中家庭收入会对消费支出产生一定的影响,但高收入未必有高消费,因而选项C 中的关系才是相关关系.故选C .
当堂检测答案:1.B 线性回归方程一定经过样本取值的平均数点(x ,y ),由取值表可计
算x =01344+++=2,y =2.2 4.3 4.8 6.74+++=9
2,知回归方程为y =0.95x +a ,又经过点(2,9
2),代入得a =2.6.
2.7.502 当x =9千元时,y =0.66×9+1.562=7.502.
3.6.5 8 327 396 y =1.14x +0.59 根据公式代入即可求得,也可以利用计算器求得,
x =6.5,y =8,6
2
1
i
i x
=∑=327,
6
1
i i
i x y
=∑=396,回归直线方程为y =1.14x +0.59.。