高中数学:必修第二册第九章-统计教学教案:变量间的相关关系(习题含答案)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高中数学:第二册
第九章:变量间的相关关系
一、基础知识梳理
1.变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的_________,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断. 注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系. 2.散点图
将样本中的n 个数据点(,)(1,2,,)i i x y i n =⋅⋅⋅描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.
(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(1)所示;
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(2)所示.
3.两个变量的线性相关
(1)如果散点图中点的分布从整体上看大致在_________附近,我们就称这两个变量之间具有_________,这条直线叫做回归直线.
回归直线对应的方程叫做回归直线方程(简称回归方程).
(2)设已经得到两个具有线性相关关系的变量的一组数据1122(,),(,),,(,)n n x y x y x y ⋅⋅⋅,直线方程
y bx a =+,其中,a b 是待定参数.
经数学上的推导,,a b 的值由下列公式给出:1
1
2
221
1
()()()n
n
i i i i
i i n
n
i i i i x x y y x y nx y
b x x x nx
a y bx
====⎧
---⎪
⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑.
其中,回归直线的斜率为b ,截距为a ,即回归方程为
y bx a =+.
上述求回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做_________. (3)利用回归方程,我们可以进行预测并对总体进行估计. 4.相关关系的强与弱
若相应于变量x 的取值i x ,变量y 的观测值为(1)i y i n ≤≤,则变量x
与y 的相关系数
()()
n
i
i
x x y y r --=
∑,即n
i i
x y nx y
r -=
∑,通常用r 来衡量x 与y 之间的
线性关系的强弱.r 的范围为11r -≤≤,r 为正时,x 与y 正相关;r 为负时,x 与y 负相关.||r 越接近于1,x 与y 的相关程度越大;||r 越接近于0,二者的相关程度越小.当||1r =时,所以数据点都在一条直线上.
习题参考答案: 1.随机性
2.(1)正相关 (2)负相关
3.(1)一条直线 线性相关关系 (2)最小二乘法
二、重点知识梳理
b 的公式或混淆b 的位置
1.回归方程的求解
(1)求回归方程的步骤:列表→计算相关量的值→代入公式计算a ,b 的值→写出回归方程. (2)回归直线一定经过样本点的中心.
【例1】假设关于某设备的使用年限x (年)和所支出的年平均维修费用y (万元)(即维修费用之和除以使用年限),有如下的统计资料:
使用年限x 2 3 4 5 6 维修费用y
2.2
3.8
5.5
6.5
7.0
(1)画出散点图;
(2)从散点图中发现使用年限与所支出的年平均维修费用之间关系的一般规律; (3)求回归方程;
(4)估计使用年限为10年时所支出的年平均维修费用是多少? 【答案】答案详见解析.
【解析】(1)画出散点图如图所示:
(2)由上图可知,各点散布在从左下角到右上角的区域里,因此,使用年限与所支出的年平均维修费用之间成正相关,即使用年限越长,所支出的年平均维修费用越多.
(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量呈线性相关关系. 由题表数据可得5
5
21
1
4,5,
112.3,90i i
i i i x y x y
x ======∑∑,
由公式可得2
112.3545 1.23,5 1.ˆ2340.089054
ˆb
a y bx -⨯⨯===-=-⨯=-⨯, 即回归方程是 1.230.08y x =+.
(4)由(3)知,当10x =时, 1.23100.0812.38y =⨯+=. 故估计使用年限为10年时所支出的年平均维修费用是12.38万元.
2.回归直线的理解及其应用
在回归方程y bx a =+中,b 是回归直线的斜率,它代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.
对于具有线性相关关系的两个变量,在求出回归方程后,就可以对总体的数据进行估计或者由已知数据的趋势去预测未知数据的值.
【例2】根据如下样本数据得到的回归方程为y bx a =+,若 5.4a =,则x 每增加1个单位,y 就
A .增加0.9个单位
B .减少0.9个单位
C .增加1个单位
D .减少1个单位
【答案】B
【解析】(5,0.9)在回归直线上,∴0.95 5.4b =+,解得0.9b =-,故
回归方程为0.9 5.4y x =-+,则x 每增加1个单位,y 就减少0.9个单位,故选B .
【例3】中国柳州从2011年起每年国庆期间都举办一届国际水上狂欢节,到2016年已举办了六届,旅游部门统计在每届水上狂欢节期间,吸引了不少外地游客到柳州,这将极大地推进柳州的旅游业的发展,现将前五届水上狂欢节期间外地游客到柳州的人数统计如下表:
(1)求y 关于x 的线性回归方程y bx a =+;
(2)旅游部门统计在每届水上狂欢节期间,每位外地游客可为本市增加100元左右的旅游收入,利用(1)中的线性回归方程,预测2017年第7届柳州国际水上狂欢节期间外地游客可为本市增加的旅游收入达多少?
参考公式:1
2
1
()()
()
n
i
i
i n
i
i x x y y b x x ==--=
-∑∑,a y bx =-.
3.弄错回归方程中a ,b 的位置
【例4】某班5名学生的数学和物理成绩如下表:
(1)画出散点图.
(2)求物理成绩y 对数学成绩x 的线性回归方程. 【答案】答案详见解析. 【错解】(1)散点图如图所示:
(2)计算得1(8876736663)73.25x =
⨯++++=,1
(7865716461)67.85
y =⨯++++=, 5
18878766573716664636125054i i
i x y
=⨯+⨯+⨯+⨯+⨯==∑,
5
2
222221
887673666327174i
i x
==++++=∑,
所以5
1
5
2
2
21
525054573.267.80.6ˆ2527174573.2
5i i
i i i x y x y
b
x x
==--⨯⨯==
≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是22.0502ˆ.65y
x =+. 【错因分析】错解中回归方程记忆错误,应为y bx a =+. 【正解】(1)散点图如图所示:
(2)计算得1
(8876736663)73.25
x =
⨯++++=, 1
(7865716461)67.85
y =⨯++++=,
5
18878766573716664636125054i i
i x y
=⨯+⨯+⨯+⨯+⨯==∑,
5
2222221
887673666327174i i x ==++++=∑, 所以5
1
52
2
21
525054573.267.80.6ˆ2527174573.2
5i i
i i i x y
xy
b
x x
==--⨯⨯==
≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是0.62520ˆ 2.5y
x =+.
三、习题强化训练
1.下列两个变量之间的关系不具有线性关系的是 A .小麦产量与施肥值 B .球的体积与表面积 C .蛋鸭产蛋个数与饲养天数
D .甘蔗的含糖量与生长期的日照天数 2.下列命题正确的是
①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究. A .①③④ B .②③④
C .③④⑤
D .②④⑤
3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断
A .变量x 与y 正相关,u 与v 正相关
B .变量x 与y 正相关,u 与v 负相关
C .变量x 与y 负相关,u 与v 正相关
D .变量x 与y 负相关,u 与v 负相关
4.下列变量是线性相关的是 A .人的体重与视力 B .圆心角的大小与所对的圆弧长 C .收入水平与购买能力
D .人的年龄与体重
5.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为
A .y ^
=1.5x +2 B .y ^
=-1.5x +2 C .y ^
=1.5x -2
D .y ^
=-1.5x -2
6.下列关系中,属于相关关系的是________ ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
7.若施肥量x (kg )与水稻产量y (kg )的线性回归方程为y ^
=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.
8.正常情况下,年龄在18岁到38岁的人,体重y (kg )对身高x (cm )的回归方程为y ^
=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右.
9.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:
x 3 4 5 6 y
2.5
t
4
4.5
根据上表提供的数据,求出y 关于x 的线性回归方程y ^
=0.7x +0.35,那么表中t 的值为________. 10.下列两个变量之间的关系是相关关系的是____________.
①正方体的棱长和体积;
②单位圆中圆心角的度数和所对弧长; ③单产为常数时,土地面积和总产量;
④日照时间与水稻的亩产量.
11.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最
小二乘法得到的线性回归直线如图所示,则以下结论正确的是
A .直线l 过点(x ,y )
B .回归直线必通过散点图中的多个点
C .直线l 的斜率必在(0,1)
D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同
12.设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,
y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^
=0.85x -85.71,则下列结论中不正确的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本的中心点(x ,y )
C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg
D .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 13.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^
A .不能小于0
B .不能大于0
C .不能等于0
D .只能小于0
14.某考察团对全国10大城市职工人均工资x 与居民人均消费y 进行统计调查,y 与x 具有线性相关关系,
线性回归方程ˆy
=0.66x +1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比约为____________.
15.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船
员人数y 关于吨位x 的回归方程为y ^
=9.5+0.006 2x , (1)若两艘船的吨位相差1 000,求船员平均相差的人数. (2)估计吨位最大的船和最小的船的船员人数.
16.某工厂对某种产品的产量与成本的资料分析后有如下数据:
(1)画出散点图;
(2)求成本y 与产量x 之间的线性回归方程; (3)预计产量为8千件时的成本.
17.某城市理论预测2014年到2018年人口总数y (单位:十万)与年份(用2014+x 表示)的关系如表所
示:
年份中的x 0 1 2 3 4 人口总数y
5
7
8
11
19
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程y ∧
=bx +a ; (3)据此估计2019年该城市人口总数.
(参考数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)
参考公式:线性回归方程为y bx a =+,其中()()()11222
11n n
i i i i i i n n i i i i x x y y x y nxy b x x x nx
====---==--∑∑∑∑.
习题参考答案:
6.【答案】②④ 7.【答案】650 8.【答案】69.96 9.【答案】3
10.【答案】④
14.【答案】83%
15.【答案】(1)船员平均相差6人;(2)吨位最大和最小的船的船员数分别为29人和10人. 16.【答案】(1)详见解析;(2)y ^
=1.1x +4.6;(3)产量为8千件时,成本约为13.4万元. 17.【答案】(1)详见解析;(2)y =3.2x +3.6;(3)估计2019年该城市人口总数约为196万.。

相关文档
最新文档