高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.3.1 & 2.3.2 变量间的相关关系 两个变量的线性相关
习课本P73~78,思考并完成以下问题预
(1)相关关系是函数关系吗?
(2)什么是正相关、负相关?与散点图有什么关系?
(3)回归直线方程是什么?如何求回归系数?
(4)如何判断两个变量之间是否具备相关关系?
[新知初探]
1.两个变量的关系
分类
函数关系
相关关系 特征
两变量关系确定
两变量关系带有随机性
2.散点图
将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关
(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.
(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.
4.最小二乘法
设x ,Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^
=a +bx ,当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^
i (i =1,2,…,n )刻画了实际观察值
y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =
i =1
n
(y i -a
-bx i)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一
条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.5.回归直线方程的系数计算公式
回归直线方程回归系数
系数a
^
的
计算公式
方程或
公式
y
^
=a
^
+b
^
x b
^
=
∑
i=1
n
xiyi-n x
-
y
-
∑
i=1
n
x2i-n x2
a
^
=y-b
^
x
-
上方加
记号“^ ”
的意义
区分y的估计值y
^
与
实际值y
a,b上方加“^ ”表示由观察值按最小二乘
法求得的估计值
[小试身手]
1.下列命题正确的是( )
①任何两个变量都具有相关关系;
②圆的周长与该圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系;
④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行
研究.
A.①③④
B.②③④
C.③④⑤
D.②④⑤
解析:选C ①显然不对,②是函数关系,③④⑤正确.
v
,
u
;对变量
1
,得散点图图
10)
,
…
,
1,2
=
i
)(
i
y
,
i
x(
有观测数据
y
,
x
.对变量
2
)
(
由这两个散点图可以判断
2.
,得散点图图
10)
,
…
,
1,2
=
i
)(
i
v
,
i
u(
有观测数据
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C .变量x 与y 负相关,u 与v 正相关
D .变量x 与y 负相关,u 与v 负相关
解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.
80
,当施肥量为250+x 5=y ^
归方程为的线性回(kg)y 与水稻产量(kg)x .若施肥量3kg 时,预计水稻产量约为________kg.
.
650(kg)=250+5×80=y ^
代入回归方程可得其预测值80=x 解析:把 答案:650
4.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.
x 2 4 5 6 8
y 30 40 60 50 70
若已求得它们的回直线的方程为
______________________.
,
5=2+4+5+6+8
5
=
x 解析:由题意可知 y
50.=30+40+60+50+70
5
=
即样本中心为(5,50).
,a ^
+x 6.5=y ^设回归直线方程为 ,
)y ,x (回归直线过样本中心∵ ,7.51=a ^
,即a ^+6.5×5=50∴ 17.5
+x 6.5=y ^
回归直线方程为∴ 17.5
+x 6.5=y ^
答案:
相关关系的判断
[典例] (1) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系. (2)某个男孩的年龄与身高的统计数据如下表所示.
年龄x (岁)
1
2
3
4
5
6
身高y (cm)
78 87 98 108 115 120
①画出散点图;
②判断y 与x 是否具有线性相关关系.
[解析] (1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.
答案:②④
(2)解:①散点图如图所示.
②由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.
两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断.
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判
断.
[活学活用]
如图所示的两个变量不具有相关关系的是________(填序号).
解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布
在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.
答案:①④
求回归方程
[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )
A.y ^
=0.4x +2.3
B.y ^
=2x -2.4
C.y ^
=-2x +9.5 D.y ^
=-0.3x +4.4
(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:
转速x (转/秒)
16 14 12 8 每小时生产有缺点的零件数y (件)
11
9
8
5
①画出散点图;
②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =
5170x -6
7
,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?
[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.
答案:A
(2)解:①散点图如图所示:
②近似直线如图所示:
秒/转14,所以机器的运转速度应控制在≤14.9x ,解得≤106
7
-x 5170得
≤10y 由③内.
求回归直线方程的步骤
.
)数据一般由题目给出)(n ,…,1,2=i )(i y ,i x (收集样本数据,设为(1) (2)作出散点图,确定x ,y 具有线性相关关系.
.
i y i x ,2i x ,i y ,i x 把数据制成表格(3)
.
i
y i ∑i =1
n
x ,2i ∑i =1n x ,y ,x 计算(4) ⎩⎪⎨⎪⎧
b ^=∑i =1n
xiyi -n x y ∑i =1n x2
i -n x 2,
a ^=y -
b ^ x .
,公式为a ^
,b ^代入公式计算(5)
.a ^
+x b ^=y ^写出回归直线方程(6) [活学活用]
已知变量x ,y 有如下对应数据:
x 1 2 3 4 y
1
3
4
5
(1)作出散点图;
(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.
,5
2
=1+2+3+44=x (2) y ,134
=1+3+4+54=
∑
i
=14
x 39.=20+12+6+1=i y i ∑
i =14
x 2i ,30=16+9+4+1= b
^
,1310=39-4×52×
13
430-4×⎝ ⎛⎭
⎪⎫522=
a
^,0=52
×13
10-134= .
为所求的回归直线方程x 13
10
=y ^所以 利用线性回归方程对总体进行估计
[典例x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:
x 3 4 5 6 y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^
;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?
[解] (1)散点图如图:
,3.5=2.5+3+4+4.5
4
=y ,4.5=3+4+5+64=
x (2) ∑
i
=14
x ,66.5=6×4.5+5×4+4×3+3×2.5=i y i ∑
i
=14
x 2i ,86=2
6+2
5+2
4+2
3= ∑i =14
xiyi -4x
y
∑i =1
4
x2i -4x 2
=
b ^所以 ,
0.7=66.5-4×4.5×3.5
86-4×4.52
=
a ^
0.35.=0.7×4.5-3.5=
x b ^-y = 0.35.
+x 0.7=y ^
所以所求的线性回归方程为 ,
)吨标准煤70.35(=0.35+0.7×100=y ^
时,100=x 当(3) 90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了
19.65吨标准煤.
只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.
[活学活用]
(重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)
5
6
7
8
10
(1)求y 关于t 的回归方程y ^=b ^t +a ^
;
(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:
i
t i
y i
t 2i
t i y i
1 1 5 1 5
2 2 6 4 12
3 3 7 9 21
4 4 8 16 32
5 5 10 25 50 ∑
15
36
55
120
这里n =5,t -=1n ∑i =1n t i =155=3,y -=1
n ∑i =1n y i =365=7.2.
又∑i =1
n
t2i -n t -2=55-5×32
=10,
i =1
n t i y i -n t
-y -
=120-5×3×7.2=12,
从而b ^
=1210=1.2,a ^=y --b ^t -
=7.2-1.2×3=3.6,
故所求回归方程为y ^
=1.2t +3.6.
(2)将t =
6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^
=1.2×6+3.6=10.8(千亿元).
[层级一 学业水平达标]
1.下列变量具有相关关系的是( )
A .人的体重与视力
B .圆心角的大小与所对的圆弧长
C .收入水平与购买能力
D .人的年龄与体重
解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C.
2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为
2+x 1.5=y ^
A. 2+x 1.5=-y ^
B. 2-x 1.5=y ^
C. 2
-x 1.5=-y ^
D. 之间负相关,回归直线
y ,x ,由散点图可知变量a ^
+x b ^=y ^设回归方程为 B 解析:选 2.
+x 1.5=-y ^
,因此方程可能为>0a ^,<0b ^轴上的截距为正数,所以y 在 个样本点,n 的y 和x 是变量)n y ,n x (,…,)2y ,2x (,)1y ,1x (设3.直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,
则以下结论正确的是( )
)
y ,x (过点l .直线A B .回归直线必通过散点图中的多个点
C .直线l 的斜率必在(0,1)
D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同
解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直
线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误. 4.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的
,
x 0.006 2+9.5=y ^
的回归方程为x 关于吨位y 人,船员人数32~5人数 (1)若两艘船的吨位相差1 000,求船员平均相差的人数;
(2)估计吨位最大的船和最小的船的船员人数.
,则2x ,1x 设两艘船的吨位分别为(1)解: y
^)2x 6 20.00+(9.5-1x 0.006 2+9.5=2y ^-1 =0.006 2×1 000≈6, 即船员平均相差6人.
,0.006 2×192≈11+9.5=y ^
时,192=x 当(2) 0.006 2×3 246≈30.
+9.5=y ^
时,3 246=x 当 即估计吨位最大和最小的船的船员数分别为30人和11人.
[层级二 应试能力达标]
1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5
次,那么取出红球的次数和口袋中红球的数量是( ) A .确定性关系 B .相关关系 C .函数关系
D .无任何关系 解析:选 B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与
球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.
,下
x 80+50=y ^
变化的回归直线方程为)千元(x 依劳动生产率)元(y .农民工月工资2列判断正确的是( )
A .劳动生产率为1 000元时,工资为130元
B .劳动生产率提高1 000元时,工资水平提高80元
C .劳动生产率提高1 000元时,工资水平提高130元
D .当月工资为210元时,劳动生产率为2 000元
的单
x ,但要注意80增加y ,1每增加x 知,x 80+50=y ^
由回归直线方程 B 解析:选位是千元,y 的单位是元.
3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:
则y 对x 的线性回归方程为( )
A .y =x -1
B .y =x +1
x 1
2
+88=y .C
176=y .D =
y ,176=174+176+176+176+178
5
=x 计算得, C 解析:选符合.
C 检验知,)y ,x (,根据回归直线经过样本中心176=175+175+176+177+177
5
4.已知x 与y 之间的几组数据如下表:
,若某同学根据上表中的前两组
a ^
+x b ^=y ^假设根据上表数据所得线性回归直线方程为数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )
′a <a ^,′b >y ^′ B.a >a ^,′b >b ^A. ′
a <a ^,′
b <y ^′ D.a >a ^,′b <b ^C. 解析:选C 由(1,0),(2,2)求b ′,a ′.
2.
=-2×1-0=′a ,2=2-0
2-1
=′b ,
58=24+15+12+3+4+0=i y i ∑i =1
6
x 时,a ^
,b ^求 x ,136
=
y ,3.5= ∑
i
=16
x 2i ,91=36+25+16+9+4+1= ,
57=58-6×3.5×
13
691-6×3.52=b ^
∴ a
^
,13
=-52-136=×3.557-136= ′.
a >a ^
,′b <b ^∴ =
y ^
的回归方程为(cm)x 对身高(kg)y 岁的人,体重38岁到18.正常情况下,年龄在5
0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右. =
y ^
时,178=x 的人的体重进行预测,当178 cm 解析:用回归方程对身高为0.72×178-58.2=69.96(kg).
答案:69.96
6.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试
销,得到如下数据:
________.
=a ,则a +x 4=-y 由表中数据,求得线性回归方程为 ,
13
2=4+5+6+7+8+96=x 解析: y
,80=92+82+80+80+78+68
6
=
)
y ,x (由回归方程过样本中心点 .
a ^
+1324×=-80得 106.
=132
4×+80=a ^
即 答案:106
7.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y ,估计该台机器最为划算的使用年限为
x 1.3-10.47=y ^
具备线性相关关系,回归方程为________年.
解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,
解得x ≈8,故估计该台机器最为划算的使用年限为8年.
答案:8
8.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件
数x (件)之间有一组数据如下表:
;
y ,x 求(1) (2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?
3 487)
=i y i ∑i =1
7
x ,45 309=2i ∑i =17y ,280=2i ∑i =17x 提示:( ,
6=3+4+
5+6+7+8+9
7
=
x (1)解: y
≈79.86.66+69+73+81+89+90+917
= ,
≈4.753 487-7×6×79.86
280-7×62
=b ^∵(2) a
^
,51.36=4.75×6-79.86= .
x 4.75+51.36=y ^
之间的回归直线方程为x 纯利与每天销售件数∴ ≈31.29.
x ,所以651.3+x 4.75=200时,200=y ^
当(3) 因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.
9.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支
出的统计资料如下表:
年收入
x (万元)
2 4 4 6 6 6 7 7 8 10
年饮食 支出y
(万元)
0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3
(2)若某家庭年收入为9万元,预测其年饮食支出.
406)
=2i ∑i =1
10
x ,117.7=i y i ∑i =110x 参考数据:( 解:依题意可计算得:
x
,10.98=y x ,36=2
x ,1.83=y ,6= ,
406=2i ∑i =1
10
x ,117.7=i y i ∑i =110x ∵又
,
≈0.17∑i
=110
xiyi -10x y ∑i =1
10
x2i -10x 2=b ^∴ a
^
0.81.+x 0.17=y ^∴,0.81=x b ^-y = 1.
0.8+x 0.17=y ^
所求的回归方程为∴ .
)万元2.34(=0.81+0.17×9=y ^
时,9=x 当(2) 可估计年收入为9万元的家庭每年饮食支出约为2.34万元.
(时间120分钟,满分150分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,
只有一项是符合题目要求的)
1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依
次为( )
A .简单随机抽样;分层抽样;系统抽样
B .分层抽样;简单随机抽样;系统抽样
C .分层抽样;系统抽样;简单随机抽样
D .系统抽样;分层抽样;简单随机抽样
解析:选 C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用
简单随机抽样.故选C.
2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5
的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )
A .09,14,19,24
B .16,28,40,52
C .10,16,22,28
D .08,12,16,20 解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.
3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )
A .193
B .192
C .191
D .190 192.
=n ,求得80=n
200+1 200+1 000
1 000× B 解析:选 4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )
200+x 10=y ^
200 B.+x 10=-y ^A. 200
-x 10=y ^
200 D.-x 10=-y ^C. 解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >
0,则C 中销售量全小于0,不符合题意,故选A.
,则
y 和x ,它们的平均数分别是n y ,…,2y ,1y 与n x ,…,2x ,1x .设有两组数据5)
(的平均数是1+n y 3-n x 2,…,1+2y 3-2x 1,2+1y 3-1x 2新的一组数据 y 3-x 2.A 1+y 3-x 2.B
y 9-x 4.C
1+y 9-x 4.D ,
)n ,…,1,2=i 1(+i y 3-i x 2=i z 设 B 解析:选 =
⎝ ⎛⎭
⎪⎫1+1+…+1n +)n y +…+2y +1y (3n -)n x +…+2x +1x (2n =)n z +…+2z +1z (1n =z 则 1.
+y 3-x 2 6.有一个容量为66的样本,数据的分组及各组的频数如下:
[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12
[35.5,39.5) 7 [39.5,43.5) 3
则总体中大于或等于31.5的数据所占比例约为( )
211
A.
1
3B. 12
C.
23
D. 解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7
.
1
3
=2266的数据约占31.5,故总体中大于或等于22=3+ 7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众
数、中位数分别是( )
A .85,85,85
B .87,85,86
C .87,85,85
D .87,85,90 解析:选C ∵得85分的人数最多为4人,
∴众数为85,中位数为85,
87.
=75)+80+85×4+90×2+95+(1001
10
平均数为 8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这
50名出租车司机该月平均违章的次数为( )
A .1
B .1.8
C .2.4
D .3 1.8.
=5×0+20×1+10×2+10×3+5×4
50
B 解析:选 9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据
月份x 1 2 3 4
用水量y 4.5 4 3 2.5
的
a ,则a +x 0.7=-y 之间具有线性相关关系,其线性回归方程为x 与月份y 用水量值为( )
A .5.25
B .5
C .2.5
D .3.5 解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为
(2.5,3.5),所以a =5.25.
10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平
均数和方差分别为( )
A .84,4.84
B .84,1.6
C .85,1.2
D .85,4 +
5+6+3+(51
5
+80,平均数为77,去掉一个最低分95去掉一个最高分 C 解析:选
,因此
1.2=]2
86)-(85+285)-(85+286)-(85+283)-(85+285)-[(8515
,方差为85=6)选C.
,
…,2+2x 2,3+1x 3,则2
s ,方差是x 的平均数是n x ,…,3x ,2x ,1x .如果数据11)
(的平均数和方差分别是2+n x 3
2
s 和x A.
2
s 9和x 3.B
2
s 9和2+x 3.C
4+2
s 12和2+x 3.D n
x …,2x ,1x ,由于数据2+x 3的平均数是2+n x 3,…,2+2x 2,3+1x 3 C 解析:选.
2
s 9的方差为2+n x 3,…,2+2x 2,3+1x 3,所以2
s 的方差为 12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误
的是( ) A .x =9 B .y =8
C .乙的成绩的中位数为26
D .乙的成绩的方差小于甲的成绩的方差
解析:选B 因为甲的成绩的极差为31,所以其最高成绩为39,所以x =9;因为乙的成绩的平均值为24,所以y =24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的
中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据
的平均数为10,方差为2,则|x -y |的值为________.
∴
,2;又方差为20=y +x ,则10=1
59)×+11+10+y +x (,得10解析:由平均数为=
xy 208,2=2
y +2x ,得2=15
]×210)-(9+210)-(11+210)-(10+210)-y (+210)-x [( 4.
=x2+y2-2xy =x -y 2=
|y -x |∴,192 答案:4
14.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全
体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.
12.
=×4821
48+36
解析:抽取的男运动员的人数为 答案:12
15.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,
________,________,________.
(下面摘取了随机数表第7行至第9行)
59408 66368 36016 26247 25965 49487 26968 86021 77681 83458 21540 62651 69424 78197 20643 67297 76413 66306 51671 54964 87683 30372 39469 97434
解析:以3开始向右读,每次读取三位,重复和不在范围内的不读,依次为
368,360,162,494,021.
答案:368,360,162,494,021
16.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在
[140,150]的学生中选取的人数应为________.
解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,
∴a =0.030.
设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人,
10.=z ,20=y 同理,30.=x ,解得0.030×10=x
100
则
3.
=×1810
30+20+10的学生中选取的人数为
[140,150]故从 答案:0.030 3
三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) ,应如何
1
10
名学生中抽取50为调查某班学生的平均身高,从)分10本小题满分(.17抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样? 抽签法或随机数(人,采用简单随机抽样法5,即抽取1
10
名学生中抽取
50解:从法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为
30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.
18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某
日加工零件个数的茎叶图如图所示. (1)根据茎叶图计算样本均值;
(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工
人中有几名优秀工人?
22.
=132
6
=17+19+20+21+25+306样本均值为1)(解: 4
=1
3
12×名工人中有12,故推断该车间13=26知样本中优秀工人所占比例为(1)由(2)名优秀工人.
19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍
询问,询问结果如图所示:
(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?
(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四
川籍的应抽取几人?
解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.
(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=
100(人);
四川籍的有15+10+5+5+5=40(人).
2
,即四川籍的应抽取2=x ,解得x
40
=5100人,依题意得x 设四川籍的驾驶人员应抽取人.
20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每
隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:
甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110.
(1)这种抽样方法是哪一种方法?
(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定?
解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样.
,
100=99)+98+103+98+99+101+(1021
7=甲x (2) x
,100=110)+115+75+85+90+115+(1101
7
=乙 ,
1)≈3.43+4+9+4+1+1+(41
7
=2甲s ,
228.57=100)+225+625+225+100+225+(1001
7
=2乙s ,故甲车间产品比较稳定.
2乙s <2甲s ∴ 21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的
统计表和频率分布直方图如下:
分组
频数 频率
[10,15) 10 0.25
[15,20) 25
n [20,25) m
p
[25,30] 2
0.05 合计
M
1
(1)求出表中M ,p 及图中a 的值;
(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间
[10,15)的人数.
解:(1)由分组[10,15)的频数是10, 40.
=M ,所以0.25=10
M
知,0.25频率是 因为频数之和为40,
所以10+25+m +2=40,解得m =3.
0.075.=340
=p 故 因为a 是对应分组[15,20)的频率与组距的商,
125.0.=2540×5
=a 所以 (2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生
参加社区服务的次数在此区间内的人数为360×0.25=90.
22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入
i
y i ∑i =1
10
x ,20=i ∑i =110y ,80=i ∑i =110x 的数据资料,算得)单位:千元(i y 与月储蓄)单位:千元(i x 720.
=2i ∑i =1
10
x ,184= ;
a ^+x
b ^=y ^的线性回归方程x 对月收入y 求家庭的月储蓄(1) (2)判断变量x 与y 之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
,8=8010=i ∑i =1
n x 1n =x ,10=n 由题意知(1)解: y ,2=2010=i ∑i =1
n y 1n = ,
80=210×8-720=2x 10-2i ∑i =1
10
x 又 ∑
i
=110
x ,24=10×8×2-184=y x 10-i y i ,0.3=2480=∑i =110
xiyi -10x y
∑i =1
10
x2
i -10x 2=b ^由此得 a
^,0.4=-0.3×8-2=x b ^-y = 0.4.
-x 0.3=y ^故所求回归方程为 (2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.
(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。