必修三第02讲 :抽样方法与变量间的相关关系

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二讲抽样方法与变量间的相关关系
A组
一、选择题
1.(2015北京卷)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
【答案】C
【解析】由题意抽样比为3201
=,∴该样本的老年教师人数为
16005
1
⨯ (人),故选C.
900=180
5
2.(2016山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5),[22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56
B.60
C.120
D.140
【答案】D
【解析】由频率分布直方图知,自习时间不少于22.5小时为后三组,有200(0.160.080.04) 2.5140
⨯++⨯=(人),故选D.
3.(2015山东卷)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的平均气温的标准差小于乙地该月14时的气温的标
准差;
④甲地该月14时的平均气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的标号为( )
A.①③ B .①④ C. ②③ D. ②④
【答案】B
【解析】由茎叶图知:
甲的数据为:26,28,29,31,31;
乙的数据为:28,29,30,31,32.
x 甲
26+28+29+31+31
=29
5
=,=
x

28+29+30+31+32
=30
5
=
2= S

22222 (26-29)+(28-29)+(29-29)+(31-29)+(31-29)
= 3.6
5
=
2= S

22222 (28-30)+(29-30)+(30-30)+(31-30)+(32-30)
2
5
=
∴x
甲<x

2>
S

2
S

故选B.
4.(2016北京卷)某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.
在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远
决赛和30秒跳绳决赛的有6人,则( )
A.2号学生进入30秒跳绳决赛
B.5号学生进入30秒跳绳决赛
C.8号学生进入30秒跳绳决赛
D.9号学生进入30秒跳绳决赛【答案】B
【解析】将确定成绩的30秒跳绳成绩的按从大到小的顺寻排,分别是3,6,7,10,(1,5并列),4,其中,3,6,7号进了立定跳远的决赛,10号没进立定跳远的决赛,故9号需进30秒跳绳比赛的前8名,此时确定的30秒跳绳比赛决赛的名单为3,6,7,10,9,还需3个编号为1-8的同学进决赛,而(1,5)与4的成绩仅相隔1,故只能1,5,4进30秒跳绳的决赛,故选B.
5.(2015全国卷Ⅰ)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
【答案】D
【解析】从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;2007年二氧化硫排放量较2006年降低了很多,B选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减
趋势,即C 选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D 选项错误,故选D.
6.(2015福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
=+y bx a 0.76,-==b a y bx 据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元
B.11.8万元
C.12.0万元
D.12.2万元
【答案】B
【解析】回归直线一定过样本点中心(10,8),∵b =0.76,∴a =0.4,由y =0.76x +0.4得当x =15万元时,y =11.8万元,故选B.
7.(2015安徽卷)若样本数据x 1,x 2,…,x 10的标准差为8,则数据
2x 1-1,2x 2-1,…,2x 10-1的标准差为( ) A.8
B.15
C.16
D.32 【答案】C
【解析】法一:设1210,,,x x x 的平均值为x ,则121010+++=x x x x
1s 则12101=[(2x -1)+(2x -1)(2x -1)]10++y 12101=
[2(x +x x )-10]2110++=-x ,
所以2s
1s ,故选C.
法二: 由方差的性质:1210,,,x x x 方差为2s 则1210,,,+++ax b ax b ax b
方差为22a s .因为1210,,,x x x 的标准差为8即方差为64,所以
12102-1,2-1,,2-1x x x 的方差为 464⨯,故选
C.
8.(2016黄冈模拟)某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
关于上述样本的下列结论中,正确的是( )
A .②、③都不能为系统抽样
B .②、④都不能为分层抽样
C .①、④都可能为系统抽样
D .①、③都可能为分层抽样
【答案】 D
【解析】 根据三种抽样方法的特征,如果是分层抽样,则各号段应占的比例为4∶3∶3,①②③均适合;如果是系统抽样,则抽取的样本号码应该构成公差为27的等差数列,且首项小于或等于27.其中①③的首项分别为7和11,适合;④的首项为30,不适合.故选
D.
二.填空题
9.(2016上海卷)某次体检,6位同学的身高(单位:米)分别
为1.72,1.78,1.75,1.80,1.69,1.77则这组数据的中位数是
_________(米)
【答案】1.76
【解析】数字按大小顺序排列为1.69,1.72, 1.75, 1.77,1.78, 1.80,位于中间的数有两个,中位数为它们的平均值1.75+1.77=1.76
2,故答案为1.76
10.(2015湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间
[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
【答案】(1)3 (2)6 000
【解析】
(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2
=1,解得a=3.
(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000. 故答案为6 000
11.(2016江苏南通模拟)某中学共有学生2000人,其中高一年级共有学生650人,高二男生有370人.现在全校学生中随机抽取1名,抽到高二年级女生的概率是0.19.则该校高三学生共有________人.【答案】600
【解析】
在全校学生中抽取1名学生,抽到高二年级女生的概率是0.19,
则高二女生人数为0.19×2000=380人,
则高三人数为2000﹣650﹣370﹣380=600人,故答案为600.三.解答题
12.(2015衡水中学二模)已知某中学高三文科班学生共有800人参加了数学与地理的水平测试,学校决定利用随机数表法从中抽取100人进行成绩抽样调查,先将800人按001,002,…,800进行编号.
(1)如果从第8行第7列的数开始向右读,请你依次写出最先检查的3个人的编号;(下面摘取了第7行到第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74
47 67 21 76 33 50 25 83 92 12 06 76(第7行)
63 01 63 78 59 16 95 56 67 19 98 10 50
71 75 12 86 73 58 07 44 39 52 38 79(第8行)
33 21 12 34 29 78 64 56 07 82 52 42 07
44 38 15 51 00 13 42 99 66 02 79 54(第9行)
(2)抽取的100人的数学与地理的水平测试成绩如下表:
与数学成绩的等级人数,例如:表中数学成绩为良好的共有20+18+4=42人.
①若在该样本中,数学成绩优秀率是30%,求a ,b 的值;
②在地理成绩及格的学生中,已知10,8≥≥a b ,求数学成绩优秀的人数比及格的人数少的概率.
【解析】
(1)从第8行第7列的数开始向右读,依次检查的编号分别为
785,916(舍)955(舍),667,199,…,故最先检查的3个人的编号为785,667,199.
(2)①7+9+30%100
=a ,∴a =14,b =100-30-(20+18+4)-(5+6)=17.
②a +b =100-(7+20+5)-(9+18+6)-4=31.
10,8≥≥a b ,,∴a b 的所以可能为(10,21),(11,20),(12,19),
(13,18),(14,17),(15,16),(16,15),(17,14),(18,13),(19,12),(20,11),(21,10),(22,9),(23,8),共14种.
记10,8≥≥a b ,数学成绩优秀的人数比及格的人数少为事件A.
则事件A 包括(10,21),(11,20),(12,19),(13,18),(14,17),(15,16),共6个基本事件.63P(A)147
∴==即数学成绩优秀的人数比及格的人数少的概率为37
.
13.(2015全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣
传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =
1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
表中8i i 1
1w =w =w 8=∑i . (1)根据散点图判断,y =a +bx 与y =c +
哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;
(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x.根据(2)的结果回答下列问题:
①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?
附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直
线v +u αβ=的斜率和截距的最小二乘估计分别

1
82
1(u u)(v v)
,v u (u
u)βαβ==--==--∑∑n i i i i i 【解析】
(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传
费x 的回归方程类型.
(2)
令w =y 关于w 的线性回归方程. 由于81821(w w )(y y )108.8681.6
(w
w)==--
===-∑∑i
i i i i d ,c y dw=563-68 6.8=100.6=-⨯, 所以y 关于w 的线性回归方程为100.668w =+y ,
因此y
关于x 的回归方程为100.6=+y (3)①由(2)知,当x =49时,
年销售量y 的预报值100.6=+y ,
年利润z 的预报值z 0.257.64966.32=⨯-=
②根据(2)的结果知,年利润z 的
预报
值2z 0.2(100.6x x 20.1220.12=+-=-+=-+
13.6 6.82
==,即x =46.24时,z 取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.
14.(2015淄博模拟)某数学兴趣小组的学生全部参加了“代数”和“几何”两个科目的考试,成绩分为A 、B 、C 、D 、E 五个等级,成绩数据统计如下图所示,其中“代数”科目的成绩为B 的考生有20人.
(1)求该小组同学中“几何”科目成绩为A的人数;
(2)若等级A、B、C、D、E分别对应5分,4分,3分,2分,1分,求该小组考生“代数”科目的平均分;
(3)已知参加本次考试的同学中,恰有4人的两科成绩均为A,在至少一科成绩为A的考生中,随机抽取两人进行座谈交流,求这两人的两科成绩均为A的概率.
【解析】
(1)因为“代数”科目中成绩等级为B的考生有20人.
所以该小组有20÷0.25=80(人).
所以该小组同学中“几何”科目成绩等级为A的人数为
80×(1-0.375-0.375-0.15-0.025)=80×0.075=6人.
(2)该考场考生“代数”科目的平均分为
1×0.2+2×0.1+3×0.375+4×0.25+5×0.075=2.9.
(3)因为两科考试中,共有12人次得分等级为A.又恰有4人的两科成绩等级均为A.
所以还有4人有且只有一个科目得分为A.
设得到成绩等级为A的这8人编号为1~8号,其中1~4号是两科成绩等级都是A的同学,则在至少一科成绩等级为A的考生中,随机抽取两人进行访谈,构成的所有基本事件有:
{1,2},{1,3},{1,4},{1,5},{1,6},{1,7},{1,8},{2,3},{2,4},{2,5},{2,6},{2,7},{2,8},{3,4},{3,5},{3,6},{3,7},{3,8},{4,5},{4,6},{4,7},{4,8},{5,
6},{5,7},{5,8},{6,7},{6,8},{7,8},共有28个基本事件.由于被选到的机会均等,因此这些基本事件的出现是等可能的. 记事件B “随机抽取两人进行座谈交流,这两人的两科成绩等级均为A ”.所以事件B 中包含的基本事件有{1,2},{1,3},{1,4},{2,3},{2,4},{3,4},共6个.则63()2814
==P B . 15.(2016年北京卷)某市民用水拟实行阶梯水价,每人用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(I )如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?
(II )假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.
【解析】(I )由用水量的频率分布直方图知,
该市居民该月用水量在区间[]0.5,1,(]1,1.5,(]1.5,2,(]2,2.5,(]2.5,3内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米
的居民占45%.依题意,w至少定为3.
(II)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
根据题意,该市居民该月的人均水费估计为:
⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯
40.160.1580.2100.25120.15170.05220.05270.05
=(元).
10.5
B组
一.选择题
1.(2016全国卷III)某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图。

图中A点表示十月的平均最高气温约为150C,B点表示四月的平均最低气温约为50C。

下面叙述不正确的是( )
A.各月的平均最低气温都在00C以上
B. 七月的平均温差比一月的平均温差大
C. 三月和十一月的平均最高气温基本相同
D. 平均气温高于200C的月份有5个
【答案】D
【解析】由图可知00C均爱虚线框内,所以各月的平均气温都在00C 以上,A正确;由图可知在七月的平均气温差大于7.50C,而一月的平均气温差小于7.50C,七月的平均气温差比一月的平均气温差大,B 正确;由图可知三月和十一月的平均气温都大约在50C,基本相同,C 正确;由图可知平均气温高于200C的月份有3个或2个,所以不正确,故选D.
2.(2016陕西西安一模)采用系统抽样方法从1 000人中抽取50
人做问卷调查,为此将他们随机编号为1,2,…,1 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间[1,400]的人做问卷A,编号落入区间[401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为( ) A.12 B.13 C.14 D.15
【答案】A
【解析】系统间隔=1 000÷50=20,故由题意可得抽到的号码构成以8为首项,以20为公差的等差数列,且此等差数列的通项公式为 8(n-1)202012n a n =+⨯=-.由75120121000n ≤-≤,解得38.1550.6,n n N *≤≤∈.可得3950,n n N *≤≤∈,故做问卷C 的人数为12.故选A
3.(2015山东泰安一模)根据如下样本数据
得到的回归方程为=+y bx a .若=7.9a ,则x 每增加1个单位,y 的值就平均( )
A.增加1.4个单位
B.减少1.4个单位
C.增加1.2个单位
D.减少1.2个单位
【答案】B
【解析】因为回归方程为=+y bx a 恒过样本中心点(5,0.9),所以b =-1.4,则x 每增加一个单位,y 就减少1.4个单位,故选B.
4.(2016山东青岛一模)已知数据x 1,x 2,x 3,…,x 50,500(单位:
公斤),其中x 1,x 2,x 3,…,x 50,是某班50个学生的体重,设这50
个学生体重的平均数为x ,中位数为y ,则x 1,x 2,x 3,…,x 50,500
这51个数据的平均数、中位数分别与x 、y 比较,下列说法正确的是
( )
A.平均数增大,中位数一定变大
B.平均数增大,中位数可能不变
C.平均数可能不变,中位数可能不变
D.平均数可能不变,中位数可能变小
【答案】B
【解析】由题意,数据x 1,x 2,x 3,…,x 50,是某班50个学生的体重,
其平均数应在50公斤左右,再增加一个数据500,这51个数据的平均数一定增大,而中位数有可能不变,故选B.
5.(2015广东东莞模拟)对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则不正确的说法是( )
A.若求得的回归方程为y^=0.9x-0.3,则变量y和x之间具有正的线性相关关系
B.若这组样本数据分别是(1,1),(2,1.5),(4,3),(5,4.5),则其回归方程=+
y bx a必过点(3,2.5)
C.若同学甲根据这组数据得到的回归模型1的残差平方和为E1=0.8.同学乙根据这组数据得到的回归模型2的残差平方和为E2=2.1,则模型1的拟合效果更好
D.若用相关指数R2(R2=1-
2
1
2
1
()
()
n
i i
i
n
i
i
y y
y y
=
=
-
-


)来刻画回归效果,回归模型3
的相关指数R23=0.32,回归模型4的相关指数R24=0.91,则模型3的拟合效果更好
【答案】D
【解析】相关指数R2越接近于1拟合效果越好,故选D.
6.(2016襄阳四中周考)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的,m n的比值m
n
=()
A.1 B.1
3C.2
9
D.3
8
【答案】D 【解析】由茎叶图可知乙的中位数是3234332
+=,甲、乙两组数据中位数相同所以=3m ,则甲的平均数为3933+27333
+=,甲、乙两组数据平均数也相同,所以3234+38+20+334+=n ,解得=8n ,即3=8
m n 故选D. 7.(2016湖北重点高中联考)教师想从52个学生中,利用简单随机抽样的方法,抽取10名谈谈学习社会主义核心价值观的体会,一小孩在旁边随手拿了两个号签,教师没在意,在余下的50个号签中抽了10名学生,则其中的李明同学的签被小孩拿去和被教师抽到的概率分别为 ( )
A.51,261
B.265,261
C. 0,261
D.5
1,251 【答案】B
【解析】∵每一个个体被抽到的概率都为样本容量总体个数
,∴小孩从52个号签中拿了两个号签,李明同学的签被小孩拿去的概率为
21=5226
,李明同学的签被教师抽到的概率为105=5226,故选B. 8.(2016西大附中一模)某校共有学生2000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )
A .17
B .16
C .15
D .14
【答案】B
【解析】因为在全校2000学生中随机抽取1名,抽到二年级女生的
概率是0.19,所以二年级女生人数0.192000380x =⨯=.由此知三年级人数为:2000-(373+377)-(380+370)=500.又分层抽样的抽样比为 642000,则应在三年级抽取的学生人数为64500=16,2000
⨯故选B.
二.填空题
9.( 2016江苏卷)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
【答案】0.1
【解析】这组数据的平均数为1(4.7 4.8 5.1 5.4 5.5) 5.15
=++++=x ,则方差
2222221(4.7 5.1)(4.8 5.1)(5.1 5.1)(5.4 5.1)(5.5 5.1)0.15S ⎡⎤∴=-+-+-+-+-=⎣⎦.故答案为0.1
10.(2016山东济宁一模)如图是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小
组的频率依次成等差数列,第2小组的频
数为10,则抽取的学生人数为________.
【答案】40
【解析】前3个小组的频率和为1-(0.037
5+0.012 5)×5=0.75,因为前3个小组的频率依次成等差数列,所
以第2小组的频率为13×0.75=0.25,所以抽取的人数为10400.25
=.故答案为40.
11.(2015湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示
0 0 3 4 5 6 6 8 8 8 9 1 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 8
0 1 2 2 3 3 3
1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[]139,151上的运动员人数是________.
【答案】4
【解析】将1~35号分成7组,每组5名运动员,由茎叶图可知,小于139的人数,刚好分2组.落在区间[]139,151的人数为20,共有4组。

再由系统抽样的性质可知:抽取4名,故答案为4.
11.(2016北京卷)某网店统计了连续三天售出商品的种类情况:第一天售出19种商品,第二天售出13种商品,第三天售出18种商品;前两天都售出的商品有3种,后两天都售出的商品有4种,则该网店①第一天售出但第二天未售出的商品有______种;②这三天售出的商品最少有_______种.
【答案】①16;②29
【解析】①由于前二天都售出的商品有3种,因此第一天售出的有19-3=16种商品第二天未售出;故答案为16.
②同①第三售出的商品中有14种第二天未售出,有1种商品第一天未售出,三天总商品种数最少时,是第三天中14种第二天未售出的商品都是第一天售出过的,此时商品总数为29.分别用表示第一、二、三天售出的商品,如图最少时的情形.故答案为29.
,,A B C C B
A
13914
2
三.解答题
12.(2016上海卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……[4,4.5]分成9组,制成了如图所示的频率分布直方图。

(I)求直方图中的a值;
(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;
(Ⅲ)估计居民月均用水量的中位数。

【解析】
(Ⅰ)由频率分布直方图,可知:月用水量在[0,0.5]的频率为0.08×0.5=0.04.同理,在[0.5,1),(1.5,2],[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1–(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,
解得a=0.30.
(Ⅱ)由(Ⅰ),100位居民月均水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3
吨的人数为300000×0.13=36000. (Ⅲ)设中位数为x 吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5, 而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5 所以2≤x<2.5.
由0.50×(x –2)=0.5–0.48,解得x=2.04. 故可估计居民月均用水量的中位数为2.04吨.
13.(2016北京卷) A 、B 、C 三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如下表(单位:小时);
(1)试估计C 班的学生人数;
(2)从A 班和C 班抽出的学生中,各随机选取一人,A 班选出的人记为甲,C 班选出的人记为乙,假设所有学生的锻炼时间相对独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;
(3)再从A 、B 、C 三个班中各随机抽取一名学生,他们该周的锻炼时间分别是7,9,8.25(单位:小时),这3个新数据与表格中的数据构成的新样本的平均数记 ,表格中数据的平均数记为 ,试判断和的大小,(结论不要求证明) 【解析】
1μ0μ0μ1μ
⑴由表格知抽到C 班学生的概率是8
20
,则C 班学生为81004020
⨯=人
⑵在A
班中取到每个人的概率相同均为15
设A 班中取到第i 个人事件为,1,2,3,4,5i A i = C 班中取到第j 个人事件为,1,2,3,4,5,6,7,8j C j = A 班中取到i j A C >的概率为i P 所求事件为D 则1234511111()5
5555
P D P P P P P =++++
12131313145858585858=⨯+⨯+⨯+⨯+⨯
38
= ⑶10μμ<三组平均数分别为7,9,8.25,总均值08.2μ=但1μ中多加的三个数据7,9,8.25,平均值为8.08,比0μ小,故拉低了平均值
14.(2016全国卷II )某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
(Ⅰ)记A 为事件:“一续保人本年度的保费不高于基本保费”.求()P A
的估计值;
(Ⅱ)记B 为事件:“一续保人本年度的保费高于基本保费但不高于
基本保费的160%”.求()P B 的估计值;
(III )求续保人本年度的平均保费估计值. 【解析】
(Ⅰ)事件A 发生当且仅当一年内出险次数小于2.由所给数据知,
一年内险次数小于2的频率为6050
0.55200
+= 故P(A)的估计值为0.55.
(Ⅱ)事件B 发生当且仅当一年内出险次数大于1且小于4.由是给
数据知,一年内出险次数大于1且小于4的频率为3030
0.3200
+=,
故P(B)的估计值为0.3. (Ⅲ)由题所求分布列为:
调查200名续保人的平均保费为
0.850.300.25 1.250.15 1.50.15 1.750.3020.10 1.1925a a a a a a a ⨯+⨯+⨯+⨯+⨯+⨯=, 因此,续保人本年度平均保费估计值为1.1925a.
15.(2016全国卷I )某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数.
(I )若n =19,求y 与x 的函数解析式;
(II )若要求“需更换的易损零件数不大于n ”的频率不小于0.5,
求n 的最小值;
(III )假设这100台机器在购机的同时每台都购买19个易损零件,
或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
【解析】
(I )当19≤x 时3800=y ;当19>x 时3800+500
195700=--y x x ()=500 所以y 与x 的函数解析式为3800,19
()5005700,19
≤⎧=∈⎨
->⎩x y x N x x
(Ⅱ)由柱状图知,需更换的零件数不大于18的频率为0.46,不大
于19的频率为0.7,故n 的最小值为19.
(Ⅲ)若每台机器在购机同时都购买19个易损零件,则这100
台机
频数
器中有70台在购买易损零件上的费用为3800,20台的费用为4300,10台的费用为4800,因此这100台机器在购买易损零件上所需费用的平均数为
1
(380070430020
480010)
4000
100
???.
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000,10台的费用为4500,因此这100台机器在购买易损零件上所需费用的平均数为
4050)104500904000(100
1
=⨯+⨯.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.。

相关文档
最新文档