高考数学专题复习十一-11.4抽样与总体分布的估计-高考真题练习(附答案)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11.4抽样与总体分布的估计
考点一随机抽样
1.(2015湖南文,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()
A.3
B.4
C.5
D.6
答案B从35人中用系统抽样方法抽取7人,则可将这35人分成7组,每组5人,从每一组中抽取1人,而成绩在[139,151]上的有4组,所以抽取4人,故选B.
2.(2015北京文,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()
类别人数
老年教师900
中年教师1800
青年教师1600
合计4300
A.90
B.100
C.180
D.300
答案C本题考查分层抽样,根据样本中的青年教师有320人,且青年教师与老年教师人数的比为1600∶900=16∶9,可以得到样本中的老年教师的人数为916×320=180,故选C.
3.(2014重庆文,3,5分)某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()
A.100
B.150
C.200
D.250
答案A由分层抽样的特点可知703500=3500+1500,解之得n=100.
4.(2014湖南文,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()
A.p
1=p
2
<p
3
B.p
2
=p
3
<p
1
C.p
1
=p
3
<p
2
D.p
1
=p
2
=p
3
答案D在简单随机抽样、系统抽样和分层抽样中,每个个体被抽中的概率均为,所以p1=p2=p3,故选D.评析随机抽样的要求是每个个体被抽中的概率相等,与具体的方法无关.
5.(2014广东文,6,5分)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()
A.50
B.40
C.25
D.20
答案C由系统抽样的定义知,分段间隔为100040=25.故答案为C.
6.(2013课标Ⅰ理,3,5分)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()
A.简单随机抽样
B.按性别分层抽样
C.按学段分层抽样
D.系统抽样
答案C因为男女生视力情况差异不大,而各学段学生的视力情况有较大差异,所以应按学段分层抽样,故选C.
评析本题考查了分层抽样,准确理解分层抽样的意义是解题关键.
7.(2013江西理,4,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()
78166572080263140702436997280198
32049234493582003623486969387481
A.08
B.07
C.02
D.01
答案D由题意知依次选取的编号为08,02,14,07,01,…(第2个02需剔除),所以选出来的第5个个体的编号为01,选D.
8.(2013陕西理,4,5分)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按
1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()
A.11
B.12
C.13
D.14
答案B因为840∶42=20∶1,故编号在[481,720]内的人数为240÷20=12.
9.(2018课标Ⅲ文,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.
答案分层抽样
解析本题考查抽样方法.
因为不同年龄段客户对其服务的评价有较大差异,所以根据三种抽样方法的特点可知最合适的抽样方法是分层抽样.
10.(2015福建文,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.
答案25
解析男生人数为900-400=500.设应抽取男生x人,则由45900=500得x=25.即应抽取男生25人.
11.(2014天津理,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.
答案60
解析420×300=60(名).
12.(2012天津理,9,5分)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取所学校,中学中抽取所学校.
答案18;9
解析应从小学中抽取150
150+75+25×30=18(所).
应从中学中抽取75150+75+25×30=9(所).
评析本题考查分层抽样及数据处理能力.
13.(2012福建文,14,4分)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是.
答案12
解析男女运动员人数比例为5698−56=43,
分层抽样中男女人数比例不变,则女运动员人数为
28×37=12.故应抽取女运动员人数是12.
评析本题考查分层抽样方法.考查学生运算求解能力.
考点二用样本估计总体
1.(2020课标Ⅲ文,3,5分)设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为(
)
A.0.01
B.0.1
C.1
D.10
答案
C 由已知条件可知样本数据x 1,x 2,…,x n 的平均数=
1+2+…+
,方差12=1
[(x 1-)2+(x 2-)2+…+(x n -)2
]=0.01,则数据10x 1,10x 2,…,10x n 的平均数为
101+102+…+10
=10.所以这组数据的方差
22=1
[(10x 1-10)2+(10x 2-10)2+…+(10x n -10)2]=100
[(x 1-)2+(x 2-)2+…+(x n -)2]=10012
=100×0.01=1,故
选C.
2.(2015安徽理,6,5分)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为()
A.8
B.15
C.16
D.32
答案
C 设样本数据x 1,x 2,…,x 10的标准差为s,则s=8,可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s=16.
3.(2014陕西文,9,5分)某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为和s 2
,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为(
)
A.,s 2+100
2 B.+100,s 2+100
2
C.,s 2
D.+100,s
2
答案D 设增加工资后10位员工下月工资均值为',方差为s'2
,则
'=
110[(x 1+100)+(x 2+100)+…+(x 10+100)]=1
10(x 1+x 2+…+x 10)+100=+100;方差s'2
=1
10[(x 1+100-')2
+(x 2+100-')2
+…+(x 10+100-')2
]=1
10[(x 1-)2+(x 2-)2+…+(x 10-)2]=s 2
.故选D.4.(2017课标Ⅲ理,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1
月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.(
)
根据该折线图,下列结论错误的是()
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
答案A本题考查统计,数据分析.
观察2014年的折线图,发现从8月至9月,以及10月开始的三个月接待游客量都是减少的,故A选项是错误的.
5.(2017山东文,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()
A.3,5
B.5,5
C.3,7
D.5,7
答案A由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5.
由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,
故甲组数据的平均值也为66,从而有56+62+65+74+70+
5=66,解得x=3.故选A.
6.(2016山东理,3文3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[1
7.5,30],样本数据分组为
[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()
A.56
B.60
C.120
D.140
答案D由频率分布直方图知这200名学生每周的自习时间不少于22.5小时的频率为
1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.
7.(2016课标Ⅲ理,4,5分)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是()
A.各月的平均最低气温都在0℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20℃的月份有5个
答案D由雷达图易知A、C正确;七月的平均最高气温超过20℃,平均最低气温约为12℃,一月的平均最高气温约为6℃,平均最低气温约为2℃,所以七月的平均温差比一月的平均温差大,故B正确;由雷达图知平均最高气温超过20℃的月份有3个月.故选D.
8.(2015课标Ⅱ理,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
答案D由柱形图可知:A、B、C均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,∴D不正确.
9.(2022全国乙文,4,5分,应用性)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:
则下列结论中错误的是()
A.甲同学周课外体育运动时长的样本中位数为7.4
B.乙同学周课外体育运动时长的样本平均数大于8
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
答案C对于A,甲同学周课外体育运动时长的样本中位数为7.3+7.52=7.4,故结论A正确;
对于B,乙同学周课外体育运动时长大部分在8h以上,故样本平均数大于8,故结论B正确;
对于C,甲同学周课外体育运动时长大于8的频率为616=0.375,由频率估计概率可知,甲同学周课外体育运动时长大于8的概率为0.375<0.4,故结论C错误;
对于D,乙同学周课外体育运动时长大于8的频率为1316=0.8125,由频率估计概率可知,乙同学周课外体育运动时长大于8的概率为0.8125>0.6,故结论D正确.
故选C.
10.(2022全国甲,理2,文2,5分,应用性)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则()
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
答案B对于A项,将讲座前的10个数据从小到大排列依次为
60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,易知这10个数据的中位数是第5个与第6个数据的
平均数,为70%+75%2=72.5%>70%,故A错误;
对于B项,后=110×(90%+85%+80%+90%+85%+85%+95%+100%+85%+100%)=89.5%>85%,故B正确;对于C项,前110×(60%+60%+65%+65%+70%+75%+80%+85%+90%+95%)=74.5%,s前
%,
s后.5%,11.93%>6.5%,故C错误;
对于D项,讲座前问卷答题的正确率的极差为95%-60%=35%,讲座后问卷答题的正确率的极差为
100%-80%=20%,20%<35%,故D错误.故选B.
11.(2021全国甲理,2,5分)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是()
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
答案C解题指导:利用频率分布直方图估计频率,再将频率转化为比率.
解析由频率分布直方图可得,该地农户家庭年收入低于4.5万元和不低于10.5万元的频率分别为0.06和0.1,则农户比率分别为6%和10%,故A、B中结论正确;家庭年收入介于4.5万元和8.5万元之间的频率为0.1+0.14+0.2+0.2=0.64,故D中结论正确;
家庭年收入的平均值为
0.02×3+0.04×4+0.1×5+0.14×6+0.2×7+0.2×8+0.1×9+0.1×10+0.04×11+0.02×12+0.02×13+0.02×14=7.68万元,因为7.68>6.5,所以估计该地区农户家庭年收入的平均值超过6.5万元,故C中结论不正确.故选C.
12.(多选)(2021新高考Ⅰ,9,5分)有一组样本数据x1,x2,…,x n,由这组数据得到新样本数据y1,y2,…,y n,其中y i=x i+c(i=1,2,…,n),c为非零常数,则()
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
答案CD A项,设=1∑=n i1x i,则=1∑=n i1y=1∑=n i1(x i+c)=1∑=n i1x i+c,因为c≠0,所以=+c,所以≠,所以A选项错误.
B项,因为y i=x i+c(i=1,2,…,n),所以y1,y2,…,y n的中位数是x1,x2,…,x n的中位数加c,所以B选项错误. C项,设12=1∑=n i1(x i-)2,22=1∑=n i1(y i-)2,
所以22=1∑=n i1(x i+c--c)2=1∑=n i1(x i-)2,
所以12=22,
所以两组数据的方差相同,从而这两组数据的标准差相同,所以C选项正确.
D项,设x1<x2<…<x n,则第一组数据的极差为x n-x1,
设y1<y2<…<y n,则第二组数据的极差为y n-y1=(x n+c)-(x1+c)=x n-x1,
所以两组数据的极差相同,
所以D选项正确,故选CD.
13.(2011江苏,6,5分)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差
s2=.
答案165
解析
记星期一到星期五收到的信件数分别为x 1,x 2,x 3,x 4,x 5,则=
1+2+3+4+55=10+6+8+5+6
5
=7.∴s 2=1
5[(x 1-)2+(x 2-)2+(x 3-)2+(x 4-)2+(x 5-)2]=1
5[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2
]=16
5.
评析本题主要考查方差的公式,考查学生的运算求解能力.公式记忆准确,运算无误是解答本题的关键,属
中等难度题.
14.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为
.
8999
01
1
答案90
解析
本题考查茎叶图、平均数.
5位裁判打出的分数分别为89,89,90,91,91,
则这5位裁判打出的分数的平均数为1
5×(89+89+90+91+91)=90.方法总结要明确“茎”处数字是十位数字,“叶”处数字是个位数字,正确写出所有数据,再根据平均数
的概念进行计算.
15.(2015湖北文,14,5分)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=
;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为
.
答案(1)3(2)6000
解析
(1)由频率分布直方图可知:
0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a=3.
(2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10000=6000.
16.(2014江苏,文6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.
答案24
解析60×(0.015+0.025)×10=24(株).
17.(2019课标Ⅱ文,19,12分)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)
企业数22453147
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:74≈8.602.
解析本题考查了统计的基础知识、基本思想和方法,考查学生对频数分布表的理解与应用,考查样本的平均数,标准差等数字特征的计算方法,以及对现实社会中实际数据的分析处理能力.
(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=1100∑J15n i(y i-)2
=1100[2×(-0.40)2+24×(-0.20)2+53×02+14×0.202+7×0.402]=0.0296,
s=0.0296=0.02×74≈0.17.
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
方法总结利用频数分布表求平均数估计值的方法:各组区间中点值乘该组频数,并求和,再除以样本容量.利用频数分布表求标准差估计值的方法:用各组区间中点值代表该组,代入标准差公式即可.
18.(2018课标Ⅰ文,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265
使用了节水龙头50天的日用水量频数分布表
日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165
(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
解析(1)
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为
0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.
(3)该家庭未使用节水龙头50天日用水量的平均数为
1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.
该家庭使用了节水龙头后50天日用水量的平均数为
2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).
易错警示利用频率分布直方图求众数、中位数与平均数时,应注意区分这三者,在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.
19.(2016北京文,17,13分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
解析(1)由用水量的频率分布直方图知,
该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为
0.1,0.15,0.2,0.25,0.15.(3分)
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.(5分)
依题意,w至少定为3.(6分)
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]频率0.10.150.20.250.150.050.050.05
(10分)根据题意,该市居民该月的人均水费估计为:
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).(13分)
思路分析第(1)问,需要计算该市居民月用水量在各区间上的频率,根据样本的频率分布直方图即可获解.第(2)问,由月用水量的频率分布直方图和w=3可计算居民该月用水费用的数据的分组与频率分布表,由此可估计该市居民该月的人均水费.
评析本题考查了频率分布直方图及用样本估计总体,属中档题.
20.(2015课标Ⅱ理,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62738192958574645376
78869566977888827689
B地区:73836251914653736482
93486581745654766579
(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
A地区B地区
4
56789
(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分低于70分70分到89分
不低于90分满意度等级
不满意
满意
非常满意
记事件C:“A 地区用户的满意度等级高于B 地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C 的概率.解析
(1)两地区用户满意度评分的茎叶图如下:
A 地区
B 地区
4683
513646
426245568864373346992
86518321
75
52
9
13
通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.
(2)记C A1表示事件:“A 地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A 地区用户的满意度等级为非常满意”;C B1表示事件:“B 地区用户的满意度等级为不满意”;C B2表示事件:“B 地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2.P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)
=P(C B1)P(C A1)+P(C B2)P(C A2).
由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,8
20,故
P(C A1)=16
20,P(C A2)=4
20,P(C B1)=10
20,P(C B2)=8
20,P(C)=10
20×1620+8
20×4
20=0.48.
21.(2015课标Ⅱ文,18,12分)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.
B 地区用户满意度评分的频数分布表
满意度评分分组
[50,60)[60,70)[70,80)[80,90)[90,100]
频数
2
8
14
10
6
(1)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
(2)根据用户满意度评分,将用户的满意度分为三个等级:
满意度评分低于70分70分到89分
不低于90分满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大,说明理由.解析
(1)
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,
)的估计值为(0.005+0.02)×10=0.25.
P(C
B
所以A地区用户的满意度等级为不满意的概率大.
22.(2015广东文,17,12分)某城市100户居民的月平均用电量(单位:度),以
[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
解析(1)由已知得,20×(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)=1,解得x=0.0075.
(2)由题图可知,面积最大的矩形对应的月平均用电量区间为[220,240),所以月平均用电量的众数的估计值为230;
因为20×(0.002+0.0095+0.011)=0.45<0.5,
20×(0.002+0.0095+0.011+0.0125)=0.7>0.5,所以中位数在区间[220,240)内.
设中位数为m,则20×(0.002+0.0095+0.011)+0.0125×(m-220)=0.5,解得m=224.
所以月平均用电量的中位数为224.
(3)由题图知,月平均用电量为[220,240)的用户数为(240-220)×0.0125×100=25,同理可得,月平均用电量为[240,260),[260,280),[280,300]的用户数分别为15,10,5.
故用分层抽样的方式抽取11户居民,月平均用电量在[220,240)的用户中应抽取11×25
25+15+10+5=5(户).
23.(2014课标Ⅰ文,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)
频数62638228
(1)作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
解析(1)
(2)质量指标值的样本平均数为
=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为
0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.
评析本题考查绘制频率分布直方图,计算样本的数字特征,及用样本估计总体等知识,同时考查统计的思想方法.
24.(2014课标Ⅱ文,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
甲部门乙部门
4
97
97665332110 98877766555554443332100
6655200
6322203
4
5
6
7
8
9
10
59
0448
122456677789
011234688
00113449
123345
011456
000
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
解析(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.。