2019高考数学理科二轮复习第一篇微型专题练习:微专题16 概率与统计的综合应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2019年4月
16 概率与统计的综合应用
1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是().
A.45
B.50
C.55
D.60
解+析▶由频率分布直方图知,低于60分的频率为
(0.010+0.005)×20=0.3,
∴该班学生人数n==50,故选B.
答案▶ B
2.有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5),2;[15.5,19.5),4;[19.5,2
3.5),9;[23.5,27.5),18;[2 7.5,31.5),11;[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5],3.
根据样本的频率分布估计,数据落在[27.5,43.5]内的概率
是.
解+析▶由条件可知,落在[27.5,43.5]内的数据有
11+12+7+3=33(个),故所求概率是=.
答案▶
3.已知某运动员每次投篮命中的概率都为40%,现采用随机模拟的方法估计该运动员三次投篮恰有两次命中的概率:先由计算机产生0到9之间取整数值的随机数,指定1,2,3,4表示命中,5,6,7,8,9,0表示不命中,再以每三个随机数为一组,代表三次投篮的结果.经随机模拟产生了如下20组随机数: 907966191925271932812458569683
431257393027556488730113537989
据此估计,该运动员三次投篮恰有两次命中的概率为.
解+析▶20组随机数中表示三次投篮恰好有两次命中的是191,271,932,812,393,其频率为=0.25,以此估计该运动员三次投篮恰有两次命中的概率为0.25.
答案▶0.25
4.如图所示的茎叶图是甲、乙两人在4次模拟测试中的成绩,其中一个数字被污损,则甲的平均成绩不超过乙的平均成绩的概率
为.
解+析▶依题意,设题中被污损的数字为x,若甲的平均成绩不超过乙的平均成绩,则有(8+9+2+1)-(5+3+x+5)≤0,解得x≥7,即此时x的可能取值是7,8,9,因此甲的平均成绩不超过乙的平均成绩的概率P==0.3.
答案▶0.3
【例1】已知某中学高三理科班学生的数学与物理的水平测试
若抽取学生n人,成绩分为A(优秀),B(良好),C(及格)三个等级,设x与y分别表示数学成绩与物理成绩,例如:表中物理成绩为A等级的共有14+40+10=64(人),数学成绩为B等级且物理成绩为C等级的共有8人.已知x与y均为A等级的概率是0.07.
(1)设在该样本中,数学成绩的优秀率是30%,求a,b的值;
(2)已知a≥7,b≥6,求数学成绩为A等级的人数比C等级的人数多的概率.
解+析▶(1)由题意知=0.07,解得n=200,
∴×100%=30%,解得a=18,
易知a+b=30,∴b=12.
(2)由14+a+28>10+b+34得a>b+2.又a+b=30且a≥7,b≥6,则(a,b)的所有可能结果为(7,23),(8,22),(9,21),…,(24,6),共18种,而a>b+2的可能结果为(17,13),(18,12),…,(24,6),共8种,则所求概率P==.
求解古典概型与抽样方法交汇问题的思路
(1)依据题目中抽样方法的信息,提炼需要的信息.
(2)进行统计与古典概型概率的正确计算.
某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,:
:
(1)求一续保人本年度的保费比基本保费高出60%的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保
费高出60%的概率;
(3)求续保人本年度的平均保费与基本保费的比值.
解+析▶(1)设A表示事件“一续保人本年度的保费比基本保费高出60%”,则事件A发生即为当且仅当一年内出险次数大于3,故
P(A)=0.1+0.05=0.15.
(2)设B表示事件“一续保人本年度的保费高于基本保费”,则事件B发生当且仅当一年内出险次数大于1,故
P(B)=0.2+0.2+0.1+0.05=0.55.
又P(AB)=P(A),故P(A|B)=()
()=()
()
==.
(3)
E(X)=0.85a×0.30+a×0.15+1.25a×0.20+1.5a×0.20+1.75a×0.10 +2a×0.05=1.23a.
【例2】PM2.5是衡量空气污染程度的一个指标,为了了解某市空气质量情况,从去年每天的PM2.5值的数据中随机抽取40天的数据,其频率分布直方图如图所示.
现将PM2.5
用频率估计概率.
(1)估计该市在下一年的360天中空气质量为一级的天数;
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值的数据,再从这8个数据中随机抽取5个,求一级、二级、三级、四级天气都有的概率;
(3)如果该市对环境进行治理,治理后经统计,每天PM2.5值X近似满足X~N(115,752),求治理后的PM2.5值的均值比治理前大约下降了多少.
解+析▶(1)由样本空气质量PM2.5的数据的频率分布直方图可知,
由上表可知,如果该市维持现状不变,那么该市下一年的某一天空气质量为一级的概率为0.25,
因此在360天中约有360×0.25=90(天).
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值数据,则这8个数据中一级、二级、三级、四级天气的数据分别有2个、3个、2个、1个.
从这8个数据中随机抽取5个,则这四种天气都有三种情况:一级天气的数据有2个,其余的均为1个;二级天气的数据有2个,其余的均为1个;三级天气的数据有2个,其余的均为1个.
情况有:++=24种.
而从8个数据中随机抽取5个,有=56种情况.
故所求概率为=.
(3)如果该市维持现状不变,那么该市的PM2.5值的均值约为
E(Y)=25×0.125+75×0.125+125×0.375+175×0.25+225×0.12 5=131.25.
如果该市对环境进行治理,那么该市的PM2.5值X的均值为
E(X)=115,
因此该市治理后的PM2.5值的均值比治理前大约下降了16.25.
有关古典概型与统计结合的题型是高考考查概率的一个重要题型,已成为高考考查的热点.概率与统计综合题,无论是直接描述还是利用概率分布表、频率分布直方图、茎叶图等给出信息,准确从题中提炼信息是解题的关键.
从某企业生产的某种产品中抽取100件,测量这些产品的质量指标值.由测量结果得到如图所示的频率分布直方图,质量指标值落在区间[55,65),[65,75),[75,85]内的频率之比为4∶2∶1.
(1)求这些产品质量指标值落在区间[75,85]内的频率;
(2)若将频率视为概率,从该企业生产的这种产品中随机抽取3件,记这3件产品中质量指标值位于区间[45,75)内的产品件数为X,求X的分布列.
解+析▶(1)设这些产品质量指标值落在区间[75,85]内的频率为x,则落在区间[55,65),[65,75)内的频率分别为4x,2x.
依题意得(0.004+0.012+0.019+0.030)×10+4x+2x+x=1,解得
x=0.05.
所以这些产品质量指标值落在区间[75,85]内的频率为0.05.
(2)由(1)得,这些产品质量指标值落在区间[45,75)内的频率为0.3+0.2+0.1=0.6,将频率视为概率得p=0.6.
从该企业生产的这种产品中随机抽取3件,相当于进行了3次独立重复试验,所以X服从二项分布B(n,p),其中n=3,p=0.6.
因为X的所有可能取值为0,1,2,3,
且P(X=0)=×0.60×0.43=0.064,
P(X=1)=×0.61×0.42=0.288,
P(X=2)=×0.62×0.41=0.432,
P(X=3)=×0.63×0.40=0.216,
所以X
【例3】某校计划面向高一年级1200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程的选课意向进行调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.
(1)分别计算抽取的样本中男生、女生选择社会科学类的频率,
并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数;
(2)根据抽取的180名学生的调查结果,完成2×2列联表,并判断能否在犯错误的概率不超过0.025的前提下认为“科类的选择与性
附:K2=(-)
,其中n=a+b+c+d.
(
解+析▶(1)由条件知,抽取的男生有105人,女生有
180-105=75(人),
所以男生选择社会科学类的频率为=,女生选择社会科学类的频率为=.
由题意知,男生总数为1200×=700,女生总数为
1200×=500,所以估计选择社会科学类的学生人数为
700×+500×=600.
则K2的观测值k=(-)≈5.1429>5.024, 所以在犯错误的概率不超过0.025的前提下能认为“科类的选择与性别有关”.
(1)本题常见的错误是对独立性检验思想理解不深刻,做出错误判定.(2)进行独立性检验时,提出的假设是两者无关.
近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入
(1)请将列联表补充完整.若用分层抽样的方法在患三高疾病的人群中抽取9人,其中女性抽取多少人?
(2)为了研究患三高疾病是否与性别有关,请计算出统计量K2的观测值k,并说明是否可以在犯错误的概率不超过0.005的前提下认为“患三高疾病与性别有关”.
临界值表:
参考公式:K2=(-)
,其中n=a+b+c+d.
()()()()
解+析▶(1)
在患三高疾病的人群中抽取9人,则抽取比例为=, 所以女性应该抽取12×=3(人).
(2)由2×2列联表,得K2的观测值
k=(-)=10>7.879,
所以可以在犯错误的概率不超过0.005的前提下认为“患三高
【例4】一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.
将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.
(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;
(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列、数学期望E(X)及方差D(X).
解+析▶(1)设A1表示事件“日销售量不低于100个”,A2表示事件“日销售量低于50个”,B表示事件“在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个”,因此P(A1)=(0.006+0.004+0.002)×50=0.6,
P(A2)=0.003×50=0.15,
P(B)=0.6×0.6×0.15×2=0.108.
(2)X可能取的值为0,1,2,3,相应的概率为
P(X=0)=×(1-0.6)3=0.064,
P(X=1)=×0.6×(1-0.6)2=0.288,
P(X=2)=×0.62×(1-0.6)=0.432,
P(X=3)=×0.63=0.216.
X
因为X~B(3,0.6),所以数学期望E(X)=3×0.6=1.8,
方差D(X)=3×0.6×(1-0.6)=0.72.
二项分布的期望与方差.
(1)如果X~B(n,p),那么用公式E(X)=np;D(X)=np(1-p)求解,可大大减少计算量.
(2)有些随机变量虽然不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aX+b)=aE(X)+b 以及E(X)=np求出E(aX+b),同样还可求出D(aX+b).
空气质量指数(AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级:0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;300以上为严重污染.
一环保人士记录去年某地六月中的10天的AQI的茎叶图如图所示.
(1)利用该样本估计该地六月空气质量为优良(AQI≤100)的天数;
(2)将频率视为概率,从六月中随机抽取3天,记3天中空气质量为优良的天数为ξ,求ξ的分布列.
解+析▶(1)从茎叶图中可以发现样本中空气质量为优的天数为2,空气质量为良的天数为4,
∴该样本中空气质量为优良的频率为=,
从而估计该地六月空气质量为优良的天数为30×=18.
(2)由(1)估计六月某天空气质量为优良的概率为,
ξ的所有可能取值为0,1,2,3,且ξ~B ,
. ∴P (ξ=0)=
=
,
P (ξ=1)=
× = , P (ξ=2)=
× = ,
P (ξ=3)=
=
,
故ξ
一、选择题
1.已知随机变量x ,y 的值如表所示,如果x 与y 线性相关且回归直线方程为 ^
=bx+
,那么实数b=( ).
A .-
B .
C .-
D .
解+析▶ 因为 =3,
=5,由回归直线过样本点的中心(3,5),得5=3b+
,所以b=
.
答案▶ B
2.把样本容量为20的数据分组,分组区间与频数如
下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2.则在区间[10,50)上的数据的频率是( ). A .0.05 B .0.25
C.0.5
D.0.7
解+析▶由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为=0.7,故选D.
答案▶ D
3.在一个容量为N的总体中抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则().
A.p1=p2<p3
B.p2=p3<p1
C.p1=p3<p2
D.p1=p2=p3
解+析▶由于在三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3,故选D.
答案▶ D
4.某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次构成公差为0.1的等差数列,又第一小组的频数是10,则n等于().
A.80
B.90
C.100
D.110
解+析▶设第1个小长方形的面积为S,
则4个小长方形的面积之和为4S+×0.1.
由题意知,4S+×0.1=1,故S=0.1.
又因为=0.1,所以n=100,故选C.
答案▶ C
二、填空题
5.从某地高中男生中随机抽取100名同学,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图).由图中数据可知体重的平均值为kg;若要从体重在[60,70),[70,80),[80,90]三组内的男生中,用分层
抽样的方法选取12人参加一项活动,再从这12个人中选两人当正副队长,则这两人体重不在同一组内的概率为.
解+析▶由频率分布直方图可知,体重在[40,50)内的男生人数为0.005×10×100=5,
同理,体重在[50,60),[60,70),[70,80),[80,90]内的人数分别为35,30,20,10,
所以体重的平均值为
=64.5.
利用分层抽样的方法选取12人,
则从体重在[60,70),[70,80),[80,90]三组内选取的人数分别为12×=6,12×=4,12×=2,则两人体重不在同一组内的概率为
=.
答案▶64.5
三、解答题
6.某校从参加高三模拟考试的学生中随机抽取60名分数不低于90分的学生,将其数学成绩(均为整数)分成
[90,100),[100,110),…,[140,150]六组后,得到如下部分频率分布直方图,观察图形的信息,回答下列问题:
(1)求分数在[120,130)内的频率;
(2)若在同一组数据中,将该组区间的中点值
如 区间[,)的中点值为作为这组数据的平均分,据此,估计这60名学生本次考试的平均分;
(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率.
解+析▶(1)分数在[120,130)内的频率为
1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3.
(2)估计平均分为
=95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0 .05=121.
(3)由题意,在[110,120)分数段的人数为60×0.15=9.
在[120,130)分数段的人数为60×0.3=18.
∵用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,
∴需在[110,120)分数段内抽取2人,并分别记为m,n,在[120,130)分数段内抽取4人,并分别记为a,b,c,d.
则从样本中任取2人的基本事件有
{m,n},{m,a},{m,b},{m,c},{m,d},{n,a},{n,b},{n,c},{n,d},{a,b} ,{a,c},{a,d},{b,c},{b,d},{c,d},共15个.
设“从样本中任取2人,至多有1人在分数段[120,130)内”为事件A,
则事件A包含的基本事件有
{m,n},{m,a},{m,b},{m,c},{m,d},{n,a},{n,b},{n,c},{n,d},共9个.
∴P(A)==.
7.在数学趣味知识培训活动中,甲、乙两名学生的6次培训成绩如茎叶图所示:
(1)从甲、乙两人中选择一人参加数学趣味知识竞赛,你会选哪位?请运用统计学的知识说明理由.
(2)从乙的6次成绩中随机选择2次成绩,求选到123分的概率.
解+析▶(1)

==112,

==112,

=×[(99-112)2+(107-112)2+(108-112)2+(115-112)2+(119-11 2)2+(124-112)2]=,

=×[(102-112)2+(105-112)2+(112-112)2+(113-112)2+(117-1 12)2+(123-112)2]=,

甲=

,

>

.
说明甲、乙的平均水平一样,但乙的方差小,乙发挥更稳定,故选择乙同学.
(2)从6个成绩中随机选择2个,共有15个基本事件,分别是{102,105},{102,112},{102,113},{102,117},{102,123},{105,112} ,{105,113},{105,117},{105,123},{112,113},{112,117},{112,123 },{113,117},{113,123},{117,123},
其中满足条件的基本事件有5个,故所求概率P==.
8.某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如
下:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),( a,),(,),(a,b),(a,),(,b),(a,b),其中a和分别表示甲组研
发成功和失败;b和分别表示乙组研发成功和失败.
(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平.
(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.
解+析▶(1)甲组研发新产品的成绩为
1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数

==;
方差

=×--
=.
乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其
平均数

==;
方差

=×--
=.
因为
甲>

,

<

,所以甲组的研发水平优于乙组.
(2)记“恰有一组研发成功”为事件E,在所抽得的15个结果中,恰有一组研发成功的结果有
(a,),(,b),(a,),(,b),(a,),(a,),(,b),共7个.因此事件E 发生的频率为.用频率估计概率,即得所求概率P(E)=.
9.某工厂有25周岁以上(含25周岁)的工人300名,25周岁以下的工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5
组:[50,60),[60,70),[70,80),[80,90),[90,100],分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.
(2)规定日平均生产件数不少于80的为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”.
附:K2=(-)
,n=a+b+c+d.
()()(
解+析▶(1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名.
所以样本中日平均生产件数不足60的工人中,25周岁以上(含25周岁)组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是
(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3 ,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),故所求的概率P=.
(2)由频率分布直方图可知,在抽取的100名工人中,25周岁以上(含25周岁)组中的生产能手有60×0.25=15(人),25周岁以下组中的
所以K2的观测值k=(-)≈1.79.
因为1.79<2.706,
所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.
10.某校高三期中考试后,数学教师对本次全部数学成绩按1∶20进行分层抽样,随机抽取了20名学生的成绩作为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,同时得到如下表所示的频率分布表:
(1)求表中
a ,
b 的值及成绩在[90,110)范围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在[90,150]范围内为及格);
(2)若从茎叶图中成绩在[100,130)范围内的样本中一次性抽取两个,求取出的两个样本数字之差的绝对值小于或等于10的概率.
解+析▶ (1)由茎叶图知成绩在[50,70)范围内的有2人,在[110,130)范围内的有3人,
∴a=0.1,b=3.
∵成绩在[90,110)范围内的频率为1-0.1-0.25-0.25=0.4, ∴成绩在[90,110)范围内的样本数为20×0.4=8. 估计这次考试全校高三学生数学成绩的及格率为 P=1-0.1-0.25=0.65. (2)所有可能的结果为
(100,102),(100,106),(100,106),(100,116),(100,118),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128),共21个,
取出的两个样本中数字之差的绝对值小于或等于10的结果为(100,102),(100,106),(100,106),(102,106),(102,106),(106,106),(106,116),(106,116),(116,118),(118,128),共10个.
∴所求概率为
.。

相关文档
最新文档