2017年北京市各区高三理科数学试题分类汇编----概率与统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2017年北京市各区高三理科数学分类汇编----概率与统计
(2017年东城一模)(8)甲抛掷均匀硬币2017次,乙抛掷均匀硬币2016次,下列四个随机事件的概率是0.5的是
①甲抛出正面次数比乙抛出正面次数多.
②甲抛出反面次数比乙抛出正面次数少. ③甲抛出反面次数比甲抛出正面次数多. ④乙抛出正面次数与乙抛出反面次数一样多. (A )①②
(B )①③
(C )②③
(D )②④
解答题部分:
(2017年朝阳期末)16.(本小题满分13分)
甲、乙两位同学参加数学文化知识竞赛培训.现分别从他们在培训期间参加的若干次测试成绩中随机抽取8次,记录如下:
甲:82 81 79 78 95 88 93 84 乙:92 95 80 75 83 80 90 85
(Ⅰ)用茎叶图表示这两组数据;
(Ⅱ)现要从中选派一人参加正式比赛,从所抽取的两组数据分析,你认为选派哪位同
学参加较为合适?并说明理由;
(Ⅲ)若对甲同学在今后的3次测试成绩进行预测,记这3次成绩中高于80分的次数
为ξ(将甲8次成绩中高于80分的频率视为概率),求ξ的分布列及数学期望E ξ.
【解析】
(Ⅰ)作出茎叶图如下:
…………………………………4分
(Ⅱ)派甲参赛比较合适.理由如下:
()1
x 70280490289124835858
=⨯+⨯+⨯++++++++=甲, ()1
x 70180490350035025858
=⨯+⨯+⨯++++++++=乙,
()()()()()22222
21s 788579858185828584858⎡=-+-+-+-+-+⎣
甲
()
()()2
22
88859385958535.5⎤-+-+-=⎦
,
()(
)()()(
)2
2
2
2
2
21s 7585808580
858385
8
5858⎡=-+-+
-+-+-
+⎣
乙 ()
()()2
22
90859285958541.⎤-+-+-=⎦
甲乙
98
8421
53
5
0035025
789
因为 x =甲x 乙,22s s <乙甲,
所以,甲的成绩较稳定,派甲参赛比较合适. …………………………8分
注:本小题的结论及理由均不唯一,如果考生能从统计学的角度分析,给出其他合理回答,同样给分.如 派乙参赛比较合适.理由如下:
从统计的角度看,甲获得85分以上(含85分)的频率为13
8f =,
乙获得85分以上(含85分)的频率为24182
f ==. 因为21f f >,所以派乙参赛比较合适.
(Ⅲ)记“甲同学在一次数学竞赛中成绩高于80分”为事件A , ()63
A 84
P =
=. ……………………………………………………… 9分
随机变量ξ的可能取值为0,1,2,3,且3
(3,)4ξB ∼.
∴()33
31C 44k
k
k P k ξ-⎛⎫⎛⎫
== ⎪ ⎪
⎝⎭⎝⎭
,k 0,1,2,3=.
所以变量ξ
11分
19272790123646464644
Eξ=⨯
+⨯+⨯+⨯=. (或39
3.44
nP Eξ==⨯
=) ………………………………………………13分
(2017年海淀期末)16. (本小题满分13分)
诚信是立身之本,道德之基.某校学生会创设了“诚信水站”,既便于学生用水,又推进诚信教育,并用“ ”. 为了便于数据分析,以四周为一周期,下表为该水站连续十二周(共三个
周期)的诚信度数据统计:
(Ⅰ)计算表中十二周“水站诚信度”的平均数x ;
(Ⅱ)分别从上表每个周期的4 个数据中随机抽取1 个数据,设随机变量X 表示取出的3个数据中“水站诚信度”
周实际回收水费 周投入成本
超过91% 的数据的个数,求随机变量X的分布列和期望;
(Ⅲ)已知学生会分别在第一个周期的第四周末和第二个周期的第四周末各举行了一次“以诚信为本”的主题教育活动. 根据已有数据,说明两次主题教育活动的宣传效果,并根据已有数据陈述理由.
解:(Ⅰ)十二周“水站诚信度”的平均数为x=95+98+92+88+94+94+83+80+85+92+95+96
=91%
12100
⨯
(Ⅱ)随机变量X的可能取值为0,1,2,3
三个周期“水站诚信度”超过91%分别有3次,2次,3次
1212
(0)
44464
P X==⨯⨯=
32112112314
(1)
44444444464
P X==⨯⨯+⨯⨯+⨯⨯=
32132132330
(2)
44444444464
P X==⨯⨯+⨯⨯+⨯⨯=
32318
(3)
44464
P X==⨯⨯=
随机变量X的分布列为
X0 1 2 3
P 1
32
7
32
15
32
9
32
17159
01232
32323232
EX=⨯+⨯+⨯+⨯=.
(Ⅲ)本题为开放问题,答案不唯一,在此给出评价标准,并给出可能出现的答案情况,阅卷时按照标准酌情给分.
给出明确结论,1分,结合已有数据,能够运用以下三个标准中的任何一个陈述得出该结论的理由,2分.
标准1:会用主题活动前后的百分比变化进行阐述
标准2:会用三个周期的诚信度平均数变化进行阐述
标准3:会用主题活动前后诚信度变化趋势进行阐述
可能出现的作答情况举例,及对应评分标准如下:
情况一:
结论:两次主题活动效果均好.(1分)
理由:活动举办后,“水站诚信度”由88%→94%和80%→85%看出,后继一周都有提升.(2分)
情况二:
结论:两次主题活动效果都不好.(1分)
理由:三个周期的“水站诚信度”平均数分别为93.25%,87.75%,92%(平均数的计算近似即可),活动进行后,后继计算周期的“水站诚信度”平均数和第一周期比较均有下降.(2分)情况三:
结论:第一次主题活动效果好于第二次主题活动.(1分)
理由:第一次主题活动举办的后继一周“水站诚信度”提升百分点(94%-88%=6%)高于第二次主题活动举办的后继一周“水站诚信度”提升百分点(85%-80%=5%).(2分)
情况四:
结论:第二次主题活动效果好于第一次主题活动.(1分)
理由:第一次活动后“水站诚信度”虽有上升,但两周后又有下滑,第二次活动后,“水站诚信度”数据连续四周呈上升趋势. (2分)(答出变化)
情况五:
结论:两次主题活动累加效果好.(1分)
理由:两次主题活动“水站诚信度”均有提高,且第二次主题活动后数据提升状态持续周期好.(2分) 情况六:
以“‘两次主题活动无法比较’作答,只有给出如下理由才给3分:“12个数据的标准差较大,尽管平均数差别不大,但比较仍无意义”.
给出其他理由,则结论和理由均不得分(0分).
说明:
①情况一和情况二用极差或者方差作为得出结论的理由,只给结论分1分,不给理由分2分. ②以下情况不得分. 情况七:
结论及理由“只涉及一次主题活动,理由中无法辩析是否为两次活动后数据比较之结果”的. 例:
结论:第二次主题活动效果好.
理由:第二次主题活动后诚信度有提高.
③其他答案情况,比照以上情况酌情给分,赋分原则是:遵循三个标准,能使用表中数据解释所得结论.
(2017年西城期末)17.(本小题满分13分)
手机完全充满电量,在开机不使用的状态下,电池靠自身消耗一直到出现低电量警告之间所能维持的时间称为手机的待机时间.
为了解A ,B 两个不同型号手机的待机时间,现从某卖场库存手机中随机抽取A ,B 两个型号的手机各7台,在相同条件下进行测试,统计结果如下:
其中,a ,b 是正整数,且a b <.
(Ⅰ)该卖场有56台A 型手机,试估计其中待机时间不少于123小时的台数;
(Ⅱ)从A 型号被测试的7台手机中随机抽取4台,记待机时间大于123小时的台数为X ,求X 的分布列; (Ⅲ)设A ,B 两个型号被测试手机待机时间的平均值相等,当B 型号被测试手机待机时间的方差最小时,写
出a ,b 的值(结论不要求证明).
解:(Ⅰ)被检测的7台手机中有5台的待机时间不少于123小时,因此,估计56台A 型手机中有5
56407
⨯
=台手机的待机时间不少于123小时.[3分] (Ⅱ)X 可能的取值为0,1,2,3.[4分]
4711(0)35C P X ===;13
34
47
C C 12(1)35C P X ===;
223447C C 18(2)35C P X ===;34
4
7
C 4(3)35C P X ===.[8分] 所以,X 的分布列为:
[10分]
(Ⅲ)若A ,B 两个型号被测试手机的待机时间的平均值相等,当B 型号被测试手机的待机时间的方差最小时,
124a =,125b =.[13分]
(2017年丰台期末)17.(本小题共14分)
数独游戏越来越受人们喜爱,今年某地区科技馆组织数独比赛,该区甲、乙、丙、丁四所学校的学生积极参赛,参赛学生的人数如下表所示:
为了解参赛学生的数独水平,该科技馆采用分层抽样的方法从这四所中学的参赛学生中抽取30名参加问卷调查.
(Ⅰ)问甲、乙、丙、丁四所中学各抽取多少名学生?
(Ⅱ)从参加问卷调查的30名学生中随机抽取2名,求这2名学生来自同一所中学的概率;
(Ⅲ)在参加问卷调查的30名学生中,从来自甲、丙两所中学的学生中随机抽取2名,用X 表示抽得甲中学的学生人数,求X 的分布列.
解:(Ⅰ)由题意知,四所中学报名参加数独比赛的学生总人数为100名, 抽取的样本容量与总体个数的比值为
303
10010
=, 所以甲、乙、丙、丁四所中学各抽取的学生人数分别为9,12,6,3. ………………3分
(Ⅱ)设“从30名学生中随机抽取两名学生,这两名学生来自同一所中学”为事件A ,
从30名学生中随机抽取两名学生的取法共有2
30435C =种, ………………5分 来自同一所中学的取法共有222291263120C C C C +++=. ………………7分
所以1208
()43529
P A =
=. 答:从30名学生中随机抽取两名学生来自同一所中学的概率为
8
29
. ………………8分 (Ⅲ)由(Ⅰ)知,30名学生中,来自甲、丙两所中学的学生人数分别为9,6.
依题意得,X 的可能取值为0,1,2, ………………9分
2
62151
(0)7
C P X C === ,11962
1518(1)35C C P X C === ,2921512(2)35C P X C ===. ……………12分
所以X
……………….14分
(2017年石景山期末)16.(本小题共13分)
2016年微信用户数量统计显示,微信注册用户数量已经突破9.27亿.微信用户平均年龄只有26岁,97.7%的
用户在50岁以下,86.2%的用户在18-36岁之间.为调查大学生这个微信用户群体中每人拥有微信群的数量,现从北京市大学生中随机抽取100位同学进行了抽样调查,结果如下:
(Ⅰ)求a ,b ,c 的值;
(Ⅱ)若从这100位同学中随机抽取2人,求这2人中恰有1人微信群个数超过15个的概率;
(Ⅲ)以这100个人的样本数据估计北京市的总体数据且以频率估计概率,若从全市..大学生...中随机抽取3人,记X 表示抽到的是微信群个数超过15个的人数,求X 的分布列和数学期望EX . 解:(Ⅰ)030305100a ++++=解得35a =,
5110020b =
=,357
10020
c ==.…………………3分 (Ⅱ)记“2人中恰有1人微信群个数超过15个”为事件A ,
则11
40602
10016
()33
C C P A C ==. 所以,2人中恰有1人微信群个数超过15个的概率为16
33
. ……………7分 (Ⅲ)依题意可知,微信群个数超过15个的概率为25
P =
. X 的所有可能取值0,1,2,3. ……………8分
则()003
3270()(1)2255
125P X C ==-=
,()11
23541()(1)2255125
P X C ==-=, ()2213362()(1)2255125P X C ==-=,()33
3083()(22551)125
P X C ==-=.
1
01
98531
956775
B 班
A 班其分布列如下:
所以,01231251251251255
EX =⨯+⨯+⨯+⨯=.……………13分
(2017年昌平期末)(16)(本小题满分13分)
A 、
B 两个班共有65名学生,为调查他们的引体向上锻炼情况,通过分层抽样获得了部分学生引体向上的测试数据(单位:个),用茎叶图记录如下:
(I ) 试估计B 班的学生人数;
(II ) 从A 班和B 班抽出的学生中,各随机选取一人,A 班选出的人记为甲,B 班选出的人记为乙,假设所有学生的测试相对独立,比较甲、乙两人的测试数据得到随机变量ξ.规定:
当甲的测试数据比乙的测试数据低时,记1ξ=-, 当甲的测试数据与乙的测试数据相等时,记0ξ=, 当甲的测试数据比乙的测试数据高时,记1ξ=. 求随机变量ξ的分布列及期望.
(III )再.从A 、B 两个班中各随机抽取一名学生,他们引体向上的测试数据分别是10,8(单位:个),这2个新数据与表格中的数据构成的新样本的平均数记错误!未找到引用源。
1μ,表格中数据的平均数记为0μ错误!未找到引用源。
,试判断0μ和1μ错误!未找到引用源。
的大小(结论不要求证明).
解:(Ⅰ)由题意可知,抽出的13名学生中,来自B 班的学生有7名.根据分层抽样方法,B 班的学生人数估计为
7
653513
⨯
=(人). ……………3分 (Ⅱ)122(1)677P ξ=-=
=⨯;42
(0)6721
P ξ===⨯; 13
(1)1(1)(0)21
P P P ξξξ==-=--==
则ξ的概率分布为:
101721213E ξ=-⨯+⨯+⨯=
. ……………11分
(Ⅲ)10μμ>. ……………13分
(2017年通州期末)16.(本小题满分13分)
某小组共10人,利用假期参加义工活动.已知参加义工活动的次数与相对应的人数的对应关系如下表:
现从这10人中随机选出2人作为该组代表在活动总结会上发言.
(Ⅰ)设A 为事件“选出的2人参加义工活动次数之和为6”,求事件A 发生的概率; (Ⅱ)设X 为选出的2人参加义工活动次数之和,求随机变量X 的分布列和数学期望.
解: (Ⅰ)从这10人中随机选出2人的基本事件个数为:2
1045C =个,
设选出的2人参加义工活动次数之和为事件A ,
设选出的2人中1人参加2次另一人参加4次为事件M , 设选出的2人均参加3次为事件N .
事件M 所含基本事件的个数为11
414C C ⋅=个,
事件N 所含基本事件的个数为246C =个,
根据古典概型可知,4()=45P M ,6()=45P N
因为M 和N 互斥事件,且A =M +N 所以102
()=()()()459
P A P M N P M P N +=+=
= ……………….6分
另:直接计算事件A 的基本事件个数,利用古典概型计算也可。
(Ⅱ)随机变量X 的可能取值为3,4,5,6,7
11412
104
(3)45
C C P X C ⋅===, 112
4142
1010(4)45
C C C P X C ⋅+===
1111
44112
1017(5)45
C C C C P X C ⋅+⋅===,
112
4142
1010(6)45
C C C P X C ⋅+===,
11412
104(7)45
C C P X C ⋅===,
所以X 的分布列如下:
E X =4345⨯
+249⨯+17545
⨯+2
69⨯+745⨯=5.……………….13分
注:第二问计算出一个概率给1分
(2017年房山期末)16.近几年网购兴起,快递行业迅速发展,某城市A ,B 两个区域共有150名快递员,
:
(Ⅰ)估计A 区域的快递员人数;
(Ⅱ)在表格中,从A ,B 区域各随机抽取一人分别记为甲、乙.假设所有快递员送件数量相互独立,求甲的送件数量比乙的送件数量多的概率;
(Ⅲ)表格中A 区域数据的标准差记为S A ,B 区域数据的标准差记为S B ,试判断S A 和S B 的大小(结论不要求证明).
解:(Ⅰ)∵某城市A ,B 两个区域共有150名快递员,
为调查他们的送件数量,通过分层抽样在A 区域抽7人,B 区域抽8人, ∴估计A 区域的快递员人数为:150×
=70人.
(Ⅱ)在表格中,A 区域有7人,B 区域有8人,
从A ,B 区域各随机抽取一人分别记为甲、乙, 基本事件总数n=7×8=56,
甲的送件数量a 比乙的送件数量b 多包含的基本事件(a ,b )个数为: a=86时,有1种情况,a=91时,有1种情况,a=95时,有3种情况, a=100时,有7种情况,a=103时,有7种情况,a=112时,有8种情况, a=123时,有8种情况,共有:1+1+3+7+7+8+8=35, ∴甲的送件数量比乙的送件数量多的概率
p=
.
(Ⅲ)由统计表知A 区域数据相对分散,B 区域数据相对集中, A 区域数据的标准差记为S A ,B 区域数据的标准差记为S B , ∴S A >S B .
(2017年朝阳一模)(16)(本小题满分13分)
某单位共有员工45人,其中男员工27人,女员工18人.上级部门为了对该单位员工的工作业绩进行评估,采用按性别分层抽样的方法抽取5名员工进行考核.
(Ⅰ)求抽取的5人中男、女员工的人数分别是多少;
(Ⅱ)考核前,评估小组从抽取的5名员工中,随机选出3人进行访谈.设选出的3人中男员工人数为X ,
求随机变量X 的分布列和数学期望;
(Ⅲ)考核分笔试和答辩两项.5名员工的笔试成绩分别为78,85,89,92,96;结合答辩情况,他们的考
核成绩分别为95,88,102,106,99.这5名员工笔试成绩与考核成绩的方差分别记为21s ,2
2s ,试比较21s 与22s 的大小.(只需写出结论)
解:(Ⅰ)抽取的5人中男员工的人数为
5
27345
⨯=, 女员工的人数为
5
18245
⨯=.…………………………………4分
(Ⅱ)由(Ⅰ)可知,抽取的5名员工中,有男员工3人,女员工2人. 所以,随机变量X 的所有可能取值为1, 2, 3.
根据题意,12323
53
(1)10
C C P X C ⋅===, 21
323
56
(2)10
C C P X C ⋅===,
30323
51
(3)10
C C P X C ⋅===. 随机变量X 的分布列是:
数学期望361189123101010105
EX =⨯
+⨯+⨯==. ………………………………10分 (Ⅲ)22
12
s s =. ……………………………………………………………13分
(2017年东城一模)(16)(本小题共13分)
近年来共享单车在我国主要城市发展迅速.目前市场上有多种类型的共享单车,有关部门对其中三种共享单车方式(M 方式、Y 方式、F 方式)进行统计(统计对象年龄在1555 岁),相关数据如表1,表2所示.
三种共享单车方式人群年龄比例(表1) 不同性别选择共享单车种类情况统计(表2)
(Ⅰ)根据表1估算出使用Y 共享单车方式人群的平均年龄;
(Ⅱ)若从统计对象中随机选取男女各一人,试估计男
性使用共享单车种
类数大于女性使用共享单车种类数的概率; (Ⅲ)现有一个年龄在2535 岁之间的共享单车用
户,那么他使用Y 方式出行的概率最大,使用F 方式出行的概率最小,试问此结论是否
正确?(只需写出结论)
(2017年海淀一模)16.(本小题满分13分)
据报道,巴基斯坦由中方投资运营的瓜达尔港目前已通航.这是一个可以停靠8-10万吨邮轮的深水港.通过这一
港口,中国船只能够更快到达中东和波斯湾地区.这相当于给中国平添了一条大动脉!在打造中巴经济走廊协议(简称协议)中,能源投资约340亿美元,公路投资约59亿美元,铁路投资约38亿美元,高架铁路投资约16亿美元,瓜达尔港投资约6.6亿美元,光纤通讯投资约0.4亿美元.
有消息称,瓜达尔港的月货物吞吐量将是目前天津、上海两港口月货物吞吐量之和.下表记录了2015年天津、
(Ⅱ)从上表中12个月任选一个月,求该月天津、上海两港口月吞吐量之和超过55百万吨的概率;
(Ⅲ)将(Ⅱ)中的计算结果视为瓜达尔港每个月货物吞吐量超过55百万吨的概率,设X 为瓜达尔港未来12个
月的月货物吞吐量超过55百万吨的个数,写出X 的数学期望(不需要计算过程). 解:
(Ⅰ)本次协议的投资重点为能源,
因为能源投资340亿,占总投资460亿的50%以上,所占比重大,
(Ⅱ)设事件A :从12个月中任选一个月,该月超过55百万吨. -----------------------------------1分
根据上面提供的数据信息,可以得到天津、上海两港口的月吞吐量之和分别是: 56,49,59,54,54,57,59,58,58,56,55,56, 其中超过55百万吨的月份有8个,
所以,82()123
P A =
=; (Ⅲ)X 的数学期望8EX =.
(2017年西城一模)17.(本小题满分13分)
在测试中,客观题难度的计算公式为i
i R P N
=,其中i P 为第i 题的难度,i R 为答对该题的人数,N 为参加测试的总人数.
现对某校高三年级240名学生进行一次测试,共5道客观题.测试前根据对学生的了解,预估了每道题的难度,如下表所示:
测试后,随机抽取了20名学生的答题数据进行统计,结果如下:
(Ⅰ)根据题中数据,估计这240名学生中第5题的实测答对人数;
(Ⅱ)从抽样的20名学生中随机抽取2名学生,记这2名学生中第5题答对的人数为X ,求X 的分布列和数学期望; (Ⅲ)试题的预估难度和实测难度之间会有偏差.设i P '为第i 题的实测难度,请用i P 和i P '设计一个统计量,并制
定一个标准来判断本次测试对难度的预估是否合理.
解:(Ⅰ)因为20人中答对第5题的人数为4人,因此第5题的实测难度为
4
0.220
=. [ 2分] 所以,估计240人中有2400.248⨯=人实测答对第5题. [ 3分] (Ⅱ)X 的可能取值是0,1,2. [ 4分]
216220C 12(0)19C P X ===; 11164
2
20C C 32(1)95C P X ===; 24220C 3(2)95
C P X ===. [ 7分] X 的分布列为:
[ 8分] 1232338
01219959595
EX =⨯
+⨯+⨯=
. [10分] (Ⅲ)将抽样的20名学生中第i 题的实测难度,作为240名学生第i 题的实测难度.
定义统计量222
11221[()()()]n n S P P P P P P n
'''=-+-++- ,其中i P 为第i 题的预估难度.并规定:若0.05S <,则称本次测试的难度预估合理,否则为不合理. [11分]
222221
[(0.80.9)(0.80.8)(0.70.7)(0.70.6)(0.20.4)]5
S =-+-+-+-+-
0.012=. [12分]
因为 0.0120.05S =<,
所以,该次测试的难度预估是合理的. [13分]
注:本题答案不唯一,学生可构造其它统计量和临界值来进行判断.如“预估难度与实测 难度差的平方和”,“预估难度与实测难度差的绝对值的和”,“预估难度与实测难度差的绝 对值的平均值”等,学生只要言之合理即可.
(2017年丰台一模)17.(本小题共13分)
某公司购买了A ,B ,C 三种不同品牌的电动智能送风口罩.为了解三种品牌口罩的电池性能,现采用分层抽样的方法,从三种品牌的口罩中抽出25台,测试它们一次完全充电后的连续待机时长,统计结果如下(单位:小时):
(Ⅰ)已知该公司购买的C 品牌电动智能送风口罩比B 品牌多200台,求该公司购买的B 品牌电动智能送风口罩的数量;
(Ⅱ)从A 品牌和B 品牌抽出的电动智能送风口罩中,各随机选取一台,求A 品牌待机时长高于B 品牌的概率;
(Ⅲ)再从A ,B ,C 三种不同品牌的电动智能送风口罩中各随机抽取一台,它们的待机时长分别是a ,b ,
c (单位:小时).这3个新数据与表格中的数据构成的新样本的平均数记为1μ,表格中数据的平均数记为0μ.
若01μμ≤,写出a +b+c 的最小值(结论不要求证明).
17.(本小题共13分)
解:(Ⅰ)设该公司购买的B 品牌电动智能送风口罩的数量为x 台,
则购买的C 品牌电动智能送风口罩为5
4
x 台,
由题意得5
2004
x x -=,所以800x =.
答:该公司购买的B 品牌电动智能送风口罩的数量为800台 ..………………5分 (Ⅱ)设A 品牌待机时长高于B 品牌的概率为P ,
则71
788
=
=⨯P . 答:在A 品牌和B 品牌抽出的电动智能送风口罩中各任取一台,
A 品牌待机时长高于
B 品牌的概率为1
8. ..………………10分
(Ⅲ)18 .………………13分
(2017年石景山一模)16.(本小题共13分)
某超市从现有甲、乙两种酸奶的日销售量(单位:箱)的1200个数据(数据均在区间(0,50]内)中,按照5%的比例进行分层抽样,统计结果按(0,10],(10,20],(20,30],(30,40],(40,50]分组,整理如下图:
(Ⅰ)写出频率分布直方图(图乙)中a 的值;记所抽取样本中甲种酸奶与乙种酸奶日销售量的方差分别为21s ,2
2s ,
试比较21s 与2
2s 的大小(只需写出结论);
/箱
日销售量/箱 图乙
(Ⅱ)从甲种酸奶日销售量在区间(0,20]的数据样本中抽取3个,记在(0,10]内的数据个数为X ,求X 的分布
列;
(Ⅲ)估计1200个日销售量数据中,数据在区间(0,10]中的个数.
解:(Ⅰ)由图(乙)知,10(0.020.030.0250.015)1a ++++=解得0.01a =,
22
12
s s >. ………………… 3分 (Ⅱ)X 的所有可能取值1,2,3.
则()124236115C C P X C ===,()214236325C C P X C ===,()30
423
61
35
C C P X C ===, 其分布列如下:
…………………8分 (Ⅲ)由图(甲)知,甲种酸奶的数据共抽取2345620++++=个,
其中有4个数据在区间(0,10]内.
又因为分层抽样共抽取了12005%60⨯=个数据, 乙种酸奶的数据共抽取602040-=个,
由(Ⅰ)知,乙种酸奶的日销售量数据在区间(0,10]内的频率为0.1, 故乙种酸奶的日销售量数据在区间(0,10]内有400.14⨯=个. 故抽取的60个数据,共有448+=个数据在区间(0,10]内. 所以,在1200个数据中,在区间(0,10]内的数据有160个.
……………13分
(2017年平谷一模)16. (本小题满分13分)
为了解学生寒假期间学习情况,学校对某班男、女学生学习时间进行调查,学习时间按整小时统计,调查结果绘成折线图如下:
男生统计图 女生统计图
(Ⅰ)已知该校有400名学生,试估计全校学生中,每天学习不足4小时的人数;
(Ⅱ)若从学习时间不少于4小时的学生中选取4人,设选到的男生人数为X ,求随机变量X 的分布列; (Ⅲ)试比较男生学习时间的方差2
1S 与女生学习时间方差2
2S 的大小。
(只需写出结论) 解:(Ⅰ)每天学习不足4小时的人数为:12
400=24020
⨯
人.……………4分 (Ⅱ)学习时间不少于4本的学生共8人,其中男学生人数为4人,故X 的取值为
0,1,2,3,4.
由题意可得44481
(0)70C P X C ===; 134448168(1)7035C C P X C ====;
22
44483618(2)7035C C P X C ====; 314448168
(3)7035C C P X C ===
=;
4
448(4)C P X C ===所以随机变量X 的分布列为
随机变量X 的均值1
0170EX =⨯+10分
(Ⅲ)2
1s >22s .…………………………………………………………………………13分
(2017年朝阳二模)16.(本小题满分13分)
从某市的中学生中随机调查了部分男生,获得了他们的身高数据,整理得到如下频率分布直方图. (Ⅰ)求a 的值;
(Ⅱ)假设同组中的每个数据用该组区间的中点值代替,
估计该市中学生中的全体男生的平均身高;
(Ⅲ)从该市的中学生中随机抽取一名男生,根据直方图中的信息,估计其身高在180 cm 以上的概率.若从全市
中学的男生(人数众多)中随机抽取3人,用X 表示身高在180 cm 以上的男生人数,求随机变量X 的分布列和数学期望EX .
解:(Ⅰ)根据题意得:(0.00520.02020.040)101a ⨯++⨯+⨯=.
解得 0.010a =. …………3分
(Ⅱ)设样本中男生身高的平均值为x ,则
1450.051550.11650.21750.41850.21950.05x =⨯+⨯+⨯+⨯+⨯+⨯
(145195)0.051550.1(165185)0.21750.4=+⨯+⨯++⨯+⨯
1715.57070172.5=+++=.
所以估计该市中学全体男生的平均身高为172.5 cm . …………7分
(Ⅲ)从全市中学的男生中任意抽取一人,其身高在180 cm 以上的概率约为
14
. 由已知得,随机变量X 的可能取值为0,1,2,3.
所以003
31327(0)()()44
64
P X C ==⋅=
; 11
231327(1)()()4464P X C ==⋅=;
2213139
(2)()()4464
P X C ==⋅=;
33
03131(3)()()4464
P X C ==⋅=.
随机变量X 的分布列为
因为X ~1(3)4B ,,所以344
EX =⨯
=.…………………………………13分
(2017年东城二模)(16)(本小题共13分)
小明计划在8月11日至8月20日期间游览某主题公园.根据旅游局统计数据,该主题公园在此期间“游览舒适度”(即在园人数与景区主管部门核定的最大瞬时容量之比,40%以下为舒适,40%—60%为一般,60%以上为拥挤)
情况如图所示.小明随机选择8月11日至8月19日中的某一天到达该主题公园,并游览2天.
(Ⅰ)求小明连续两天都遇上拥挤的概率;
(Ⅱ)设X 是小明游览期间遇上舒适的天数,求X 的分布列和数学期望; (Ⅲ)由图判断从哪天开始连续三天游览舒适度的方差最大?(结论不要求证明) 解:设i A 表示事件“小明8月11日起第i 日连续两天游览主题公园”(1,2,,9i = ). 根据题意,1
()9
i P A =
,且()i j A A i j =乒 . …………1分
(Ⅰ)设B 为事件“小明连续两天都遇上拥挤”, 则47B A A = . …………2分
所以47472
()()()()9
P B P A A P A P A ==+=
. …………5分 (Ⅱ)由题意,可知X 的所有可能取值为0,1,2, …………6分
4784781
(0)()()()()3
P X P A A A P A P A P A ===++= ,…………7分
356935694
(1)()()()()()9
P X P A A A A P A P A P A P A ===+++= ,
…………8分
12122
(2)()()()9
P X P A A P A P A ===+=
. …………9分 所以X 的分布列为
故X 的期望1428
0123999
EX =?
??.…………………11分 (Ⅲ)从8月16日开始连续三天游览舒适度的方差最大.…………13分
(2017年海淀二模)16.(本小题满分13分)
为了响应教育部颁布的《关于推进中小学生研学旅行的意见》,某校计划开设八门研学旅行课程,并对全校学生的选择意向进行调查(调查要求全员参与,每个学生必须从八门课程中选出唯一一门课程).本次调查结果整理成条形图如下.
上图中,已知课程,,,,A B C D E 为人文类课程,课程,,F G H 为自然科学类课程.为进一步研究学生选课意向,结合上面图表,采取分层抽样方法从全校抽取1%的学生作为研究样本组(以下简称“组M ”). (Ⅰ)在“组M ”中,选择人文类课程和自然科学类课程的人数各有多少?
(Ⅱ)为参加某地举办的自然科学营活动,从“组M ”所有选择自然科学类课程的同学中随机抽取4名同学前往,其
中选择课程F 或课程H 的同学参加本次活动,费用为每人1500元,选择课程G 的同学参加,费用为每人2000元.
(ⅰ)设随机变量X 表示选出的4名同学中选择课程G 的人数,求随机变量X 的分布列; (ⅱ)设随机变量Y 表示选出的4名同学参加科学营的费用总和,求随机变量Y 的期望. 解:
(Ⅰ)选择人文类课程的人数为(100+200+400+200+300)⨯1%=12(人);
选择自然科学类课程的人数为(300+200+300)⨯1%=8(人). (Ⅱ) (ⅰ) 依题意,随机变量X 可取0,1,2.
4062483(0)14C C p X C ===;3162484(1)7
C C p X C ===;
22
62483
(2).14C C p X C === 故随机变量X 的分布列为
(ⅱ)法1:依题意,随机变量Y =2000X +1500(4)X -=6000+500X , 所以随机变量Y 的数学期望为
E (Y )=6000+500E (X )
=6000+500(34301214714
⨯
+⨯+⨯) =6500.
(ⅱ)法2:依题意,随机变量Y 可取6000,6500,7000. 所以随机变量Y 的分布列为
所以随机变量Y 的数学期望为 E (Y )=34360006500700014714
⨯
+⨯+⨯ =6500.
(2017年西城二模)17.(本小题满分13分)
某大学为调研学生在A ,B 两家餐厅用餐的满意度,从在A ,B 两家餐厅都用过餐的学生中随机抽取了100人,每人分别对这两家餐厅进行评分,满分均为60分.
整理评分数据,将分数以10为组距分成6组:[0,10),[10,20),[20,30),[30,40),[40,50),[50,60],得到A 餐厅分数的频率分布直方图,和B 餐厅分数的频数分布表:
定义学生对餐厅评价的“满意度指数”如下:
(Ⅰ)在抽样的100人中,求对A 餐厅评价“满意度指数”为0的人数;
(Ⅱ)从该校在A ,B 两家餐厅都用过餐的学生中随机抽取1人进行调查,试估计其对A 餐厅评价的“满意度指数”比对B 餐厅评价的“满意度指数”高的概率;
(Ⅲ)如果从A ,B 两家餐厅中选择一家用餐,你会选择哪一家?说明理由.
解:(Ⅰ)由对A 餐厅评分的频率分布直方图,得
对A 餐厅“满意度指数”为0的频率为(0.0030.0050.012)100.2++⨯=,[ 2分]
所以,对A 餐厅评价“满意度指数”为0的人数为1000.220⨯=. [ 3分] (Ⅱ)设“对A 餐厅评价‘满意度指数’比对B 餐厅评价‘满意度指数’高”为事件C .
记“对A 餐厅评价‘满意度指数’为1”为事件1A ;“对A 餐厅评价‘满意度指数’为2”为事件2A ;“对B 餐厅评价‘满意度指数’为0”为事件0B ;“对B 餐厅评价‘满意度指数’为1”为事件1B .
B 餐厅分数频数分布表。