2021年高考数学二轮复习 统计、统计案例训练题 理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2021年高考数学二轮复习 统计、统计案例训练题 理
1.(xx·新课标全国卷Ⅰ)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( )
A .简单随机抽样
B.按性别分层抽样
C.按学段分层抽样
D.系统抽样
2.(xx·石家庄模拟)设随机变量ξ服从正态分布N(1,σ2),若P(ξ<2)=0.8,则P(0<ξ<1)的值为( )
A .0.2
B .0.3
C .0.4
D .0.6
3.(xx·福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )
A .588
B .480
C .450
D .120
4.(xx·湖北高考)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y 与x 负相关且y ^=2.347x -6.423;
②y 与x 负相关且y ^=-3.476x +5.648;
③y 与x 正相关且y ^=5.437x +8.493;
④y 与x 正相关且y ^=-4.326x -4.578.
其中一定不正确的结论的序号是( )
A .①②
B .②③
C .③④
D .①④
5.(xx·湖南五市十校联考)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K 2=
n ad -bc 2a +b c +d a +c b +d 算得,K 2=110×40×30-20×20260×50×60×50
≈7.8.
附表: P(K 2
≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
A .有99%以上的把握认为“爱好该项运动与性别有关”
B .有99%以上的把握认为“爱好该项运动与性别无关”
C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
6.某实验中学共有职工150人,其中高级职称的职工15人,中级职称的职工45人,一般职员90人,现采用分层抽样抽取容量为30的样本,则抽取的高级职称、中级职称、一般职员的人数分别为( )
A .5、10、15
B .3、9、18
C .3、10、17
D .5、9、16
7.(xx·山东滨州模拟)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).
篮球组 书画组 乐器组
高一 45 30 a
高二 15 10 20
从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a 的值为________.
8.以下四个命题,其中正确的是________.
①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
②两个随机变量相关性越强,则相关系数的绝对值越接近于1;
③在回归直线方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均
增加0.2个单位;
④对分类变量X 与Y ,它们的随机变量K 2(χ2)的观测值k 来说,k 越小,“X 与Y 有关
系”的把握程度越大.
9.(xx·湖北八校联考)对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.
10.(xx·成都诊断性检测)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如下:
试根据图表中的信息解答下列问题:
(1)求全班的学生人数及分数在[70,80)之间的频数;
(2)为快速了解学生的答题情况,老师按分层抽样的方法从位于[70,80),[80,90)和[90,100]分数段的试卷中抽取8份进行分析,再从中任选3人进行交流,求交流的学生中,成绩位于[70,80)分数段的人数X的分布列和数学期望.
11.(xx·湖北高考)假设每天从甲地去乙地的旅客人数X是服从正态分布N(800,502)的随机变量.记一天中从甲地去乙地的旅客人数不超过900的概率为p0.
(1)求p0的值;(参考数据:若X~N(μ,σ2),有P(μ-σ<X≤μ+σ)=0.682 6,P(μ-2σ<X≤μ+2σ)=0.954 4,P(μ-3σ<X≤μ+3σ)=0.997 4)
(2)某客运公司用A、B两种型号的车辆承担甲、乙两地间的长途客运业务,每车每天往返一次.A、B两种车辆的载客量分别为36人和60人,从甲地去乙地的营运成本分别为1 600元/辆和2 400元/辆.公司拟组建一个不超过21辆车的客运车队,并要求B型车不多于A 型车7辆.若每天要以不小于p0的概率运
完从甲地去乙地的旅客,且使公司从甲地去乙地的营运成本最小,那么应配备A型车、B型车各多少辆?
12.(xx·石家庄模拟)为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查.得到了如下的统计结果:
上网时间(分钟) [30,40) [40,50) [50,60) [60,70) [70,80] 人数 5 25 30 25 15
上网时间(分钟) [30,40) [40,50) [50,60) [60,70) [70,80] 人数10 20 40 20 10
(2)完成下面的2×2列联表,并回答能否有90%的把握认为“大学生上网时间与性别有关”?
上网时间少于60分钟
上网时间不
少于60分钟
合计
男生
女生
合计
附:K2=
P(K2≥k0) 0.100 0.050 0.025 0.010 0.005 k0 2.706 3.841 5.024 6.635 7.879
1.选C 由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A ;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行分层抽样,排除B 和D.
2.选B P(ξ<2)=0.8,∴P(ξ>2)=0.2,
又P(ξ<0)=P(ξ>2)=0.2.
∴P(0<ξ<2)=1-P(ξ<0)-P(ξ>2)=0.6.
∴P(0<ξ<1)=12
(0<ξ<2)=0.3. 3.选B 由频率分布直方图可得,该模块测试成绩不少于60分的学生人数为600-(0.005+0.015)×10×600=480.
4.选D ①中y 与x 负相关而斜率为正,不正确;④中y 与x 正相关而斜率为负,不正确.
5.选A 因为6.635<7.8<10.828,所以有99%以上的把握认为“爱好该项运动与性别有关”,故选A.
6.选B 在150人中抽取30人,分层抽样时应按1∶5的比例抽取, 故抽取的高级职称、中级职称、一般职员的人数分别为3、9、18.
7.解析:由题意知1245+15=30120+a
,解得a =30. 答案:30
8.解析:①是系统抽样;对于④,随机变量K 2(χ2)的观测值k 越小,说明两个变量有
关系的把握程度越小.
答案:②③
9.解析:(1)设[25,30)年龄组对应小矩形的高度为h ,则5(0.01+h +0.07+0.06+0.02)=1,h =0.04.(2)志愿者年龄在[25,35)的频率为5(0.04+0.07)=0.55,故志愿者年龄在
[25,35)的人数约为0.55×800=440.
答案:(1)0.04 (2)440
10.解:(1)由茎叶图可知,分数在[50,60)上的频数为4,频率为0.008×10=0.08,
故全班的学生人数为40.08
=50. 分数在[70,80)之间的频数等于50-(4+14+8+4)=20.
(2)按分层抽样原理,三个分数段抽样数之比等于相应人数之比.
又[70,80),[80,90)和[90,100]分数段人数之比等于5∶2∶1,由此可得抽出的样本中分数在[70,80)之间的有5人,分数在[80,90)之间的有2人,分数在[90,100]之间的有1人.
从中任取3人,共有C 38=56种不同的结果.
被抽中的成绩位于[70,80)分数段的学生人数X 的所有取值为0,1,2,3.
它们的概率分别是:
P(X =0)=C 3356=156
, P(X =1)=C 15C 2356=1556
, P(X =2)=C 25C 1356=3056=1528
, P(X =3)=C 3556=1056=528
. ∴X 的分布列为
∴X 的数学期望为E(X)=0×156+1×1556+2×1528+3×528=10556=158
. 11.解:(1)由于随机变量X 服从正态分布N(800,502),故有μ=800,σ=50,
P(700<X≤900)=0.954 4.
由正态分布的对称性,可得
p 0=P(X≤900)=P(X≤800)+P(800<X≤900)=12+12
P(700<X≤900)=0.977 2. (2)设A 型、B 型车辆的数量分别为x ,y 辆,则相应的营运成本为1 600x +2 400y. 依题意,x ,y 还需满足x +y≤21,y≤x+7,
P(X≤36x+60y)≥p 0.
由(1)知,p 0=P(X≤900),故P(X≤36x+60y)≥p 0等价于36x +60y≥900. 于是原问题等价于求满足约束条件⎩⎪⎨⎪⎧ x +y≤21,y≤x+7,36x +60y≥900,x ,y≥0,x ,y ∈N ,
且使目标函数z =1 600x +2 400y 达到最小的x ,y.
作可行域如图所示,可行域的三个顶点坐标分别为P(5,12),
Q(7,14),R(15,6).
由图可知,当直线z =1 600x +2 400y 经过可行域的点P 时,
直线z =1 600x +2 400y 在y 轴上截距z 2 400
最小,即z 取得最小值.
故应配备A 型车5辆、B 型车12辆.
12.解:(1)由男生上网时间与频数分布表可知100名男生中,上网时间少于60分钟的有60人,不少于60分钟的有40人,故从其中任选3人,恰有1人上网的时间少于60分钟
的概率为C 160C 240C 3100=156539
. 上网时间少于60分钟 上网时间不少于60分钟 合计
男生 60 40 100
女生 70 30 100
合计 130 70 200
K 2=2100×100×130×70=91
≈2.20, ∵K 2≈2.20<2.706.
∴没有90%的把握认为“大学生上网时间与性别有关”.J26580 67D4 柔39166 98FE 飾33893 8465 葥4r 28812 708C 炌\Zs 440421 9DE5 鷥。