2022衡水名师原创数学专题卷:专题16 统计与统计案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2022衡水名师原创数学专题卷
专题十六《统计与统计案例》
考点51:随机抽样与用样本估计总体(1-4题,9,10题,13,14题,17-20题)
考点52:变量的相关性与统计案例(5-8题,11,12题,15,16题,21,22题)
考试时间:120分钟 满分:150分
说明:请将选择题正确答案填写在答题卡上,主观题写在答题纸上
第I卷(选择题)
一、选择题(本题共8小题,每小题5分,共40分。
在每小题给出的四个选项中,只有一项是符合题目要求的。
)
1.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米648石,验得米内夹谷,抽样取米一把,数得288粒内夹谷32粒,则这批米内夹谷约为(注:石dàn 古代重量单位,1石=60千克)( )
A.74石B.72石C.70石D.68石
2.某校为了了解学生学习的情况,采用分层抽样的方法从高一2400人、高二2000人、高三n人中,抽取90人进行问卷调查.已知高一被抽取的人数为30人,那么高三被抽取的人数为()
A.20 B.25 C.30
D.35
3.如图是某学校研究性课题《什么样的活动最能促进同学们进行垃圾分类》问题的统计图(每个受访者都只能在问卷的5个活动中选择一个),以下结论错误的是( )
A.回答该问卷的总人数不可能是100个
B.回答该问卷的受访者中,选择“设置分类明确的垃圾桶”的人数最多
C.回答该问卷的受访者中,选择“学校团委会宣传”的人数最少
D.回答该问卷的受访者中,选择“公益广告”的人数比选择“学校要求”的少8个
4.某公司将20名员工工作五年以来的迟到次数统计后得到如下的茎叶图,则从中任取1名员
20,30的概率为( )
工,迟到次数在[)
A.720
B.
310 C.35
D.
12
5.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =L 得到下面的散点图:
由此散点图,在10C ︒至40C ︒之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A.y a bx =+
B.2y a bx =+
C.e x y a b =+
D.ln y a b x =+
6.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为
ˆˆˆy
bx a =+.已知101
225i i x ==∑,10
1
1600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计身高为( ) A.160cm
B.163cm
C.166cm
D.170cm
7.为考察某种药物预防疾病的效果,对100只某种动物进行试验,得到如下的列联表:
患病 未患病 合计 服用药
10
40
50
没服用药 20 30 50 合计
30
70
100
经计算,统计量2K 的观测值 4.762k ≈.
已知独立性检验中统计量2K 的临界值参考表为:
20()P K k ≥
0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
则认为药物有效,犯错误的概率不超过( ) A.0.005
B.0.05
C.0.010
D.0.025
8.根据最小二乘法由一组样本点(),(i i x y 其中i 1,2,,300)=⋅⋅⋅,求得的回归方程是ˆˆˆy
bx a =+,则下列说法正确的是( ) A. 至少有一个样本点落在回归直线ˆˆˆy
bx a =+上 B. 若所有样本点都在回归直线ˆˆˆy
bx a =+上,则变量间的相关系数为1 C. 对所有的解释变量()i i i 1,2300.x bx a =⋅⋅⋅+的值一定与i y 有误差 D. 若回归直线ˆˆˆy
bx a =+的斜率0b >,则变量x 与y 正相关 二、选择题(本题共4小题,每小题5分,共20分。
在每小题给出的选项中,有多项符合题目要求。
全部选对的得5分,有选错的得0分,部分选对的得3分。
)
9.某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式 主要有:A —结伴步行,B —自行乘车,C —家人接送,D —其他方式.并将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,下列说法正确的是( )
A.扇形统计图中D 的占比最小
B.条形统计图中A 和C 一样高
C.无法计算扇形统计图中A 的占比
D.估计该校一半的学生选择结伴步行或家人接送
10.原油价格的走势在一定程度上反映了全球的经济形势。
下面是2008年至2019年国际原油价格高低区间的对比图。
下列说法正确的是( ) A.2008年原油价格波动幅度最大
B.2008年至2019年,原油价格平均值不断变小
C.2013年原油价格平均值一定大于2018年原油价格平均值
D.2008年至2019年,原油价格波动幅度均不小于20美元/桶
11.随着养生观念的深入,国民对餐饮卫生条件和健康营养的要求逐渐提高.据了解,烧烤食品含有强致癌物,因此吃烧烤的人数日益减少,烧烤店也随之减少.某市对2014年至2018年这五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如下表所示:
年份 2014 2015 2016 2017 2018 年份代码t 1
2
3
4
5
盈利店铺
的个数y
260
240
215
200
180
根据所给数据,得出y 关于t 的回归直线方程为 273y bt =+ ,则下列说法正确的是( ) A.该市2014年至2018年全市烧烤店盈利店铺个数的平均数219y = B.y 关于t 的回归值直线方程为 18273y t =-+
C.估计该市2020年烧烤店盈利店铺的个数为147
D.预测从2025年起,该市烧烤店盈利店铺的个数将不超过100
12.2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高条形图:
根据图中信息,下列结论正确的是:( )
A.样本中男性比女性更关注地铁1号线全线开通
B.样本中多数女性是35岁及以上
C.样本中35岁以下的男性人数比35岁及以上的女性人数多
D.样本中35岁及以上的人对地铁1号线的开通关注度更高
第II卷(非选择题)
三、填空题(本题共4小题,每小题5分,共20分。
)
13.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为______.
14.若一组数据的频率分布直方图如图所示,则该组数据的中位数为___________.
15.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x (万元) 3 4 5 6
销售额y (万元) 25 30 40 45
根据上表可得回归方程ˆˆˆy bx a =+中的ˆb 为7.根据此模型预测广告费用为10万元时销售额为__________万元.
16.某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
喜欢甜品
不喜欢甜品
总计 南方学生 60 20 80 北方学生 10 10 20 总计
70
30
100
根据表中数据,________95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”,(填“有”或“没有”) 附:
()20P K k ≥
0.10 0.05 0.010 0.005 0k
2.706
3.841
6.635
7.879
2
2
()()()()()
n ad bc K a b c d a c b d -=
++++,其中n a b c d =+++. 四、解答题(本题共6小题,共70分。
)
17.(本题满分10分)某中学共有1000名学生参加了“中原名校”的高三第二次模拟考试,数学成绩 如下表所示: 数学成绩分组 [)0,30
[)30,60
[)60,90
[)90,120
[]120,150
人数
60
90
300
x
160
(1)在高考前的冲刺阶段,为了更好的了解同学们前段复习的得失,以便制定冲 刺阶段的复习计划,学校将采用分层抽样的方法抽取100名同学进行问卷调查, 甲同学在本次测试中数学成绩为95分,求他被抽中的可能性;
(2)已知本次数学成绩的优秀线为115分,试根据所提供数据估计该中学达到优 秀线的人数;
(3)作出频率分布直方图,并估计该学校本次考试的数学平均分.(同一组中的数据用该组区间的中点值作代表)
18.(本题满分12分)某大学生在开学季准备销售一种文具盒进行试创业,在一个开学季内,每售出1盒该产品获利润30元,未售出的产品,每盒亏损10元.根据历史资料,得到开学季市场需求量的频率分布直方图,如图所示.该同学为这个开学季购进了160盒该产品,以x (单位:盒,100200x ≤≤)表示这个开学季内的市场需求量,y (单位:元)表示这个开学季内经销该产品的利润.
(1)根据直方图估计这个开学季内市场需求量x 的众数和平均数(同一组中的数据用该组区间的中点值为代表); (2)将y 表示为x 的函数;
(3)根据直方图估计利润y 不少于3200元的概率.
19.(本题满分12分)某学校为了了解高三复习效果,从高三第一学期期中考试成绩中随机抽取50名考生的数学成绩,分成6组制成频率分布直方图,如图所示.
(1)求m 的值及这50名同学数学成绩的平均数x .
(2)该学校为制定下阶段的复习计划,从成绩在[]130,140的同学中选出3名作为代表进行座谈,若已知成绩在[]130,140的同学中男女比例为2:1,求至少有一名女生参加座谈的概率. 20.(本题满分12分)中国在欧洲的某孔子学院为了让更多的人了解中国传统文化,在当地举办了一场由当地人参加的中国传统文化知识大赛,为了了解参加本次大赛参赛人员的成绩情况,从参赛的人员中随机抽取n 名人员的成绩(满分100分)作为样本,将所得数据进行分析整理后画出频率分布直方图如下图所示,已知抽取的人员中成绩在[)50,60内的频数为3.
(1)求n 的值和估计参赛人员的平均成绩(保留小数点后两位有效数字);
(2)已知抽取的n 名参赛人员中,成绩在[)80,90和[]90,100女士人数都为2人,现从成绩在
[)80,90和[]90,100的抽取的人员中各随机抽取1人,求这两人恰好都为女士的概率.
21.(本题满分12分)2020年1月底因新型冠状病毒感染的肺炎疫情形势严峻,避免外出是减少相互交叉感染最有效的方式.在家中适当锻炼,合理休息,能够提高自身免疫力,抵抗该种病毒.某小区为了调查“宅”家居民的运动情况,从该小区随机抽取了100位成年人,记录了他们某天的锻炼时间,其频率分布直方图如图:
(1)求a 的值,并估计这100位居民锻炼时间的平均值(同一组中的数据用该组区间的中点值代表);
(2)小张是该小区的一位居民,他记录了自己“宅”家7天的锻炼时长: 序号n 1 2 3 4 5 6
7 锻炼时长m (单位:分钟) 10 15 12 20 30
25
35
(Ⅰ)根据数据求m 关于n 的线性回归方程;
(Ⅱ)若4m x -≥(x 是1中的平均值),则当天被称为“有效运动日”.估计小张“宅”家第8天是否是“有效运动日”?
x
附;线性回归方程ˆˆˆy
bx a =+,其中,()()
()
1
2
1
ˆn i i i n i i x x y y b x x ==--=-∑
∑
,ˆˆa
y bx =-. 22.(本题满分12分)手机用户可以通过关注某些公众号查看自己每天行走的步数,同时也可以和好友进行运动量的比较或点赞.现从小明的朋友圈内随机选取了40人(男、女各20人),记录了他们某一天的行走步数,并将数据整理如下表:
若某人一天的行走步数超过8 000则被系统评定为“积极型”,否则被评定为“懈怠型”. (1)利用样本估计总体的思想,试估计小明的朋友圈内所有好友中每日行走步数超过10 000的概率.
(2)根据题意完成下面的22⨯列联表,并据此判断能否有90%的把握认为“评定类型”与“性别”有关.
积极型
懈怠型
总计 男 女 总计
附:
()2P K k ≥
0.100 0.050 0.010 0.005 0.001 k
2.706
3.841
6.635
7.879
10.828
2
2
()()()()()
n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.
参考答案及解析
1.答案:B
解析:设送来648石米内夹谷约为x 石因为抽样取米一把,数得288粒内夹谷32粒,可得
32648288
x =,解得72x =石故选:B 2.答案:D
解析:由题意根据分层抽样的特征可得3090
240024002000n
=++,求得2800n =,故应从高三年级抽取的人数为30
2800352400
⨯
=故选:D. 3.答案:D
解析:A. 若回答该问卷的总人数不可能是100个,则选择③④⑤的同学人数不为整数,故A 正确;
B. 由统计图可知,选择“设置分类明确的垃圾桶”的人数最多,故B 正确;
C. 由统计图可知,选择“学校团委会宣传”的人数最少,故C 正确;
D. 由统计图可知,选择“公益广告”的人数比选择“学校要求”的少8%,故D 错误。
故选:D 。
4.答案:B
解析:依题意,该公司共有20名员工,其中迟到次数在[)20,30的有6人,故所求概率310
P =
. 5.答案:D
解析:散点图中点的分布形状与对数函数的图象类似,故选D. 6.答案:C
解析:由已知22.5x =,160y =,∴16042570ˆ 2.a
=-⨯=,42470166y =⨯+=,选C. 7.答案:B
解析:由题意算得, 4.762 3.841k =>,参照附表,可得在犯错误的概率不超过0.05的前提下,认
为药物有效. 8.答案:D
解析:回归直线必过样本数据中心点,但样本点可能全部不在回归直线上,故A 错误; 所有样本点都在ˆˆˆy
bx a =+上,则变量间的相关系数为1±,故B 错误; 若所有的样本点都在ˆˆˆy
bx a =+上,则i ˆbx a +的值与i y 相等,故C 错误; 相关系数r 与b 符号相同,若ˆˆˆy
bx a =+的斜率0b >,则0r >,样本点应分布从左到右应该是上升的,则变量x 与y 正相关,故D 正确.
故选:D . 9.答案:ABD
解析:由条形统计图知,B 一自行乘车上学的有42人,C 一家人接送上学的有30人,D 一其他方式上学的有18人,采用B,C,D 三种方式上学的共90人,设A 一结伴步行上学的有x 人, 由扇形统计图知,A 一结伴步行上学与B 一自行乘车上学的学生占60%,所以
4260
9010
x x +=
+,解 得30x =,故条形图中,A C 一样高,扇形图中A 类占比与C 一样都为25%,A 和C 共占约50%,故D 也正确.D 的占比最小,A 正确. 10.答案:AC
解析:由图可知,2008年原油价格波动幅度最大,A 对;
通过最高价,最低价,并不反应出平均值的大小,得不出结论,B 错;
因为2013年原油价格最低价都比2018年原油价格最高值大,则2013年原油价格平均值一定大于2018年原油价格平均值,C 对,
由图可知,2016年原油价格波动幅度均小于20美元/桶,D 错, 故选:AC. 11.答案:ABC
解析:由已知数据得3,219t y ==,因为y 关于t 的回归直线过点(3,219),所以2193273b =+ ,所以18b =- ,所以y 关于t 的回归直线方程为 18273y t =-+.2020年的年份代码为7,故2020
年该市烧烤店盈利店铺的个数约为187273147y =-⨯+=.令18273100t -+≤,由*N t ∈,得*10,N t t ≥∈,故从2023年起,该市烧烤店盈利店铺的个数将不超过100.故选ABC.
12.答案:ABD
解析:设等高条形图对应22⨯列联表如下: 35岁及以上 35岁以下 总计
男性 a c a c +
女性 b d b d +
总计
a b +
c d +
a b c d +++
根据第1个等高条形图可知,35岁及以上男性比35岁及以上女性多,即a b >;35岁以下男性比”岁以下女性多,即c d >.根据第2个等高条形图可知,男性中35岁及以上的比35岁以下的多,即a c >;女性中35岁及以上的比35岁以下的多,即b d >,对于A,男性人数为a c +,女性人数为b d +,因为,a b c d >>,所以a c b d +>+,所以A 正确;
对于B,35岁及以上女性人数为b ,35岁以下女性人数为d ,因为b d >,所以B 正确;
对于C,35岁以下男性人数为c ,35岁及以上女性人数为b,无法从图中直接判断b 与c 的大小关系,所以C 不一定正确;
对于D,35岁及以上的人数为a b +,35岁以下的人数为c d +,因为,a c b d >>,所以a b c d +>+所以D 正确.
13.答案:8
解析:设样本容量为N ,则30
6,14,70
N N ⨯== 高二所抽人数为40
14870
⨯=. 故答案为:8 14.答案:45
解析:各组的频率分别为0.03,0.05,0.12,0.2,0.2,0.4,故所求中位数为45. 15.答案:73.5
解析:由题表可知, 4.5x =,35y =, 代入回归方程ˆ7ˆy
x a =+,得ˆ 3.5a =, 所以回归方程为7 3.5ˆy
x =+, 所以当10x =时, 710 3.5 3.ˆ75y =⨯+= (万元). 16.答案:有
解析:根据表中数据,计算观测值22
100(60102010)100
3.8418020703021
K ⨯⨯-⨯=
=>⨯⨯⨯.对照临界值知,有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异. 17.答案:(1)分层抽样中,每个个体被抽到的可能性均 为
样本容量
总体中个体总数
,
故甲同学被抽到的可能性为:
1
10
. (2)由题意1000(6090300160)390x =-+++=,
故估计该中学达到优秀线的人数120115
16039022512090
m -=+⨯
=-,
(3)频率分布直方图.该学校本次考试数学平均分 6015904530075390105160135
901000
x ⨯+⨯+⨯+⨯+⨯=
=.
估计该学校本次考试的数学平均分为90分.
解析:
18.答案:(1)由频率直方图得:最大需求量为[)140,160的频率0.015200.3=⨯=,为频率的最大值.
这个开学季内市场需求量的众数估计值是150;
需求量为[)100,120的频率0.005200.1=⨯=,需求量为[)120,140的频率0.01200.2=⨯=, 需求量为[)140,160的频率0.015200.3=⨯=,需求量为[)160,180的频率0.0125200.25=⨯=,
需求量为[)180,200的频率0.0075200.15=⨯=.
则平均数1100.11300.21500.31700.251900.15153x =⨯+⨯+⨯+⨯+⨯=. (2)因为每售出1盒该产品获利润30元,未售出的产品,每盒亏损10元, 所以当100160x ≤≤时,3010(160)401600y x x x =-⨯-=-, 当160200x <≤时,160304800y =⨯=, 所以401600,1001604800,160200
x x y x -≤≤⎧=⎨
<≤⎩. (3)因为利润不少于3200元所以,解得4016003200x -≥,解得120x ≥. 所以由(1)知利润不少于3200元的概率10.10.9p =-=. 解析:
19.答案:(1)由题意知()0.0040.0120.0240.0400.012101m +++++⨯=,解得0.008m =. 所以950.004101050.012101150.024101250.040x =⨯⨯+⨯⨯+⨯⨯+⨯⨯ 101350.012101450.00810121.8+⨯⨯+⨯⨯=.
(2)由频率分布直方图可知成绩在[]130,140的同学有0.01210506⨯⨯=(人). 又因为成绩在[]130,140的同学中,男女比例为2:1, 所以男生有2643⨯=(人),女生有1
623
⨯=(人).
记男生分别为,,,A B C D ,女生分别为,x y ,则从6名同学中选出3名的所有可能为,,,,,,,,ABC ABD ABx ABy ACD ACx ACy ADx ADy ,
,,,,,,,,,,Axy BCD BCx BCy BDx BDy Bxy CDx CDy Cxy Dxy ,共20种,其中不含女生的有4种,为
,,,ABC ABD ACD BCD .
设“至少有一名女生参加座谈”为事件A , 则44()1205
P A =-=. 解析:
20.答案:(1)由频率分布直方图知,成绩在[50,60)频率为 1(0.04000.03000.01250.0100)100.075-+++⨯=, 成绩在[)50,60内频数为3,∴抽取的样本容量3
400.075
n =
=, ∴参赛人员平均成绩为550.075650.3750.4850.125950.173.75⨯+⨯+⨯+⨯+⨯=.
(2)由频率分布直方图知,抽取的人员中成绩在[)80,90的人数为0.012510405⨯⨯=, 成绩在[]90,100的人数为0.010010404⨯⨯=,
设抽取的40人中成绩在[)80,90之间男士为123,,A A A ,女士为12,B B , 成绩在[]90,100之间的男士为45,A A ,女士为35,B B ,
从成绩在[)80,90,[]90,100的被抽取人员中各随机选取1人,有{1A ,4A },{1A ,5A },{1A ,3B },{1A ,4B },{2A ,4A },{2A ,5A },{2A ,3B },{2A ,4B },{3A ,4A },{3A ,5A },{3A ,3B },
{3A ,4B },{1B ,4A },{1B ,5A },{1B ,4B },{1B ,3B },{2B ,4A },{2B ,5A },{2B ,4B },{2B ,3B }, 共有20种不同取法,其中选中的2人中恰好都为女士的取法有{1B ,4B },{1B ,3B },{2B ,4B },{2B ,3B }共4种不同取法,
故选中的2人中恰好都为女士的概率为41205
=. 解析:
21.答案:(1)∵(0.0050.0120.0350.0150.003)101a +++++⨯=,∴0.03a =
50.00510150.01210250.0310350.03510450.01510550.0031030.2x =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=
(2)(Ⅰ)∵123456747n ++++++=
=,10151220253035
217
m ++++++==
()()71
(14)(1021)(24)(1521)i i i n n m m =--=-⨯-+-⨯-∑
(34)(1221)(44)(2021)(54)(3021)+-⨯-+-⨯-+-⨯- (64)(2521)(74)(3521)118+-⨯-+-⨯-= ∴11311334,2142828ˆˆ7
b
a ==-⨯= ∴m 关于n 的线性回归方程为11334
2ˆ87
m
n =+ (Ⅱ)当8n =时,11334260260
8.30.2428777
m =
⨯+=-> , ∴估计小张“宅”家第8天是“有效运动日”
解析:
22.答案:(1)根据表中的数据可知,小明的40位好友中每日行走步数超过10 000的有8人, 所以利用样本估计总体的思想,估计小明的朋友圈内所有好友中每日行走步数超过10 000的概率为
8
0.240
=. (2)根据题意完成22⨯列联表如下:
积极型 懈怠型 总计 男 13 7 20 女 8 12 20 总计
21
19
40
所以2
2
40(131278) 2.5 2.70620202119
K ⨯⨯-⨯=
≈<⨯⨯⨯, 所以没有90%的把握认为“评定类型”与“性别”有关. 解析:。