2019届高考数学文科二轮分类突破训练:第二篇考点四考查角度1统计案例Word版含解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考察角度 1统计事例
分类透析一统计图表与数字特点剖析
例 1 从某食品厂生产的面包中抽取 100 个, 丈量这些面包的一项质量指标值 , 由丈量结果得以下频数散布表 :
质量
[105[115
指标 [75,[85,[95,
值分 85)95)105),115,125
组)]
频数 82237285
(1)在相应地点上画出这些数据的频次散布直方图 ;
(2)预计这类面包质量指标值的均匀数 X(同一组中的数据用该组区间的中点值作代表 );
(3)依据以上抽样检查数据 , 可否定为该食品厂生产的这类面包
切合“质量指标值不低于 85 的面包起码要占所有面包 90%的规定”?剖析 (1) 依据题设中的数据 , 可画出频次散布直方图 ;
(2)利用均匀数的计算公式 , 可求得均匀数X;
(3)计算质量指标值不低于 85 的面包所占比率的预计值 , 再做出判断 .
分析 (1) 绘图.
(2)量指的本均匀数
=80×0. 08+90×0. 22+100×0. 37+110×0. 28+120×0. 05=100.
因此种面包量指的均匀数的估100.
(3)量指不低于 85 的面包所占比率的估
0. 22+0. 37+0. 28+0. 05=0. 92,
因为估大于 0. 9, 故能够食品厂生的种面包切合“ 量指不低
于 85 的面包起码要占所有面包 90%的定”.
方法技巧在率散布直方中 , 小矩形的高表示“ 率/距”,而不是率 ; 利用率散布直方求均匀数 , 均匀数是率散布直
方的“重心” , 能够估率散布直方中每个小方形的面乘以小方形
底中点的横坐之和 .
分透析二性回的合用
例 2 某市了引居民合理用水 , 居民生活用水行二梯式水价算法 , 详细以下 : 第一梯 , 每居民月用水量不超 12 吨, 价钱 4 元/吨; 第二
梯 , 每居民月用水量超 12 吨, 超部分的价钱 8 元/吨.了认识全市居
民月用水量的散布状况 , 通抽得了 100 居民的月用水量 ( 位 : 吨), 将数据依据
[0,2],(2,4],⋯,(14,16](全市居民月用水量均不超16吨)分红 8
, 制成了如①所示的率散布直方.
(1)求频次散布直方图中字母 a 的值,并求该组的频次 .
(2)经过频次散布直方图 , 预计该市居民每个月的用水量的中位数m 的值 ( 保存两位小数 ) .
(3)图②是该市居民张某 2018 年 1~6 月份的月用水费y( 元) 与月
份 x 的散点图,其拟合的线性回归方程是^
=2x+33. 若张某2018年1~7
月份水费总支出为 312 元, 试预计张某7 月份的用水吨数.
剖析 (1) 依据矩形面积和为 1 可得结果 ;
(2)利用 m左右边积都是列方程可得结果;
(3)依据回归直线过样本点的中心 , 算出前六个月均匀花费 , 总花费减去前六个月的花费和即可得结果 .
分析 (1) ∵(0 . 02+0. 04+0. 08+a+0. 13+0. 08+0. 03+0. 02) ×2=1, ∴a=0. 10.
故第四组的频次为 0. 1×2=0. 2.
(2)∵0. 02×2+0. 04×2+0. 08×2+0. 10×2+( m-8) ×0. 13=0. 5,
-
∴m=8+≈8.15.
(3)∵=
^
=3. 5,且 =2x+33,
∴=2×3. 5+33=40.
∴张某 7 月份的用水花费为 312- 6×40=72( 元),
设张某 7 月份的用水x吨,
∵12×4=48<72,
∴12×4+( x- 12) ×8=72, 解得x=15.
则张某 7 月份用水 15 吨.
方法技巧 (1) 要能够从统计图表中获得数据来解决问题.
(2)若已知回归直线方程 , 则能够直接将数值代入求得特定要求下的展望值 ; 若回归直线方程有待定参数 , 则依据回归直线方程恒过点( , )求参数.
分类透析三独立性查验的综合应用
例 3 某校工会对全校教员工在平昌冬天奥运会时期每日收看竞
赛转播的时间做了一次检查 , 获得以下频数散布表 :
收看
时间[0,[1,[2,[3,[4,[5,
( 单
1)2)3)4)5)6]
位: 小
时)
收看
143016282012
人数
(1)若将每日收看竞赛转播时间不低于 3 小时的教员工定义为“体育达人” , 不然定义为“非体育达人” , 请依据频数散布表补全
2×2 列联表 :
男女共计
体育达人 40
非体育达
30
人
共计
并判断可否有90%的掌握以为该校教员工能否为“体育达人”与“性别”有关 .
(2)在全校“体育达人”中按性别分层抽样抽取6 名, 再从这6 名“体育达人”中随意选用 2 名做冬奥会知识讲座.求拿出的 2 名“体
育达人”中起码有 1 名女员工的概率.
附表及公式 :
P( K20. 10. 10. 00. 00. 00. 00. 0
≥k )505251005 01
02. 02. 73. 85. 06. 67. 810.
k0720641243579 828
2(-( 此中n=a+b+c+d为样本容
量 ) .
附: K=((((
剖析 (1) 依据表格中的数据 , 计算K2, 比较附表 , 做出判断 ;
(2)先利用分层抽样方法抽取 6 名“体育达人” , 并确立此中男
女员工人数 , 再利用概率知识求解即可.
分析 (1) 由题意得下表 :
男女共计
体育达人402060
非体育达
303060
人
7050120
共计
k=(-=>2. 706.
因此有90%的掌握以为该校教员工能否为“体育达人”与“性别”有关 .
(2)由题意知抽取的 6 名“体育达人”中有 4 名男员工 ( 记作a, b, c, d),2名女员工(记作 m, n),
则从这 6 名“体育达人”中随意选用
2 名有
ab , ac , ad , am , an , bc , bd , bm , bn , cd , cm , cn , dm , dn , mn , 共 15 种
取法 , 拿出的 2 名“体育达人”中起码有 1 名女员工有
am , an , bm , bn , cm , cn , dm , dn , mn , 共 9 种取法 , 因此所求概率 P= = .
方法技巧 独立性查验的方法的解题步骤
①结构 2×2 列联表 ; ②计算 K 2 的观察值 k ; ③查表确立有多大的掌握判断两个变量有关系 .
1. (2018 年全国 Ⅲ卷, 文 18 改编 )PM
2. 5 是指大气中直径小于或等于
2. 5 微米的颗粒物 , 也称为可入肺颗粒物 , 一般状况下 PM2.5 浓度越大 , 大气环境质量越差 . 我国 PM2.5 的标准是 :24 小时 PM2.5 的均匀浓度
在 0~35μg/m 3 范围内 , 则空气质量是优 , 在 35~75μg/m 3 范围内 , 则空气质量是优秀 , 在 75~115μg/m 3 范围内 , 则空气质量是轻度污染 . 在 115~150μg/m 3 范围内 , 则空气质量是中度污染 . 甲、乙两座城市 2016 年末经评估 PM2.5 的年均匀浓度均在 80μg/m 3 左右 , 空气质量是轻度污染 , 甲、乙两座城市采纳不一样的环境综合治理方式 , 经过各个监测站 的大数据汇总获得 2017 年每个月 PM2.5 的均匀浓度数据以下 ( 单 位: μg/m 3) .
甲城市 :83,74,55,62,47,65,58,61,56,50,54,46 . 乙城市 :82,68,61,65,68,68,71,67,82,70,66,72 .
(1) 依据以上统计数据判断 2017 年哪座城市的大气环境质量整体较好?并说明原因 .
(2) 求两座城市 24 个 PM2. 5 的均匀浓度的中位数 , 并将两座城市超出
和不超出中位数的月份数填入下边的列联表 :
不超出 超出
甲城市 乙城市
(3) 依据 (2) 中的列联表 , 可否有 99%的掌握以为甲、乙两座城市的大气环境质量与该城市综合治理的方式有关 ?
附: K 2=
( -
,
((
(
(
P ( K 2≥k 0 0. 05 0. 0100. 001
) 3. 841 6. 635 10. 82
k 0
8
分析 (1) 甲城市的大气环境质量整体较好 .
原因如
下: 甲=
×(83+74+55+62+47+65+58+61+56+50+54+46) = =59. 25,
乙
=
×(82 +68+61+65+68+68+71+67+82+70+66+72)= =70, 所
以甲<乙,
因此甲城市的大气环境质量整体较好
.
(2) 把 24 个数据由小到大排序可得中位数为 m= =66. 5.
列联表以下 :
不超出
超出
甲城市 10 2
乙城市
2 10
(3) 因为 k= (
-
≈10. 667>6. 635,
因此有 99%的掌握以为甲、乙两座城市的大气环境质量与他们综
合治理的方式有关 .
y ( 单位 : 个)
2. (2018 年全国 Ⅱ卷, 文 18 改编 ) 一只药用昆虫的产卵数
与必定范围内的温度 x ( 单位 : ℃ 有关 , 现采集了该种药用昆虫的 6 组
观察数据以下表所示 .
温度
21 23 24 27 29 32 x/ ℃ 产卵
6 11 20 2
7 57 77
y/ 个
经计算得
= i
26, i 33, ( i - )( i - ) 557, ( i - ) 2 84, ( i
x = = y = x y = x = y - ) 2=3930, 线性回归模型的残差平方和
^
( y i - ) 2=236. 64,e 8. 0605≈3167, 此中 x i , y i 分别为观察数据中的温度
和产卵数 , i= 1,2,3,4,5,6 .
(1) 若用线性回归模型拟合 , 求 y 与 x 的回归方程 ^
=bx+a ( 结果正确到
0. 1).
(2) 若用非 性回 模型 合求得
^
,
y 与
x 的回 方程
0 06e 0. 2303x
= .
且有关指数 R 2 =0. 9522.
① 用 (1) 中的回 模型对比 , 用 R 2 明哪一种模型的 合成效更好 . ②用 合成效好的模型 当温度 35℃ , 种 用昆虫的 卵数 ( 果取整数 ) .
^
附: 一 数据 ( x 1, y 1 ),( x 2, y 2 , ⋯,( x n , y n ), 其回 直 =bx+a 的斜率
和截距的最小二乘估 分
^
( -
( - =
-
( -
.
b=
-
, a= -b ; R 2=1-
- (
-
(
分析 (1)
( - ( -
≈6. 6,
由 意得 , b=
-
=
(
因此 a=33-
×26=- 139. 4,
因此 y 对于 x 的 性回 方程
^
=6. 6x- 139. 4.
(2) ①由所 数据求得的 性回 方程
^
=6. 6x- 139. 4, 有关指
数
^
( -
=1-≈0. 9398.
R 2
=1-
-
(
因 0. 9398<0. 9522,
^
^
因此回 方程
=0. 06e 0. 2303x 比 性回 方程 =6. 6x- 139. 4 合
成效更好 .
②由①适当温度 x=35℃
^
, =0. 06e 0. 2303×35=0. 06e 8. 0605≈0. 06×3167≈190( 个) .
即当温度 x=35℃ , 种 用昆虫的 卵数估 190 个.
3. (2018 全国 Ⅰ卷, 文 19 改 ) 某商场 划 售某种食品 , 邀甲、乙两个商家 5 天. 两个商家供给的返利方案以下 : 甲商家每日固定返利 60 元, 且每 出一件食品商家再返利 2 元; 乙商家无固定返
利, 出 30 件之内 ( 含 30 件) 的食品 , 每件食品商家返利 4 元, 高出 30 件的部分每件返利 6 元. , 两个商家的 状况茎叶 以下 :
(1) 现从甲商家试销的 5 天中抽取两天 , 求这两天的销售量都小于 30 的概率 ;
(2) 商场拟在甲、乙两个商家中选择一家长久销售 , 假如仅从日均匀返利额的角度考虑 , 请利用所学的统计学知识为商场做出选择 , 并说明原因 .
分析 (1) 记“抽取的两天销售量都小于 30”为事件 A , 则 5 天中抽取两天的状况有 (29,28),(29,29),(29,32), (29,32),(28,29),(28,32),(28,32),(29,32),(29,32),(32,32),
共 10种,
两天的销售量都小于 30 的状况有 (29,28),(29,29),(28,29), 共
3 种,
因此 P (A )= .
(2) 依题意 ,
甲商家的日均匀销售量为
×(29 +28+29+32+32) =30.
因此甲商家的日均匀返利额为 60+30×2=120 元.
乙商家的日均匀返利额为
×(28 ×4+28×4+30×4+2×6+30×4+1×6+30×4+1×6) =121. 6
元.
因为 121. 6>120,
因此介绍该商场选择乙商家长久销售
.
1. (2018 安徽淮南二模 )2018 年春 , 为响应中国大豆参加世界贸易的竞争 , 某市农科院踊跃研究 , 加大优秀品种的培养工作 . 此中一项基础工作就是研究日夜温差大小与大豆抽芽率之间的关系 . 为此科研人员分别记录了 5 天中每日 100 粒大豆的抽芽数 , 得以下数据表格 :
日期 4月 4月 4月 4月 4月
4日 5日 6日 7日 8日 温差
10 11 13 12 8
x ( ℃
抽芽
23 26 32 26 16 数
y ( 粒)
科研人员确立研究方案以下 : 从 5 组数据中选 3 组数据求线性回归方
程, 再用求得的回归方程对剩下的 2 组数据进行查验 . (1) 求剩下的 2 组数据正是不相邻的 2 天数据的概率 ;
(2)若选用的是 4 月 5 日、 6 日、 7 日三天的数据 , 据此求y对于x的
^
线性回归方程=bx+a;
(3)若由线性回归方程获得的预计数据与实质数据的偏差绝对值均不
超出 1 粒, 则以为获得的线性回归方程是靠谱的, 请查验 (2) 中回归方程能否靠谱 .
( -(-
=-附: b=
-, a= -b .
(-
分析 (1)剩下的 2 组数据的状况有 (4日,5日),(4日,6 日),(4日,7 日),(4日,8日),(5日,6 日),(5日,7日 ),(5 日,8日),(6 日,7日),(6 日,8 日),(7 日,8 日), 共 10 种,
恰巧是不相邻的 2 天数据的状况有 (4 日,6 日),(4 日,7 日),(4日,8 日),(5 日,7 日),(5 日,8 日),(6 日,8 日 ), 共 6 种,
因此恰巧是不相邻的 2 天数据的概率是= .
(2) 由数据得i i 1126 1332 12
×26 1014,
x y = ×+ ×+= =×(11 +13+12) =12,
=×(26 +32+26) =28,
3=3×12×28=1008,
∴x i y i -n = x i y i - 3=1014- 1008=6,
=112 +132+122=434,
3 =3×122=432,
∴-n=- 3 =434- 432=2,
∴b=
-
= =3, -
∴a= -b =28- 3×12=- 8,
y x ^
.
故对于的线性回归方程为3 8
= x-
^
(3) 当x=10 时 ,=3×10- 8=22, | 22- 23| ≤1;
^
当 x=8时, =3×8- 8=16, | 16- 16| ≤1.
故获得的线性回归方程是靠谱的 .
2. (2018 云南保山统考 ) 某校进行文科、理科数学成绩对照 , 某次考试
后, 各随机抽取 100 名同学的数学考试成绩进行统计 , 其频次散布表以下 .
分组 [135,15
0] [120,13
5) [105,12
0) [90,105
)
[75,90) [60,75) 总计 分组
[135,15
0] [120,13
5) [105,12
0) [90,105
)
[75,90) [60,75) 总计
频数 频次 8 0. 08
17 0. 17
40 0.4
21 0. 21
12 0. 12 2 0. 02 1001
理科
频数 频次 4 0. 04
18 0. 18
37 0. 37
31 0. 31 7 0. 07 3 0. 03 100 1
文科
(1) 依据数学成绩的频次散布表 , 求理科数学成绩的中位数的预计值 ;
(2) 请填写下边的列联表 , 并依据列联表判断能否有 90%的掌握以为数学成绩与文理科有关 .
数学成绩
数学成绩
共计
≥120 分 <120 分
理 科 文 科
合 200
计
附: K 2=
(
-
(
, 此中 n=a+b ∈c+d.
(
(
(
0. 020. 01 0. 00 P ( K 2≥
0. 10 0. 05 k 0) 5 0 1
k 0
2. 70
3. 845. 026. 63 10. 8
6 1 4 5 28
分析 (1) 理科数学成的率散布表中, 成小于 105 分的率0. 35,
成小于 120 分的率 0. 75,
故理科数学成的中位数的估
105+(-=110. 625(分) .
(2)依据数学成的率散布表得以以下表 :
数学成数学成
合
≥120 分<120分
理
2575100
科
文
2278100
科
合
47153200
k=(-≈0. 250<2. 706,
故没有 90%的掌握数学成与文理科有关.
3. (2018 宁凌源二中模考 ) 某大型高端制造企业响《中国制造2025》中提出的持“ 新、量先、色展、构化、人材本”的基本方 , 准加大品研投 , 下表是企业 2017
年 5~12 月份研用 ( 百万元 ) 和品量 ( 万台 ) 的详细数据 :
月份 5 6 7 8 9101112
研用
x(百万 2 3 6 10 21 13 15 18
元)
2.3. 3. 4.
品量
y(万台)5 5 5 5
1 1 26
(1)依据数据可知 y 与 x 之存在性有关关系 .
①求出 y 对于 x 的性回方程(系数精准到0. 001);
②若 2018 年 6 月份研投入 25( 百万元 ), 依据所求的性回方程估当月品的量 .
(2) 企业在 2017 年年准从年8~12 月份 5 个月中抽取
3 个月的数据行要点剖析, 求没有抽到 9 月份数据的概率.
参照数据 : x i y i=347,=1308.
参照公式 : 于一数据 ( x1, y1),( x2, y2 , ⋯,( x n, y n), 其回直
^-
=bx+a的斜率和截距的最小二乘估分 b=, a= -b .
-
分析 (1)①因 =11,=3,
-
-
因此 b=== ≈0. 244, a=3-×11≈0. 315,
-
-
y
x
^
因此
对于
的线性回归方程为
0 244 0 315
= .x+ . .
^
②当 x=25 时, =0. 244×25+0. 315=6. 415( 万台 ) .
(2) 记 8~12 月份这 5 个月的数据分别为 a , A , b , c , d , 从中抽取 3 个月有
a , A ,
b ; a , A ,
c ; a , A ,
d ; a , b , c ; a , b , d ; a , c , d ; A , b , c ; A , b , d ; A , c , d ; b , c , d ,
共 10 个基本领件 .
没有抽到 9 月份的有 a , b , c ; a , b , d ; a , c , d ; b , c , d , 共 4 个基本领
件, 因此概率 P= = .
4. (2018 广东省江门市一模 ) 为探究讲堂教课改革 , 江门某中学数学老师用传统教课和“导教案”两种教课方式 , 在甲、乙两个平行班进行教课实验 . 为认识教课成效 , 期末考试后 , 分别从两个班级各随机抽取 20 名学生的成绩进行统计 , 获得以下茎叶图 . 记成绩不低于 70 分为“成绩优秀” .
(1) 请大概判断哪一种教课方式的教课成效更佳 , 并说明原因 ;
(2) 结构一个教课方式与成绩优秀的列联表 , 并判断可否在出错误的概率不超出 0. 05 的前提下以为“成绩优秀与教课方式有关” .
附公式及表 : K 2= ( - (
( 此中 n=a+b+c+d 为样本容
量 ) (
(
(
P (K 2≥ 0.1 0.0 0.0 0.0 0.0
k 0) 0 5 25 10 05
k 0
2.7
3.8 5.0 6.6 7.8
06 41 24 35 79
分析 (1) 乙班 ( “导教案”教课方式 ) 教课成效更佳 .
原因 1: 乙班样本数学成绩大多在 70 分以上 , 甲班样本数学成绩
70 分以下的显然更多 .
70. 2; 乙班样本数学成绩
原因 2: 甲班样本数学成绩的均匀分为 的均匀分为 79. 05, 高 10%以上 .
原因 3: 甲班样本数学成绩的中位数为
=70; 乙班样本数学成
绩的中位数为
=77. 5, 高 10%以上 .
(2) 列联表以下 :
甲 乙 总
成绩
班 班 计
10 16 26
优秀
成绩
10 4 14
不优
良
2040
总计 20
由上表可得 K2的观察值 k=(-≈3. 956>3. 841.
因此能在出错误的概率不超出0. 05 的前提下以为“成绩优秀与教课方式有关” .。