16-17版 专题限时集训7 专题3 突破点7 用样本估计总体
用样本估计总体的三种题型
频 数 分 布 表
频数 ( 人
身 高分组
<1 5 5
频数
5
百分 比
1 O%
1 5 5≤ < 16 0
1 6 O≤ < 16 5
0
1 5
2 0%
3 O%
1 6 5≤ < 1 7 0
≥ 1 7 0
1 4
6
b
1 2%
总 计
1 O O %
图1
( 1 ) 填空 :
—
—
,
—
—
一
;
频数 ( 人
( 2 ) 补全 频数 分 布 直方 图 ;
( 3 ) 该 校九 年级 共有 6 0 0 名学 生 , 估 计 身高不低于1 6 5 e m 的学生大约有多少人?
解: ( 1 ) 总人数为5 ÷1 0 %= 5 0 ,
’ . .
a = 5 0 X 2 0% =1 0.
6 =1 4÷ 5 0 X 1 0 0 % =2 8 %.
( 2 ) 补全的频数分布直方图如图2 .
、
( 3 ) 6 0 0 X( 2 8 %+ 1 2 %) = 2 4 0 ( 人) .
图2
诺
…
… …
责任编辑 : 王 二 喜
的三种题 型
0/ - 7 -  ̄ 王 琦
统计 的基本思想是用样本估计 总体 , 即用部分来 推断整体 , 从 而做 出正确 的决策. 在2 0 1 6 年 的中考试题 中, 用样 本估计 总体有 以下三种题 型. 用样本的分布估计 总I 本的分布
一
高中数学用样本估计总体 用样本的数字特征估计总体的数字特征练习与解析 新课标 人教版 必修3(A)
用样本估计总体-用样本的数字特征估计总体的数字特征 练习与解析一、选择题思路导引1.在统计中,样本的标准差可以近似地反映总体的 A.平均状态 B.分布规律 C.波动大小D.最大值和最小值答案:C解析:数据的标准差和方差反映数据的波动大小,故选C. 2.在抽查某产品尺寸的过程中,将其尺寸分成若干组,[a ,b ]是其中一组,抽查出的个体数在该组内的频率为m ,该组直方图的高为h ,则|a -b |的值等于A.h ·mB.m /hC.h /mD.与m ,h 无关答案:B解析:小长方形的高=组距频率,|a -b |=h m =小长方形的高频率.←标准差的统计意义,属基本概念题.3.频率分布直方图的重心是 A.众数 B.中位数 C.标准差 D.平均数 答案:D解析:平均数是频率直方图的“重心”. 4.能反映一组数据的离散程度的是A.众数B.平均数C.标准差D.极差 答案:C解析:标准差反映数据的波动大小及离散程度. 5.与原数据单位不一样的是A.众数B.平均数C.标准差D.方差 答案:D解析:方差的单位是原始数据单位的平方. 6.下列数字特征一定是数据组中数据的是 A.众数 B.中位数 C.标准差 D.平均数 答案:A解析:根据各数字特征的意义可知唯有众数一定是原数据中的数.←明确各统计量在直方图中的位置应根据它们的意义. 7.数据:1,1,3,3的众数和中位数分别是 A.1或3,2B.3,2C.1或3,1或3D.3,3答案:A解析:由众数的意义可得众数是1,3,中位数是231+=2. ←区分众数和中位数.8.频率分布直方图中最高小矩形的中间位置所对的数字特征是 ←结合各统计量和“频率分布直方A.中位数B.众数C.平均数D.标准差答案:B解析:众数是出现最多的数据,其频数最多,故选B. 9.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3.下列说法正确的个数为①甲队的技术比乙队好 ②乙队发挥比甲队稳定 ③乙队几乎每场都进球 ④甲队的表现时好时坏A.1B.2C.3D.4 答案:D解析:四种说法都正确,甲队的平均进球数多于乙队,故第一句正确;乙队标准差较小,说明技术水平稳定;甲队平均进球数是3.2,但其标准差却是3,离散程度较大,由此可判断甲队表现不稳定;平均进球数是1.8,标准差只有0.3,每场的进球数相差不多,可见乙队的确很少不进球.图中最高小矩形的中间位置”所反映的数据信息来选择.←认真审题,深入分析各说法与哪一种统计量有关.10.某校高一有四个班,1~4班的人数分别为N 1,N 2,N 3,N 4,总人数N ,英语成绩的平均分分别为M 1,M 2,M 3,M 4,则该校高一的英语平均分是A.M 1,M 2,M 3,M 4的平均数B..M 1,M 2,M 3,M 4的中位数C.M 1N 1,M 2N 2,M 3N 3,M 4N 4的平均数D. M 1N 1,M 2N 2,M 3N 3,M 4N 4和的N1答案:D解析:这组数据的总和M 1N 1+M 2N 2+M 3N 3+M 4N 4除以数据的总个数N 所得的商是平均数,故选D.二、填空题←依据平均数的定义判断. 11.数据-2,-1,0,1,2的方差是____________. 答案:2解析:利用公式计算.←要求用公式笔算. 公式的逆用.12.五个数1,2,3,4,a 的平均数是3,则a =____________,这五个数的标准差是____________.答案:5 2 解析:∵54321a++++=3,∴a =5.∴S =])35()34()33()12()31[(5122222-+-+-+-+-. 13.已知一个样本方差为s 2=101[(x 1-4)2+(x 2-4)2+…+(x 10-4)2],则这个样本的容量是____________,平均数是____________.答案:10 4←明确公式中各参数的意义是正确运用公式的前提.解析:通过公式中字母参数意义可直接读出.14.在频率分布直方图上中位数的位置特点是____________. 答案:中位数两侧的矩形的面积各是0.5←在计算标准差时,各数据加上或减去一个常数,其数值不变.当每个数据乘以或除以一个常数a ,则所得的标准差是原来标准差的a 倍或1/a 倍.15.已知样本数据x 1,x 2,…,x n 的方差为4,则数据2x 1+3,2x 2+3,2x n +3的标准差是____________.答案:4解析:把数据都加上或减去同一常数后,其方差不变,把数据都乘以同一常数a ,则方差变为原来的a 2倍.←由方差的统计意义并结合“株高整齐”的要求来判断.16.对甲、乙两个小麦品种的各100株小麦的株高进行了测量,结果算得x 甲=0.95,s 甲2=1.01,x 乙=0.95,s乙2=1.35,由此可估计株高较整齐的小麦是____________.答案:甲比乙整齐解析:甲的方差小于乙的,反映了甲的株高较整齐. 三、解答题←尽管利用现代信息技术手段计算数据的标准差和平均数非常方便,但仍需我们熟记公式,并具有较高的运算能力.17.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸分别如下(单位:mm ).甲机床:10.2 10.1 10 9.8 9.9 10.3 9.7 10 9.9 10.1;乙机床:10.3 10.4 9.6 9.9 10.1 10.9 8.9 9.7 10.2 10.分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10 mm ,从计算的结果来看哪台机床加工这种零件较合适?(要求利用公式笔算)解:x 甲=)1.101.102.10(101+++Λ =,10100101=⨯ x 乙=10100101)104.103.10(101=⨯=+++Λ. ∴s 甲2=101[(10.2-10)2+(10.1-10)2+…+(10.1-10)2] =101(0.22+0.12+0+0.22+0.12+0.32+0.32+0+0.12+0.12) =101(0.04+0.01+0+0.04+0.01+0.09+0.09+0+0.01+0.01)=101×0.3=0.03(mm 2). s 乙2=101[(10.3-10)2+(10.4-10)2+…+(10-10)2] ←茎叶图与频率分布直方图都是常用的统计图.它们各有特点.=101(0.32+0.42+0.42+0.12+0.12+0+0.22+0.32+0.22+0) =101(0.09+0.16+0.16+0.01+0.01+0.04+0.09+0.04) =101×0.6=0.06 (mm 2). ∴s 甲2<s 乙2∴用甲机床比乙机床稳定,即用甲机床加工较合适. 注意:此题两机床生产零件尺寸的平均数相等都是10 mm ,与规定尺寸相同,但方差不同,从方差可以估计出哪个机床加工的零件较合适.18.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s )的数据如下表.甲 27 38 30 37 35 31 乙332938342836(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s )数据的平均数、中位数、极差、标准差,并判断选谁参加比赛更合适.解:(1)画茎叶图,中间数为数据的十位数甲乙7 23 3 8 4 69 81 5 7 0 8从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是35,甲的中位数是33.因此乙发挥比较稳定,总体得分情况比甲好.(2)利用科学计算器:x 甲=33,x 乙=33;s 甲=3.96,s 乙=3.56;甲的中位数是33,极差11,乙的中位数是35,极差9.综合比较选乙参加比赛较为合适.。
高三数学复习专题限时集训8专题3突破点8用样本估计总体理
专题限时集训(八) 回归分析、独立性检验建议A 、B 组各用时:45分钟]A 组 高考达标]一、选择题1.(2016·开封一模)下列说法错误的是( )A .自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在线性回归分析中,相关系数r 的值越大,变量间的相关性越强C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好B 根据相关关系的概念知A 正确;当r >0时,r 越大,相关性越强,当r <0时,r 越大,相关性越弱,故B 不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好,二是R 2越大,拟合效果越好,所以R 2为0.98的模型比R 2为0.80的模型拟合的效果好,C ,D 正确,故选B.]2.(2016·长沙模拟)某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:A .有99.5%的把握认为使用智能手机对学习有影响B .有99.5%的把握认为使用智能手机对学习无影响C .有99.9%的把握认为使用智能手机对学习有影响D .有99.9%的把握认为使用智能手机对学习无影响A 因为7.879<k <10.828,故有99.5%的把握认为使用智能手机对学习有影响,故选A.] 3.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( )【导学号:85952032】A.116 B.18 C.14D.12B 依题意可知样本中心点为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18,故选B.] 4. 已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′ ,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B .b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′C 画出散点图,作出直线y =b ′x +a ′与大致的线性回归直线.根据两直线的位置关系知b ′>b ^,a ^>a ′.]5.(2016·东北三省四市联考)某集团为了解新产品的销售情况,销售部在3月1日至3月5日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查,其中该产品的价格x (元)与销售量y (万件)的统计资料如下表所示:日期 3月1日3月2日 3月3日 3月4日 3月5日 价格x (元) 9 9.5 10 10.5 11 销售量y (万件)1110865已知销售量y (万件)与价格x (元)之间具有线性相关关系,其回归直线方程为y =b x +40.若该集团将产品定价为10.2元,预测该批发市场的日销售量约为( )A .7.66万件B .7.86万件C .8.06万件D .7.36万件D 因为x -=15(9+9.5+10+10.5+11)=10,y -=15(11+10+8+6+5)=8,线性回归直线恒过样本中心点(x -,y -),将(10,8)代入回归直线方程得b ^=-3.2,所以y ^=-3.2x +40,将x =10.2代入得y =7.36,故选D.]二、填空题6.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:女 男 总计 喜爱 40 20 60 不喜爱 20 30 50 总计6050110试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d99% 分析列联表中数据,可得k =110×40×30-20×20260×50×60×50≈7.822>6.635,所以有99%的把握认为“喜爱该节目与否和性别有关”.]7.以下四个命题,其中正确的是________.(填序号)①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2个单位;④对分类变量X 与Y ,它们的随机变量K 2的值越小,“X 与Y 有关系”的把握程度越大. ②③①是系统抽样;对于④,随机变量K 2的值越小,说明两个变量有关系的把握程度越小.] 8.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.则家庭的月储蓄y对月收入x 的线性回归方程为____________.附:线性回归方程y =bx +a 中,b =∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a =y --b x -,其中x -,y -为样本平均值.线性回归方程也可写为y ^=b ^x +a ^.y =0.3x -0.4 由题意知n =10,x -=1n ∑i =1n x i =8010=8,y -=1n ∑i =1ny i =2010=2,又∑i =1nx 2i -n x -2=720-10×82=80,∑i =1nx i y i -n x -y -=184-10×8×2=24,由此得b =2480=0.3,a =y --b x -=2-0.3×8=-0.4,故所求回归方程为y =0.3x -0.4.] 三、解答题9.(2016·重庆南开二诊模拟)某品牌新款夏装即将上市,为了对夏装进行合理定价,在该地区的ZZ 锁店各进行了两天试销售,得到如下数据:连锁店 A 店B 店C 店售价x (元) 80 86 82 88 84 90 销量y (件)887885758266(1)以三家连锁店分别的平均售价与平均销量为散点,求出售价与销量的回归直线方程y ^=b^x +a ^;(2)在大量投入市场后,销量与单价仍然服从(1)中的关系,且该夏装成本价为40元/件,为使该新夏装在销售上获得最大利润,该款夏装的单价应定为多少元?(保留整数)附:b ^=∑ni =1x i -x y i -y∑ni =1x i -x2=∑ni =1x i y i -n x y ∑ni =1x 2i -n x2,a ^=y -b ^x . 解] (1)A ,B ,C 三家连锁店平均售价和销量分别为:(83,83),(85,80),(87,74),∴x =85,y =79,2分∴b =83-85×83-79+85-85×80-79×87-85×74-7983-852+85-852+87-852=-2.25,4分∴a ^=y -b ^x =270.25,∴y ^=-2.25x +270.25.6分(2)设该款夏装的单价应定为x 元,利润为f (x )元,则f (x )=(x -40)(-2.25x +270.25)=-2.25x 2+360.25x -10 810.10分当x ≈80时,f (x )取得最大值,故该款夏装的单价应定为80元.12分10.(2016·长春二模)近年来我国电子商务行业迎来蓬勃发展的新机遇,2015年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务评价体系.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都作出好评的交易为80次.(1)是否可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关? (2)若将频率视为概率,某人在该购物平台上进行的5次购物中,设对商品和服务全好评的次数为随机变量X :①求对商品和服务全好评的次数X 的分布列(概率用组合数算式表示); ②求X 的数学期望和方差.P (K 2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d解] (1)由题意可得关于商品和服务评价的2×2列联表如下:对服务好评对服务不满意总计 对商品好评 80 40 120 对商品不满意70 10 80 总计15050200k =200×2120×80×150×50≈11.111>10.828,可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关.6分 (2)每次购物时,对商品和服务都好评的概率为25,且X 的取值可以是0,1,2,3,4,5.其中P (X =0)=⎝ ⎛⎭⎪⎫355;P (X =1)=C 15⎝ ⎛⎭⎪⎫251⎝ ⎛⎭⎪⎫354;P (X =2)=C 25⎝ ⎛⎭⎪⎫252⎝ ⎛⎭⎪⎫353;P (X =3)=C 35⎝ ⎛⎭⎪⎫253⎝ ⎛⎭⎪⎫352;P (X=4)=C 45⎝ ⎛⎭⎪⎫254⎝ ⎛⎭⎪⎫351;P (X =5)=⎝ ⎛⎭⎪⎫255.①X 的分布列为:X 0 1 2 3 4 5P⎝ ⎛⎭⎪⎫355C15⎝ ⎛⎭⎪⎫25 1 ⎝ ⎛⎭⎪⎫354 C25⎝ ⎛⎭⎪⎫25 2 ⎝ ⎛⎭⎪⎫353 C35⎝ ⎛⎭⎪⎫25 3 ⎝ ⎛⎭⎪⎫352 C45⎝ ⎛⎭⎪⎫25 4 ⎝ ⎛⎭⎪⎫351 ⎝ ⎛⎭⎪⎫255 10分②由于X ~B ⎝ ⎛⎭⎪⎫5,25,则E (X )=5×25=2,11分 D (X )=5×25×⎝⎛⎭⎪⎫1-25=65.12分B 组 名校冲刺]一、选择题1.已知x ,y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a 等于( ) 【导学号:85952033】A .1.30B .1.45C .1.65D .1.80B 依题意得,x -=16×(0+1+4+5+6+8)=4,y -=16(1.3+1.8+5.6+6.1+7.4+9.3)=5.25.又直线y ^=0.95x +a ^必过样本中心点(x -,y -),即点(4,5.25),于是有5.25=0.95×4+a ^,由此解得a ^=1.45,故选B.]2.(2016·阜阳模拟)下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程为y ^=0.7x +0.35,则下列结论错误的是( )A.B .t 的取值必定是3.15 C .回归直线一定过(4.5,3.5)D .A 产品每多生产1吨,则相应的生产能耗约增加0.7吨 B 由题意,x -=3+4+5+64=4.5,因为y ^=0.7x +0.35,所以y -=0.7×4.5+0.35=3.5,所以t =4×3.5-2.5-4-4.5=3,故选B.]3.为了普及环保知识,增强环保意识,某大学从理工类专业的A 班和文史类专业的B 班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表:(1)统计量:K 2=n ad -bc 2a +bc +d a +cb +d(n =a +b +c +d ).(2)独立性检验的临界值表:P (K 2≥k 0)0.050 0.010 k 03.8416.635则下列说法正确的是( A .有99%的把握认为环保知识测试成绩与专业有关 B .有99%的把握认为环保知识测试成绩与专业无关 C .有95%的把握认为环保知识测试成绩与专业有关 D .有95%的把握认为环保知识测试成绩与专业无关 C k =40×14×13-7×6220×20×21×19≈4.912,3.841<k <6.635,所以有95%的把握认为环保知识测试成绩与专业有关.]4.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元) 4 5 6 7 8 9 销量y (件)908483807568由表中数据,求得线性回归方程为y =-4x +a .若在这些样本点中任取一点,则它在回归直线左下方的概率为( )A.16 B .13 C.12D.23B 由题意可知x -=4+5+6+7+8+96=132,y -=90+84+83+80+75+686=80.又点⎝ ⎛⎭⎪⎫132,80在直线y ^=-4x +a 上,故a =106.所以回归方程为y =-4x +106.由线性规划知识可知,点(5,84),(9,68)在直线y =-4x +106的下侧. 故所求事件的概率P =26=13.]二、填空题5.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 22根据表中数据,得到k =50×13×20-10×7223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为________. 5% ∵4.844>3.841,且P (K 2≥3.841)≈0.05. ∴可认为选修文科与性别有关系出错的可能性为5%.]6.高三某班学生每周用于物理学习的时间x (单位:小时)与物理成绩y (单位:分)之间有如下关系:x 24 15 23 19 16 11 20 16 17 13 y92799789644783687159(精确到0.1)13.5 由已知可得 x -=24+15+23+19+16+11+20+16+17+1310=17.4,y -=92+79+97+89+64+47+83+68+71+5910=74.9,设回归直线方程为y ^=3.53x +a ^, 则74.9=3.53×17.4+a ^,解得a ^≈13.5.] 三、解答题7.(2016·合肥二模)某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间x (月)和市场占有率y (%)的几组相关对应数据:x 1 2 3 4 5 y0.020.050.10.150.18(1)(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%.(精确到月)附:b ^=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a ^=y --b ^x -. 解] (1)经计算b ^=0.042,a ^=-0.026,所以线性回归方程为y ^=0.042x -0.026.6分(2)由上面的回归方程可知,上市时间与市场占有率正相关,即上市时间每增加1个月,市场占有率增加0.042个百分点.9分令y ^=0.042x -0.026>0.5,解得x ≥13,所以预计从上市13个月后,市场占有率能超过0.5%.12分8.(2016·沈阳模拟)为考查某种疫苗预防疾病的效果,进行动物试验,得到统计数据如下:未发病 发病 总计未注射疫苗 20 x A 注射疫苗 30 yB总计5050100现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为25.(1)求2×2列联表中的数据x ,y ,A ,B 的值; (2)绘制发病率的条形统计图,并判断疫苗是否有效?图84(3)能够有多大把握认为疫苗有效? 附:K 2=n ad -bc 2a +ba +c c +db +d,n =a +b +c +d . P (K 2≥k 0)0.05 0.010.005 0.001 k 03.8416.6357.87910.828解] (1)A , 由已知得P (A )=y +30100=25,所以y =10,B =40,x =40,A =60.5分(2)未注射疫苗发病率为4060=23,注射疫苗发病率为1040=14.发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率.10分(3)k =100×20×10-30×40250×50×40×60=1 000 00050×20×60=503≈16.67>10.828. 所以至少有99.9%的把握认为疫苗有效.12分。
【课堂新坐标】2017届高三文科数学(通用版)二轮复习:专题限时集训7 用样本估计总体 Word版含解析
专题限时集训(七)用样本估计总体建议A、B组各用时:45分钟]A组高考达标]一、选择题1.(2016·山西考前模拟)某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图7-5所示),据此估计此次考试成绩的众数是()图7-5A.100 B.110C.115D.120C分析频率分布折线图可知众数为115,故选C.]2.(2016·南昌二模)如图7-6所示是一样本的频率分布直方图.若样本容量为100,则样本数据在15,20)内的频数是()图7-6A.50 B.40C.30D.14C因为15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在15,20]的频数为0.3×100=30,故选C.]3.(2016·青岛模拟)已知数据x1,x2,x3,…,x50,500(单位:kg),其中x1,x2,x3,…,x50是某班50个学生的体重,设这50个学生体重的平均数为x, 中位数为y,则x1,x2,x3,…,x50,500这51个数据的平均数、中位数分别与x,y比较,下列说法正确的是()【导学号:85952030】A.平均数一定变大,中位数一定变大B.平均数一定变大,中位数可能不变C.平均数可能不变,中位数可能不变D.平均数可能不变,中位数可能变小B显然500大于这50个学生的平均体重,则这51个数据的平均数一定增大,中位数可能增大也可能不变,故选B.]4.(2016·沈阳模拟)从某小学随机抽取100名同学,现已将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图7-7).若要从身高在120,130),130,140),140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150]内的学生中选取的人数应为()图7-7A.2 B.3C.4D.5B依题意可得10×(0.005+0.010+0.020+a+0.035)=1,解得a=0.030,故身高在120,130),130,140),140,150]三组内的学生比例为3∶2∶1,所以从身高在140,150]内的学生中选取的人数应为3.]图7-85.(2016·郑州模拟)某车间共有6名工人,他们某日加工零件个数的茎叶图如图7-8所示,其中茎为十位数,叶为个位数,日加工零件个数大于样本均值的工人为优秀工人.从该车间6名工人中,任取2人,则至少有1名优秀工人的概率为()A.815 B.49C.35 D.19C依题意,平均数x=20+60+30+(7+9+1+5)6=22,故优秀工人只有2人,用a,b表示优秀工人,用c,d,e,f表示非优秀工人,故任取2人的情况如下:(a,b),(a,c),(a,d),(a,e),(a,f),(b,c),(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f)共15种,其中至少有1名优秀工人只有9种情况,故所求概率P=915=35.]二、填空题6.某中学共有女生2 000人,为了了解学生体质健康状况,随机抽取100名女生进行体质监测,将她们的体重(单位:kg)数据加以统计,得到如图7-9所示的频率分布直方图,则直方图中x的值为________;试估计该校体重在55,70)的女生有________人.图7-90.024 1 000由5×(0.06+0.05+0.04+x+0.016+0.01)=1,得x=0.024.在样本中,体重在55,70)的女生的频率为5×(0.01+0.04+0.05)=0.5,所以该校体重在55,70)的女生估计有2 000×0.5=1 000人.]7.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图7-10所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.图7-101当x≥4时,89+89+92+93+92+91+947=6407≠91,∴x <4,∴89+89+92+93+92+91+x +907=91, ∴x =1.] 8.从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图7-11.根据茎叶图,树苗的平均高度较高的是__________种树苗,树苗长得整齐的是__________种树苗.【导学号:85952031】图7-11乙 甲 根据茎叶图可知,甲种树苗中的高度比较集中,则甲种树苗比乙种树苗长得整齐;而通过计算可得,x 甲=27,x 乙=30,即乙种树苗的平均高度大于甲种树苗的平均高度.]三、解答题9.(2016·太原二模)某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成如下六段:40,50),50,60),…,90,100],得到如图7-12所示的频率分布直方图.图7-12(1)若该校高一年级共有学生640名,试估计该校高一年级期中考试数学成绩不低于60分的人数;(2)在抽取的40名学生中,若从数学成绩在40,50)与90,100]两个分数段内随机选取2名学生,求这2名学生的数学成绩之差的绝对值不大于10的概率.解] (1)由10×(0.005+0.01+0.02+a +0.025+0.01)=1,得a =0.03.2分 根据频率分布直方图,成绩不低于60分的频率为1-10×(0.005+0.01)=0.85.4分估计期中考试数学成绩不低于60分的人数约为640×0.85=544(人).6分(2)成绩在40,50)分数段内的人数为40×0.05=2,成绩在90,100]分数段内的人数为40×0.1=4,则记在40,50)分数段的两名同学为A1,A2,在90,100]分数段内的同学为B1,B2,B3,B4.若从这6名学生中随机抽取2人,则总的取法共有15种.8分如果2名学生的数学成绩都在40,50)分数段内或都在90,100]分数段内,那么这2名学生的数学成绩之差的绝对值不大于10,则所取2名学生的数学成绩之差的绝对值不大于10的取法有(A1,A2),(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共7种取法,所以所求概率为P=715.12分10.(2016·郑州一模)为了整顿道路交通秩序,某地考虑将对行人闯红灯进行处罚.为了更好地了解市民的态度,在普通行人中随机选取了200人进行调查,当不处罚时,有80人会闯红灯,处罚时,得到如下数据:(1)当罚金定为10元时,行人闯红灯的概率会比不进行处罚降低多少?(2)将先取的200人中会闯红灯的市民分为两类:A类市民在罚金不超过10元时就会改正行为;B类是其他市民.现对A类与B类市民按分层抽样的方法抽取4人依次进行深度问卷,则前两位均为B类市民的概率是多少.解](1)设“当罚金定为10元时,闯红灯的市民改正行为”为事件A,2分则P(A)=40200=15.4分所以当罚金定为10元时,比不制定处罚,行人闯红灯的概率会降低15.6分(2)由题可知A类市民和B类市民各有40人,故分别从A类市民和B类市民中各抽出2人,设从A类市民中抽出的2人分别为A1,A2,从B类市民中抽出的2人分别为B1,B2.设“A类与B类市民按分层抽样的方法抽取4人依次进行深度问卷”为事件M,8分则事件M中首先抽出A1的事件有:(A1,A2,B1,B2),(A1,A2,B2,B1),(A1,B1,A2,B2),(A1,B1,B2,A2),(A1,B2,A2,B1),(A1,B2,B1,A2),共6种.同理首先抽出A2,B1,B2的事件也各有6种.故事件M 共有24种.10分设“抽取4人中前两位均为B 类市民”为事件N ,则事件N 有(B 1,B 2,A 1,A 2),(B 1,B 2,A 2,A 1),(B 2,B 1,A 1,A 2),(B 2,B 1,A 2,A 1).∴P (N )=424=16.12分B 组 名校冲刺]一、选择题1.已知甲、乙两组数据的茎叶图如图7-13所示,若它们的中位数相同,平均数也相同,则图中的m ,n 的比值m n =( )图7-13A .1B.13C.38D.29C 由茎叶图可知乙的中位数是32+342=33,根据甲、乙两组数据的中位数相同,可得m =3,所以甲的平均数为27+33+393=33,又由甲、乙两组数据的平均数相同,可得20+n +32+34+384=33,解得n =8,所以m n =38,故选C.]2.(2016·山西四校二联)某学校组织学生参加数学测试,成绩的频率分布直方图如图7-14,数据的分组依次为20,40),40,60),60,80),80,100),若低于60分的人数是15,则该班的学生人数是( )图7-14A .45B.50C.55D.60B∵20,40),40,60)的频率为(0.005+0.01)×20=0.3,∴该班的学生人数是150.3=50.]3.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图7-15),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是()图7-15A.240 B.280C.320D.480D由频率分布直方图知:学生的体重在65~75 kg的频率为(0.012 5+0.037 5)× 5=0.25,则学生的体重在50~65 kg的频率为1-0.25=0.75.从左到右第2个小组的频率为0.75×26=0.25.所以抽取的学生人数是120÷0.25=480,故选D.]4.3个老师对某学校高三三个班级各85人的数学成绩进行分析,已知甲班平均分为116.3分,乙班平均分为114.8分,丙班平均分为115.5分,成绩分布直方图如图7-16,据此推断高考中考生发挥差异较小的班级是()图7-16A.甲 B.乙C.丙D.无法判断C由于平均分相差不大,由直方图知丙班中,学生成绩主要集中在110~120区间上且平均分较高,其次是乙,分数相对甲来说比较集中,相对丙而言相对分散.数据最分散的是甲班,虽然平均分较高,但学生两极分化,彼此差距较大,根据标准差的计算公式和性质知甲的方差大于乙的方差大于丙的方差,所以丙班的学生发挥差异较小.故选C.]5.已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.图7-17(1)若第1组抽出的号码为2,则所有被抽出职工的号码为________;(2)分别统计这5名职工的体重(单位:kg),获得体重数据的茎叶图如图7-17所示,则该样本的方差为________.(1)2,10,18,26,34 (2)62 (1)分段间隔为405=8,则所有被抽出职工的号码为2,10,18,26,34.(2)x =15(59+62+70+73+81)=69.s 2=15(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.]6.如图7-18是某个样本的频率分布直方图,分组为100,110),110,120),120,130),130,140),140,150),已知a ,b ,c 成等差数列,且区间130,140)与140,150)上的数据个数相差10,则区间110,120)上的数据个数为__________.图7-1820 由频率分布直方图得130,140)上的频率为0.025×10=0.25,140,150)上的频率为0.015×10=0.15.设样本容量为x ,则由题意知0.25x -0.15x =0.1x =10,解得x =100.因为a ,b ,c 成等差数列,则2b =a +c .又10a +10b +10c =1-0.25-0.15=0.6⇒a +b +c =0.06⇒3b =0.06,解得b =0.02.故区间110,120)上的数据个数为10×0.020×100=20.]7.从甲、乙两部门中各任选10名员工进行职业技能测试,测试成绩(单位:分)数据的茎叶图如图7-19(1)所示:(1)(2)图7-19(1)分别求出甲、乙两组数据的中位数,并比较两组数据的分散程度(只需给出结论);(2)甲组数据频率分布直方图如图7-19(2)所示,求a,b,c的值;(3)从甲、乙两组数据中各任取一个,求所取两数之差的绝对值大于20的概率.解](1)甲组数据的中位数为78+792=78.5,乙组数据的中位数为75+822=78.5.从茎叶图可以看出,甲组数据比较集中,乙组数据比较分散.3分(2)由题图易知a=0.05,b=0.02,c=0.01.7分(3)从甲、乙两组数据中各任取一个,得到的所有基本事件共有100个,其中满足“两数之差的绝对值大于20”的基本事件有16个,故所求概率P=16100=425.12分8.(2016·河南六市联考)在某大学自主招生考试中,所有选报Ⅱ类志向的考生全部参加了“数学与逻辑”和“阅读与表达”两个科目的考试,成绩分为A,B,C,D,E五个等级.某考场考生的两科考试成绩的数据统计如图7-20所示,其中“数学与逻辑”科目的成绩为B的考生有10人.图7-20(1)求该考场考生中“阅读与表达”科目中成绩为A的人数;(2)若等级A,B,C,D,E分别对应5分,4分,3分,2分,1分,求该考场考生“数学与逻辑”科目的平均分;(3)已知参加本考场测试的考生中,恰有2人的两科成绩均为A,在至少一科成绩为A的考生中,随机抽取2人进行访谈,求这2人的两科成绩均为A的概率.解](1)因为“数学与逻辑”科目中成绩等级为B的考生有10人,所以该考场有10÷0.25=40(人),2分所以该考场考生中“阅读与表达”科目中成绩等级为A的人数为40×(1-0.375-0.375-0.15-0.025)=40×0.075=3.4分(2)该考场考生“数学与逻辑”科目的平均分为1×(40×0.2)+2×(40×0.1)+3×(40×0.375)+4×(40×0.25)+5×(40×0.075)]÷40=2.9.8分(3)由题图可知,“数学与逻辑”科目的成绩为A的有3人,“阅读与表达”科目的成绩为A的有3人,因为恰有2人的两科成绩等级均为A,所以还有2人只有一个科目得分为A.设这4人为甲,乙,丙,丁,其中甲,乙是两科成绩都是A的同学,则在至少一科成绩等级为A的考生中,随机抽取2人进行访谈,基本事件空间为Ω={{甲,乙},{甲,丙},{甲,丁},{乙,丙},{乙,丁},{丙,丁}},一共有6个基本事件.设“随机抽取2人进行访谈,这2人的两科成绩等级均为A”为事件B,所以事件B中包含的基本事件有1个,则P(B)=16.12分。
用样本估计总体练习
2.2 用样本估计总体测试题第1题. 对于一组数据(,2,3,,),如果将它们改变为i Z C -(,2,,)其中0C ≠,则下面结论正确的是( ) A .平均数与方差均不变 B .平均数变了,而方差保持不变 C .平均数不变,而方差变了 D .平均数与方差均发生了变化答案:B .第2题. 一组数据的方差是,将这组数据中的每个数据都乘以2,所得到的一组新数据的方差是( )A .212SB .C .D .答案:D .第3题. 甲、乙两个总体各抽取一个样本,甲的样本均值为15,乙的样本均值为17,甲的样本方差为3,乙的样本方差为2, 的总体波动小. 答案:乙第4题. 在10人中,有4名学生,2名学校行政干部,3名专业教师,1名工人,数0.3是教师占总体分布的( ) A .频数 B .概率 C .频率 D .累积频率答案:C .第5题. 一组观察值为4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为( ) A .4.56 B .4.5 C .12.5D .1.64答案:A .第6题. 是,,,的平均数,是,,,的平均数,是,,,的平均数,则下列各式正确的是( ) A .4060100a bx +=B .6040100a bx +=C .x a b =+D .2a bx +=答案:A . 第7题. 已知一组数据,,,,的方差是2,并且2221210(3)(3)(3)120x x x -+-++-=…,求.答案:解:222212101()()()210S x x x x x x ⎡⎤=-+-++-=⎣⎦∵…222212101210()2()1020x x x x x x x x +++-++++=∴…… 即22221210()2101020x x x x x x +++-+=…222110()1020x x x ++-=∴….又222212101210()6()103120x x x x x x +++-++++⨯=……,2(2010)61090120x x +-+=∴,即2610x x --=,3x =∴第8题. 数据,,,的平均数为,方差为,则数据135x +,235x +,,35n x +的平均数和方差分别是( ) A .和 B .和 C .35x +和D .35x +和293025S S ++ 答案:C .第9题. 容量为100的样本数据,按从小到大的顺序分为8组,如下表:第3组的频数和频率分别是( ) A .14和0.14 B .0.14和14C .114和 D .13和114答案:A .第10题. 在用样本频率估计总体分布的过程中,下列说法正确的是( ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确答案:C .第11题. 已知数据,,,的平均数20x =,方差20.015S =.求: (1),,,的平均数和方差;(2)142x -,242x -,,1042x -的平均数和方差. 答案:解:(1)60x =',2290.135S S =='; (2)78x =',22160.24S S =='.第12题. 为了了解高三年级一、二班的数学学习情况,从两个班各抽出10名学生进行数学水平测试,成绩如下(单位:分) 一班:76,90,84,86,81,87,86,82,85,83 二班:82,84,85,89,79,80,91,89,79,74比较两组数据的方差,并估计一、二两个班哪个班学生的数学成绩比较整齐. 答案:解:2113.2S =,2226.36S =,一班比二班数学成绩更整齐.第13题. 某市对上、下班交通情况做抽样调查,上下班时间各抽取了12辆机动车行驶时速如下(单位km/h ):上班时间:30 33 18 27 32 40 26 28 21 28 35 20 下班时间:27 19 32 29 36 29 30 22 25 16 17 30 用茎叶图表示上面的样本数据,并求出样本数据的中位数. 答案:上班时间的中位数是:28; 下班时间的中位数是:27,29.第14题. 样本12310a a a a ,,,,的平均数为,样本12310b b b b ,,,,的平均数为,那么样本1122331010a b a b a b a b ,,,,,,,,的平均数是( ) A . B .1()2a b +C .2()a b +D .1()10a b +答案:B第15题. 甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环)如果甲、乙两人中只有1人入选,则入选的应是 . 答案:甲第16题. 将容量为100的样本数据,按由小到大的排列顺序分成8个组12 3 48 887610 532067925799 0026上班时间下班时间则第3组的频率为( ) A .0.14 B .114 C .0.03 D .314答案:A第17题. 样本12310a a a a ,,,,的平均数为12,样本128b b b ,,,的平均数为5,则样本112288910a b a b a b a a ,,,,,,,,的平均数为 . 答案:809第18题. 将一个容量为的样本分成若干组,已知某组的频数和频率分别为30和0.25,则 . 答案:120第19题. 已知10个数如下:63,65,67,69,66,64,66,64,65,68,对这些数据编制频率分布表,其中(64.566.5),的频率是 . 答案:0.4第20题. 甲、乙两种冬小麦试验品连续5年的平均单位面积产量见表(1)求两种小麦的平均年产量(2)试根据这组数据估计哪一种小麦品种产量较稳定 答案:(1)10,10(2)20.02s =甲,20.244s =乙22s s <乙甲∴即甲稳定.第21题. 某校为了了解学生的课外阅读情况,随机调查了50名学生得到他们在某一天各自课外阅读所用时间的数据,结果用条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( ) A . B . C . D .答案:B第22题. 描述总体稳定性的特征数是,以下统计量能估计总体的稳定性的有( ) A .样本平均值 B .样本方差 C .样本最大值 D .样本最小值答案:B第23题. 已知一个样本12n x x x ,,,,其标准差8.5S =,另一样本12353535n x x x +++,,,,其标准差为 .答案:第24题. 在频率分布直方图中共有11个小长方形,若中间一个小长方形面积等于所有各长方形面积和的14,样本容量是160,则中间一组的频数是( )时间A.32 B.0.2 C.40 D.0.25 答案:C。
高中数学一对一辅导资料——用样本估计总体的相关问题.doc
高中数学一对一辅导资料——用样本估计
总体的相关问题
首先是用样本估计总体的基础知识点总结:
1.统计图表
(1)频率分布直方图的画法步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
(2)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
(3)茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
2.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
高中数学重点知识归纳,今天就学习到这里啦,如果喜欢也欢迎收藏或者转发给更多人哦,期待留言一起讨论。
【山东省】2017年高考数学(理科)-用样本估计总体-专题练习(三)-答案
山东省2017年高考数学(理科)专题练习(三)用样本估计总体答案【真题回访】回访一频率分布表或频率分布直方图1.D2.B回访二茎叶图6.8812.6(2)频率分布直方图如图:估计总体数据落在12.95,[13.95)中的概率为()0.60.80.50.7+⨯=.山东省2017年高考数学(理科)专题练习(三)用样本估计总体解析【真题回访】回访一频率分布表或频率分布直方图1.D [由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.]2.B [由题图可知,车速大于或等于70 km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆).]回访二茎叶图解()频率分布直方图如图所示:2611.C [分析频率分布折线图可知众数为115,故选C.] 2.D [样本中高三年级的人数为280400+320+280×50=14.]3.B [显然500大于这50个学生的平均体重,则这51个数据的平均数一定增大,中位数可能增大也可能不变,故选B.]4.B [依题意可得10×(0.005+0.010+0.020+a +0.035)=1,解得a =0.030,故身高在[120,130),[130,140),[140,150]三组内的学生比例为3∶2∶1,所以从身高在[140,150]内的学生中选取的人数应为3.] 5.C [依题意,平均数x =20+60+30+7+9+1+56=22,故优秀工人只有2人,从中任取2人共有C 26=15种情况,其中至少有1名优秀工人的情况有C 26-C 24=9种,故至少有1名优秀工人的概率P =915=35,故选C.] 二、填空题6.0.024,1 000[由5×(0.06+0.05+0.04+x +0.016+0.01)=1,得x =0.024.在样本中,体重在[55,70)的女生的频率为5×(0.01+0.04+0.05)=0.5,所以该校体重在[55,70)的女生估计有2 000×0.5=1 000人.] 7.1 [当x ≥4时,89+89+92+93+92+91+947=6407≠91, ∴x <4,∴89+89+92+93+92+91+x +907=91, ∴x =1.]8.乙,甲[根据茎叶图可知,甲种树苗中的高度比较集中,则甲种树苗比乙种树苗长得整齐;而通过计算可得,x 甲=27,x 乙=30,即乙种树苗的平均高度大于甲种树苗的平均高度.] 三、解答题 9.[解](1)由10×(0.005+0.01+0.02+a +0.025+0.01)=1, 得a =0.03.根据频率分布直方图,成绩不低于60分的频率为1-10×(0.005+0.01)=0.85.估计期中考试数学成绩不低于60分的人数约为640×0.85=544(人).(2)成绩在[40,50)分数段内的人数为40×0.05=2,成绩在[90,100]分数段内的人数为40×0.1=4,则记在[40,50)分数段的两名同学为A 1,A 2,在[90,100]分数段内的同学为B 1,B 2,B 3,B 4. 若从这6名学生中随机抽取2人,则总的取法共有15种.如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值不大于10,则所取2名学生的数学成绩之差的绝对值不大于10的取法有(A 1,A 2),(B 1,B 2),(B 1,B 3),(B 1,B 4),(B 2,。
高三数学一轮复习讲义(用样本估计总体)学生
课题:用样本估计总体知识点一、频率分布直方图1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的特征数估计总体的特征数.(2)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.2.频率分布折线图和总体密度曲线 (1)频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图. (2)总体密度曲线随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.统计中称之为总体分布的密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.3.作频率分布直方图的步骤:(1)作出频率分布表:①求极差(即一组数据中最大值与最小值得差)②决定组距和组数:绘制频数分布表和频数分布直方图时要将一批数据分组,•组距和组数的确定没有固定的标准,通常数据越多,所分的组数也越多,当数据在100个以内时,•根据数据的多少常分成5─12组.一般地,所分的小组里含最小值,不含最大值,•即数据x 满足a ≤x<b(2)建立直角坐标系:X 轴为组距;Y 轴为频率/组距4.在频率直方图中,众数是最高的小长方形的底边的中点横坐标的值;中位数是所有小长方形的面积相等的分界线;平均数是各小长方形底边中点的横坐标与对应频率的积的和.【典型例题】【例1】(2023·全国·高三专题练习)某校1000名学生参加数学竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( ) A .频率分布直方图中aB .估计这20名学生数学考试成绩的第60百分位数为80C .估计这20名学生数学考试成绩的众数为80D .估计总体中成绩落在[50,60)内的学生人数为110【例2】(2022·天津滨海新·模拟预测)某品牌家电公司从其全部200名销售员工中随机抽出50名调查销售情况,销售额都在区间[5,25](单位:百万元)内,将其分成5组:[5,9),[9,13,[13,17),[17,21),[21,25],并整理得到如下的频率分布直方图,下列说法正确的是( ) A .频率分布直方图中aB .估计全部销售员工销售额的中位数为15C .估计全部销售员工中销售额在区间[9,13内有64人D .估计全部销售员工销售额的第75百分位数为17【例3】(2022·全国·模拟预测)(多选)某城市地铁交通建设项目已经基本完成,为了解市民对该项目的满意度,分别从不同地铁站点随机抽取1000名市民对该项目进行评分,统计发现评分均在[]40,100内,把评分分成[)40,50,[)50,60,[)60,70,[)70,80,[)80,90,[]90,100六组,并绘制成频率分布直方图(如图所示).则下列判断正确的是( ) A .图中aB .该次满意度评分的平均分为85C .该次满意度评分的众数为85D .大约有34%的市民满意度评分在[)60,80内【例4】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a ,b 的值;【举一反三】1.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a =_________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为_________.2.(2022·全国·高三专题练习)某区政府组织了以“不忘初心,牢记使命”为主题的教育活动,为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n 名,获得了他们一周参与主题教育活动时间(单位:h )的频率分布直方图如图所示,已知参与主题教育活动时间在(]12,16内的人数为92. (1)求n 的值;(2)以每组数据所在区间的中点值作为本组的代表,估算这些党员干部参与主题教育活动时间的中位数(中位数精确到0.01).(3)如果计划对参与主题教育活动时间在(]16,24内的党员干部给予奖励,且在(]16,20,(]20,24内的分别评为二等奖和一等奖,那么按照分层抽样的方法从获得一、二等奖的党员干部中选取5人参加社区义务宣讲活动,再从这5人中随机抽取2人作为主宣讲人,求这2人均是二等奖的概率.知识点二、茎叶图茎叶图:定义是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数画法对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎优缺点用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图中得到;(2)便于记录和读取,能够展示数据的分布情况.缺点是:当样本数据较多或数据位数较多时,茎叶图就显得不太方便【典型例题】【例1】为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h ),试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 服用B 药的20位患者日平均增加的睡眠时间: (1)作出茎叶图;(2)从茎叶图看,哪种药的疗效更好?A 药B 药 0. 1. 2.3.【例2】某中学高三年级从甲、乙两个班级各选出8名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的平均分是86,乙班学生成绩的中位数是83,则x y +的值为( ) A .9 B .10 C .11 D .13【举一反三】1.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图I 所示;若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为( )A 、3B 、4C 、5D 、6 2.某车间20名工人年龄数据如下表:年龄(岁) 工人数(人)19 1 28 3 29 3 30 5 31 4 32 3 40 1 合计20知识三、用样本的数字特征估计总体的数字特征1.用样本的特征数估计总体的特征数 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:样本数据的算术平均数,即12n 1(x +x +...+x )x n=. 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 样本方差2222121[()()...()]n s x x x x x x n=-+-++- 标准差222121[()()...()]n s x x x x x x n=-+-++-其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.2.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.3.在频率直方图中,众数是最高的小长方形的底边的中点横坐标的值;中位数是所有小长方形的面积相等的分界线;平均数是各小长方形底边中点的横坐标与对应频率的积的和.4.平均数与方差都是重要的特征数,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,掌握公式不难求出,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.【典型例题】【例1】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( ) A .46,45,56 B .46,45,53 C .47,45,56 D .45,47,53【例2】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)[)00.50.5,1⋅⋅⋅,,,[]4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的a 值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.请说明理由;(3)估计居民月均用水量的中位数.【举一反三】1.某市高三学生数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若130~140分数段的人数为90人,则90~100分数段的人数为_____.2.(2022·新疆克拉玛依·三模(文))第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a 的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.【课堂巩固】1.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( ) A .众数 B .平均数 C .中位数 D .标准差2.某班学生一次数学考试成绩频率分布直方图如图所示,数据分组依次为]150,130[),130,110[),110,90[),90,70[,若成绩大于等于90分的人数为36,则成绩在)130,110[的人数为()A.12B.9C.15D.183.为了研究某药物的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,右图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.184.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为.【课后练习】正确率:__________1.某学校高一、高二、高三年级的学生人数之比为4:3:3,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则从高二年级抽取的学生人数为()A.15 B.20 C.25 D.302.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析。
专题限时集训7 探索世界与把握规律公开课教案教学设计课件资料
专题限时集训(七)探索世界与把握规律一、判断题1.心想定然事成犯了客观唯心主义的错误。
()F[心想定然事成是把人的主观精神理解为世界的本原,犯的是主观唯心主义的错误。
]2.哲学对具体科学的指导作用要具体分析。
()T【哲学因性质不同,其对具体科学的指导作用是不同的,所以对其作用要具体情况具体分析。
]3.人类意识能够把观念的东西变成现实的东西。
()F[人类意识没有直接现实性,只有通过实践才能把观念的东西变成现实的东西,其自身不能实现这一点。
]4.要坚持从人民群众的愿望出发去实施十四五规划。
()F[我们要坚持一切从实际出发,而不能从主观愿望出发,不能将主观愿望当作工作的出发点或落脚点。
]5.并非任何事物之间都是相互联系的。
()T[联系是普遍的,并不意味着任何事物之间都存在联系,联系是有条件的。
]6.整体功能大于部分功能之和。
()F[整体功能不是部分功能的简单相加,整体功能可能大于部分功能之和,也可能小于部分功能之和,关键看整体内部的各部分之间的关系情况。
]7.要根据情况决定是否加强量的积累。
()T[如果需要通过量变引起质变时,要加强量的积累;如果需要防止事物的质变时,要控制量的积累。
]8.量变必然引起质变。
()F[量变只有积累到一定程度才能引起质变,所以并非所有量变都会引起质变。
]9.解决问题要把握好寓于斗争性中的同一性。
()F[解决问题需要将斗争性和同一性结合起来,但是,斗争性寓于同一性之中,不能将它们的位置颠倒。
]10.矛盾的次要方面对事物的性质没有影响。
()F[事物的性质主要由主要矛盾的主要方面决定的,但依然受到次要方面的影响。
]二、选择题∏.(2023•浙江绍兴模拟)《实践论》《矛盾论》作为马克思主义哲学中国化的经典之作,在撰写上以自然科学知识为有力论据,在世界观和方法论上为科技发展提供思路谋划和策略指导,成为推动我国科技事业稳步发展的重要力量。
这说明()①哲学离不开具体科学②思维和存在具有同一性③哲学是具体科学的总和④哲学为具体科学提供指导A. B.(D@C.dX3)D.@@B[《实践论》《矛盾论》在撰写上以自然科学知识为有力论据,说明哲学离不开具体科学,在世界观和方法论上为科技发展提供思路谋划和策略指导,成为推动我国科技事业稳步发展的重要力量,说明哲学为具体科学提供指导,①④正确。
高考常考基础题7 用样本估计总体(理)
高考常考基础题7 用样本估计总体(理)1.(2020全国Ⅲ理3)在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且∑==411i ip,则下面四种情形中,对应样本的标准差最大的一组是( )A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====2.(2019全国II 理5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差 D .极差3.(2019全国II 理13)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为__________.4.(2018全国Ⅰ理)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例建设后经济收入构成比例则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半5.(2017新课标Ⅲ理)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳6.(2016年全国III 理)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下面叙述不正确的是A .各月的平均最低气温都在0℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D .平均气温高于20℃的月份有5个7.(2015安徽理)若样本数据1x ,2x ,⋅⋅⋅,10x 的标准差为8,则数据121x -,221x -,⋅⋅⋅,1021x -的标准差为A .8B .15C .16D .178.(2014广东理)已知某地区中小学生人数和近视情况分别如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别是A .200,20B .100,20C .200,10D .100,109.(2013山东理)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以表示:则7个剩余分数的方差为( )A .B .C .36D .10.(2019全国III 理17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A 、B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).x 9 4 0 1 0 x 9 18 7 71169367711.(2013年新课标I 理)为了比较两种治疗失眠症的药(分别称为药,药)的疗效,随机地选取位患者服用药,位患者服用药,这位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:),试验的观测结果如下: 服用药的位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用药的位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5 (1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?A B 20A 20B 40h A 20B 2012.(2016年四川理)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨)、一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.(I)求直方图中a的值;(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(III)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.。
16-17版 第1部分 专题3 突破点7 用样本估计总体
突破点7 用样本估计总体提炼1 频率分布直方图 (1)频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距. (2)频率分布直方图中各小长方形的面积之和为1.(3)利用频率分布直方图求众数、中位数与平均数,在频率分布直方图中: ①最高的小长方形底边中点的横坐标即是众数; ②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.提炼2 茎叶图的优点 (1)所有的信息都可以从茎叶图中得到.(2)可以帮助分析样本数据的大致频率分布情况.提炼3 样本的数字特征 (1)众数、中位数.(2)样本平均数x =1n (x 1+x 2+…+x n ).(3)样本方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].(4)样本标准差s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].回访 用样本估计总体1.(2016·全国乙卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:图记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数.(1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?[解] (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700,所以y 与x 的函数解析式为y =⎩⎨⎧ 3 800,x ≤19,500x -5 700,x >19(x ∈N ).4分 (2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.6分(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4300×20+4 800×10)=4 000.8分若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050. 10分比较两个平均数可知,购买1台机器的同时应购买19个易损零件.12分2.(2014·全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?[解] (1)4分(2)质量指标值的样本平均数为x -=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.6分质量指标值的样本方差为s 2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.8分(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.10分由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.12分3.(2013·全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.23.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.12.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.31.4 1.60.5 1.80.6 2.1 1.1 2.5 1.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?图[解](1)设A药观测数据的平均数为x,B药观测数据的平均数为y.由观测结果可得x=120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,2分y=120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.4分由以上计算结果可得x >y ,因此可看出A 药的疗效更好.6分(2)由观测结果可绘制茎叶图如图:9分从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎“2.”,“3.”上,而B 药疗效的试验结果有710的叶集中在茎“0.”,“1.”上,由此可看出A 药的疗效更好.12分热点题型1 频率分布直方图题型分析:频率分布直方图多以生活中的实际问题为背景,考查学生运用已知数据分析问题的能力,难度中等.(2016·合肥三模)某高中为了解全校学生每周参与体育运动的情况,随机从全校学生中抽取100名学生,统计他们每周参与体育运动的时间如下:(2)①估计该校学生每周参与体育运动的时间的中位数及平均数;②若该校有学生3 000人,根据以上抽样调查数据,估计该校学生每周参与体育运动的时间不低于8小时的人数.[解] (1)频率分布直方图如图所示:(2)①由数据估计中位数为4+2640×4=6.6,8分估计平均数为2×0.24+6×0.4+10×0.28+14×0.06+18×0.02=6.88.10分 ②将频率看作概率知P (t ≥8)=0.36,∴3 000×0.36=1 080.12分解决该类问题的关键是正确理解已知数据的含义.掌握图表中各个量的意义,通过图表对已知数据进行分析.提醒:(1)小长方形的面积表示频率,其纵轴是频率组距,而不是频率. (2)各组数据频率之比等于对应小长方形的高度之比.[变式训练1] 某电子商务公司随机抽取1 000名网络购物者进行调查.这1 000名购物者2015年网上购物金额(单位:万元)均在区间[0.3,0.9]内,样本分组为:[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7),[0.7,0.8),[0.8,0.9],购物金额的频率分布直方图如下:图7-3电子商务公司决定给购物者发放优惠券,其金额(单位:元)与购物金额关系如下:(2)以这1 000名购物者购物金额落在相应区间的频率作为概率,求一个购物者获得优惠券金额不少于150元的概率.[解](1)购物者的购物金额x与获得优惠券金额y的频率分布如下表:这50×400+100×300+150×280+200×201 000=96.4分(2)由获得优惠券金额y与购物金额x的对应关系,有P(y=150)=P(0.6≤x<0.8)=(2+0.8)×0.1=0.28,P(y=200)=P(0.8≤x≤0.9)=0.2×0.1=0.02,10分从而,获得优惠券不少于150元的概率为P(y≥150)=P(y=150)+P(y=200)=0.28+0.02=0.3.12分热点题型2茎叶图题型分析:结合样本数据和茎叶图对总体作出估计是高考命题的热点,应引起足够的重视,难度中等.(2016·福州模拟)长时间用手机上网严重影响着学生的身体健康,某校为了解A,B两班学生手机上网的时长,分别从这两个班中随机抽取5名同学进行调查,将他们平均每周手机上网的时长作为样本,绘制成茎叶图如图7-4所示(图中的茎表示十位数字,叶表示个位数字).图7-4(1)分别求出图中所给两组样本数据的平均值,并据此估计哪个班的学生平均上网时间较长;(2)从A班的样本数据中随机抽取一个不超过19的数据记为a,从B班的样本数据中随机提取一个不超过21的数据记为b,求a>b的概率.[解](1)A班样本数据的平均值为15(9+11+14+20+31)=17.3分由此估计A班学生每周平均上网时间17小时;B班样本数据的平均值为15(11+12+21+25+26)=19,由此估计B班学生每周平均上网时间较长.6分(2)A班的样本数据中不超过19的数据a有3个,分别为9,11,14,B班的样本数据中不超过21的数据b也有3个,分别为11,12,21,从A班和B班的样本数据中各随机抽取一个共有:9种不同情况,分别为(9,11),(9,12),(9,21),(11,11),(11,21),(11,21),(14,11),(14,12),(14,21),其中a>b的情况有(14,11),(14,12)两种,故a>b的概率P=29.12分作茎叶图时先要弄清“茎”和“叶”分别代表什么,根据茎叶图,可以得到数据的众数、中位数,也可从图中直接估计出两组数据的平均数大小与稳定性.[变式训练2](名师押题)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.[解](1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21.2分(2)这20名工人年龄的茎叶图如下:6分(3)这20名工人年龄的平均数x =120(19×1+28×3+29×3+30×5+31×4+32×3+40×1)=30,8分故方差s 2=120[1×(19-30)2+3×(28-30)2+3×(29-30)2+5×(30-30)2+4×(31-30)2+3×(32-30)2+1×(40-30)2]=120×(121+12+3+0+4+12+100)=12.6.12分。
高中数学 专题1.7 用样本的频率分布估计总体分布练习(含解析)新人教A版必修3(2021年整理)
2016-2017学年高中数学专题1.7 用样本的频率分布估计总体分布练习(含解析)新人教A版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学专题1.7 用样本的频率分布估计总体分布练习(含解析)新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学专题1.7 用样本的频率分布估计总体分布练习(含解析)新人教A版必修3的全部内容。
用样本的频率分布估计总体分布1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是 ( ).A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确2。
10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,数0.4是指1号球占总体分布的A。
频数 B.频率 C。
频率/组距 D.累计频率3.如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20)内的频数为()A.20 B.30 C.40 D.504。
某校为了了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是()A.10 B.2 C.5 D.155.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53【解析】由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.【答案】A6.(2016·东营高一检测)从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.【答案】96 92 乙7.一个容量为n的样本分成若干组,已知某组的频数和频率分别是30和0。
高中数学 专题突破练3 数据的数字特征用样本估计总体 新人教A版必修3(2021年整理)
2017年高中数学专题突破练3 数据的数字特征用样本估计总体新人教A版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017年高中数学专题突破练3 数据的数字特征用样本估计总体新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017年高中数学专题突破练3 数据的数字特征用样本估计总体新人教A版必修3的全部内容。
专题3 数据的数字特征用样本估计总体1.中心位置特征:众数、中位数、平均数.2.标准差、方差标准差是样本数据到平均数的一种平均距离,一般用s表示.其计算公式为s=错误!.3.样本数据x1,x2,…,x n的标准差的算法(1)算出样本数据的平均数x;(2)算出每个样本数据与样本数据平均数的差:x i-x(i=1,2,…,n);(3)算出(2)中x i-x(i=1,2,…,n)的平方;(4)算出(3)中n个平方数的平均数,即为样本方差;(5)算出(4)中平均数的算术平方根,即为样本标准差.4.方差从数学的角度考虑,人们有时用标准差的平方s2(即方差)来代替标准差,作为测量样本数据分散程度的工具:s2=错误![(x-x)2+(x2-x)2+…+(x n-x)2].1例1 在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表:分组频数频率[1.30,1.34)4[1.34,1.38)25[1.38,1。
42)30[1。
42,1.46)29[1。
46,1。
1050)[1.50,1.54]2合计100(1)完成频率分布表,并画出频率分布直方图;(2)估计纤度落在[1.38,1.50)内的可能性及纤度小于1.42的可能性各是多少?变式训练1 在某次法律知识竞赛中,将来自不同学校的学生的成绩绘制成如图所示的频率分布直方图.已知成绩在60~70的学生有40人,则成绩在70~90的有______人.例2 甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列正确的是( )A.x甲>x乙;乙比甲成绩稳定B.x甲>x乙;甲比乙成绩稳定C.x甲<x乙;乙比甲成绩稳定D.x甲〈x乙;甲比乙成绩稳定变式训练2 为选拔运动员参加比赛,测得7名选手的身高(单位:cm),其茎叶图分布为:记录的平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数字记为x,那么x的值为( )A.5 B.6 C.7 D.8例3 甲、乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测10个,它们的尺寸(单位:mm)分别为:甲:10。
课时作业17:2.2.2 用样本的数字特征估计总体的数字特征
2.2.2 用样本的数字特征估计总体的数字特征一、选择题1.如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是( )A .32 34 32B .33 45 35C .34 45 32D .33 36 35答案 B解析 从茎叶图中知共16个数据,按照从小到大排序后中间的两个数据为32,34,所以这组数据的中位数为33;45出现的次数最多,所以这组数据的众数为45; 最大值是47,最小值是12,故极差是35.2.某台机床加工的五批同数量的产品中次品数的频率分布如表:次品数 0 1 2 3 4 频率0.50.20.050.20.05则次品数的平均数为( ) A .1.1 B .3 C .1.5 D .2 答案 A解析 设数据x i 出现的频率为p i (i =1,2,…,n ),则x 1,x 2,…,x n 的平均数为x 1p 1+x 2p 2+…+x n p n =0×0.5+1×0.2+2×0.05+3×0.2+4×0.05=1.1,故选A.3.样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为( ) A.65B.65 C .2 D. 2 答案 D解析 ∵样本a,0,1,2,3的平均数为1, ∴a +65=1,解得a =-1. 则样本的方差s 2=15×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故标准差为 2.故选D.4.设样本数据x 1,x 2,…,x 10的平均数和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的平均数和方差分别为( ) A .1+a,4 B .1+a,4+a C .1,4 D .1,4+a答案 A解析 ∵x 1,x 2,…,x 10的平均数x =1,方差s 21=4, 且y i =x i +a (i =1,2,…,10), ∴y 1,y 2,…,y 10的平均数 y =110·(y 1+y 2+…+y 10)=110·(x 1+x 2+…+x 10+10a )=110·(x 1+x 2+…+x 10)+a =x +a =1+a ,其方差s 22=110·[(y 1-y )2+(y 2-y )2+…+(y 10-y )2]=110[(x 1-1)2+(x 2-1)2+…+(x 10-1)2] =s 21=4.故选A.5.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值为( )A .62,62.5B .65,62C .65,62.5D .62.5,62.5答案 C解析 ∵最高的矩形为第三个矩形, ∴时速的众数的估计值为65.前两个矩形的面积为(0.01+0.03)×10=0.4. ∵0.5-0.4=0.1,0.10.4×10=2.5,∴中位数的估计值为60+2.5=62.5. 故选C.6.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( ) A .a >b >c B .b >c >a C .c >a >bD .c >b >a答案 D解析 由已知得a =110×(15+17+14+10+15+17+17+16+14+12)=14.7,b =12×(15+15)=15,c =17, ∴c >b >a .故选D.7.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为:x ,y,105,109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x -y |的值为( ) A .15 B .16 C .17 D .18答案 D解析 由题意得,x +y +105+109+1105=108,①(x -108)2+(y -108)2+9+1+45=35.2,②由①②解得⎩⎪⎨⎪⎧ x =99,y =117,或⎩⎪⎨⎪⎧x =117,y =99,所以|x -y |=18.故选D.8.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ) A .57.2,3.6 B .57.2,56.4 C .62.8,63.6 D .62.8,3.6答案 D解析 每一个数据都加上60,所得新数据的平均数增加60,而方差保持不变.9.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示.若甲、乙两人的平均成绩分别是x 甲,x 乙,则下列结论正确的是( )A.x 甲<x 乙;乙比甲成绩稳定B.x 甲>x 乙;甲比乙成绩稳定C.x 甲>x 乙;乙比甲成绩稳定D.x 甲<x 乙;甲比乙成绩稳定 答案 A解析 甲同学的成绩为78,77,72,86,92,乙同学的成绩为78,82,88,91,95, 所以x 甲=15×(78+77+72+86+92)=81,x 乙=15×(78+82+88+91+95)=86.8.所以x 甲<x 乙,从叶在茎上的分布情况来看,乙同学的成绩更集中于平均值附近,这说明乙比甲成绩稳定. 二、填空题10.一组数据2,x,4,6,10的平均数是5,则此组数据的标准差是________. 答案 2 2解析 ∵一组数据2,x,4,6,10的平均数是5, ∴2+x +4+6+10=5×5, 解得x =3,∴此组数据的方差s 2=15×[(2-5)2+(3-5)2+(4-5)2+(6-5)2+(10-5)2]=8,∴此组数据的标准差s =2 2.11.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70分~99分),若甲、乙两组学生的平均成绩一样,则a =________;甲、乙两组学生的成绩相对稳定的是________.答案 5 甲组解析 由题意可知75+88+89+98+90+a5=76+85+89+98+975=89,解得a =5.因为s 2甲=15×[(-14)2+(-1)2+0+92+62]=3145,s 2乙=15×[(-13)2+(-4)2+0+92+82]=3305, 所以s 2甲<s 2乙,故成绩相对稳定的是甲组.12.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为________. 答案 5743解析 ∵-1,0,4,x,7,14的中位数为5, ∴4+x2=5,∴x =6.∴这组数据的平均数是-1+0+4+6+7+146=5,这组数据的方差是16×(36+25+1+1+4+81)=743.三、解答题13.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)内的用户中应抽取多少户? 解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得x =0.007 5, 故直方图中x 的值是0.007 5.(2)月平均用电量的众数为220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5, ∴月平均用电量的中位数在[220,240)内, 设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5, 得a =224,即月平均用电量的中位数为224.(3)月平均用电量在[220,240)内的有0.012 5×20×100=25(户), 月平均用电量在[240,260)内的有0.007 5×20×100=15(户), 月平均用电量在[260,280)内的有0.005×20×100=10(户), 月平均用电量在[280,300]内的有0.002 5×20×100=5(户), 抽取比例为1125+15+10+5=15,∴月平均用电量在[220,240)内的用户中应抽取25×15=5(户).14.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和x B ,样本标准差分别为s A 和s B ,则( )A.x A >x B ,s A >s BB.x A <x B ,s A >s BC.x A >x B ,s A <s BD.x A <x B ,s A <s B答案 B解析 由题图知,A 组的6个数分别为 2.5,10,5,7.5,2.5,10;B 组的6个数分别为15,10,12.5,10,12.5,10,所以x A =2.5+10+5+7.5+2.5+106=254,x B =15+10+12.5+10+12.5+106=353.显然x A <x B .又由图形可知,B 组数据的分布比A 组的均匀,变化幅度不大,故B 组数据比较稳定,方差较小,从而标准差较小,所以s A >s B .15.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.答案 50 1 015 解析 由分层抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为 1 020×50%+980×20%+1 030×30%=1 015(小时).。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题限时集训(七) 用样本估计总体[建议A、B组各用时:45分钟][A组高考达标]一、选择题1.(2016·山西考前模拟)某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图7-5所示),据此估计此次考试成绩的众数是()图7-5A.100B.110C.115 D.120C[分析频率分布折线图可知众数为115,故选C.]2.(2016·南昌二模)如图7-6所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20)内的频数是()图7-6A.50 B.40C.30 D.14C[因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30,故选C.]3.(2016·青岛模拟)已知数据x1,x2,x3,…,x50,500(单位:kg),其中x1,x2,x3,…,x50是某班50个学生的体重,设这50个学生体重的平均数为x, 中位数为y,则x1,x2,x3,…,x50,500这51个数据的平均数、中位数分别与x,y 比较,下列说法正确的是()【导学号:85952030】A.平均数一定变大,中位数一定变大B.平均数一定变大,中位数可能不变C.平均数可能不变,中位数可能不变D.平均数可能不变,中位数可能变小B[显然500大于这50个学生的平均体重,则这51个数据的平均数一定增大,中位数可能增大也可能不变,故选B.]4.(2016·沈阳模拟)从某小学随机抽取100名同学,现已将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图7-7).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为()图7-7A.2 B.3C.4 D.5B[依题意可得10×(0.005+0.010+0.020+a+0.035)=1,解得a=0.030,故身高在[120,130),[130,140),[140,150]三组内的学生比例为3∶2∶1,所以从身高在[140,150]内的学生中选取的人数应为3.]图7-85.(2016·郑州模拟)某车间共有6名工人,他们某日加工零件个数的茎叶图如图7-8所示,其中茎为十位数,叶为个位数,日加工零件个数大于样本均值的工人为优秀工人.从该车间6名工人中,任取2人,则至少有1名优秀工人的概率为()A.815B.49C.35 D.19C[依题意,平均数x=20+60+30+(7+9+1+5)6=22,故优秀工人只有2人,从中任取2人共有C26=15种情况,其中至少有1名优秀工人的情况有C26-C24=9种,故至少有1名优秀工人的概率P=915=35,故选C.]二、填空题6.某中学共有女生2 000人,为了了解学生体质健康状况,随机抽取100名女生进行体质监测,将她们的体重(单位:kg)数据加以统计,得到如图7-9所示的频率分布直方图,则直方图中x的值为________;试估计该校体重在[55,70)的女生有________人.图7-90.024 1 000[由5×(0.06+0.05+0.04+x+0.016+0.01)=1,得x=0.024.在样本中,体重在[55,70)的女生的频率为5×(0.01+0.04+0.05)=0.5,所以该校体重在[55,70)的女生估计有2 000×0.5=1 000人.]7.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图7-10所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.图7-101[当x≥4时,89+89+92+93+92+91+947=6407≠91,∴x<4,∴89+89+92+93+92+91+x+907=91,∴x=1.]8.从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图7-11.根据茎叶图,树苗的平均高度较高的是__________种树苗,树苗长得整齐的是__________种树苗.【导学号:85952031】图7-11乙甲[根据茎叶图可知,甲种树苗中的高度比较集中,则甲种树苗比乙种树苗长得整齐;而通过计算可得,x甲=27,x乙=30,即乙种树苗的平均高度大于甲种树苗的平均高度.]三、解答题9.(2016·太原二模)某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成如下六段:[40,50),[50,60),…,[90,100],得到如图7-12所示的频率分布直方图.图7-12(1)若该校高一年级共有学生640名,试估计该校高一年级期中考试数学成绩不低于60分的人数;(2)在抽取的40名学生中,若从数学成绩在[40,50)与[90,100]两个分数段内随机选取2名学生,求这2名学生的数学成绩之差的绝对值不大于10的概率.[解](1)由10×(0.005+0.01+0.02+a+0.025+0.01)=1,得a=0.03.2分根据频率分布直方图,成绩不低于60分的频率为1-10×(0.005+0.01)=0.85.4分估计期中考试数学成绩不低于60分的人数约为640×0.85=544(人).6分(2)成绩在[40,50)分数段内的人数为40×0.05=2,成绩在[90,100]分数段内的人数为40×0.1=4,则记在[40,50)分数段的两名同学为A1,A2,在[90,100]分数段内的同学为B1,B2,B3,B4.若从这6名学生中随机抽取2人,则总的取法共有15种.8分如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值不大于10,则所取2名学生的数学成绩之差的绝对值不大于10的取法有(A1,A2),(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共7种取法,所以所求概率为P=715.12分10.(2016·郑州一模)为了整顿道路交通秩序,某地考虑将对行人闯红灯进行处罚.为了更好地了解市民的态度,在普通行人中随机选取了200人进行调查,当不处罚时,有80人会闯红灯,处罚时,得到如下数据:(1)当罚金定为10元时,行人闯红灯的概率会比不进行处罚降低多少?(2)将先取的200人中会闯红灯的市民分为两类:A类市民在罚金不超过10元时就会改正行为;B类是其他市民.现对A类与B类市民按分层抽样的方法抽取4人依次进行深度问卷,则前两位均为B类市民的概率是多少.[解](1)设“当罚金定为10元时,闯红灯的市民改正行为”为事件A,2分则P(A)=40200=15.4分所以当罚金定为10元时,比不制定处罚,行人闯红灯的概率会降低15.6分(2)由题可知A类市民和B类市民各有40人,故分别从A类市民和B类市民中各抽出2人,设从A类市民中抽出的2人分别为A1,A2,从B类市民中抽出的2人分别为B1,B2.设“A类与B类市民按分层抽样的方法抽取4人依次进行深度问卷”为事件M,8分则事件M中首先抽出A1的事件有:(A1,A2,B1,B2),(A1,A2,B2,B1),(A1,B1,A2,B2),(A1,B1,B2,A2),(A1,B2,A2,B1),(A1,B2,B1,A2),共6种.同理首先抽出A2,B1,B2的事件也各有6种.故事件M共有24种.10分设“抽取4人中前两位均为B类市民”为事件N,则事件N有(B1,B2,A1,A2),(B1,B2,A2,A1),(B2,B1,A1,A2),(B2,B1,A2,A1).∴P(N)=424=16.12分[B组名校冲刺]一、选择题1.已知甲、乙两组数据的茎叶图如图7-13所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值mn=()图7-13A.1 B.1 3C.38 D.29C[由茎叶图可知乙的中位数是32+342=33,根据甲、乙两组数据的中位数相同,可得m=3,所以甲的平均数为27+33+393=33,又由甲、乙两组数据的平均数相同,可得20+n +32+34+384=33,解得n =8,所以m n =38,故选C.]2.(2016·山西四校二联)某学校组织学生参加数学测试,成绩的频率分布直方图如图7-14,数据的分组依次为[20,40),[40,60),[60,80),[80,100),若低于60分的人数是15,则该班的学生人数是( )图7-14A .45B .50C .55D .60B [∵[20,40),[40,60)的频率为(0.005+0.01)×20=0.3,∴该班的学生人数是150.3=50.]3.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图7-15),已知图中从左到右的前3个小组的频率之比为1∶ 2∶ 3,第2小组的频数为120,则抽取的学生人数是( )图7-15A .240B .280C .320D .480D [由频率分布直方图知:学生的体重在65~75 kg 的频率为(0.012 5+0.037 5)× 5=0.25,则学生的体重在50~65 kg 的频率为1-0.25=0.75.从左到右第2个小组的频率为0.75×26=0.25.所以抽取的学生人数是120÷0.25=480, 故选D.]4.3个老师对某学校高三三个班级各85人的数学成绩进行分析,已知甲班平均分为116.3分,乙班平均分为114.8分,丙班平均分为115.5分,成绩分布直方图如图7-16,据此推断高考中考生发挥差异较小的班级是()图7-16A.甲B.乙C.丙D.无法判断C[由于平均分相差不大,由直方图知丙班中,学生成绩主要集中在110~120区间上且平均分较高,其次是乙,分数相对甲来说比较集中,相对丙而言相对分散.数据最分散的是甲班,虽然平均分较高,但学生两极分化,彼此差距较大,根据标准差的计算公式和性质知甲的方差大于乙的方差大于丙的方差,所以丙班的学生发挥差异较小.故选C.]二、填空题5.已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.图7-17(1)若第1组抽出的号码为2,则所有被抽出职工的号码为________;(2)分别统计这5名职工的体重(单位:kg),获得体重数据的茎叶图如图7-17所示,则该样本的方差为________.(1)2,10,18,26,34(2)62[(1)分段间隔为405=8,则所有被抽出职工的号码为2,10,18,26,34.(2)x=15(59+62+70+73+81)=69.s 2=15[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.]6.如图7-18是某个样本的频率分布直方图,分组为[100,110),[110,120),[120,130),[130,140),[140,150),已知a ,b ,c 成等差数列,且区间[130,140)与[140,150)上的数据个数相差10,则区间[110,120)上的数据个数为__________.图7-1820 [由频率分布直方图得[130,140)上的频率为0.025×10=0.25,[140,150)上的频率为0.015×10=0.15.设样本容量为x ,则由题意知0.25x -0.15x =0.1x =10,解得x =100.因为a ,b ,c 成等差数列,则2b =a +c .又10a +10b +10c =1-0.25-0.15=0.6⇒a +b +c =0.06⇒3b =0.06,解得b =0.02.故区间[110,120)上的数据个数为10×0.020×100=20.]三、解答题7.从甲、乙两部门中各任选10名员工进行职业技能测试,测试成绩(单位:分)数据的茎叶图如图7-19(1)所示:(1) (2)图7-19(1)分别求出甲、乙两组数据的中位数,并比较两组数据的分散程度(只需给出结论);(2)甲组数据频率分布直方图如图7-19(2)所示,求a ,b ,c 的值;(3)从甲、乙两组数据中各任取一个,求所取两数之差的绝对值大于20的概率.[解](1)甲组数据的中位数为78+792=78.5,乙组数据的中位数为75+822=78.5.从茎叶图可以看出,甲组数据比较集中,乙组数据比较分散.3分(2)由题图易知a=0.05,b=0.02,c=0.01.7分(3)从甲、乙两组数据中各任取一个,得到的所有基本事件共有100个,其中满足“两数之差的绝对值大于20”的基本事件有16个,故所求概率P=16100=425.12分8.(2016·河南六市联考)在某大学自主招生考试中,所有选报Ⅱ类志向的考生全部参加了“数学与逻辑”和“阅读与表达”两个科目的考试,成绩分为A,B,C,D,E五个等级.某考场考生的两科考试成绩的数据统计如图7-20所示,其中“数学与逻辑”科目的成绩为B的考生有10人.图7-20(1)求该考场考生中“阅读与表达”科目中成绩为A的人数;(2)若等级A,B,C,D,E分别对应5分,4分,3分,2分,1分,求该考场考生“数学与逻辑”科目的平均分;(3)已知参加本考场测试的考生中,恰有2人的两科成绩均为A,在至少一科成绩为A的考生中,随机抽取2人进行访谈,求这2人的两科成绩均为A的概率.[解](1)因为“数学与逻辑”科目中成绩等级为B的考生有10人,所以该考场有10÷0.25=40(人),2分所以该考场考生中“阅读与表达”科目中成绩等级为A的人数为40×(1-0.375-0.375-0.15-0.025)=40×0.075=3.4分(2)该考场考生“数学与逻辑”科目的平均分为[1×(40×0.2)+2×(40×0.1)+3×(40×0.375)+4×(40×0.25)+5×(40×0.075)]÷40=2.9.8分(3)由题图可知,“数学与逻辑”科目的成绩为A的有3人,“阅读与表达”科目的成绩为A的有3人,因为恰有2人的两科成绩等级均为A,所以还有2人只有一个科目得分为A.设这4人为甲,乙,丙,丁,其中甲,乙是两科成绩都是A的同学,则在至少一科成绩等级为A的考生中,随机抽取2人进行访谈,基本事件空间为Ω={{甲,乙},{甲,丙},{甲,丁},{乙,丙},{乙,丁},{丙,丁}},一共有6个基本事件.设“随机抽取2人进行访谈,这2人的两科成绩等级均为A”为事件B,所以事件B中包含的基本事件有1个,则P(B)=16.12分。