考点44 用样本估计总体-高考全攻略之备战2019年高考数学(理)考点一遍过Word版含解析
人教版高中数学高考一轮复习--用样本估计总体(课件)
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2
2019年高考数学一轮复习:用样本估计总体
2019年高考数学一轮复习:用样本估计总体用样本估计总体1.用样本的频率分布估计总体分布(1)通常我们对总体作出的估计一般分成两种:一种是用样本的__________估计总体的__________;另一种是用样本的________估计总体的__________.(2)在频率分布直方图中,纵轴表示________,数据落在各小组内的频率用________________表示.各小长方形的面积总和等于________.(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布________.随着样本容量的增加,作图时所分的________增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为______________,它能够更加精细地反映出____________________________________.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以____________________,而且可以______________,给数据的记录和表示都带来方便.2.用样本的数字特征估计总体的数字特征 (1)众数,中位数,平均数众数:在一组数据中,出现次数________的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的________)叫做这组数据的中位数.平均数:样本数据的算术平均数,即x =______________.在频率分布直方图中,中位数左边和右边的直方图的面积应该________.(2)样本方差,样本标准差 标准差s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x n 是__________________,n 是________,x 是________.标准差是反映总体__________的特征数,样本方差是样本标准差的__________.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.自查自纠1.(1)频率分布 分布 数字特征 数字特征(2)频率组距 各小长方形的面积 1 (3)折线图 组数 总体密度曲线 总体在各个范围内取值的百分比(4)保留所有信息 随时记录2.(1)最多平均数 1n (x 1+x 2+…+x n ) 相等(2)样本数据的第n 项 样本容量平均数 波动大小 平方(2016·山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120 D .140 解:由频率分布直方图知,自习时间不少于22.5小时的有200×(0.16+0.08+0.04)×2.5=140(人).故选D .(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解:易知B ,C ,D 对,A 错.故选A .(2015·全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确...的是()A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解:根据柱形图易知选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D .(2016·江苏)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.解:这组数据的平均数 x —=4.7+4.8+5.1+5.4+5.55=5.1,则方差s 2=(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)25=0.16+0.09+0+0.09+0.165=0.1.故填0.1.(2017·山东)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为________.解:根据两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以56+62+65+74+(70+x )5=59+61+67+(60+y )+785,解得x =3.故填3,5.类型一 数字特征及其应用(2015·广东)某工厂36名工人的年龄数据工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄 140 10 36 19 27 28 34 2 44 11 31 20 43 29 39 3 40 12 38 21 41 30 43 4 41 13 39 22 37 31 38 5 33 14 43 23 34 32 42 6 40 15 45 24 42 33 53 7 45 16 39 25 37 34 37 8 42 17 38 26 44 35 49 943183627423639(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的平均值x 和方差s 2; (3)36名工人中年龄在x -s 与x +s 之间有多少人?所占的百分比是多少(精确到0.01%)?解:(1)根据系统抽样的方法,抽取容量为9的样本,因此分成9组,每组4人,由于第一组中用随机抽样抽到的年龄数据为44,且编号间隔为4,因此,依次抽到的年龄数据为:44,40,36,43,36,37,44,43,37.(2) x =19(44+40+36+43+36+37+44+43+37)=40,s 2=19[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=1009.(3)s =s 2=1009=103,x —-s =3623,x —+s =4313,在x —-s 与x —+s 之间的数据是37,38,39,40,41,42,43,处在此年龄阶段的工人一共有23人,所占比例为2336×100%≈63.89%.【点拨】(1)根据系统抽样的定义和性质,结合题意,直接列举样本;(2)利用均值、方差的概念求解样本的均值x 及方差s 2;(3)利用(2)的结果,计算得到年龄在x —-s 与x —+s 之间的人数,再求解百分比.本题主要考查系统抽样及平均数、方差的知识,意在考查学生的数据处理能力和计算能力.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的甲 27 38 30 37 3531 乙332938342836(1)画出茎叶图;(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、方差、极差,并判断选谁参加比赛比较合适?解:(1)画茎叶图如下(中间数为数据的十位数).(2)x —甲=27+38+30+37+35+316=33.x —乙=33+29+38+34+28+366=33.s 2甲=16[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.s 2乙=16[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.甲的极差为11,乙的极差为10.综合比较以上数据可知,甲、乙平均数相同,但乙的极差、方差相对更小,成绩更稳定,故选乙参加比赛较合适.类型二 频率分布表、频率分布直方图及其应用(1)(2016·四川)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(Ⅲ)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.解:(Ⅰ)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02,由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1,解得a =0.30.(Ⅱ)由(Ⅰ)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(Ⅲ)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x <3.由0.3×(x -2.5)=0.85-0.73,解得x =2.9. 所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.(2)(2016·北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(Ⅰ)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(Ⅱ)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解:(Ⅰ)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(Ⅱ)由用水量的频率分布直方图及题意,得居民组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]频率0.10.150.20.250.150.050.050.05根据题意,该市居民该月的人均水费估计为:4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).【点拨】在频率分布直方图中,每个小矩形的面积就是相应的频率或概率,所有小矩形的面积之和为1,这是解题的关键,也是识图的基础.(1)(北京朝阳2017届二模)从某市的中学生中随机调查了部分男生,获得了他们的身高数据,整理得到如下频率分布直方图.(Ⅰ)求a的值;(Ⅱ)假设同组中的每个数据用该组区间的中点值代替,估计该市中学生中的全体男生的平均身高;(Ⅲ)从该市的中学生中随机抽取一名男生,根据直方图中的信息,估计其身高在180 cm以上的概率.若从全市中学的男生(人数众多)中随机抽取3人,用X表示身高在180 cm以上的男生人数,求随机变量X的分布列和数学期望E(X).解:(Ⅰ)根据题意得:(0.005×2+a+0.020×2+0.040)×10=1.解得a=0.010.(Ⅱ)设样本中男生身高的平均值为x—,则x—=145×0.05+155×0.1+165×0.2+175×0.4+185×0.2+195×0.05=(145+195)×0.05+155×0.1+(165+185)×0.2+175×0.4=17+15.5+70+70=172.5.所以估计该市中学生中全体男生的平均身高为172.5 cm.(Ⅲ)从全市中学的男生中任意抽取一人,其身高在180 cm以上的概率约为14.由已知得,随机变量X的可能取值为0,1,2,3.所以P(X=0)=C03⎝⎛⎭⎫14·⎝⎛⎭⎫343=2764;P(X=1)=C13⎝⎛⎭⎫141·⎝⎛⎭⎫342=2764;P(X=2)=C23⎝⎛⎭⎫142·⎝⎛⎭⎫341=964;P(X=3)=C33⎝⎛⎭⎫143·⎝⎛⎭⎫34=164.X 0123P27642764964164因为X~B⎝⎭⎫3,14,所以E(X)=3×14=34.(2)(2016·贵州模拟)一组样本数据的频率分布直13 B .12 C .11.52 D.100由图知,(0.02+0.08)×4=0.4,则样本数据的中位数为10+4×0.5-0.40.09×4=1009.故选D .产品的满意度,从通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.(2)记C A 1表示事件:“A 地区用户的满意等级为满意或非常满意”;C A 2表示事件:“A 地区用户的满意等级为非常满意”;C B 1表示事件:“B 地区用户的满意度等级为不满意”;C B 2表示事件:“B 地区用户的满意度等级为满意”,则C A 1与C B 1独立,C A 2与C B 2独立,C B 1与C B 2互斥,C =C B 1C A 1∪C B 2C A 2.P (C )=P (C B 1C A 1∪C B 2C A 2)=P (C B 1C A 1)+P (C B 2C A 2)=P (C B 1)P (C A 1)+P (C B 2)P (C A 2).由所给数据得C A 1,C A 2,C B 1,C B 2发生的频率分别为1620,420,1020,820,故P (C A 1)=1620,P (C A 2)=420,P (C B 1)=1020,P (C B 2)=820,P (C )=1020×1620+820×420=0.48.【点拨】本题考查茎叶图和特征数、互斥事件和独立事件,根据茎叶的密集程度比较平均值大小,如果密集主干部位在高位,那么平均值大;方差看它们的数字偏离程度,偏离越大则方差越大.读懂所求概率事件包含的基本事件的含义,利用分类讨论思想将事件分解为几个互斥事件的情况来求概率.某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16.故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.1.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观.2.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.3.茎叶图的优点是原有信息不会抹掉,能够展示数据分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.4.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差都是测量样本数据离散程度的工具,但在解决实际问题时,一般多采用标准差.1.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )A .总体B .个体C .样本的容量D .从总体中抽取的一个样本解:5 000名居民的阅读时间的全体是总体,每名居民的阅读时间是个体,200是样本容量.故选A .2.(2016·陕西质检)一个频数分布表(样本容量为30)不小心被损坏了一部分(如图),若样本中数据在[20,60)内的频率为0.8,则样本中在[40,60)内的数据个数为()A .15B .16C .17D .19 解:由题意知,样本中在[40,60)内的数据个数为30×0.8-4-5=15.故选A .3.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32 解:令y i =2x i -1(i =1,2,3,…,10),则s y =2s x =16.故选C .4.(成都七中2017年一模)某校教育处连续30天对同学们的着装进行检查,着装不合格的人数见如图所示的茎叶图,则中位数、众数、极差分别是()A .44,45,56B .44,43,57C .44,43,56D .45,43,57 解:由茎叶图知,排在第15,16位的是43,45,故中位数为44.观察茎叶图易知,众数为43,极差为67-10=57.故选B .5.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下面叙述不正确的是()A .各月的平均最低气温都在0℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D .平均最高气温高于20℃的月份有5个 解:平均最高气温高于20℃的月份只有七、八两个月份,D 叙述不正确.故选D .由于电脑故障,有两个数字在表格中不能显示出来,则下列说法正确的是( )A .年龄数据的中位数是40,众数是38B .年龄数据的中位数和众数一定相等C .年龄数据的平均数x ∈(39,40)D .年龄数据的平均数一定大于中位数解:根据表中数据,得120(5×38+10×39+3×41+2×42)<x —<120(5×38+10×40+3×41+2×42),解得39.35<x —<39.85,所以x —∈(39,40).故选C .7.(2015·湖北)某电子商务公司对10 000名网络购物者上一年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =____________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为____________.解:(1)由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a ×0.1=1,解得a =3.(2)消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.故填3;6 000.8.抽样统计甲、乙两位射击运动员的5次训练则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.解:x —甲=8.7+9.1+9.0+8.9+9.35=9.0,x —乙=8.9+9.0+9.1+8.8+9.25=9.0,s 2甲=15[(8.7-9.0)2+(9.1-9.0)2+(9.0-9.0)2+(8.9-9.0)2+(9.3-9.0)2]=0.04,s 2乙=15[(8.9-9.0)2+(9.0-9.0)2+(9.1-9.0)2+(8.8-9.0)2+(9.2-9.0)2]=0.02,s 2乙<s 2甲,所以成绩较为稳定的运动员乙成绩的方差为0.02.故填0.02.9.(2017·吉林二次调研)某车间20名工人年龄数(1)求这20名工人年龄的众数与平均数; (2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)从年龄在24和26的工人中随机抽取2人,求这2人均是24岁的概率.解:(1)由题意可知,这20名工人年龄的众数是30,平均数为x —=120×(19+24×3+26×3+30×5+34×4+35×3+40)=30.(2)这20名工人年龄的茎叶图为,(3)所求概率P =C 23C 26=15.10.(2017·北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4,所以所求为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.11.(2016·北京)A ,B ,C 三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部A 班6 6.57 7.58 B 班 6 7 89 10 11 12 C 班34.567.5910.51213.5(1)试估计C 班的学生人数;(2)从A 班和C 班抽出的学生中,各随机选取一人,A 班选出的人记为甲,C 班选出的人记为乙.假设所有学生的锻炼时间相互独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;(3)再从A ,B ,C 三个班中各随机抽取一名学生,他们该周的锻炼时间分别是7,9,8.25(单位:小时).这3个新数据与表格中的数据构成的新样本的平均数记为μ1,表格中数据的平均数记为μ0,试判断μ0和μ1的大小(结论不要求证明).解:(1)C 班学生人数约为100×85+7+8=100×820=40(人). (2)设事件A i 为“甲是现有样本中A 班的第i 个人”,i =1,2, (5)事件C j 为“乙是现有样本中C 班的第j 个人”,j =1,2, (8)由题意可知P (A i )=15,i =1,2,…,5;P (C j )=18,j =1,2, (8)P (A i C j )=P (A i )P (C j )=15×18=140,i =1,2, (5)j =1,2, (8)设事件E 为“该周甲的锻炼时间比乙的锻炼时间长”,由题意知,E =A 1C 1∪A 1C 2∪A 2C 1∪A 2C 2∪A 2C 3∪A 3C 1∪A 3C 2∪A 3C 3∪A 4C 1∪A 4C 2∪A 4C 3∪A 5C 1∪A 5C 2∪A 5C 3∪A 5C 4.因此P (E )=P (A 1C 1)+P (A 1C 2)+P (A 2C 1)+P (A 2C 2)+P (A 2C 3)+P (A 3C 1)+P (A 3C 2)+P (A 3C 3)+P (A 4C 1)+P (A 4C 2)+P (A 4C 3)+P (A 5C 1)+P (A 5C 2)+P (A 5C 3)+P (A 5C 4)=15×140=38.(3)μ1<μ0.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为()A.9 B.10 C.11 D.12 解:不妨设样本数据为x1,x2,x3,x4,x5且x1<x2<x3<x4<x5,则由样本方差为4可知:(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20.五个整数的平方和为20,则这五个整数的平方只能在集合{0,1,4,9,16}中选取(每个数字最多出现2次):当这五个整数的平方中最大的为16时,分析可知,总不满足和为20;当这五个整数的平方中最大的为9时,{0,1,1,9,9}这组数满足要求,此时对应的样本数据为:x1=4,x2=6,x3=7,x4=8,x5=10;当这五个整数的平方中最大的数不超过4时,总不满足要求,因此不存在满足条件的另一组数据.故选B.2019年高考数学一轮复习第10 页共10 页。
高考数学用样本估计总体知识点大全
高考数学用样本估计总体知识点大全推荐文章总经理工作评语大全热度:乡镇补贴细则大全热度: 2017在校大学生入党申请书范文大全热度: 2019清明祭扫演讲稿大全热度:2017建军90周年观后感大全热度:高中数学课程标准中,用样本估计总体已经成为必修内容,下面是店铺给大家带来的高考数学用样本估计总体知识点大全,希望对你有帮助。
高考数学用样本估计总体知识点一、频率分布的概念1、概念:频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图2、频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势.(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
注;(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率频率,故每组样本的频率为组距×,即矩形的面积. 组距组距。
(3)直方图中每组样本的频数为频率×总体数.3、频率分布折线图、总体密度曲线(1)频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
(2)总体密度曲线的定义:在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。
二、茎叶图当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。
1、茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
2019版高考数学复习概率与统计第四节用样本估计总体课件文
30 30 y 30 35 40 ,化简可得y=x+5,且x<10,y<10,根据选项可知y=5,x
5
=0,故选B.
考点三 样本的数字特征
典例3 (2017北京丰台一模)某校学生营养餐由A和B两家配餐公司配 送.学校为了解学生对这两家配餐公司的满意度,采用问卷的形式,随机 抽取了40名学生对两家公司分别评分.根据收集的80份问卷的评分,得 到A公司满意度评分的频率分布直方图和B公司满意度评分的频数分布 表:
所以样本中分数小于70的频率为1-0.6=0.4. 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为
0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=
0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5.
第四节 用样本估计总体
教材研读
总纲目录
1.作频率分布直方图的步骤 2.频率分布折线图和总体密度曲线
3.茎叶图的优点 4.样本的数字特征
考点突破
考点一 频率分布直方图
考点二 茎叶图 考点三 样本的数字特征
教材研读
1.作频率分布直方图的步骤
(1)求极差(一组数据中① 最大值 与② 最小值 的差). (2)决定③ 组距 与④ 组数 . (3)将数据⑤ 分组 . (4)列⑥ 频率分布表 . (5)画⑦ 频率分布直方图 .
频数.
=样频频本数率容量,样本容量×频率=
1-1 (2017北京朝阳二模)从某中学随机选取了40名男生,将他们的身高 作为样本进行统计,得到如图所示的频率分布直方图.观察图中数据,完 成下列问题. (1)求a的值及样本中男生身高在[185,195](单位:cm)的人数; (2)假设同一组中的每个数据可用该组区间的中点值代替,试估计该校 全体男生的平均身高; (3)在样本中,从身高在[145,155)和[185,195](单位:cm)内的男生中任选 两人,求这两人的身高都不低于185 cm的概率.
2024年高考数学一轮复习(新高考版)《用样本估计总体》课件ppt
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( × ) (2)方差与标准差具有相同的单位.( × )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,
方差不变.( √ )
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.
题型三 总体离散程度的估计
例3 (2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新 设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产 了10件产品,得到各件产品该项指标数据如下.
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5 旧设备和新设备生产产品的该项指标的样本平均数分别记为 x 和 y ,样 本方差分别记为 s21和 s22. (1)求 x , y ,s21,s22;
∴x=190. 故a=0.025 0,众数为190,中位数为190.
(2)若树苗高度在185 cm及以上是可以移栽的合格树苗.从样本中用比例分 配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格 树苗分别应抽取多少株?
由题意可知,合格树苗所占频率为(0.030 0+0.025 0+0.008 0+0.002 0) ×10=0.65,不合格树苗所占频 率为1-0.65=0.35, 所以不合格树苗抽取20×0.35= 7(株),合格树苗抽取20×0.65= 13(株), 故不合格树苗、合格树苗应分别 抽取7株和13株.
数为
A.102
√ B.103
C.109.5 D.116
考点52 几何概型-高考全攻略之备战2019年高考数学(理)考点一遍过 Word版含解析
(1)了解随机数的意义,能运用模拟方法估计概率.(2)了解几何概型的意义.一、几何概型1.几何概型的概念如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型,简称为几何概型.2.几何概型的特点(1)试验中所有可能出现的结果(基本事件)有无限多个.(2)每个基本事件发生的可能性相等.3.几何概型的概率计算公式P A .()4.必记结论(1)与长度有关的几何概型,其基本事件只与一个连续的变量有关;(2)与面积有关的几何概型,其基本事件与两个连续的变量有关,若已知图形不明确,可将两个变量分别作为一个点的横坐标和纵坐标,这样基本事件就构成了平面上的一个区域,即可借助平面区域解决问题;(3)与体积有关的几何概型.二、随机模拟用计算器或计算机模拟试验的方法为随机模拟方法或蒙特卡罗方法.这个方法的基本步骤是:(1)用计算器或计算机产生某个范围内的随机数,并赋予每个随机数一定的意义;(2)统计代表某意义的随机数的个数M和总的随机数个数N;(3)计算频率()n Mf AN=作为所求概率的近似值.注意,用随机模拟方法得到的结果只能是概率的近似值或估计值,每次试验得到的结果可能不同,而所求事件的概率是一个确定的数值.考向一与长度有关的几何概型求解与长度有关的几何概型的问题的关键是将所有基本事件及事件A包含的基本事件转化为相应长度,进而求解.此处的“长度”可以是线段的长短,也可以是时间的长短等.注意:在寻找事件A发生对应的区域时,确定边界点是问题的关键,但边界点能否取到不会影响事件A的概率.典例1 某学校星期一至星期五每天上午都安排五节课,每节课的时间为40分钟.第一节课上课的时间为7:50~8:30,课间休息10分钟.某同学请假后返校,若他在8:50~9:30之间到达教室,则他听第二节课的时间不少于10分钟的概率是A.12B.13C.23D.35【答案】A【解析】由题意得第二节课上课的时间为8:40~9:20,该同学到达教室的时间总长度为40,其中在8:50~9:10进入教室时,听第二节课的时间不少于10分钟,其时间长度为20,故所求概率为201402=,选A.典例2 在区间[]0,2上随机抽取一个数x,则事件“”发生的概率为A.34B.23C.13D.14【答案】A1m,能使函数在R上有零点的概率为A.25B.35C.15D.3102随机安排播出时长.则他能收看到这条新闻的完整报道的概率是A.25B.13C.15D.16考向二与面积有关的几何概型求解与面积有关的几何概型的问题的关键是构造出随机事件对应的几何图形,利用图形的几何特征找出两个“面积”,套用几何概型的概率计算公式,从而求得随机事件的概率. 必要时可根据题意构造两个变量,把变量看成点的坐标,找到全部试验结果构成的平面图形,以便求解.“面积比”是求几何概型的一种重要的方法.典例3 在如图所示的扇形AOB中,∠AOB=,半圆C切AO于点D,与圆弧AB切于点B,若随机向扇形AOB 内投一点,则该点落在半圆C外的概率为A.B.C.D.【答案】A典例4 如图,已知A(a,0)(a>0),B是函数f(x)=2x2图象上的一点,C(0,2),若在矩形OABC内任取一点P,则点P 落在阴影部分的概率为________. 学¥%科网【答案】3.一只蚂蚁在边长为4的正三角形区域内随机爬行,则它在离三个顶点距离都大于2的区域内的概率为A .1π6-B .34C .π6D .144上随机取两个实数A .π18- B .π14- C .π12-D .3π14-考向三 与体积有关的几何概型的求法用体积计算概率时,要注意所求概率与所求事件构成的区域的体积的关系,准确计算出所求事件构成的区域的体积,确定出基本事件构成的区域的体积,求体积比即可.一般当所给随机事件是用三个连续变量进行描述或当概率问题涉及体积时,可以考虑用此方法求解.典例5 一只小蜜蜂在一个棱长为30的正方体玻璃容器内随机飞行,若蜜蜂在飞行过程中与正方体玻璃容器六个表面中至少有一个的距离不大于10,则就有可能撞到玻璃上而不安全,即始终保持与正方体玻璃容器六个表面的距离均大于10,飞行才是安全的.假设蜜蜂在正方体玻璃容器内飞行到任意位置的可能性相等,那么蜜蜂飞行安全的概率是学#$科网A.512B.23C.127D.425【答案】C5.有一底面半径为1,高为2的圆柱,点O为圆柱下底面圆的圆心,在这个圆柱内随机取一点P,则点P 到点O的距离大于l的概率为A.13B.23C.34D.14考向四随机模拟的应用利用随机模拟试验可以近似计算不规则图形A的面积,解题的依据是根据随机模拟估计概率,然后根据列等式求解.典例6 《周髀算经》中给出了勾股定理的绝妙证明,如图是赵爽的弦图及注文,弦图是一个以勾股形之弦为边的正方形,其面积称为弦实.图中包含四个全等的勾股形及一个小正方形,分别涂成朱(红)色及黄色,其面积分别称朱实、黄实,利用2×勾×股+(股-勾)2=4×朱实+黄实=弦实,化简得勾2+股2=弦2.设勾股形中勾股比为1∶若向弦图内随机抛掷3000颗图钉,则落在黄色图形内的图钉数约为≈1.732)A.134 B.268C.402 D.536【答案】C【解析】设大正方形的边长为2,由图中直角三角形的两直角边长之比为1,1,=1,所以落在小正方形内的图钉数为(13000≈(1-12×1.732)×3000=402.故选C.6.受其启发,我1201的正实数对1m ,最后根据统计个数m .A .227 B .4715 C .5116D .53171.在[]0,π内任取一个实数x ,则1sin 2x ≤的概率为 A .2 3B .1 2C .13D .1 42.之间的概率为 A .310 B .15 C .25D .453.在直角坐标系中,任取n 个满足x 2+y 2≤1的点(x ,y ),其中满足|x|+|y|≤1的点有m 个,则用随机模拟的方法得到的圆周率π的近似值为A .4mn B .4n m C .2m nD .2n m4.如图,在矩形ABCD 中,AB BC =1,以A 为圆心、1为半径作圆弧DE ,点E 在线段AB 上,在圆弧DE 上任取一点P ,则直线AP 与线段BC 有公共点的概率是A .14B .13C .25D .355.已知函数为自然对数的底数)的图象与直线e 、x x =轴围成的区域为E ,直线与x 轴、y 轴围成的区域为F ,在区域F 内任取一点,则该点落在区域E 内的概率为A .43eB .23eC .23D .2e6.《九章算术》中有如下问题:“今有勾八步,股一十五步,问勾中容圆,径几何? ”其大意:“已知直角三角形两直角边长分别为8步和15步,问其内切圆的直径为多少步?”现若向此三角形内随机投一粒豆子,则豆子落在其内切圆外的概率是 A .3π 10B .3π 20C .3π110-D .3π120-7A .514 B .914 C .59D .498.赵爽是我国古代的数学家、天文学家,大约在公元222年,赵爽为《周碑算经》一书作序时,介绍了“勾股圆方图”,亦称“赵爽弦图”(以弦为边长得到的正方形是由4个全等的直角三角形再加上中间的一个小正方形组成的).类比“赵爽弦图”,可类似地构造如图所示的图形,它是由3个全等的三角形与中间的一取自小等边三角形的概率是A .413 B .13C .926D 9.已知P 是ABC △所在平面内一点,,现将一粒黄豆随机撒在ABC △内,则黄豆落在PBC △内的概率是A .23 B .12 C .13D .1410.有一根长为1米的细绳,将细绳随机剪断,则两截的长度都大于18米的概率为__________. 11.若在区间[0,4]上随机选取一个数x ,使x ≥a 的概率为14,则a =__________.12.如图,__________.13.一个正方体的外接球的表面积为48π,从这个正方体内任取一点,则该点取自正方体的内切球内的概率为__________.14.下图是一个边长为4的正方形二维码,为了测算图中黑色部分的面积,在正方形区域内随机投掷400个点,其中落入黑色部分的有225个点,据此可估计黑色部分的面积为_____________.15.在区间[]0,2内随机地取出两个实数,则这两个实数之和小于52的概率是__________. 16.某班早晨7:30开始上早读课,该班学生小陈和小李在早上7:10至7:30之间到班,且两人在此时间段的任何时刻到班是等可能的.(1)在平面直角坐标系中画出两人到班的所有可能结果表示的区域; (2)求小陈比小李至少晚5分钟到班的概率.17.已知圆,(1),;(2),.18.已知函数).(1)若a 从集合{}0,1,2,3中任取一个元素,b 从集合{}0,1,2,3中任取一个元素,求方程()0f x =有实根的概率;(2)若b 从区间[]0,2中任取一个数,a 从区间[]0,3中任取一个数,求方程()0f x =没有实根的概率.1.(2018新课标全国Ⅰ理科)下图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .ABC △的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p 1,p 2,p 3,则A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 32.(2017新课标全国Ⅰ理科)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14 B .π8 C .12D .π43.(2016新课标全国Ⅰ理科)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是 A .13B .12C .23 D .344.(2017江苏)记函数的定义域为D .在区间[4,5]-上随机取一个数x ,则x D ∈的概率是 ▲ .5.(2016山东理科)在[1,1]-上随机地取一个数k ,则事件“直线y =kx 与圆相交”发生的概率为 .1.【答案】B所以有零点的概率为63105=. 2.【答案】D30整新闻报道的时间为5分钟,所以所求的概率为51306=.故选D . 学科@#网 3.【答案】A【解析】满足条件的正三角形如图所示:其中正三角形ABC 的面积,满足到正三角形ABC 的顶点A B C ,,的距离至少有一个小于2的平面区域如图中阴影部分所示, 且2πS =阴影,则使取到的点到三个顶点A B C ,,的距离都大于2的概率为 .故选A.4.【答案】B5.【答案】B【解析】设点P 到点O 的距离小于1的概率为P 1,由几何概型,得P 1==13, 故点P 到点O 的距离大于1的概率为1-13=23.故选B .6.【答案】B【解析】由题意,120对都小于1的正实数(),x y 满足0101x y <<<<⎧⎨⎩,面积为1;两个数能与1构成钝角三角形的三边的数对(),x y 满足221x y +<且0101x y <<<<⎧⎨⎩,1x y +>,则面积为π142-, 因为统计两数能与1构成钝角三角形三边的数对(),x y 的个数为34m =,所以,解得47π15=.故选B .1.【答案】C【解析】若1sin2x≤,则在[]0,π内,所以所求概率为.选C.学#¥科网2.【答案】B3.【答案】D【解析】画出可行域,如图所示,四边形ABCD的面积为2,其中圆O的面积为π.由几何概型的概率公式,可得2πmn=,则π=2nm,故选D.4.【答案】B【解析】连接AC,交圆弧DE于点M.在Rt△ABC中,AB,BC=1,所以tan∠BAC=3BCAB=,即∠BAC=π6.要使直线AP与线段BC有公共点,则点P必须在圆弧EM上,于是所求概率为P=π16π32=.故选B.5.【答案】A【解析】由题意,区域F的面积为e;区域E 的面积S ==,所以在区域F 内任取一点,则该点落在区域E 内的概率为43e. 6.【答案】D【解析】由题意,直角三角形内切圆的半径r =,所以现若向此三角形内随机投一粒豆子,则豆子落在其内切圆外的概率P =.7.【答案】B8.【答案】A【解析】在ABD △中,3AD =,1BD =,,由余弦定理,得,所以DF AB =. 故所求概率为.故选A .9.【答案】B【解析】如图,以PB 、PC 为邻边作平行四边形PBDC ,则,∴,得2PD PA =-,由此可得P 是ABC △的边BC 上的中线AO 的中点,则点P 到BC 的距离等于A 到BC 的距离的12,∴.将一粒黄豆随机撒在ABC △内,则黄豆落在PBC △内的概率为.故选B.10.【答案】34学科¥%网11.【答案】3【解析】由题意得[0,4]与[a ,+∞)的交集在数轴上的长度为1,即x ≥a 的概率P =4144a -=,解得a =3. 12.【答案】16【解析】由题可得.13.【答案】【解析】因为一个正方体的外接球的表面积为48π,所以这个正方体的棱长为4,而棱长为4的正方体的体积为43,该正方体的内切球的半径为2,体积为×23,所以所求概率P =.14.【答案】915.【答案】2332【解析】取,(),x y 所在区域是边长为2的正方形区域,面积为4,直线52x y +=上方正方形区域的面积为133222⨯⨯, 直线52x y +=下方正方形区域的面积,由几何概型的概率公式可得,这两个实数之和小于52的概率是23234832÷=, 故答案为2332. 16.【解析】(1)用,x y 分别表示小陈、小李到班的时间,则,所有可能结果对应坐标平面内一个正方形区域ABCD ,如图所示.(2)小陈比小李至少晚到5分钟,即5x y -≥,对应区域为△BEF ,则所求概率为.17.【解析】(1),则其所有可能结果有.18.【解析】(1),a b的取值情况是:,其中第一个数表示a的取值,第二个数表示b的取值,即基本事件总数为16.1.【答案】A【解析】设面积为,其余部分的面积为,所以有12S S ,A. 2.【答案】B 【解析】设正方形边长为a ,则圆的半径为2a ,正方形的面积为2a ,圆的面积为2π4a .由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,此点取自黑色部分的概率是221ππ248aa⋅=,选B.秒杀解析:由题意可知,此点取自黑色部分的概率即为黑色部分面积占整个面积的比例,由图可知其概率p满足1142p<<,故选B.【名师点睛】对于几何概型的计算,首先确定事件类型为几何概型并确定其几何区域(长度、面积、体积或时间),其次计算基本事件区域的几何度量和事件A区域的几何度量,最后计算()P A.3.【答案】B【解析】由题意,这是一个几何概型问题,班车每30分钟发出一辆,到达发车站的时间总长度为40,等车不超过10分钟的时间长度为20,故所求概率为201402=,选B.【名师点睛】这是全国卷首次考查几何概型,求解几何概型问题的关键是确定“测度”,常见的测度有长度、面积、体积等.4.【答案】59学¥%科网【名师点睛】(1)当试验的结果构成的区域为长度、面积或体积等时,应考虑使用几何概型求解.(2)利用几何概型求概率时,关键是试验的全部结果构成的区域和事件发生的区域的寻找,有时需要设出变量,在坐标系中表示所需要的区域.(3)几何概型有两个特点:①无限性,②等可能性.基本事件可以抽象为点,尽管这些点是无限的,但它们所占据的区域都是有限的,因此可用“比例解法”求解几何概型的概率.5.【答案】3 4【解析】直线y=kx 与圆相交,需要满足圆心到直线的距离小于半径,即,解得3344k-<<,而[1,1]k?,所以所求概率P=33224=.。
高二数学必修三寒假复习要点:知识点:用样本估计总体
高二数学必修三寒假复习重点:知识点:用样本预计整体我们从一出生到耋耄之年,向来就没有走开过数学,或者说我们根本没法走开数学,这全部有点像水之于鱼同样。
小编准备了高二数学必修三寒假复习重点,详细请看以下内容。
1.频次散布直方图(1)往常我们对整体作出的预计一般分红两种:一种是用样本的频次散布预计整体的散布;另一种是用样本的数字特点估计整体的数字特点.(2)作频次散布直方图的步骤①求极差 (即一组数据中最大值与最小值的差).②决定组距与组数.③将数据分组 .④列频次散布表.⑤画频次散布直方图.(3)在频次散布直方图中,纵轴表示频次/组距,数据落在各小组内的频次用各小长方形的面积表示.各小长方形的面积总和等于 1.2.频次散布折线图和整体密度曲线(1)频次散布折线图:连结频次散布直方图中各小长方形上端的中点,就得频次散布折线图.(2)整体密度曲线:跟着样本容量的增添,作图时所分组数增加,组距减小,相应的频次折线图会愈来愈靠近于一条圆滑曲线,即整体密度曲线.3.茎叶图的长处用茎叶图表示数占有两个突出的长处:一是统计图上没有原始数据信息的损失,全部数据信息都可以从茎叶图中获得;二是茎叶图中的数据能够随时记录,随时增添,方便记录与表示 .4.样本方差与标准差注意:两个异同(1)众数、中位数与均匀数的异同①众数、中位数及均匀数都是描绘一组数据集中趋向的量,均匀数是最重要的量.②因为均匀数与每一个样本数据相关,因此,任何一个样本数据的改变都会惹起均匀数的改变,这是中位数、众数都不拥有的性质 .③众数考察各数据出现的频次,其大小只与这组数据中的部分数据相关 .当一组数据中有许多量据多次重复出现时,其众数常常更能反应问题.④某些数据的改动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据改动较大时,可用中位数描绘其集中趋向.(2)标准差与方差的异同标准差、方差描绘了一组数据环绕均匀数颠簸的大小.标准差、方差越大,数据的失散程度就越大;标准差、方差越小,数据的失散程度则越小,因为方差与原始数据的单位不一样,且平方后可能夸张了误差的程度,因此固然方差与标准差在刻画样本数据的分别程度上是同样的,但在解决实质问题时,一般多采纳标准差.三个特点利用频次散布直方图预计样本的数字特点:(1)中位数:在频次散布直方图中,中位数左侧和右侧的直方图的面积相等,由此能够预计中位数值.宋此后,京师所设小学馆和武学堂中的教师称呼皆称之为“教谕”。
高考数学总复习考点知识专题讲解57---用样本估计总体
2.在如图所示的茎叶图所示的数据中,众数和中位数分 别是( B )
A.23,26 B.31,26 C.24,30 D.26,30
[解析] 由茎叶图得到所有的数据从小到大排列依次为 12,14,20,23,25,26,30,31,31,41,42 , ∴ 众 数 和 中 位 数 分 别 为 31,26.故选 B.
的一个数据(或两个 它对极端值的不敏感有 数据的平均数)
时也会成为缺点
平均数
平均数与每一个样本数
如果有 n 个数据 x1,据有关,可以反映出更
x2,…,xn,那么这 多的关于样本数据全体
n 个数的平均数 x = 的信息,但平均数受数
x1+x2+…+xn ________n______
据中的极端值的影响较 大,使平均数在估计总
中国 CBA 篮球赛中甲、乙两篮球运动员上赛季某些场 次比赛的得分如下:
甲:12,15,24,25,31,31,36,36,37,39,44,49. 乙:8,13,14,16,21,23,24,26,28,33,38,39. (1)画出两组数据的茎叶图; (2)试比较这两位运动员的得分水平.
[解] (1)为便于对比分析,可将茎放在中间共用,叶分 列左、右两侧.如图.
某城市 100 户居民的月平均用电量(单位:千瓦时),以 [160,180) , [180,200) , [200,220) , [220,240) , [240,260) , [260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中 x 的值; (2)求月平均用电量的众数和中位数; (3)在月平均用电量为[200,240),[240,260),[260,280), [280,300]的四组用户中,用分层抽样的方法抽取 11 户居民, 则月平均用电量在[220,240]的用户中应抽取多少户?
用样本估计总体知识点
用样本估计总体知识点在统计学中,用样本估计总体是一项非常重要的方法和理念。
这一概念在我们的日常生活、科学研究以及各种数据驱动的决策中都发挥着关键作用。
首先,我们要明白什么是样本和总体。
总体,简单来说,就是我们所关心的整个对象群体。
比如说,一个城市所有居民的收入情况,这就是总体。
而样本呢,则是从总体中抽取的一部分个体。
比如,我们随机抽取了这个城市中的 1000 位居民来调查他们的收入,这 1000 位居民的收入数据就是样本。
为什么我们要用样本去估计总体呢?这主要是因为在很多情况下,要获取总体的全部数据是不现实或者成本过高的。
比如,要调查一个国家所有成年人的身高,这几乎是不可能完成的任务。
但通过抽取一个具有代表性的样本,我们就能够以相对较小的成本和时间来获取一些信息,并以此来推测总体的情况。
那么,怎样才能保证样本具有代表性呢?这就涉及到抽样方法的选择。
常见的抽样方法有简单随机抽样、分层抽样和系统抽样。
简单随机抽样,就是从总体中随机地抽取个体,每个个体被抽取的概率相等。
这种方法操作简单,但如果总体的个体差异较大,可能会导致样本的代表性不足。
分层抽样则是先将总体按照某些特征分成不同的层次或类别,然后从每个层次中分别进行随机抽样。
比如,要调查一个学校学生的学习情况,可以先按照年级分层,然后从每个年级中抽取一定数量的学生。
这样可以保证样本在不同层次上都有代表性。
系统抽样是将总体中的个体按照一定的顺序排列,然后按照固定的间隔抽取样本。
在获得了样本数据之后,我们需要对这些数据进行整理和分析,以得出对总体的估计。
比如,我们可以计算样本的均值、中位数、众数等来描述样本数据的集中趋势;通过计算样本的方差、标准差等来描述样本数据的离散程度。
样本均值,也就是样本数据的算术平均值,它是最常用的描述集中趋势的指标。
假设我们抽取的样本数据是 x1, x2, x3,, xn ,那么样本均值就是(x1 + x2 + x3 ++ xn) / n 。
考点44 用样本估计总体-备战2020年高考数学(理)考点一遍过 (1)
考点44 用样本估计总体用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.一、数字特征1.众数、中位数、平均数2.极差、方差和标准差极差:即一组数据中最大值与最小值的差. 方差:2222121[()()()]n s x x x x x x n=-+-++-.标准差:(n s x x =++-注:平均数反映了数据取值的平均水平,方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定. 3.性质 (1)若12,,,n x x x 的平均数为x ,那么12,,,n mx a mx a mx a +++的平均数为mx a +.(2)数据12,,,n x x x 与数据1122n n x x a x x a x x a '='='=+++,,,的方差相等,即数据经过平移后方差不变. (3)若12,,,n x x x 的方差为s 2,那么12,,n ax b ax b ax b +++,的方差为22a s .二、茎叶图 1.定义茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. 2.表示方法(1)对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理. (2)对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎. 三、统计表 1.频率分布直方图(1)画频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; ③将数据分组; ④列频率分布表;⑤画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值). (2)频率分布直方图的性质①落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.②频率分布直方图与众数、中位数与平均数的关系A.最高的小长方形底边中点的横坐标即是众数;B.中位数左边和右边的小长方形的面积和是相等的;C.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.各种统计表的优点与不足考向一 数字特征的应用明确数字特征的意义:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.典例1 为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m ,众数为n ,平均数为x ,则m ,n ,x 的大小关系为________.(用“<”连接)【答案】n <m <x【解析】由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m =5.5;又5出现次数最多,故n =5;x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97. 故n <m <x .1.若样本121,1,,1n x x x +++的平均数为10,其方差为2,则对于样本1222,22,,22n x x x +++的下列结论正确的是A .平均数为20,方差为8B .平均数为20,方差为10C .平均数为21,方差为8D .平均数为21,方差为102.已知一组数据3,5,7,x ,10的平均数为6,则这组数据的方差为A.335B.6C.285D.5考向二茎叶图的应用茎叶图中的三个关注点:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.茎叶图的优、缺点:由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示,其缺点是当样本容量较大时,作图较繁琐.典例2 为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学次数在[16,30)内的人数为A.100 B.160C.200 D.280【答案】B【解析】由茎叶图,可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×820=160.3.第十一届全国少数民族传统体育运动会将于2019年9月8日至16日在郑州举行.如下图所示的茎叶图是两位选手在运动会前期选拔赛中的比赛得分,则下列说法正确的是A.甲的平均数大于乙的平均数B.甲的中位数大于乙的中位数C.甲的方差大于乙的方差D.甲的极差小于乙的极差4.如图,茎叶图表示甲、乙两人在5次测验中的数学分数,其中有一个被污损,若乙的中位数恰好等于甲的平均数,则•的值为_________.考向三频率分布直方图的应用频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.典例3 某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的2000名顾客的消费金额(单位:元),并从中随机抽取了100名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]进行统计,得到如图所示的频率分布直方图.已知a,b,c成等差数列,则该商店这一个月来消费金额超过150元的顾客数量约为A.600B.30C.60D.300【答案】A【解析】因为a,b,c成等差数列,所以2b=a+c,-(0.002+0.006)=0.012,所以b=0.004.由频率分布直方图可得a+b+c=150故消费金额超过150元的频率为(b+0.002)×50=0.3.故该商店这一个月来消费金额超过150元的顾客数量约为2000×0.3=600.故选A.90,100, 5.统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数依次分成六组:[) [)[)[)[)[]100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =; ②800n =;③100分的人数为60; ④分数在区间[)120,140的人数占大半. 则说法正确的是A .①②B .①③C .②③D .②④典例4 为了增强学生的环保意识,某中学随机抽取了50名学生举行了一次环保知识竞赛,并将本次竞赛的成绩(得分均为整数,满分100分)进行整理,制成下表:(1)作出被抽查学生成绩的频率分布直方图;(2)若从成绩在[40,50)中选1名学生,从成绩在[90,100]中选2名学生,共3名学生召开座谈会,求[40,50)组中学生A 1和[90,100]组中学生B 1同时被选中的概率.【解析】(1)由题意可知,各组频率分别为0.04,0.06,0.28,0.30,0.24,0.08,所以图中各组的纵坐标分别为:0.004,0.006,0.028,0.030,0.024,0.008,则被抽查学生成绩的频率分布直方图如图所示:(2)记[40,50)组中的学生为A1,A2,[90,100]组中的学生为B1,B2,B3,B4,A1和B1同时被选中记为事件M.由题意可得,全部的基本事件为:A1B1B2,A1B1B3,A1B1B4,A1B2B3,A1B2B4,A1B3B4,A2B1B2,A2B1B3,A2B1B4,A2B2B3,A2B2B4,A2B3B4,共12个,事件M包含的基本事件为:A1B1B2,A1B1B3,A1B1B4,共3个,所以学生A1和B1同时被选中的概率为P(M)=312=14.6.伴随着科技的迅速发展,国民对“5G”一词越来越熟悉,“5G”全称是第五代移动电话行动通信标准,也称第五代移动通信技术.2017年12月10日,工信部正式对外公布,已向中国电倌、中国移动、中国联通发放了5G系统中低频率使用许可.2019年2月18日上海虹桥火车站正式启动5G网络建设.为了了解某市市民对“5G”的关注情况,通过问卷调查等方式研究市民对该市300万人口进行统计分析,数据分析结果显示:约60%的市民“掌握一定5G知识(即问卷调查分数在80分以上)”,将这部分市民称为“5G爱好者”.某机构在“5G爱好者”中随机抽取了年龄在15-45岁之间的100人按照年龄分布(如图所示),其分组区间为:[15,20),[20,25),[25,30),[30,35),[35,40),[40,45].(1)求频率分布直方图中的a的值;(2)估计全市居民中35岁以上的“5G爱好者”的人数;(3)若该市政府制定政策:按照年龄从小到大,选拔45%的“5G爱好者”进行5G的专业知识深度培养,按照上述政策及频率分布直方图,估计该市“5G爱好者”的年龄上限.1.有下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有A.0个B.1个C.2个D.3个2.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A县、B县两个地区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,A县、B县两个地区浓度的方差较小的是A.A县B.B县C.A县、B县两个地区相等D.无法确定3.某仪器厂从新生产的一批零件中随机抽取40个检测.如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82)、[82,84),[84,86)、[86,88)、[88,90)、[90,92)、[92,94)、[94,96],则样本的中位数在A.第3组B.第4组C.第5组D.第6组4.在如图所示的茎叶图中,有一个数字模糊不清,但某同学曾经计算得到该组数据的极差与中位数之和为61,则模糊不清的数字为A.1B.2C.3D.45.某人为了检测自己的解题速度,记录了5次解题所花的时间(单位:分)分别为,,55,60,50x y,已知这组数据的平均数为55,方差为525,则||x y=A.1分B.2分C.3分D.4分6.一次数学考试后,某老师从自己所带的两个班级中各抽取6人,记录他们的考试成绩,得到如图所示的-=茎叶图.已知甲班6名同学成绩的平均数为82,乙班6名同学成绩的中位数为77,则x yA.3 B.3-C.4 D.4-7.在某次高中数学竞赛中,随机抽取90名考生,其分数如图所示,若所得分数的平均数,众数,中位数分别为a,b,c,则a,b,c的大小关系为A.b<a<c B.c<b<aC.c<a<b D.b<c<a8.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为A.100,10B.100,20C.200,10D.200,209.某地区为了解小学生的身高发育情况,从某小学随机抽取100名同学,将他们的身高(单位:厘米)数a b ,由图中可知,身高落在[110,130)范围内的学生人数是据绘制成频率分布直方图(如图).若:7A.35B.24C.46D.6510.为普及校园安全知识,某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图形的信息,估计这次考试的及格率(60分及以上为及格)、平均分分别为A.75%,71B.80%,85C.85%,90D.70%,6511.某赛季甲、乙两名篮球运动员每场比赛的得分如茎叶图所示,则下列结论错误的是A.乙运动员得分的中位数是36B .甲运动员发挥的稳定性比乙运动员发挥的稳定性差C .甲运动员的平均分为27分D .乙运动员的得分有613集中在茎3上 12.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:总体均值为2,总体方差为3D .丁地:中位数为2,众数为313.一个样本a ,3,5,7的平均数是b ,且a ,b 分别是数列{}()2*2n n -∈N 的第2项和第4项,则这个样本的方差是 A .3 B .4 C .5D .614.某网店在2019年1月的促销活动中,随机抽查了100名消费者的消费情况,并记录了他们的消费金额(单位:千元),将数据分成6组:(0,1],(1,2],(2,3],(3,4],(4,5],(5,6],整理得到频率分布直方图如图所示.若消费金额不超过3千元的人数占总人数的35,则消费金额超过4千元的人数为A .12B .15C .16D .1815.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则 A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s ><16.某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,画出频率分布直方图.已知从左到右前3个小组的频率之比为1∶2∶3,第4小组与第5小组的频率分布直方图如图所示,第2小组的频数为10,则第5小组的频数是A .4B .5C .8D .1017.在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是A .成绩在[70,80]分的考生人数最多B .不及格的考生人数为1000人C .考生竞赛成绩的平均分约70.5分D .考生竞赛成绩的中位数为75分18.某次知识竞赛中,五个参赛小队的初始积分都是50,在答题过程中,各小队每答对一题可使本队积分增加5,每答错一题本队积分不变,若答题过程中五个小队答对的题数分别是4,7,6,2,5,则这五个小队积分的方差为 .19.某市为了增加2020届高三毕业生对各著名高校的了解,从而调动他们的学习动力,利用2019年暑假组织部分有意愿的学生赴部分大学参加夏令营,各大学夏令营的天数都在[2,12]内,现从中抽出100名学生,统计他们参加夏令营的天数,绘制成如图所示的频率分布直方图,则这100名学生中参加夏令营的天数在[6,10)的人数为 .20.某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为________.21.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久的历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为_____________药物单位.22.为组织好第十一届全国少数民族传统体育运动会,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄在[25,30)内对应小长方形的高度为______________;(2)这800名志愿者中年龄在[25,35)内的人数为______________.23.某届马拉松招聘志愿者,报名者首先进入笔试,按笔试成绩选出参加面试的人员,最后确定入选名单.现从报名的所有人中按男女比例采用分层抽样的方式抽取了100名,统计了他们的笔试成绩(满分100分),统计结果见如下所示的频率分布表,其中分数在区间[90,100]内的人员直接进入面试阶段,若分数在区间[80,90)内,则需要进行短期的培训后,再参加第二次笔试,从而确定能否参加面试.(1)求a与b的值,并作出频率分布直方图;(2)(i)根据表中数据,估计这100名人员笔试成绩的中位数(精确到小数点后1位);(ii)分析知,这100名人员在各分数段内的男女比例如下表所示,那么若以频率分布表中的频率近似作为概率,在总共2000名参考人员中,求经过第一次考试就可直接进入面试的男女人数的估计值.24.随着科技发展,手机成了人们日常生活中必不可少的通信工具,现在的中学生几乎都拥有了属于自己的手机了.为了调查某地区高中生一周使用手机的频率,某机构随机调查了该地区100名高中生某一周使用手机的时间(单位:小时),所取样本数据分组区间为[0,2)、[2,4)、[4,6)、[6,8)、[8,10)、[10,12),由此得到如图所示的频率分布直方图.(1)求a的值并估计该地区高中生一周使用手机时间的平均值;(2)从使用手机时间在[6,8)、[8,10)、[10,12)、[12,14]的四组学生中,用分层抽样方法抽取13人,则每层各应抽取多少人?25.某校高一某班的一次数学测试成绩的茎叶图和频率分布直方图因事故都受到不同程度的损坏,但可见部分如下,据此解答如下问题:(1)求分数在[50,60)的频率及全班人数;(2)求分数在[80,90)的频数,并计算频率分布直方图中[80,90)间的矩形的高;(3)若规定:90分(包含90分)以上为优秀,现从分数在80分(包含80分)以上的试卷中任取两份分析学生失分情况,求在抽取的试卷中至少有一份优秀的概率.26.某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量(单位:百千瓦·时),将数据按[0,1),[1,2),[2,3),[3,4),[4,5),[5,6),[6,7),[7,8),[8,9)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中m的值;(2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦·时的人数及每户居民月均用电量的中位数;(3)政府计划对月均用电量在4百千瓦·时以下的用户进行奖励,月均用电量在[0,1)内的用户奖励20元/月,月均用电量在[1,2)内的用户奖励10元/月,月均用电量在[2,4)内的用户奖励2元/月.若该市共有400万户居民,试估计政府执行此计划的年度预算.27.某数学兴趣小组有男、女生各5名,以下茎叶图记录了该小组同学在一次数学测试中的成绩(单位:分).已知男生数据的中位数为125,女生数据的平均数为126.8.(1)求,x y 的值;(2)现从成绩高于125分的同学中随机抽取两名同学,求抽取的两名同学恰好为一男一女的概率.28.已知经销某种商品的电商在任何一个销售季度内,每售出1吨该商品可获利润0.5万元,未售出的商品,每1吨亏损0.3万元.根据往年的销售经验,得到一个销售季度内市场需求量的频率分布直方图如图所示.已知电商为下一个销售季度筹备了130吨该商品.现以x (单位:吨,100150x ≤≤)表示下一个销售季度的市场需求量,T (单位:万元)表示该电商下一个销售季度内经销该商品获得的利润.(1)根据频率分布直方图,估计一个销售季度内市场需求量x的平均数与中位数的大小;(2)根据频率分布直方图估计利润T不少于57万元的概率.29.某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X的分布列和均值.1.(2019年高考全国Ⅱ卷理数)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数B.平均数C.方差D.极差2.(2018新课标全国Ⅰ理科)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例建设后经济收入构成比例则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半3.(2017新课标全国Ⅲ理科)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳4.(2016新课标全国Ⅲ理科)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15C,B点表示四月的平均最低气温约为5C.下面叙述不正确的是A.各月的平均最低气温都在0C以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20C的月份有5个5.(2016山东理科)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56B.60C.120D.1406.(2019年高考江苏卷)已知一组数据6,7,8,8,9,10,则该组数据的方差是______________.7.(2018江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为▲ .8.(2016上海理科)某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是_________(米).9.(2019年高考全国Ⅲ卷理数)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).10.(2017新课标全国Ⅲ理科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg).其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:,22()()()()()n ad bcKa b c d a c b d-=++++11.(2017北京理科)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,。
【推荐】考点65+用样本估计总体-2019年领军高考数学(理)必刷题
考点65 用样本估计总体1.空气质量指数AQI是反映空气质量状况的指数,AQI指数值越小,表明空气质量越好,其对应关系如下表:下图是某市10月1日—20日AQI指数变化趋势:下列叙述错误的是A.这20天中AQI指数值的中位数略高于100B.这20天中的中度污染及以上的天数占C.该市10月的前半个月的空气质量越来越好D.总体来说,该市10月上旬的空气质量比中旬的空气质量好【答案】C2.某地某所高中2018年的高考考生人数是2015年高考考生人数的1.5倍,为了更好地对比该校考生的升学情况,统计了该校2015年和2018年的高考情况,得到如下柱状图:2015年高考数据统计2018年高考数据统计则下列结论正确的是A.与2015年相比,2018年一本达线人数减少B.与2015年相比,2018年二本达线人数增加了0.5倍C.与2015年相比,2018年艺体达线人数相同D.与2015年相比,2018年不上线的人数有所增加【答案】D3.某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在之间,其得分的频率分布直方图如图,则下列结论错误的是()A.得分在之间的共有40人B.从这100名参赛者中随机选取1人,其得分在的概率为C.这100名参赛者得分的中位数为65D.估计得分的众数为55【答案】C4.如图,海水养殖厂进行某水产品的新旧网箱养殖方法产量对比,收获时各随机抽取了100个网箱,测量各箱水产品产量(单位:kg),其频率分布直方图如图根据频率分布直方图,下列说法正确的是①新网箱产量的方差的估计值高于旧网箱产量的方差的估计值②新网箱产量中位数的估计值高于旧网箱产量中位数的估计值③新网箱产量平均数的估计值高于旧网箱产量平均数的估计值④新网箱频率最高组的总产量的估计值接近旧网箱频率最高组总产量估计值的两倍A.①②③B.②③④C.①③④D.①④【答案】B5.某高校调查了320名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为,,,,.根据直方图,这320名学生中每周的自习时间不足22.5小时的人数是()A.68 B.72 C.76 D.80【答案】B【解析】由频率分布直方图可得,320名学生中每周的自习时间不足22.5小时的人数是人.选B.6.甲、乙两名同学次数学测验成绩如茎叶图所示,分别表示甲、乙两名同学次数学测验成绩的平均数,分别表示甲、乙两名同学次数学测验成绩的标准差,则有A.,B.,C.,D.,【答案】B7.有一个容量为66的样本,数据的分组及各组的频数如下:[10.5,14.5)2[14.5,18.5) 4 [18.5,22.5)9[22.5,26.5)18[26.5,30.5)11[30.5,34.5)12 [34.5,38.5)8[38.5,42.5) 2根据样本的频率分布估计,数据落在[30.5,42.5)内的概率约是()A.B.C.D.【答案】B8.一组样本数据的频率分布直方图如图所示,试估计此样本数据的中位数为()A.13 B.12 C.11.52 D.【答案】D【解析】设中位数为,样本数列落在上的频率为,在上的频率为,,则,故.故选D.9.为了解某品种一批树苗生长情况,在该批树苗中随机抽取了容量为120的样本,测量树苗高度(单位:cm),经统计,其高度均在区间[19,31]内,将其按[19,21),[21,23),[23,25),[25,27),[27,29),[29,31]分成6组,制成如图所示的频率分布直方图.其中高度为27 cm及以上的树苗为优质树苗.(1)求图中a的值;(2)已知所抽取的这120棵树苗来自于A,B两个试验区,部分数据如下列联表:将列联表补充完整,并判断是否有99.9%的把握认为优质树苗与A,B两个试验区有关系,并说明理由;(3)用样本估计总体,若从这批树苗中随机抽取4棵,其中优质树苗的棵数为X,求X的分布列和数学期望EX.下面的临界值表仅供参考:(参考公式:,其中.)【答案】(1)0.025;(2)见解析;(3)见解析【解析】(1)根据直方图数据,有,10.某高校为了对2018年录取的大一理工科新生有针对性地进行教学,从大一理工科新生中随机抽取40名,对他们2018年高考的数学分数进行分析,研究发现这40名新生的数学分数在内,且其频率满足(其中,).(1)求的值;(2)请画出这20名新生高考数学分数的频率分布直方图,并估计这40名新生的高考数学分数的平均数(同一组中的数据用该组区间的中点值作代表);(3)将此样本的频率估计为总体的概率,随机调查4名该校的大一理工科新生,记调查的4名大一理工科新生中“高考数学分数不低于130分”的人数为随机变量,求的数学期望.【答案】(1);(2)120;(3)见解析.所以.11.央视传媒为了解央视举办的“朗读者”节目的收视时间情况,随机抽取了某市名观众进行调查,其中有名男观众和名女观众,将这名观众收视时间编成如图所示的茎叶图(单位:分钟),收视时间在分钟以上(包括分钟)的称为“朗读爱好者”,收视时间在分钟以下(不包括分钟)的称为“非朗读爱好者”.规定只有女“朗读爱好者”可以参加央视竞选.(1)若采用分层抽样的方法从“朗读爱好者”和“非朗读爱好者”中随机抽取名,再从这名观众中任选名,求至少选到名“朗读爱好者”的概率;(2)若从所有的“朗读爱好者”中随机抽取名,求抽到的名观众中能参加央视竞选的人数的分布列及其数学希望.【答案】(1);(2)分布列见解析,12.某地区为了解学生学业水平考试的状况,从参加学业水平考试的学生中抽出160名,其数学组成绩均为整数的频率分布直方图如图所示.估计这次考试数学成绩的平均分和众数;假设在段的学生中有3人得满分100分,有2人得99分,其余学生的数学成绩都不相同现从90分以上的学生中任取4人,不同分数的个数为,求的分布列及数学期望.【答案】(1)平均分72分,众数为75分;(2)见解析.【解析】(1)2 34的数学期望是.16.某少儿游泳队需对队员进行限时的仰卧起坐达标测试.已知队员的测试分数与仰卧起坐个数之间的关系如下:;测试规则:每位队员最多进行三组测试,每组限时1分钟,当一组测完,测试成绩达到60分或以上时,就以此组测试成绩作为该队员的成绩,无需再进行后续的测试,最多进行三组;根据以往的训练统计,队员“喵儿”在一分钟内限时测试的频率分布直方图如下:(1)计算值;(2)以此样本的频率作为概率,求①在本次达标测试中,“喵儿”得分等于的概率;②“喵儿”在本次达标测试中可能得分的分布列及数学期望.【答案】(1);(2)见解析【解析】(1)(2)由直方图可知,“喵儿”的得分情况如下:17.某校高三有500名学生,在一次考试的英语成绩服从正态分布,数学成绩的频率分布直方图如下:(Ⅰ)如果成绩大于135的为特别优秀,则本次考试英语、数学特别优秀的大约各多少人?(Ⅱ)试问本次考试英语和数学的成绩哪个较高,并说明理由.(Ⅲ)如果英语和数18.2018年央视大型文化节目《经典咏流传》的热播,在全民中掀起了诵读诗词的热潮.某大学社团调查了该校文学院300名学生每天诵读诗词的时间(所有学生诵读时间都在两小时内),并按时间(单位:分钟)将学生分成六个组:,,,,,,经统计得到了如图所示的频率分布直方图(Ⅰ)求频率分布直方图中的值,并估计该校文学院的学生每天诵读诗词的时间的平均数;(Ⅱ)若两个同学诵读诗词的时间满足,则这两个同学组成一个“Team”,已知从每天诵读时间小于20分钟和大于或等于80分钟的所有学生中用分层抽样的方法抽取了5人,现从这5人中随机选取2人,求选取的两人能组成一个“Team”的概率.【答案】(1) ;64(分钟).(2) .【解析】(Ⅰ)∵各组数据的频率之和为1,即所有小矩形面积和为1,∵.解得1 9.按照我国《机动车交通事故责任强制保险条例》规定,交强险是车主必须为机动车购买的险种,若普通7座以下私家车投保交强险第一年的费用(基准保费)统一为元,在下一年续保时,实行的是保费浮动机制,保费与上一、二、三个年度车辆发生道路交通事故的情况相关联,发生交通事故的次数越多,费率也就越高,具体浮动情况如下表:某机构为了研究某一品牌普通7座以下私家车的投保情况,随机抽取了80辆车龄已满三年的该品牌同型号私家车在下一年续保时的情况,统计得到了下面的表格:(1)根据上述样本数据,估计一辆普通7座以下私家车(车龄已满3年)在下一年续保时,保费高于基准保费的概率;(2)某销售商专门销售这一品牌的二手车,且将下一年的交强险保费高于基准保费的车辆记为事故车.①若该销售商部门店内现有6辆该品牌二手车(车龄已满3年),其中两辆事故车,四辆非事故车.某顾客在店内随机挑选两辆车,求这两辆车中恰好有一辆事故车的概率;②以这80辆该品牌车的投保类型的频率代替一辆车投保类型的概率.该销售商一次购进120辆(车龄已满三年)该品牌二手车,若购进一辆事故车亏损4000元,一辆非事故车盈利8000元.试估计这批二手车一辆车获得利润的平均值.【答案】(1);(2)①;②.助“树状图”列举;2.注意区分排列与组合,以及计数原理的正确使用.20.交强险是车主必须为机动车购买的险种,若普通座以下私家车投保交强险第一年的费用(基准保费)统一为元,在下一年续保时,实行的是费率浮动机制,保费与上一年度车辆发生道路交通事故的情况相联系,发生交通事故的次数越多,费率也就越高,具体浮动情况如下表(其中浮动比率是在基准保费上上下浮动):下浮下浮下浮上浮上浮某机构为了研究某一品牌普通座以下私家车的投保情况,随机抽取了辆车龄已满三年的该品牌同型号私家车的下一年续保时的情况,统计得到了下面的表格:(Ⅰ)求这辆车普通座以下私家车在第四年续保时保费的平均值(精确到元)(Ⅱ)某二手车销售商专门销售这一品牌的二手车,且将下一年的交强险保费高于基准保费的车辆记为事故车.假设购进一辆事故车亏损元,一辆非事故车盈利元,且各种投保类型车的频率与上述机构调查的频率一致.试完成下列问题:①若该销售商店内有六辆(车龄已满三年)该品牌二手车,某顾客欲在该店内随机挑选辆车,求这辆车恰好有一辆为事故车的概率;②若该销售商一次购进辆车(车龄已满三年)该品牌二手车,求一辆车盈利的平均值.【答案】(1)942.1;(2)①概率为;②5000.21.十九大报告提出:坚决打赢脱贫攻坚战,做到精准扶贫工作.某帮扶单位帮助贫困村种植蜜柚,并利用互联网电商渠道进行销售.为了更好地销售,现从该村的蜜柚树上随机摘下了100个蜜柚进行测重,其质量分布在区间内(单位:克),统计质量的数据作出其频率分布直方图如图所示:(1)按分层抽样的方法从质量落在,的蜜柚中随机抽取5个,再从这5个蜜柚中随机抽2个,求这2个蜜柚质量均小于2000克的概率;(2)以各组数据的中间数值代表这组数据的平均水平,以频率代表概率,已知该贫困村的蜜柚树上大约还有5000个蜜柚待出售,某电商提出两种收购方案:.所有蜜柚均以40元/千克收购;.低于2250克的蜜柚以60元/个收购,高于或等于2250的以80元/个收购.请你通过计算为该村选择收益最好的方案.【答案】(1);(2)应该选择方案.【解析】(1)由题得蜜柚质量在和的比例为,∴分别抽取2个和3个.记抽取质量在的蜜柚为,,质量在的蜜柚为,,,则从这个蜜柚中随机抽取个的情况共有以下10种:(2)若按方案收购,,,,,,,,,,其中质量小于2000克的仅有这1种情况,故所求概率为.(2)方案好,理由如下:由频率分布直方图可知,蜜柚质量在的频率为,22.哈师大附中高三学年统计甲、乙两个班级一模数学分数(满分150分),每个班级20名同学,现有甲、乙两班本次考试数学分数如下列茎叶图所示:(I)根据基叶图求甲、乙两班同学数学分数的中位数,并将乙班同学的分数的频率分布直方图填充完整;(Ⅱ)根据基叶图比较在一模考试中,甲、乙两班同学数学分数的平均水平和分数的分散程度(不要求计算出具体值,给出结论即可)(Ⅲ)若规定分数在的成绩为良好,分数在的成绩为优秀,现从甲、乙两班成绩为优秀的同学中,按照各班成绩为优秀的同学人数占两班总的优秀人数的比例分层抽样,共选出12位同学参加数学提优培训,求这12位同学中恰含甲、乙两班所有140分以上的同学的概率.【答案】(1)见解析.(2) 乙班学生数学考试分数的平均水平高于甲班学生数学考试分数的平均水平;甲班学生数学考试分数的分散程度高于乙班学生数学考试分数的分散程度.(3) .【解析】(1)甲班数学分数的中位数:乙班数学分数的中位数:23.2018年某市政府为了有效改善市区道路交通拥堵状况出台了一系列的改善措施.其中市区公交站点重新布局和建设作为重点项目.市政府相关部门根据交通拥堵情况制定了“市区公交站点重新布局方案”,现准备对该“方案”进行调查,并根据调查结果决定是否启用该“方案”,调查人员分别在市区的各公交站点随机抽取若干市民对该“方案”进行评分,并将结果绘制成如图所示的频率分布直方图.相关规则为:①调查对象为本市市民,被调查者各自独立评分;②采用百分制评分,内认定为满意,不低于分认定为非常满意;③市民对公交站点布局的满意率不低于即可启用该“方案”;④用样本的频率代替概率.(1)从该市市民中随机抽取人,求恰有人非常满意该“方案”的概率;并根据所学统计学知识判断该市是否启用该“方案”,说明理由;(2)已知在评分低于分的被调查者中,老年人占,现从评分低于分的被调查者中按年龄分层抽取人以便了解不满意的原因,并从中抽取人担任群众监督员,记为群众监督员中老年人的人数,求随机变量的分布列及其数学期望.【答案】(1) 该市应启用该方案(2)见解析24.某市政府为了节约生活用电,计划在本市试行居民生活费定额管理,即确定一户居民月用电量标准,用电量不超过的部分按平价收费,超出的部分按议价收费.为此,政府调查了100户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图所示.(1)根据频率分布直方图的数据,求直方图中的值并估计该市每户居民平均用电量的值;(2)用频率估计概率,利用(1)的结果,假设该市每户居民月平均用电量服从正态分布(i)估计该市居民月平均用电量介于度之间的概率;(ii)利用(i)的结论,从该市所有居民中随机抽取3户,记月平均用电量介于度之间的户数为,求的分布列及数学期望.【答案】(1)225.6.(2) (i);(ii)分布列见解析;.25.随着经济的发展,人民的收入水平逐步提高,为了解北京市居民的收入水平,某报社随机调查了名居民的月收入,得到如下的频率分布直方图:(1)求的值及这名居民的平均月收入(同一组中的数据用该组区间的中点值作代表)(2)①通过大数据分析,北京人的月收入服从正态分布,其中,,求北京人收入落在的概率;②将频率视为概率,若北京某公司一部门有人,记这人中月收入落在的人数为,求的数学期望. 附:若,则【答案】(1);.(2)①,②.。
2019年高考数学总复习9.5 用样本估计总体
【答案】C
8
5.容量为100的样本数据,按从小到大的顺序分为8组,如下 表:
组号 1 2 3 4 5 6 7 8 频数 10 13 14 14 15 13 12 9
第 3 组的频数和频率分别是 ( )
A.14 和 0.14 B.0.14 和 14
C. ������ 和 0.14 D.������和 ������
【答案】B
10
7.在样本x1, x2 , x3, x4 , x5中,若x1, x2 , x3的均值为80,x4 , x5的均值为90,
则x1, x2 , x3, x4 , x5的均值是
A.80 B.84 C.85 D.90
【答案】B
11
8.已知样本3,2,a,5的均值为3,则样本数据的方差是 ( )
A.1
B.1.5
C.2.5
D.6
【答案】B
12
二、填空题������ Nhomakorabea9.数据80,81,82,83的标准差为 ������
.
10.将一个容量为n的样本分成若干组,已知某组的频
数和频率分别为30和0.25,则n= 120
.
11.已知样本方差由S2=[(x1-5)2+(x2-5)2+…+(x8-5)2]
������
标准差为:S=
������ ������
[(������������������������
−
������������������������)������
+
(������������������������
−
������������������������)������
+
2019高考数学考点突破——统计与统计案例用样本估计总体学案
用样本估计总体【考点梳理】1.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图).横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征数字特征定义众数在一组数据中,出现次数最多的数据叫做这组数据的众数中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积相等平均数样本数据的算术平均数,即x=x1+x2+…+x nn方差s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2],其中s为标准差考点一、茎叶图及其应用【例1】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.[解析] (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67. (2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.【类题通法】1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2.(1)作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.(2)根据茎叶图中数据数字特征进行分析判断考查识图能力,判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.【对点训练】以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x +y 的值为______.[答案] 13[解析] 由茎叶图及已知得x =5,又乙组数据的平均数为16.8,即9+15+10+y +18+245=16.8,解得y =8,因此x +y =13. 考点二、频率分布直方图【例2】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.[解析] (1)由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.【类题通法】1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率和条形图混淆.2.抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键,并利用频率分布直方图可以估计总体分布.【对点训练】某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则从月平均用电量在[220,240)内的用户中应抽取多少户?[解析] (1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,得x=0.007 5,∴直方图中x 的值为0.007 5.(2)月平均用电量的众数是220+2402=230. ∵(0.002+0.009 5+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a ,则(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,解得a =224,即中位数为224.(3)月平均用电量在[220,240)内的用户有0.012 5×20×100=25(户),同理可求月平均用电量为[240,260),[260,280),[280,300]的用户分别有15户、10户、5户,故抽样比为1125+15+10+5=15. ∴从月平均用电量在[220,240)内的用户中应抽取25×15=5(户). 考点三、样本的数字特征【例3】为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h ).试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3 2.4服用B 药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.62.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?[解析] (1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y ,又观测结果可得1(0.6 1.2 1.2 1.5 1.5 1.8 2.2 2.3 2.3 2.4 2.520x =++++++++++ 2.6 2.7 2.7 2.8 2.9 3.0 3.1 3.2 3.5) 2.3+++++++++=,1(0.50.50.60.80.9 1.1 1.2 1.2 1.3 1.4 1.6 1.7 1.8 1.9 2.120y =++++++++++++++2.4 2.5 2.6 2.7 3.2) 1.6+++++=,由以上计算结果可得x >y ,因此可看出A 药的疗效更好.(2)由观测结果可绘制如下茎叶图: A 药B 药 60. 5 5 6 8 9 8 5 5 2 2 1. 1 2 2 3 4 6 7 8 99 8 7 7 6 5 4 3 3 2 2. 1 4 5 6 75 2 1 0 3.2 从以上茎叶图可以看出,A 药疗效的试验结果有10的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好. 【类题通法】1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式.2.平均数与方差所反映的情况有着重要的实际意义,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择.【对点训练】A 药B 药 0.1.2.3.某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.[解析] (1)这20名工人年龄的众数为30;这20名工人年龄的极差为40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为1 20(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.。
考点43 随机抽样、用样本估计总体 【2019年高考数学真题分类】
温馨提示:此题库为Word 版, 请按住Ctrl, 滑动鼠标滚轴, 调节合适的观看比例, 关闭Word 文档返回原板块。
考点43 随机抽样、用样本估计总体一、选择题1.(2019·全国卷Ⅰ文科·T6)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 ( )A.8号学生B.200号学生C.616号学生D.815号学生【命题意图】本题主要考查系统抽样.【解题指南】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案.【解析】选C .由已知将1 000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{a n },公差d =10,所以a n =6+10n (n ∈N *),若8=6+10n ,则n =,不合题意;若200=6+10n ,则n =19.4,不合题意;15若616=6+10n ,则n =61,符合题意;若815=6+10n ,则n =80.9,不合题意.故选C .2.(2019·全国卷Ⅱ理科·T5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 ( )A.中位数B.平均数C.方差D.极差【命题意图】考查统计中的数字特征,属于容易题.【解析】选A .由于去掉1个最高分、1个最低分,不影响中间的数值,故中位数不变.3.(2019·全国卷Ⅲ理科·T3同2019·全国卷Ⅲ文科·T4)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为 ( )A.0.5B.0.6 C .0.7 D .0.8【命题意图】本题考查抽样、利用样本估计总体,考查考生数据的分析、运算求解能力.【解析】选C .由题意知阅读过《红楼梦》而没有阅读过《西游记》的学生人数为80-60=20,所以阅读过《西游记》的学生人数为90-20=70,故所求的估计值为=0.7.70100二、填空题4.(2019·全国卷Ⅱ理科·T13同2019·全国卷Ⅱ文科·T14)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .【命题意图】本题主要考查频率、频数以及平均数的有关知识,容易题.【解析】=0.98. 10×0.97+20×0.98+10×0.9940答案:0.985.(2019·江苏高考·T5)已知一组数据6,7,8,8,9,10,则该组数据的方差是 .【命题意图】主要考查方差,运用方差公式计算.【解析】=×(6+7+8+8+9+10)=8, x 16所以方差为×[(6-8)2+(7-8)2+0+0+(9-8)2+(10-8)2]=. 1653答案:5 3三、解答题6.(2019·全国卷Ⅲ理科·T17同2019·全国卷Ⅲ文科·T17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值.(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【命题意图】本题考查用样本估计总体,意在考查考生频率分布直方图的运算求解能力.【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。
高考数学真题考点43 随机抽样、用样本估计总体
温馨提示:此题库为Word 版, 请按住Ctrl, 滑动鼠标滚轴, 调节合适的观看比例, 关闭Word 文档返回原板块。
考点43 随机抽样、用样本估计总体一、选择题1.(2019·全国卷Ⅰ文科·T6)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 ( )A.8号学生B.200号学生C.616号学生D.815号学生【命题意图】本题主要考查系统抽样.【解题指南】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案.【解析】选C .由已知将1 000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{a n },公差d =10,所以a n =6+10n (n ∈N *),若8=6+10n ,则n =15,不合题意;若200=6+10n ,则n =19.4,不合题意;若616=6+10n ,则n =61,符合题意;若815=6+10n ,则n =80.9,不合题意.故选C .2.(2019·全国卷Ⅱ理科·T5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 ( )A.中位数B.平均数C.方差D.极差【命题意图】考查统计中的数字特征,属于容易题.【解析】选A .由于去掉1个最高分、1个最低分,不影响中间的数值,故中位数不变.3.(2019·全国卷Ⅲ理科·T3同2019·全国卷Ⅲ文科·T4)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为 ( )A.0.5B.0.6 C .0.7 D .0.8【命题意图】本题考查抽样、利用样本估计总体,考查考生数据的分析、运算求解能力.【解析】选C .由题意知阅读过《红楼梦》而没有阅读过《西游记》的学生人数为80-60=20,所以阅读过《西游记》的学生人数为90-20=70,故所求的估计值为70100=0.7. 二、填空题4.(2019·全国卷Ⅱ理科·T13同2019·全国卷Ⅱ文科·T14)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .【命题意图】本题主要考查频率、频数以及平均数的有关知识,容易题.【解析】10×0.97+20×0.98+10×0.9940=0.98. 答案:0.985.(2019·江苏高考·T5)已知一组数据6,7,8,8,9,10,则该组数据的方差是 .【命题意图】主要考查方差,运用方差公式计算.【解析】x =16×(6+7+8+8+9+10)=8,所以方差为16×[(6-8)2+(7-8)2+0+0+(9-8)2+(10-8)2]=53.答案:53三、解答题6.(2019·全国卷Ⅲ理科·T17同2019·全国卷Ⅲ文科·T17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值.(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【命题意图】本题考查用样本估计总体,意在考查考生频率分布直方图的运算求解能力.【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。
2019年高考数学(理)考点一遍过 考点01 集合含解析
考点01 集合1.集合的含义与表示(1)了解集合的含义、元素与集合的属于关系.(2)能用自然语言、图形语言、集合语言(列举法或描述法)描述不同的具体问题. 2.集合间的基本关系(1)理解集合之间包含与相等的含义,能识别给定集合的子集.(2)在具体情境中,了解全集与空集的含义.3.集合的基本运算(1)理解两个集合的并集与交集的含义,会求两个简单集合的并集与交集.(2)理解在给定集合中一个子集的补集的含义,会求给定子集的补集.(3)能使用韦恩(V e n n)图表达集合的关系及运算.一、集合的基本概念1.元素与集合的关系:a Aa A∈⎧⎨∉⎩属于,记为不属于,记为.2.集合中元素的特征:3.集合的分类:有限集与无限集,特别地,我们把不含有任何元素的集合叫做空集,记作∅. 4.常用数集及其记法:注意:实数集R 不能表示为{x |x 为所有实数}或{R },因为“{ }”包含“所有”“全体”的含义. 5.集合的表示方法:自然语言、列举法、描述法、图示法. 二、集合间的基本关系必记结论:(1)若集合A 中含有n 个元素,则有2n 个子集,有21n -个非空子集,有21n -个真子集,有22n -个非空真子集.(2)子集关系的传递性,即,A B B C A C ⊆⊆⇒⊆.注意:空集是任何集合的子集,是任何非空集合的真子集,在涉及集合关系时,必须优先考虑空集的情况,否则会造成漏解.三、集合的基本运算 1.集合的基本运算{|B x x =|{B x x =2.集合运算的相关结论B A ⊆ B B ⊆ A A = ∅=∅B A ⊇B B ⊇A A =A ∅=()U A A =U U =∅U U ∅=)A A =∅A U =3.必记结论(.)U UU A B A B A A B B A B A B ⊆⇔=⇔=⇔⊇=⇔∅痧?考向一 集合的基本概念解决集合概念问题的一般思路:(1)研究集合问题时,首先要明确构成集合的元素是什么,即弄清该集合是数集、点集,还是其他集合,然后再看集合的构成元素满足的限制条件是什么,从而准确把握集合的意义.常见的集合的意义如下表:(2)利用集合元素的限制条件求参数的值或确定集合中的元素的个数时,要注意检验集合是否满足元素的互异性.典例1 已知集合{}1,1A =-,{}1,0,1B =-,则集合{}|, C a b a A b B -∈∈=中元素的个数为 A .2 B .3 C .4 D .5【答案】D【名师点睛】在解题时经常用到集合元素的互异性,一方面利用集合元素的互异性能顺利找到解题的切入点;另一方面,在解答完毕时,注意检验集合的元素是否满足互异性,以确保答案正确.1.已知集合,若,则非零实数的值是_________. 考向二 集合间的基本关系集合间的基本关系在高考中时有出现,常考查求子集、真子集的个数及利用集合关系求参数的取值范围问题,主要以选择题的形式出现,且主要有以下两种命题角度:(1)求子集的个数;(2)由集合间的关系求参数的取值范围.典例2 已知集合22{|0},{|,}2x A x B y y x x A x -=∈≤==∈+Z ,则集合B 的子集的个数为 A .7 B .8 C .15 D .16【答案】B【名师点睛】求集合的子集(真子集)个数问题,当集合的元素个数较少时,也可以利用枚举法解决,枚举法不失为求集合的子集(真子集)个数的好方法,使用时应做到不重不漏.2.已知集合{}1,0,A a =-,{}B a =.若B A ⊆,则实数a 的值为__________.考向三 集合的基本运算有关集合间运算的试题,在高考中多以客观题的形式出现,且常与函数、方程、不等式等知识相结合,难度一般不大,常见的类型有:(1)有限集(数集)间集合的运算求解时,可以用定义法和Venn 图法,在应用Venn 图时,注意全集内的元素要不重不漏. (2)无限集间集合的运算常结合不等式等内容考查,一般先化简集合,再将集合在数轴上表示出来,最后进行集合运算求范围. (3)用德·摩根公式法求解集合间的运算 对于有()()U U A B 痧和()()U U A B 痧的情况,可以直接应用德·摩根公式()()()U U U A B A B =痧?和()()()U U U A B A B =痧?进行运算.典例3 已知集合,,则()P Q =R ðA .B .C .D .【答案】C【解析】因为或,所以2|03P x x ⎧⎫=<<⎨⎬⎩⎭R ð又因为 ,所以()PQ =R ð,故选C .【名师点睛】对连续数集间的运算,借助数轴的直观性,进行合理转化;对已知连续数集间的关系,求其中参数的取值范围时,要注意单独考查等号能否取到.3.设集合,集合,则 A . B . C .D .4.设集合,已知,那么的取值范围是A .B .C .D .考向四 与集合有关的创新题目与集合有关的创新题目是近几年高考的一个新趋势,试题出现较多的是在现有运算法则和运算律的基础上定义一种新的运算,并运用它解决相关的一些问题.解决以集合为背景的新定义问题,要抓住两点:(1)紧扣新定义.首先分析新定义的特点,把新定义所叙述的问题的本质弄清楚,并能够应用到具体的解题过程之中,这是破解新定义型集合问题难点的关键所在;(2)用好集合的性质.集合的性质(概念、元素的性质、运算性质等)是破解新定义型集合问题的基础,也是突破口,在解题时要善于从试题中发现可以使用集合性质的一些因素,在关键之处用好集合的运算与性质.典例4 设S 是整数集Z 的非空子集,如果,a b S ∀∈,有ab S ∈,则称S 关于数的乘法是封闭的.若,T V 是Z 的两个不相交的非空子集,T V =Z ,且,,a b c T ∀∈,有abc T ∈;,,x y z V ∀∈,有xyz V ∈,则下列结论恒成立的是A .,T V 中至少有一个关于乘法是封闭的B .,T V 中至多有一个关于乘法是封闭的C .,T V 中有且只有一个关于乘法是封闭的D .,T V 中每一个关于乘法都是封闭的 【答案】A1.已知集合{}|1A x x =>-,则下列选项正确的是 A .0A ⊆ B .{}0A ⊆ C . A ∅∈D .{}0A ∈2.已知单元素集合(){}2|210A x x a x =-++=,则a = A .0 B .-4 C .-4或1 D .-4或03.已知集合,则M N ð=A .B .C .D .4.已知集合,,则A .B .C .D .5.已知集合,若,则实数的值为 A .B .C .D .6.已知全集,集合1{|,01}M y y x x==<<,,则下图中阴影部分所表示的集合为A .B .C .D .7.已知集合,,则满足条件的集合的个数有A .2个B .3个C .4个D .5个 8.设集合,,则下列关系正确的是 A .B .C .A B ⊆R R痧D .B A ⊆R ð9.已知集合{}4,5,6P =,{}1,2,3Q =,定义{},,P Q x x p q p P q Q ⊕==-∈∈,则集合P Q ⊕的所有非空真子集的个数为 A .32 B .31 C .30 D .以上都不对 10.设集合,,则的真子集的个数为A .3B .4C .7D .8 11.设集合,其中,若,则实数_______. 12.若集合,,,则的取值范围是_______.13.已知集合{,,}{0,1,2}a b c =,且下列三个关系:①2a ≠;②2b =;③0c ≠有且只有一个正确,则10010a b c++等于________.14.已知集合,集合,集合,若AB C ⊆,则实数m 的取值范围是_______.1.(2018浙江)已知全集U ={1,2,3,4,5},A ={1,3},则=U A ð A .∅ B .{1,3}C .{2,4,5}D .{1,2,3,4,5}2.(2018新课标全国Ⅰ理科)已知集合{}220A x x x =-->,则A =R ð A .{}12x x -<<B .{}12x x -≤≤ C .}{}{|1|2x x x x <->D .}{}{|1|2x x x x ≤-≥3.(2018新课标全国Ⅲ理科)已知集合{}|10A x x =-≥,{}012B =,,,则A B =A .{}0B .{}1C .{}12,D .{}012,, 4.(2018新课标全国Ⅱ理科)已知集合(){}223A x y xy x y =+∈∈Z Z ,≤,,,则A 中元素的个数为 A .9 B .8 C .5D .45.(2017新课标全国Ⅰ理科)已知集合A ={x |x <1},B ={x |31x <},则 A .{|0}A B x x =< B .A B =R C .{|1}AB x x =>D .AB =∅6.(2017新课标全国Ⅱ理科)设集合{}1,2,4A =,{}240B x x x m =-+=.若{}1A B =,则B =A .{}1,3-B .{}1,0C .{}1,3D .{}1,57.(2017天津理科)设集合{1,2,6},{2,4},{|15}A B C x x ===∈-≤≤R ,则()AB C =A .{2}B .{1,2,4}C .{1,2,4,6}D .{|15}x x ∈-≤≤R8.(2017江苏)已知集合{1,2}A =,2{,3}B a a =+,若{1}A B =,则实数a 的值为 ▲ .1.【答案】 【解析】若则此时集合B 不符合元素的互异性,故若则符合题意;若则不符合题意.故答案为2.4.【答案】C 【解析】∵集合,集合,且,∴.故选C .1.【答案】B【解析】元素与集合的关系,用 ∈ ;集合与集合的关系,用 ⊆ ,可知 B 正确. 2.【答案】D【解析】由于只有一个元素,故判别式为零,即()222440,a a a +-=+=得0a =或4a =-.故选D . 3.【答案】B 【解析】由已知,则M Nð,故选B .4.【答案】A【解析】由题意,集合,所以,故选A .5.【答案】B 【解析】或,解得或,由集合中元素的互异性知,故选B .7.【答案】C考点冲关【解析】因为,,所以集合中一定含有元素1,所以符合条件的集合为,故选C.8.【答案】C 【解析】由题意,,∴,只有C 正确.9.【答案】C【解析】根据新定义的运算可知{}1,2,3,4,5P Q ⊕=,P Q ∴⊕的所有非空真子集的个数为52230-=,故选C . 10.【答案】C【解析】∵,,,其真子集个数为,故选C .11.【答案】【解析】因为A =B ,所以故答案为.12.【答案】【解析】根据题意,可以求得,,因为,所以,结合数轴可以求得,所以的取值范围是.13.【答案】201【解析】可分下列三种情形:(1)若只有①正确,则a ≠2,b ≠2,c =0,所以a =b =1,与集合中元素的互异性相矛盾,所以只有①正确是不可能的;(2)若只有②正确,则b =2,a =2,c =0,这与集合中元素的互异性相矛盾,所以只有②正确是不可能的; (3)若只有③正确,则c ≠0,a =2,b ≠2,所以c =1,b =0,所以100a +10b +c =100×2+10×0+1=201. 14.【答案】1,12⎡⎤-⎢⎥⎣⎦【解析】由题意,{|12}A B x x =-<<,集合{|10}C x mx A B C =+⊆>,,则①当0m <时,11112022x m m m m -∴-≥∴≥-∴-≤<,,,<;②当m 0=时,成立;③当0m >时1.【答案】C 【解析】因为全集,,所以根据补集的定义得,故选C .2.【答案】B 【解析】解不等式得,所以,所以可以求得{}|12A x x =-≤≤R ð,故选B .【名师点睛】该题考查的是有关一元二次不等式的解法以及集合的补集的求解问题,在解题的过程中,需要明确一元二次不等式的解集的形式以及补集中元素的特征,从而求得结果. 3.【答案】C【解析】易得集合{|1}A x x =≥,所以{}1,2A B =,故选C .4.【答案】A 【解析】,当时,;当时,;当时,,所以共有9个元素,选A .6.【答案】C 【解析】由{}1A B =得1B ∈,即1x =是方程240x x m -+=的根,所以140,3m m -+==,{}1,3B =,故选C .【名师点睛】集合中元素的三个特性中的互异性对解题影响较大,特别是含有字母的集合,在求出字母的值后,要注意检验集合中的元素是否满足互异性.两个防范:①不要忽视元素的互异性;②保证运算的准确性. 7.【答案】B 【解析】(){1,2,4,6}[1,5]{1,2,4}A B C =-=,故选B .8.【答案】1【解析】由题意1B ∈,显然233a +≥,所以1a =,此时234a +=,满足题意,故答案为1.【名师点睛】(1)认清元素的属性.解决集合问题时,认清集合中元素的属性(是点集、数集或其他情形)和化简集合是正确求解的两个先决条件.(2)注意元素的互异性.在解决含参数的集合问题时,要注意检验集合中元素的互异性,否则很可能会因为不满足“互异性”而导致错误. (3)防范空集.在解决有关,A B A B =∅⊆等集合问题时,往往容易忽略空集的情况,一定要先考虑∅时是否成立,以防漏解.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本估计总体
(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
(2)理解样本数据标准差的意义和作用,会计算数据标准差.
(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题
.
一、数字特征
1.众数、中位数、平均数
2.极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:2
222121
[()()()]n s x x x x x x n
=
-+-++-.
标准差:s =
注:平均数反映了数据取值的平均水平,方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定. 3.性质 (1)若12,,,n x x x 的平均数为x ,那么12,,,n mx a mx a mx a +++的平均数为mx a +.
(2)数据12,,,n x x x 与数据1122n n x x a x x a x x a '='='=+++,,,的方差相等,即数据经过平移后
方差不变. (3)若12,,,n x x x 的方差为s 2,那么12,
,n ax b ax b ax b +++,的方差为22a s .
二、茎叶图 1.定义
茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. 2.表示方法
(1)对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理. (2)对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎. 三、统计表 1.频率分布直方图
(1)画频率分布直方图的步骤
①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; ③将数据分组; ④列频率分布表;
⑤画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值). (2)频率分布直方图的性质
①落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1. ②频率分布直方图与众数、中位数与平均数的关系
a.最高的小长方形底边中点的横坐标即是众数;
b.中位数左边和右边的小长方形的面积和是相等的;
c.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底
边中点的横坐标之和.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来
越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.各种统计表的优点与不足
考向一数字特征的应用
明确数字特征的意义:
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
典例1 某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为 A .85,85,85 B .87,85,86 C .87,85,85 D .87,85,90
【答案】C
【解析】平均数=100+95+90×2+85×4+80+75
10
=87分,众数为85,中位数为85.故选C.
1.若一组数据的方差为1,则
的方差为
A .1
B .2
C .4
D .8
2.已知一组数据3,5,7,x ,10的平均数为6,则这组数据的方差为 A .
335 B .6
C .285
D .5
考向二 茎叶图的应用
茎叶图的优、缺点:
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示,其缺点是当样本容量较大时,作图较繁琐.
典例2 为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.
据此可估计上学期该校400名教师中,使用多媒体进行教学次数在[16,30)内的人数为
A.100 B.160
C.200 D.280
【答案】B
3.一次数学考试后,某老师从自己所带的两个班级中各抽取6人,记录他们的考试成绩,得到如图所示的
-=茎叶图.已知甲班6名同学成绩的平均数为82,乙班6名同学成绩的中位数为77,则x y
-
A.3 B.3
-
C.4 D.4
考向三频率分布直方图的应用
频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:
(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.
(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.
典例3 某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的2000名顾客的消费金额(单位:元),并从中随机抽取了100名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]进行统计,得到如图所示的频率分布直方图.已知a,b,c成等差数列,则该商店这一个月来消费金额超过150元的顾客数量约为
A.600 B.30
C.60 D.300
【答案】A
4.200辆载着某炮兵团士兵的汽车急赴某地抗洪抢险,如图是汽车途经某大桥时的速度的频率分布直方图,则这200辆汽车的速度的中位数的估计值为
A.64 B.63
C.63.5 D.65
典例4 为了增强学生的环保意识,某中学随机抽取了50名学生举行了一次环保知识竞赛,并将本次竞赛的成绩(得分均为整数,满分100分)进行整理,制成下表:
(1)作出被抽查学生成绩的频率分布直方图;
(2)若从成绩在[40,50)中选1名学生,从成绩在[90,100]中选2名学生,共3名学生召开座谈会,求[40,50)组中学生A1和[90,100]组中学生B1同时被选中的概率.
A 1
B 1B 2,A 1B 1B 3,A 1B 1B 4,A 1B 2B 3,A 1B 2B 4,A 1B 3B 4,A 2B 1B 2,A 2B 1B 3,A 2B 1B 4,A 2B 2B 3,A 2B 2B 4,A 2B 3B 4,共12个,
事件M 包含的基本事件为:A 1B 1B 2,A 1B 1B 3,A 1B 1B 4,共3个, 所以学生A 1和B 1同时被选中的概率为P (M )=312=1
4
.
5.已知经销某种商品的电商在任何一个销售季度内,每售出1吨该商品可获利润0.5万元,未售出的商品,每1吨亏损0.3万元.根据往年的销售经验,得到一个销售季度内市场需求量的频率分布直方图如图所示.已知电商为下一个销售季度筹备了130吨该商品.现以x (单位:吨,100150x ≤≤)表示下一个销售季度的市场需求量,T (单位:万元)表示该电商下一个销售季度内经销该商品获得的利润. (1)根据频率分布直方图,估计一个销售季度内市场需求量x 的平均数与中位数的大小; (2)根据频率分布直方图估计利润T 不少于57万元的概率.
1.有下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有
A.0个B.1个
C.2个D.3个
2.某商场对一个月内每天的顾客人数进行统计,得到如图所示的样本茎叶图,则该样本的中位数和众数分别是
A.46,45 B.45,46
C.45,45 D.47,45
3.某仪器厂从新生产的一批零件中随机抽取40个检测.如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为、,、、、
、、,则样本的中位数在。