第1讲 随机抽样、用样本估计总体

合集下载

12第一部分 板块二 专题四 概率与统计 第1讲 概率与统计(小题)

12第一部分 板块二 专题四 概率与统计 第1讲 概率与统计(小题)

第1讲概率与统计(小题)热点一随机抽样1.随机抽样的各种方法中,每个个体被抽到的概率都是相等的.2.系统抽样又称“等距”抽样,被抽到的各个号码间隔相同.3.分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.例1(1)(2019·汉中联考)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:不喜欢喜欢男性青年观众3010女性青年观众3050现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢的男性青年观众”的人中抽取了6人,则n等于()A.12 B.16 C.20 D.24(2)(2019·上饶联考)某校高三科创班共48人,班主任为了解学生高考前的心理状况,将学生按1至48的学号用系统抽样方法抽取8人进行调查,若抽到的最大学号为48,则抽到的最小学号为________.跟踪演练1(1)(2019·漳州质检)某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,…,599,600从中抽取60个样本,如下提供随机数表的第4行到第6行:32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号为()A .522B .324C .535D .578(2)(2019·合肥质检)某工厂生产的A ,B ,C 三种不同型号的产品数量之比为2∶3∶5,为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A ,B ,C 三种产品中抽出样本容量为n 的样本,若样本中A 型产品有10件,则n 的值为( ) A .15 B .25 C .50 D .60 热点二 用样本估计总体1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数 频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.4.对于其他的统计图表,要注意结合问题背景分析其所表达的意思,进而解决所给问题. 例2 (1)(2019·厦门质检)下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份(2)(2019·临沂质检)已知8位学生的某次数学测试成绩的茎叶图如图,则下列说法正确的是( )A .众数为7B .极差为19C.中位数为64.5 D.平均数为64跟踪演练2(1)已知某高中的一次测验中,甲、乙两个班级的九科平均分的雷达图如图所示,下列判断错误的是()A.乙班的理科综合成绩强于甲班B.甲班的文科综合成绩强于乙班C.两班的英语平均分分差最大D.两班的语文平均分分差最小(2)(2019·黄冈模拟)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的学生称为“阅读霸”,则下列命题正确的是()A.抽样表明,该校约有一半学生为阅读霸B.该校只有50名学生不喜欢阅读C.该校只有50名学生喜欢阅读D.抽样表明,该校有50名学生为阅读霸热点三变量间的相关关系、统计案例高考中解决变量间的相关关系问题时需注意:(1)回归直线一定过样本点的中心(x,y).(2)随机变量K2的观测值k越大,说明“两个变量有关系”的可能性越大.例3(1)(2019·皖江联考)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温x (℃) 18 13 10 -1 用电量y (度)24343864由表中数据得线性回归方程y ^=b ^x +a ^中b ^=-2,预测当温度为-5 ℃时,用电量的度数约为( )A .64B .66C .68D .70(2)某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:使用智能手机不使用智能手机总计 学习成绩优秀 4 8 12 学习成绩不优秀16 2 18 总计201030附表:P (K 2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828经计算K 2的观测值k =10,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响跟踪演练3 (1)(2019·长春质检)某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),上图为选取的15名志愿者身高与臂展的折线图,下图为身高与臂展所对应的散点图,并求得其回归方程为y ^=1.16x -30.75,以下结论中不正确的为( )A .15名志愿者身高的极差小于臂展的极差B .15名志愿者身高和臂展成正相关关系C .可估计身高为190厘米的人臂展大约为189.65厘米D .身高相差10厘米的两人臂展都相差11.6厘米(2)(2019·泸州模拟)随着国家二胎政策的全面放开,为了调查一线城市和非一线城市的二胎生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线城市一线城市 总计 愿生 45 20 65 不愿生 13 22 35 总计5842100附表:P (K 2≥k 0)0.100 0.050 0.010 0.001 k 02.7063.8416.63510.828由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算得,K 2的观测值k =100×(45×22-20×13)258×42×35×65≈9.616,参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关”真题体验1.(2019·全国Ⅰ,文,6)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生2.(2018·全国Ⅰ,文,3)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半3.(2018·全国Ⅲ,文,14)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.押题预测1.某市气象部门根据2018年各月的每天最高气温平均值与最低气温平均值(单位:℃)数据,绘制如下折线图:那么,下列叙述错误的是( )A .各月最高气温平均值与最低气温平均值总体呈正相关B .全年中,2月份的最高气温平均值与最低气温平均值的差值最大C .全年中各月最低气温平均值不高于10 ℃的月份有5个D .从2018年7月至12月该市每天最高气温平均值与最低气温平均值都呈下降趋势 2.给出如下列联表患心脏病 患其他病 总 计 高血压 20 10 30 非高血压 30 50 80 总 计5060110P (K 2≥10.828)≈0.001,P (K 2≥6.635)≈0.010,参照公式k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),得到的正确结论是( )A .有99%以上的把握认为“高血压与患心脏病无关”B .有99%以上的把握认为“高血压与患心脏病有关”C .在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病无关”D .在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病有关” 3.某设备的使用年数x 与所支出的维修总费用y 的统计数据如下表:使用年数x (单位:年) 2 3 4 5 6 维修总费用y (单位:万元)1.54.55.56.57.5根据上表可得线性回归方程为y ^=1.4x +a ^.若该设备维修总费用超过12万元就报废,据此模型预测该设备最多可使用________年.A 组 专题通关1.(2019·河北省五个一名校联盟联考)经调查,某市骑行共享单车的老年人、中年人、青年人的比例为1∶3∶6,用分层抽样的方法抽取了一个容量为n 的样本进行调查,其中中年人数为12人,则n 等于( ) A .30 B .40 C .60D .802.某校李老师本学期负责高一甲、乙两个班的数学课,两个班都是50个学生,如图反映的是两个班的本学期5次数学测试中的班级平均分对比情况,根据图中信息,下列结论不正确的是( )A .甲班的数学平均成绩高于乙班B .乙班的数学成绩没有甲班稳定C .下次测试乙班的数学平均分高于甲班D .在第1次测试中,甲、乙两个班总平均分为783.(2019·全国Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A .0.5 B .0.6 C .0.7 D .0.84.某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校2 400名学生中抽取30人进行调查.现将2 400名学生随机地从1~2 400编号,按编号顺序平均分成30组(1~80号,81~160号,…,2 321~2 400号),若第3组与第4组抽出的号码之和为432,则第6组抽到的号码是( ) A .416 B .432 C .448 D .4645.(2019·郑州质检)若1,2,3,4,m (m ∈R )这五个数的平均数等于其中位数,则m 等于( ) A .0或5 B .0或52 C .5或52 D .0或5或526.(2019·长春质检)下列命题:①在线性回归模型中,相关指数R 2表示解释变量x 对于预报变量y 的贡献率,R 2越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在线性回归方程y ^=-0.5x +2中,当解释变量x 每增加一个单位时,预报变量y ^平均减少0.5个单位;④对分类变量X 与Y ,它们的随机变量K 2的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.其中正确命题的个数是( ) A .1 B .2 C .3 D .47.(2019·衡水质检)某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图所示,则下列结论错误的是( )A .得分在[40,60)之间的共有40人B .从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5C .估计得分的众数为55D .这100名参赛者得分的中位数为658.(2019·济宁模拟)如图为某市国庆节7天假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断:①日成交量的中位数是16;②日成交量超过日平均成交量的有2天;③认购量与日期正相关;④10月7日认购量的增幅大于10月7日成交量的增幅.则上述判断正确的个数为( )A .0B .1C .2D .39.(2019·广东天河区普通高中测试)为保证树苗的质量,林业管理部门在每年3月12日植树节前都对树苗进行检测,现从甲、乙两种树苗中各抽测了10株树苗的高度(单位:cm),其茎叶图如图所示,则下列描述正确的是( )A .甲种树苗的平均高度大于乙种树苗的平均高度,甲种树苗比乙种树苗长得整齐B .甲种树苗的平均高度大于乙种树苗的平均高度,乙种树苗比甲种树苗长得整齐C .乙种树苗的平均高度大于甲种树苗的平均高度,乙种树苗比甲种树苗长得整齐D .乙种树苗的平均高度大于甲种树苗的平均高度,甲种树苗比乙种树苗长得整齐10.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问110名不同的大学生是否爱好该项运动,得出2×2列联表,由计算可得K 2≈8.806.P (K 2≥k 0)0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.828参照附表,得到的正确结论是( )A .有99.5%以上的把握认为“爱好该项运动与性别无关”B .有99.5%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.05%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.05%的前提下,认为“爱好该项运动与性别无关”11.已知变量x ,y 之间的线性回归方程为y ^=-0.7x +10.3,且变量x ,y 之间的一组数据如下表所示,则下列说法中错误的是( )x 6 8 10 12 y6m32A.变量x ,y 之间呈现负相关关系 B .可以预测当x =20时,y ^=-3.7 C .m =4D .由表格数据知,该回归直线必过点(9,4)12.(2019·江淮质检)为了了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( )A .是否倾向选择生育二胎与户籍有关B .是否倾向选择生育二胎与性别有关C .倾向选择生育二胎的人员中,男性人数与女性人数相同D .倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数13.(2019·河南省九师联盟质检)为了了解世界各国的早餐饮食习惯,现从由中国人、美国人、英国人组成的总体中用分层抽样的方法抽取一个容量为m 的样本进行分析.若总体中的中国人有400人、美国人有300人、英国人有300人,且所抽取的样本中,中国人比美国人多10人,则样本容量m =________.14.某班40名学生参加普法知识竞赛,成绩都在区间[40,100]内,其频率分布直方图如图所示,则成绩不低于60分的人数为________.15.(2019·成都模拟)节能降耗是企业的生存之本,树立一种“点点滴滴降成本,分分秒秒增效益”的节能意识,以最好的管理,来实现节能效益的最大化.为此某国企进行节能降耗技术改造,下面是该国企节能降耗技术改造后连续五年的生产利润:年号1 2 3 4 5 年生产利润y (单位:千万元)0.70.811.11.4预测第8年该国企的生产利润约为________千万元.参考公式及数据:b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2;a ^=y -b ^x ,∑i =15(x i -x )(y i-y )=1.7, i =15(x i -x )2=10.根据该折线图,下列结论正确的是________(填序号). ①月接待游客量逐月增加;②年接待游客量逐年增加; ③各年的月接待游客量髙峰期大致在7,8月份;④各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳.B 组 能力提高17.(2019·葫芦岛模拟)近日,据媒体报道称,“杂交水稻之父”袁隆平及其团队培育的超级杂交稻品种“湘两优900(超优千号)”再创亩产世界纪录,经第三方专家测产,该品种的水稻在实验田内亩产1 203.36公斤.中国工程院院士袁隆平在1973年率领科研团队开启了杂交水稻王国的大门,在数年的时间内就解决了十多亿人的吃饭问题,有力回答了世界“谁来养活中国”的疑问.2012年,在袁隆平的实验田内种植了A ,B 两个品种的水稻,为了筛选出更优的品种,在A ,B 两个品种的实验田中分别抽取7块实验田,如图所示的茎叶图记录了这14块实验田的亩产量(单位:10 kg),通过茎叶图比较两个品种的平均数及方差,并从中挑选一个品种进行以后的推广,有如下结论:①A 品种水稻的平均产量高于B 品种水稻,推广A 品种水稻;②B 品种水稻的平均产量高于A 品种水稻,推广B 品种水稻;③A 品种水稻的产量比B 品种水稻更稳定,推广A 品种水稻;④B 品种水稻的产量比A 品种水稻更稳定,推广B 品种水稻;其中正确结论的编号为( )A .①②B .①③C .②④D .①④18.(2019·南昌模拟)已知具有线性相关的五个样本点A 1(0,0),A 2(2,2),A 3(3,2),A 4(4,2),A 5(6,4),用最小二乘法得到回归直线l 1:y ^=b ^x +a ^,过点A 1,A 2的直线l 2:y =mx +n ,那么下列说法中,正确的有________.(填序号) ①m >b ^,a ^>n ; ②直线l 1过点A 3;③∑i =15(y i -b ^x i -a ^)2≥∑i =15 (y i -mx i -n )2; ④∑i =15|y i -b ^x i -a ^|≥∑i =15|y i -mx i -n |.⎝ ⎛⎭⎪⎪⎫参考公式:b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2= ∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2,a ^=y -b ^x。

随机抽样方法

随机抽样方法

随机抽样方法
随机抽样方法是一种常用的统计学方法,它通过随机抽取样本来代表整体总体,从而进行统计分析和推断。

在实际应用中,随机抽样方法被广泛运用于调查研究、市场调研、医学实验等领域。

本文将介绍随机抽样方法的定义、特点、常见类型以及应用注意事项。

首先,随机抽样方法是指在总体中,每个个体被抽取为样本的概率是相等的,
且相互独立。

这意味着每个个体都有被抽取为样本的机会,从而能够代表整体总体。

随机抽样方法的特点是能够减小抽样误差,提高样本的代表性和可靠性。

随机抽样方法有多种类型,常见的包括简单随机抽样、分层随机抽样、整群随
机抽样等。

简单随机抽样是指从总体中随机抽取样本,每个个体被抽到的概率相等,相互独立。

分层随机抽样是将总体按照某种特征分成若干层,然后在每一层中进行简单随机抽样。

整群随机抽样是将总体按照某种特征分成若干群,然后随机抽取若干群作为样本。

不同类型的随机抽样方法适用于不同的研究对象和目的,研究者需要根据实际情况选择合适的抽样方法。

在应用随机抽样方法时,需要注意一些事项。

首先,抽样前需要对总体进行充
分的了解,包括总体特征、分布规律等。

其次,抽样时需要保证样本的代表性和随机性,避免抽样偏差。

最后,对于不同类型的随机抽样方法,需要根据实际情况进行灵活运用,选择最适合的抽样方法。

总之,随机抽样方法是一种重要的统计学方法,它能够有效地代表总体,提高
统计分析的准确性和可靠性。

在实际应用中,研究者需要根据实际情况选择合适的抽样方法,并注意抽样过程中的各项细节,以确保研究结果的科学性和可信度。

2023年高考数学一轮复习 新高考方案 课件第九章 统计与成对数据的统计分析

2023年高考数学一轮复习 新高考方案 课件第九章  统计与成对数据的统计分析
解析:设 20 名女生的平均成绩为 x ,则 92=3500×90+2500× x ,解得 x =95.
答案:95
• 层级一/ 基础点——自练通关(省时间)
• 基础点(一) 抽样方法
• [题点全训]
• 1.某班有男生36人,女生18人,用分层随机抽样的方法从该班全 体学生中抽取一个容量为9的样本,则抽取的女生人数为
在一组数据中出现次数_最__多__的数
中位数 将一组数据按_大__小__顺__序___依次排列(相同的数据要重复列出), 处在最中间位置的那个数据(或最中间两个数据的平均数)
平均数
一组数据的_算__术__平__均__数___
方差
s2=n1[(x1- x )2+(x2- x )2+…+(xn- x )2](xn 是样本数据,n 是样本容量, x 是样本平均数),其中 s 是标准差
样本量
(3)平均数计算
在分层随机抽样中,如果层数分为 2 层,第 1 层和第 2 层包含的个体数分
别为 M 和 N,抽取的样本量分别为 m 和 n,第 1 层和第 2 层样本的平均数分别

x

y
,则样本的平均数
w

m m+n
x
+m+n n
y
M = M+N
x +M+N N y .
• 3.作频率分布直方图的步骤 • (1)求极_差____ (即一组数据中最大值与最小值的差);
• 8 44 2 17 8 31 57 4 55 6
•88 77 74 47 7 21 76 33 50 63
•解析:生成的随机数中落在编号1~100范围内的有8,44,2,17,8(重 复,舍弃),31……故选中的第5个个体的编号为31.

样本估计总体 系统抽样 统计与统计案例

样本估计总体 系统抽样 统计与统计案例

高考总复习:统计与统计案例【考纲要求】1.随机抽样(1)理解随机抽样的必要性和重要性;(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. 2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题. 3.变量的相关性(1)会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆). 【知识网络】【考点梳理】考点一、随机抽样从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项统计图表用样本估计总体统计简单随机抽样数据的整 理分析数据的数字特征 分层抽样系统抽样变量的相关性指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样 简单随机抽样的概念:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.① 用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为n N;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等; ③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等.②为将整个的编号分段 (即分成几个部分),要确定分段的间隔k .当Nn是整数时(N 为总体中的个体的个数,n 为样本容量),N k n =;当Nn 不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数'N 能被n 整除,这时'N k n=.③在第一段用简单随机抽样确定起始的个体编号l .④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l k +,第3个编号2l k +,这样继续下去,直到获取整个样本).要点诠释:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.4.常用的三种抽样方法的比较:要点诠释:(1)各种抽样的个体被抽到的概率相等;(2)抽样过程中个体被抽到的概率相等.5.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样考点二、用样本估计总体1. 统计图表包括条形图、折线图、饼图、茎叶图.2.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布表3.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离,s = (2)方差: 2222121[()()...()]n s x x x x x x n=-+-++- (n x 是样本数据,n 是样本容量,x 是样本平均数)要点诠释:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与有样本的频率分布近似代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标 6. 频率分布直方图反映样本的频率分布 (1)频率分布直方图中横坐标表示组距,纵坐标表示组距频率,频率=组距×组距频率(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. (4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标. 考点三、变量的相关性 1. 散点图将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合.2.两个变量的线性相关(1)相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.(2)正相关在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(3)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (4)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.3.回归方程 (1)最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程$y bx a =+是两个具有线性相关关系的变量的一组数据1122(,),(,),(,),n n x y x y x y L 的回归方程,期中,a b 是待定参数.$1122211()()()n ni i i ii i n ni ii i x x y y x ynxy b x x xnx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑$要点诠释:相关关系与函数关系的异同点: 相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系; ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 考点四、统计案例 1.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;(2)随机误差:线性回归模型用y bx a e =++表示,其中a,b 为模型的未知数,e 称为随机误差. (3)样本点的中心在具有线性相关关系的数据1122(,),(,),(,),n n x y x y x y L 中回归方程的截距和斜率的最小二乘估计公式分别为:$$121()(),=-()nii i nii xx y y ba y bxxx ==--=-∑∑$$ 其中111,=,(,,)nni i i i x x y x x y n ===∑∑称为样本点的中心.(4)相关系数①()()nii xx y y r --=∑②当>0r 时,表明两个变量正相关; 当<0r 时,表明两个变量负相关.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常r 大于0.75时,认为两个变量有很强的线性相关性.2.残差分析 (1)总偏差平方和把每个效应(观测值减去总的平均值)的平方加起来即:21()nii yy =-∑(2)残差数据点和它回归直线上相应位置的差异µ2()i i y y -是随机误差的效应,称µµ=i ii e y y -为残差. (3)残差平方和µ21()nii i yy =-∑.(4)相关指数µ22121()()nii i n ii yy R yy ==-=-∑∑2R 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中, 2R 表示解释变量对预报变量变化的贡献率, 2R 越接近于1,表示回归的效果越好.3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y,它们的可能取值分别为1122{,}{,}x y x y 和,其样本频数列联表(称为2×2列联表)为2×2列联表1y 2y总计1x a b a b + 2xcd c d + 总计a c +b d +a b c d +++构造一个随机变量22()()()()()n ad bc K a b c d a c b d -=++++,其中a b c d +++为样本容量.(3)独立性检验利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.注: 在独立性检验中经常由2K 得到观测值k ,则k =2K 是否成立?(2K 与k 的关系并不是k =2K ,k 是2K 的观测值,或者说2K 是一个随机变量,它在a ,b ,c ,d )取不同值时,2K 可能不同,而k 是取定一组数a ,b ,c ,d 后的一个确定的值. 【典型例题】类型一、简单随机抽样【例1】某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?【思路点拨】简单随机抽样一般采用两种方法:抽签法和随机数表法.【解析】解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.【总结升华】从以上两种方法可以看出,当总体个数较少时用两种方法都可以,当样本总数较多时,方法2优于方法1.举一反三:【变式】某大学为了支持奥运会,从报名的24名大三的学生中选6人组成志愿小组,请用抽签法和随机数表法设计抽样方案.【思路点拨】(1)总体的个体数较少,利用抽签法或随机数表法可容易获取样本;(2)抽签法的操作要点:编号、制签、搅匀、抽取;(3)随机数表法的操作要点:编号、选起始数、读数、获取样本.【解析】抽签法第一步:将24名志愿者编号,编号为1,2,3, (24)第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;[来源:]第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法第一步:将24名学生编号,编号为01,02,03,……24;第二步:在随机数表中任选一数开始,按某一确定方向读数;第三步:凡不在01~24中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:找出号码与记录的数相同的学生组成志愿小组.类型二、系统抽样【例2】某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.【思路点拨】按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.【解析】按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293.【总结升华】系统抽样可按事先规定的规则抽取样本. 本题采用的规则是第一组随机抽取的学生编号为k,那么第m组抽取的学生编号为k+5(m-1).举一反三:【变式】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为l ,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第最小组中抽取的号码个位数字与m+k 的个位数字相同.若m=6,则在第7组中抽取的号码是 .【答案】∵6m =,7k =,∴13m k += ∴在第7小组中抽取的号码是63. 类型三、分层抽样【例3】某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.【解析】依据题意,第①项调查应采用分层抽样l 法、第②项调查应采用简单随机抽样法.故选B . 【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定. 举一反三:【变式】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( )A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人【答案】B ;根据样本容量和总体容量确定抽样比,最终得到每层中学生人数.【例4】一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.【思路点拨】采用分层抽样的方法.【解析】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层.(2)按照样本容量的比例随机抽取各乡镇应抽取的样本.300×3/15=60(人),300×2/15=40(人),300×5/15=100(人),300×2/15=40(人),300×3/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人.(3)将300人组到一起,即得到一个样本.【总结升华】分层抽样在日常生活中应用广泛,其抽取样本的步骤尤为重要,应牢记按照相应的比例去抽取.举一反三:【变式】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的41,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定(Ⅰ)游泳组中,青年人、中年人、老年人分别所占的比例; (Ⅱ)游泳组中,青年人、中年人、老年人分别应抽取的人数. 【答案】(Ⅰ)设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c ,则有40%347.5%410%310%4x xbxx xc x ⋅+⎧=⎪⎪⎨⋅+⎪=⎪⎩,解得50%10%b c =⎧⎨=⎩故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%. (Ⅱ)游泳组中,抽取的青年人数为320040%604⨯⨯=(人);抽取的中年人数为32004⨯⨯50%=75(人); 抽取的老年人数为32004⨯⨯10%=15(人).类型四、用样本估计总体【例4】甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:甲茎乙6 7 4 9 97 6 6 5 4 3 2 1 8 0 2 4 5 9 90 9 1由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如图所示,则他们在这次测验中成绩较好的是组.【答案】甲小组【变式2】甲、乙两名运动员的5次测试成绩如下图所示,设12,s s分别表示甲、乙两名运动员测试成绩的标准差,12,x x分别表示甲、乙两名运动员测试成绩的平均数,则有()A.12x x=,12s s<B.12x x=,12s s>C.12x x>,12s s> D.12x x=,12s s=【答案】B【例5】以下茎叶图记录了甲、乙两组各四名同学在某次数学测验中的成绩,甲组记录中有一个数据模糊,无法确认,在图中以X表示.甲组乙组6 X8 74 1 9 0 0 3甲茎乙5 7 16 88 8 2 2 3 6 7(Ⅰ)如果甲组同学与乙组同学的平均成绩一样,求X 及甲组同学数学成绩的方差;(Ⅱ)如果X=7,分别从甲、乙两组同学中各随机选取一名,求这两名同学的数学成绩之和大于180的概率.(注:方差2222121=[()()...()],n s x x x x x x n-+-++-其中12,,...,.n x x x x 为的平均数)【思路点拨】(Ⅰ)利用平均数的基本概念加以求解。

第一节 抽样方法、用样本估计总体

第一节  抽样方法、用样本估计总体

6.样本的数字特征
返回
(1)众数、中位数、平均数
数字特征
概念
优点与缺点
众数 中位数 平均数
众数通常用于描述变量的值出现
一组数据中重复出 次数最多的数.但显然它对其他
现次数 最多 的数 数据信息的忽视使它无法客观地
反映总体特征
把一组数据按 从小 中位数等分样本数据所占频率,
到大的 顺序排列, 它不受少数几个极端值的影响,
返回
[小题纠偏] 1.已知某商场新进 3 000 袋奶粉,为检查其三聚氰胺是否超标,
现采用系统抽样的方法从中抽取 150 袋检查,若第一组抽出 的号码是 11,则第六十一组抽出的号码为________. 解析:每组袋数:d=3105000=20, 由题意知这些号码是以 11 为首项,20 为公差的等差数列. a61=11+60×20=1 211. 答案:1 211
返回
[由题悟法] 1.茎叶图中的 3 个关注点 (1)“叶”的位置只有一个数字,而“茎”的位置的数字 位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字 由小到大排列,一般“重心”下移者平均数较大,数据集中 者方差较小.
返回
2.由频率分布直方图进行相关计算时,需掌握的 2 个关 系式
答案:8
返回
2.(2018·海安质量测试)某校高一年级共有 800 名学生,根据 他们参加某项体育测试的成绩得到了如图所示的频率分 布直方图,则成绩不低于 80 分的学生人数为________.
解析:由题设中提供的频率分布直方图可以看出:不低于 80 分的学生人数为(0.02+0.01)×10×800=240. 答案:240
返回

随机抽样、用样本估计总体习题及答案解析

随机抽样、用样本估计总体习题及答案解析

随机抽样、用样本估计总体1.某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有 根棉花纤维的长度小于20 mm.惠生活 观影指南爱尚嘟嘟园迅播影院请支持我们,有更多资源和动力【答案】 30【解析】 因为频率分布直方图的矩形的高为,频率概率故矩形的高⨯组距即为频率.从图中可知长 度小于20 mm 的频率为(0.01+0.01+0.04)50⨯=.3,又总体为100根,故纤维长度小于20 mm 的根 数为1000⨯.3=30根. 惠生活 观影指南 爱尚 嘟嘟园 迅播影院 请支持我们,有更多资源和动力 课后作业夯基基础巩固2.从2 008名学生中选取50名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽 样从2 008人中剔除8人,剩下的2 000人再按系统抽样的方法抽取,则这2 008名学生中每人入选的概率( )A.不全相等B.均不相等C.都相等,且为502008D.都相等,且为140【答案】 C 【解析】 随机抽样过程中,保证每个个体被抽取的可能性是相等的,所以每人入选的概率都相等,且为502008. 3.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年 级的学生中应抽取的人数为… ( )A.6B.8C.10D.12【答案】 B【解析】 分层抽样的原理是按照各部分所占的比例抽取样本,设从高二年级抽取的学生数为n ,则30640n=,得n =8. 4.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的 频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A.90B.75C.60D.45【答案】A【解析】样本中产品净重小于100克的频率为(0.050+0.100)⨯2=0.3,频数为36.样本总数为36120 03= ..∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)20⨯=.75, ∴样本中净重大于或等于98克并且小于104克的产品的个数为1200⨯.75=90.5.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92【答案】A【解析】按照从小到大的顺序排列为87,89,90,91,92,93,94,96.∵有8个数据,∴中位数是中间两个数的平均数:91922+=91.5,平均数为8789909192939496918+++++++=.5,故选A.6.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )A.55.2,3.6B.55.2,56.4C.64.8,63.6D.64.8,3.6【答案】D【解析】每一个数据都加上60时,平均数也应加上60,而方差不变.7.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为.【答案】40【解析】在系统抽样中,确定分段间隔k,对编号进行分段,(N k N n=为总体的容量,n 为样本的容量), ∴12004030N k n ===. 8.高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的办法抽取一个容量为4的样本,已知 学号为6,34,48的同学在样本中,那么还有一个同学的学号应为 .【答案】 20【解析】 根据题意,56人应分为4组,每组14人,第一组为6号,第二组为6+14=20号,第三组为20+14=34号,第四组为34+14=48号,故还有一个同学的学号为20.9.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图,则由此估计该厂工人一天生产该产品数量在[55,70)的人数约占该厂工人总数的百分率是 .【答案】 52.5%【解析】 结合频率分布直方图可以看出:生产数量在[55,65)的人数频率为0.04100⨯=.4,生产数量在[65,75)的人数频率为0.025⨯10=0.25,而生产数量在[65,70)的人数频率约为0.25⨯102=.125,那么生产数量在[55,70)的人数频率约为0.4+0.125=0.525,即52.5%. 10.(2011江苏高考,6)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差2s = .【答案】 165【解析】 ∵10685675x ++++==, ∴2s = 22222(107)(67)(87)(57)(67)1655-+-+-+-+-=. 11.为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图,则该组数据的方差为.【答案】 5 【解析】 该运动员6场的总得分为14+17+18+18+20+21=108,平均得分为10818(6=分),方差为 2222221[(1418)(1718)(1818)(1818)(2018)(2118)]56-+-+-+-+-+-=,故填5. 12.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如 下表:惠生活 观影指南 爱尚 嘟嘟园 迅播影院 请支持我们,有更多资源和动力(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适【解】 (1)画茎叶图,如图所示,中间数为数据的十位数.从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是33.5,甲的中位数是33.因此乙总体得分情况比甲好(2)根据公式得3333x x =,=甲乙;s =甲 3.96s ,=乙 3.35;甲的中位数是33,乙的中位数是综合比较选乙参加比赛较为合适.。

☆☆用样本估计总体

☆☆用样本估计总体

组距
0.5
4、列出频率分布表.(填写频率/组距一栏) 5、画出频率分布直方图。
思考: 频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示 频率与组距的比值, 其相应组距上的频率等于该组距上长方形的面积。
总体密度曲线反映了总体在各个范围内取值的
百分比,精确地反映了总体的分布规律。是研究总
体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值
百分比。
表示样本的分布的方法: 3.频率分布折线图 1.频率分布表 样本频率分布中, 分组 个数累计 频数 频率 当样本容量无限增 大,组距无限缩小
频率分布
样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。 所有数据(或数据组)的频数的分布 变化规律叫做样本的频率分布。
频率分布的表示形式有:
①样本频率分布表 ②样本频率分布图 样本频率分布条形图 样本频率分布直方图 ③样本频率分布折线图
1、抛掷硬币的大量重复试验的结果: 频率分布表: 样本容量为72 088
分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100

高考数学一轮总复习课件:随机抽样、用样本估计总体

高考数学一轮总复习课件:随机抽样、用样本估计总体

6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )

2.1随机抽样

2.1随机抽样
[分析] 简单随机抽样的实质是逐个地从总体中 随机抽取样本,而这里只是随机确定了起始张, 其他各张牌虽然是逐张起牌,但是各张在谁手 里已被确定,所以不是简单随机抽样。
例2:某车间工人加工一种轴100件,为 了了解这种轴的直径,要从中抽取10件 轴在同一条件下测量,如何采用简单随 机抽样的方法抽取样本?
B.与第几次抽样有关,第一次抽的可能性最小
C.与第几次抽样无关,每次抽到的可能性相等
D.与第几次抽样无关,与抽取几个样本无关
引例:某学校为了了解高一年级学生对教师 教学的意见,打算从高一年级500名学生中 抽取50名进行调查。请设计抽样方法。 问题: (1)例中总体容量、样本容量分别为 多少? (2)除了用简单随机抽样法完成抽样外还可 以设计怎样的抽样方法?
抽签法有哪些优点和缺点? 优点: 简单易行,当总体个数不多的时候 搅拌均匀很容易,个体有均等的机会被 抽中,从而能保证样本的代表性. 缺点: 当总体个数较多时很难搅拌均匀, 产生的样本代表性机数表、随机数骰 子或计算机产生的随机数进行抽样, 叫随机数表法,这里仅介绍随机数表 法。 怎样利用随机数表产生样本呢?下面通 过例子来说明,
解法1:(抽签法)将100件轴编号为1, 2,…,100,并做好大小、形状相同的号签, 分别写上这100个数,将这些号签放在一起, 进行均匀搅拌,接着连续抽取10个号签,然 后测量这个10个号签对应的轴的直径。
解法2:(随机数表法)将100件轴编号为00, 01,…99,在随机数表中选定一个起始位 置,如取第21行第1个数开始,选取10个 为68,34,30,13,70,55,74,77, 40,44,这10件即为所要抽取的样本。
样本中个体的数量. 5.样本容量:
1、为了了解全校240名学生的身高情况,从中 抽取40名学生进行测量,下列说法正确的是 ( ) D A.总体是240 B、个体是每一个学生 C、样本是40名学生 D、样本容量是40

初中数学 教学设计:用样本估计总体

初中数学 教学设计:用样本估计总体

用样本估计总体一、教学目标:通过实例,使学生体会用样本估计总体的思想,能够根据统计结果作出合理的判断和推测,能与同学进行交流,用清晰的语言表达自己的观点。

二、教学重点、难点:重点:根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差,从而对总体有个体有个合理的估计和推测。

难点:用样本的平均数和方差,从而对总体有个体有个合理的估计和推测。

三、教学过程:1、观察与思考为了估计全校初中女生的平均身高,九年级(一)班8个课外学习小组采取随机抽样的方法,分别抽取容量为25和100的样本,样本平均数用⎺x25和⎺x100表示,结果如下表:把得到的样本平均数表在数轴上(1)对容量相同的不同样本,算的样本平均数相同吗?(2)在两组样本平均数中,哪一组样本平均数的波动较小?这体现了什么样的统计规律?(3)如果总体身高的平均数为160cm ,哪一组样本平均数整体上更接近160cm.四、例题讲解例1:用某台车床加工一种轴承,规定轴承的平均直径为20cm ,方差不超过。

从某天加工的轴承中随机抽取了10件,测得其直径(mm )如下:20(1)计算样本的平均数和样本的方差(2)用样本的平均数和方差估计总体的平均数和方差(3)规定当方差不超过时。

车床生产情况正常,推断这台车床的生产情况是否正常。

解:(1)样本平均数为·9.191.20101++⨯=(x ···+)=20(min ). 样本方差为S 2=101×[()2+···+()2]=(min ) (2)总体平均数和总体方差的估计值分别为20mm 和.(3)由于方差不超过,所以可以认为车床的生产情况正常。

例2:一个的苹果园,共有2000棵树龄相同的苹果树,为了估计今年苹果的总产量,任意选择了6棵苹果树,数出它们挂果的个数分别为:260 340 280 420 360 380根据往年的经验,平均每个苹果的质量约为250g 。

新人教A版高中数学必修2第九章统计的第一节第一课时—简单随机抽样-经典教学设计

新人教A版高中数学必修2第九章统计的第一节第一课时—简单随机抽样-经典教学设计
引导学生得出结论:当总体规模较大,经费、时间上受限或调查有破坏性时,选择抽样调查。
(3)通过调查历城二中高一学生的平均身高来估计济南市高一学生的平均身高,请你写出此次调查的总体,个体样本和样本容量。
通过熟悉的生活情境引入普查、抽样调查的适用范围,回顾总体、样本、个体、样本容量的概念。
通过提问,从学生熟悉的具体问题入手,迅速吸引学生的注意力,体会到了抽样调查的必要性。
2.简单随机抽样的特点:
总体有限,逐个抽取,等概率抽样。
3.简单随机抽样的方法:
抽签法和随机数法
学生回顾本节课所学知识点。
小结本节课知识点,加深对知识点的记忆理解。总结提炼,理清脉络,有利于帮助学生建构知识体系,起到画龙点睛的作用。
6.课后作业
1.一个学生在一次竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道.选用合适的方法确定这个学生所要回答的三门学科的题的序号(物理题的编号为1~15,化学题的编号为16~35,生物题的编号为36~47).
此处设计遵循由特殊到一般的认知规律,让学生在观察中归纳,在具体问题中进行总结,自然而然地形成简单随机抽样的概念,培养数学抽象的学科核心素养,最终实现突破难点的目的。
2.实践探究,形成概念
请小组在全班范围内交流,教师在学生回答基础上完善补充,得到下列结论:
(1)一般地,设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n(1≤n<N)个个体作为样本,每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样。如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单抽样。

初中数学用样本估计总体优秀教案

初中数学用样本估计总体优秀教案

初中数学用样本估计总体优秀教案(经典版)编制人:__________________审核人:__________________审批人:__________________编制单位:__________________编制时间:____年____月____日序言下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。

文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!并且,本店铺为大家提供各种类型的经典范文,如工作计划、工作总结、发言致辞、自我鉴定、合同协议、条据文书、规章制度、心得体会、教学资料、其他范文等等,想了解不同范文格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!Moreover, our store provides various types of classic sample texts for everyone, such as work plans, work summaries, speeches, self-evaluation, contract agreements, documents, rules and regulations, experiences, teaching materials, other sample texts, etc. If you want to learn about different sample formats and writing methods, please pay attention!初中数学用样本估计总体优秀教案初中数学用样本估计总体优秀教案(通用5篇)在教学工作者开展教学活动前,常常要写一份优秀的教案,教案有助于学生理解并掌握系统的知识。

高考数学真题 抽样方法与总体分布的估计

高考数学真题 抽样方法与总体分布的估计

11.4抽样方法与总体分布的估计考点一随机抽样1.(2015湖南文,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3B.4C.5D.6答案B从35人中用系统抽样方法抽取7人,则可将这35人分成7组,每组5人,从每一组中抽取1人,而成绩在[139,151]上的有4组,所以抽取4人,故选B.2.(2015北京文,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师 1 800青年教师 1 600合计 4 300A.90B.100C.180D.300答案C本题考查分层抽样,根据样本中的青年教师有320人,且青年教师与老年教师人数的比为1600∶900=16∶9,可以得到样本中的老年教师的人数为916×320=180,故选C.3.(2014重庆文,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250答案A由分层抽样的特点可知703 500=n3 500+1 500,解之得n=100.4.(2014湖南文,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案D在简单随机抽样、系统抽样和分层抽样中,每个个体被抽中的概率均为nN,所以p1=p2=p3,故选D. 评析随机抽样的要求是每个个体被抽中的概率相等,与具体的方法无关.5.(2014广东文,6,5分)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20答案C由系统抽样的定义知,分段间隔为1 00040=25.故答案为C.6.(2013课标Ⅰ理,3,5分)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样答案C因为男女生视力情况差异不大,而各学段学生的视力情况有较大差异,所以应按学段分层抽样,故选C.评析本题考查了分层抽样,准确理解分层抽样的意义是解题关键.7.(2013江西理,4,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01答案D由题意知依次选取的编号为08,02,14,07,01,…(第2个02需剔除),所以选出来的第5个个体的编号为01,选D.8.(2013陕西理,4,5分)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.14答案B因为840∶42=20∶1,故编号在[481,720]内的人数为240÷20=12.9.(2018课标Ⅲ文,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是 . 答案 分层抽样解析 本题考查抽样方法.因为不同年龄段客户对其服务的评价有较大差异,所以根据三种抽样方法的特点可知最合适的抽样方法是分层抽样.10.(2015福建文,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为 . 答案 25解析 男生人数为900-400=500.设应抽取男生x 人,则由45900=x500得x=25.即应抽取男生25人. 11.(2014天津理,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取 名学生. 答案 60 解析420×300=60(名). 12.(2012天津理,9,5分)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取 所学校,中学中抽取 所学校. 答案 18;9解析 应从小学中抽取150150+75+25×30=18(所).应从中学中抽取75150+75+25×30=9(所).评析 本题考查分层抽样及数据处理能力.13.(2012福建文,14,4分)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是 . 答案 12解析 男女运动员人数比例为5698-56=43, 分层抽样中男女人数比例不变,则女运动员人数为 28×37=12.故应抽取女运动员人数是12.评析本题考查分层抽样方法.考查学生运算求解能力.考点二用样本估计总体1.(2017课标Ⅲ理,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.()根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A本题考查统计,数据分析.观察2014年的折线图,发现从8月至9月,以及10月开始的三个月接待游客量都是减少的,故A选项是错误的.2.(2017山东文,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7答案A由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5.由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66,从而有56+62+65+74+70+x5=66,解得x=3.故选A.3.(2016山东理,3文3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D由频率分布直方图知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.4.(2016课标Ⅲ理,4,5分)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案D由雷达图易知A、C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,故B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月.故选D.5.(2015课标Ⅱ理,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,∴D 不正确.6.(2020课标Ⅲ文,3,5分)设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( )A.0.01B.0.1C.1D.10答案 C 由已知条件可知样本数据x 1,x 2,…,x n 的平均数x =x 1+x 2+…+x nn,方差s 12=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=0.01,则数据10x 1,10x 2,…,10x n 的平均数为10x 1+10x 2+…+10x nn=10x .所以这组数据的方差s 22=1n [(10x 1-10x )2+(10x 2-10x )2+…+(10x n -10x )2]=100n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=100s 12=100×0.01=1,故选C.7.(2015安徽理,6,5分)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A.8B.15C.16D.32答案 C 设样本数据x 1,x 2,…,x 10的标准差为s,则s=8,可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s=16. 8.(2014陕西文,9,5分)某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A.x ,s 2+1002B.x +100,s 2+1002C.x ,s 2D.x +100,s 2答案 D 设增加工资后10位员工下月工资均值为x ',方差为s'2,则x '=110[(x 1+100)+(x 2+100)+…+(x 10+100)]=110(x 1+x 2+…+x 10)+100=x +100;方差s'2=110[(x 1+100-x ')2+(x 2+100-x ')2+…+(x 10+100-x ')2]=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=s 2.故选D. 9.(2011江苏,6,5分)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2= . 答案165解析 记星期一到星期五收到的信件数分别为x 1,x 2,x 3,x 4,x 5,则x =x 1+x 2+x 3+x 4+x 55=10+6+8+5+65=7.∴s 2=15[(x 1-x )2+(x 2-x )2+(x 3-x )2+(x 4-x )2+(x 5-x )2]=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165. 评析 本题主要考查方差的公式,考查学生的运算求解能力.公式记忆准确,运算无误是解答本题的关键,属中等难度题.10.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .8 9 9 90 1 1答案 90解析 本题考查茎叶图、平均数.5位裁判打出的分数分别为89,89,90,91,91,则这5位裁判打出的分数的平均数为15×(89+89+90+91+91)=90.方法总结 要明确“茎”处数字是十位数字,“叶”处数字是个位数字,正确写出所有数据,再根据平均数的概念进行计算.11.(2015湖北文,14,5分)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a= ;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .答案(1)3(2)6 000解析(1)由频率分布直方图可知:0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a=3.(2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10 000=6 000.12.(2014江苏,文6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100 cm.答案24解析60×(0.015+0.025)×10=24(株).13.(2019课标Ⅱ文,19,12分)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:√74≈8.602.解析本题考查了统计的基础知识、基本思想和方法,考查学生对频数分布表的理解与应用,考查样本的平均数,标准差等数字特征的计算方法,以及对现实社会中实际数据的分析处理能力.(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21. 产值负增长的企业频率为2100=0.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%. (2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100∑i=15n i (y i-y )2=1100[2×(-0.40)2+24×(-0.20)2+53×02+14×0.202+7×0.402]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.方法总结 利用频数分布表求平均数估计值的方法:各组区间中点值乘该组频数,并求和,再除以样本容量.利用频数分布表求标准差估计值的方法:用各组区间中点值代表该组,代入标准差公式即可.14.(2018课标Ⅰ文,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) [0.6,0.7) 频数13249265使用了节水龙头50天的日用水量频数分布表日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) 频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).易错警示利用频率分布直方图求众数、中位数与平均数时,应注意区分这三者,在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.15.(2016北京文,17,13分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解析(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.(3分)所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.(5分)依题意,w至少定为3.(6分)(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]频率0.10.150.20.250.150.050.050.05(10分) 根据题意,该市居民该月的人均水费估计为:4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).(13分)思路分析第(1)问,需要计算该市居民月用水量在各区间上的频率,根据样本的频率分布直方图即可获解.第(2)问,由月用水量的频率分布直方图和w=3可计算居民该月用水费用的数据的分组与频率分布表,由此可估计该市居民该月的人均水费.评析本题考查了频率分布直方图及用样本估计总体,属中档题.16.(2015课标Ⅱ理,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B地区456789(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解析(1)两地区用户满意度评分的茎叶图如下:A地区B地区4 683 5 136 46 4 26 2 4 5 5 6 8 8 6 4 37 3 3 4 6 9 9 28 6 5 18 3 2 1 7 5 5 29 1 3通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.(2)记C A1表示事件:“A 地区用户的满意度等级为满意或非常满意”; C A2表示事件:“A 地区用户的满意度等级为非常满意”; C B1表示事件:“B 地区用户的满意度等级为不满意”; C B2表示事件:“B 地区用户的满意度等级为满意”, 则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2) =P(C B1C A1)+P(C B2C A2) =P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48. 17.(2015课标Ⅱ文,18,12分)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.B 地区用户满意度评分的频数分布表满意度评分分组[50,60) [60,70) [70,80) [80,90) [90,100]频 数2814106(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大,说明理由.解析(1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”. 由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.18.(2015广东文,17,12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解析(1)由已知得,20×(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.(2)由题图可知,面积最大的矩形对应的月平均用电量区间为[220,240),所以月平均用电量的众数的估计值为230;因为20×(0.002+0.009 5+0.011)=0.45<0.5,20×(0.002+0.009 5+0.011+0.012 5)=0.7>0.5,所以中位数在区间[220,240)内.设中位数为m,则20×(0.002+0.009 5+0.011)+0.012 5×(m-220)=0.5,解得m=224.所以月平均用电量的中位数为224.(3)由题图知,月平均用电量为[220,240)的用户数为(240-220)×0.0125×100=25,同理可得,月平均用电量为[240,260),[260,280),[280,300]的用户数分别为15,10,5.故用分层抽样的方式抽取11户居民,月平均用电量在[220,240)的用户中应抽取11×2525+15+10+5=5(户).19.(2014课标Ⅰ文,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.评析本题考查绘制频率分布直方图,计算样本的数字特征,及用样本估计总体等知识,同时考查统计的思想方法.20.(2014课标Ⅱ文,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:甲部门乙部门49797665332110 98877766555554443332100665520063222034567891059044812245667778901123468800113449123345011456000(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解析(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.评析本题考查利用茎叶图进行中位数,概率的相关计算,考查用样本的数字特征估计总体的数字特征,运用统计与概率的知识与方法解决实际问题的能力,考查数据处理能力及应用意识.21.(2014北京文,18,13分)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号 分组 频数 1 [0,2) 6 2 [2,4) 8 3 [4,6) 17 4 [6,8) 22 5 [8,10) 25 6 [10,12) 12 7 [12,14) 6 8 [14,16) 2 9[16,18)2 合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)解析 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9. 故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a=频率组距=0.172=0.085. 课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b=频率组距=0.252=0.125. (3)样本中的100名学生该周课外阅读时间的平均数在第4组.22.(2013课标Ⅰ文,18,12分)为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解析 (1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y ,由观测结果可得x =120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3, y =120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6. 由以上计算结果可得x >y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好.评析 本题考查数据的平均数和茎叶图,考查数据的分析处理能力和应用意识.23.(2013安徽文,17,12分)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x1、x2,估计x1-x2的值.解析(1)设甲校高三年级学生总人数为n.由题意知,30n=0.05,即n=600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级此次联考数学成绩及格率为1-530=5 6.(2)设甲、乙两校样本平均数分别为x'1、x'2,根据样本茎叶图可知,30(x'1-x'2)=30x'1-30x'2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15. 因此x'1-x'2=0.5.故x1-x2的估计值为0.5分.评析本题考查随机抽样与茎叶图等统计学的基本知识,考查学生用样本估计总体的思想以及数据分析处理能力.24.(2020课标Ⅰ文,17,12分)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级 A B C D频数40 20 20 20乙分厂产品等级的频数分布表等级 A B C D频数28 17 34 21(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解析(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为40100=0.4;。

第十五章_第1讲_随机抽样和样本估计总体

第十五章_第1讲_随机抽样和样本估计总体
解析:对于在区间的频率的数值为0.3, 而总数为100,因此频数为30.
图 15-1-2
考点1 随机抽样及其应用 例 1:现要完成下列3项抽样调查:①从 10 盒酸奶中抽取 3 盒进行食品卫生检查.②科技报告厅有 32 排,每排有 40 个座位, 有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,
(1)频率分布直方图的绘制按照前面的要点预览 的步骤进行.值得注意的是,在频率分布直方图中,纵轴表示 “频组率 距”,数据落在各小组内的频率用小矩形的面积表示,各小
矩形的面积总和等于 1. (2)由频率分布直方图估计样本的数字特征时:①众数为频率
用样本估计总体 是统计学的重要 思想.从总体中如 何抽取样本,以及 如何研究样本数 据是本节需要掌 握的主要内容.根 据总体的特点可 采取合适的抽样 方式,然后从列 表,画图途径来体 现样本数据特征, 而样本的数字特 征则是其客观体 现,从而进一步去
估计总体特征.
1.总体、个体、样本 把所考察对象的某一个数值指标的全体构成的集合看成总 体,构成总体的每一个元素为个体,从总体中随机抽取若干个个 体构成的集合叫做总体的一个样本. 2.随机抽样 抽样时保证每一个个体都可能被抽到,每一个个体被抽到的 机会是__均__等__的__,满足这样的条件的抽样是随机抽样.
8.茎叶图 在样本数据较少、较为集中,且位数不多时,用茎叶图表示
数据的效果较好,它较好的保留了原始数据信息,方便记录与表 示.茎是中间的一列数,叶是从茎的旁边生长出来的数.
9.样本数字特征 (1)众数:在一组数据中,出现次数最多的数据叫做这组数据 的众数. (2)中位数:将一组数据按大小依次排列,把处在_最__中__间__位置 的一个数据(或最中间两个数据的平均数)叫做这组数据的中__位__数__.

第1讲 随机抽样、用样本估计总体

第1讲 随机抽样、用样本估计总体

第1讲随机抽样、用样本估计总体一、知识梳理1.随机抽样(1)简单随机抽样①定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),且每次抽取时总体内的各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.②常用方法:抽签法和随机数法.(2)分层抽样①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.②适用范围:适用于总体由差异比较明显的几个部分组成时.2.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s = 1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2], s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].常用结论1.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.2.会用三个关系频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.3.巧用四个有关的结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x-+a ;(2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑n i =1 (x i -x -)2=1n ∑n i =1x 2i-x -2,即各数平方的平均数减去平均数的平方. 二、教材衍化1.某校为了解学生学习的情况,采用分层抽样的方法从高一2 400人、高二2 000人、高三n 人中,抽取90人进行问卷调查.已知高一被抽取的人数为36,那么高三被抽取的人数为________.解析:由分层抽样可得 2 4002 400+2 000+n×90=36,则n =1 600,所以高三被抽取的人数为 1 6002 400+2 000+1 600×90=24. 答案:242.已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案:533.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在第________组.解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第4组.答案:4一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)简单随机抽样是一种不放回抽样.()(2)在抽签法中,先抽的人抽中的可能性大.()(3)一组数据的方差越大,说明这组数据的波动越大.()(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()答案:(1)√(2)×(3)√(4)√(5)√(6)√二、易错纠偏常见误区|(1)随机数表法的规则不熟出错;(2)频率分布直方图识图不清;1.假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随机数法从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001, (499)行编号,若从随机数表第7行第8列的数开始向右读,则抽取的第3支疫苗的编号为________.(下面摘取了随机数表的第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 00 13 4299 66 02 79 54解析:由题意得,从随机数表第7行第8列的数开始向右读,符合条件的前三个编号依次是331,455,068,故抽取的第3支疫苗的编号是068.答案:0682.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:50考点一随机抽样(基础型)复习指导| 1.理解随机抽样的必要性和重要性.2.学会用简单随机抽样的方法从总体中抽取样本.3.通过对实例的分析,了解分层抽样的方法.核心素养:数据分析1.(2020·重庆中山外国语学校模拟)如饼图,某学校共有教师120人,从中选出一个30人的样本,其中被选出的青年女教师的人数为()A.12B.6C.4D.3解析:选D .青年教师的人数为120×30%=36,所以青年女教师为12人,故青年女教师被选出的人数为12×30120=3.故选D . 2.(2020·武汉市武昌区调研考试)已知某射击运动员每次射击击中目标的概率都为80%.现采用随机模拟的方法估计该运动员4次射击至少3次击中目标的概率:先由计算器产生0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标;再以每4个随机数为一组,代表4次射击的结果.经随机模拟产生了如下20组随机数:7527 0293 7140 9857 0347 4373 8636 6947 1417 4698 0371 6233 2616 8045 6011 3661 9597 7424 7610 4281据此估计,该射击运动员4次射击至少3次击中目标的概率为________.解析:4次射击中有1次或2次击中目标的有:0371,6011,7610,1417,7140,所以所求概率P =1-520=1520=0.75. 答案:0.753.一支田径队有男运动员56人,女运动员m 人,用分层抽样抽出一个容量为n 的样本,在这个样本中随机取一个当队长的概率为128,且样本中的男队员比女队员多4人,则m =________.解析:由题意知n =28,设其中有男队员x 人,女队员有y 人.则⎩⎪⎨⎪⎧x +y =28,x -y =4,56m =x y .解得x =16,y =12,m =42.答案:42(1)抽签法与随机数法的适用情况①抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.②一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)分层抽样问题类型及解题思路①求某层应抽个体数量,根据该层所占总体的比例计算.②已知某层个体数量,求总体容量,根据分层抽样即按比例抽样,列比例式进行计算.③确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.考点二样本的数字特征(应用型)复习指导| 1.通过实例理解样本数据的标准差的意义和作用,学会计算数据的标准差.2.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.核心素养:数据分析、数学运算(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为( )A .92,2.8B .92,2C .93,2D .93,2.8(2)(2020·盐城模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的方差是2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的标准差为________.【解析】 (1)由题意得所剩数据:90,90,93,94,93.所以平均数x -=90+90+93+94+935=92. 方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8. (2)由s 2=1n i =1n (x i -x -)2=2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的方差是8,标准差为2 2. 【答案】 (1)A (2)2 2【迁移探究】 (变条件)本例(2)增加条件“x 1,x 2,x 3,x 4,x 5的平均数为2”,求数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数和方差.解:数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数为2×2+3=7,方差为22×2=8.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s2=1n[(x21+x22+…+x2n)-n x-2],或写成s2=1n(x21+x22+…+x2n)-x-2,即方差等于原数据平方的平均数减去平均数的平方.1.(2020·昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地.这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,x n,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是()A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数解析:选B .平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度.故选B .2.(2020·甘肃、青海、宁夏联考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下:A .119.3B .119.7C .123.3D .126.7解析:选C .由题意知身高在(100,110],(110,120],(120,130]内的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x ,则(x -120)×0.310=0.1,解得x ≈123.3.故选C .3.一组数据1,10,5,2,x ,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为________.解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x ,5,10,则2+x2=3,解得x =4,所以这组数据的平均数为 x -=16×(1+2+2+4+5+10)=4,方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.答案:9考点三 频率分布直方图(应用型)复习指导| 1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图,体会它们各自的特点.2.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性.核心素养:直观想象、数据分析角度一求样本的频率、频数(2020·福建五校第二次联考)某服装店对过去100天其实体店和网店的销售量(单位:件)进行了统计,制成频率分布直方图如下:(1)若将上述频率视为概率,已知该服装店过去100天的销售中,实体店和网店销售量都不低于50的概率为0.24,求过去100天的销售中,实体店和网店至少有一边销售量不低于50的天数;(2)若将上述频率视为概率,已知该服装店实体店每天的人工成本为500元,门市成本为1 200元,每售出一件利润为50元,求该实体店一天获利不低于800元的概率.【解】(1)由题意知,网店销售量不低于50共有(0.068+0.046+0.010+0.008)×5×100=66(天),实体店销售量不低于50共有(0.032+0.020+0.012×2)×5×100=38(天),实体店和网店销售量都不低于50的天数为100×0.24=24,故实体店和网店至少有一边销售量不低于50的天数为66+38-24=80.(2)由题意,设该实体店一天售出x件,则获利为(50x-1 700)元,50x-1 700≥800⇒x ≥50.记该实体店一天获利不低于800元为事件A,则P(A)=P(x≥50)=(0.032+0.020+0.012+0.012)×5=0.38.故该实体店一天获利不低于800元的概率为0.38.角度二求样本的数字特征(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.(1)频率、频数、样本容量的计算方法①频率组距×组距=频率;②频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.(2)频率分布直方图中数字特征的计算①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60解析:选B .设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x =140,解得x =40.2.(2020·武昌区调研考试)对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据直方图完成以下表格;(2)); (3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩? 解:(1)填表如下:(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78, 方差s 2=(-23)2×0.05+(-13)2×0.15+(-3)2×0.35+72×0.35+172×0.1=101. (3)进入复赛选手的成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及其以上的选手均可进入复赛.(说明:回答82分以上,或82分及其以上均可)[基础题组练]1.某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座号是( )49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 A .23B .09C .02D .16解析:选D .从随机数表第一行的第6列数字3开始,由左到右依次选取两个数字,不超过34的依次为21,32,09,16,17,故第4个志愿者的座号为16.2.(2020·陕西汉中重点中学联考)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:若在“不喜欢的男性青年观众”中抽取了6人,则n =( )A .12B .16C .20D .24解析:选D .由题意得3030+10+30+50=30120=6n,解得n =24.故选D .3.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差解析:选A .记9个原始评分分别为a ,b ,c ,d ,e ,f ,g ,h ,i (按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A .4.(多选)某学生5次考试的成绩(单位:分)分别为85,67,m ,80,93,其中m >0.若该学生在这5次考试中成绩的中位数为80,则得分的平均数可能为( )A .70B .75C .80D .85解析:选ABC .已知的四次成绩按照由小到大的顺序排列为67,80,85,93,该学生这5次考试成绩的中位数为80,则m ≤80,所以平均数85+67+m +80+935≤81,可知平均数可能为70,75,80,不可能为85.故选ABC .5.(多选)从某地区年龄在25~55岁的人员中,随机抽取100人,了解他们对今年两会热点问题的看法,绘制出频率分布直方图,如图所示,则下列说法正确的是( )A .抽取的100人中,年龄在40~45岁的人数大约为20B .抽取的100人中,年龄在35~45岁的人数大约为40C .抽取的100人中,年龄在40~50岁的人数大约为50D .抽取的100人中,年龄在35~50岁的人数大约为60解析:选AD .根据频率分布直方图的性质得(0.01+0.05+0.06+a +0.02+0.02)×5=1,解得a =0.04,所以抽取的100人中,年龄在40~45岁的大约为0.04×5×100=20,所以A 正确;年龄在35~45岁的人数大约为(0.06+0.04)×5×100=50,所以B 不正确;年龄在40~50岁的人数大约为(0.04+0.02)×5×100=30,所以C 不正确;年龄在35~50岁的人数大约为(0.06+0.04+0.02)×5×100=60,所以D 正确.故选AD .6.(2020·开封市定位考试)某工厂生产A ,B ,C 三种不同型号的产品,产品数量之比为k ∶5∶3,现用分层抽样的方法抽出一个容量为120的样本,已知A 种型号产品共抽取了24件,则C 种型号产品抽取的件数为________.解析:依题意得24120=k k +5+3,解得k =2,所以C 种型号产品抽取的件数为32+5+3×120=36.答案:367.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是________.解析:由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.答案:丙8.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.解析:设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.答案:(1)0.04(2)4409.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)求a、b、c(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=0.81. (3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73, 所以这次数学测验的年级平均分大约为73分.10.为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制图如下:每名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超出35件的部分每件7元.(1)根据图中数据写出甲公司员工A 在这10天投递的快递件数的平均数和众数;(2)根据图中数据估算两公司的每位员工在该月所得的劳务费.解:(1)甲公司员工A 在这10天投递的快递件数的平均数为36,众数为33.(2)根据题图中数据,可估算甲公司的每位员工该月所得劳务费为 4.5×36×30=4 860(元),易知乙公司员工B 每天所得劳务费X 的可能取值为136,147,154,189,203,所以乙公司的每位员工该月所得劳务费约为110×(136×1+147×3+154×2+189×3+203×1)×30=165.5×30=4 965(元). [综合题组练]1.(2020·安徽五校联盟第二次质检)数据a 1,a 2,a 3,…,a n 的方差为σ2,则数据2a 1,2a 2,2a 3,…,2a n 的方差为( )A .σ22B .σ2C .2σ2D .4σ2解析:选D .设a 1,a 2,a 3,…,a n 的平均数为a ,则2a 1,2a 2,2a 3,…,2a n 的平均数为2a ,σ2=(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n. 则2a 1,2a 2,2a 3,…,2a n 的方差为(2a 1-2a )2+(2a 2-2a )2+(2a 3-2a )2+…+(2a n -2a )2n=4×(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n=4σ2.故选D . 2.(多选)新闻出版业不断推进供给侧结构性改革,深入推动优化升级和融合发展,持续提高优质出版产品供给,实现了行业的良性发展.下面是2015年至2019年我国新闻出版业和数字出版业营收情况,则下列说法正确的是( )A .2015年至2019年我国新闻出版业和数字出版业营收均逐年增加B .2019年我国数字出版业营收超过2015年我国数字出版业营收的2倍C .2019年我国新闻出版业营收超过2015年我国新闻出版业营收的1.5倍D .2019年我国数字出版业营收占新闻出版业营收的比例未超过三分之一解析:选ABD .根据图示数据可知A 正确;1 935.5×2=3 871<5 720.9,故B 正确;16 635.3×1.5=24 952.95>23 595.8,故C 不正确;23 595.8×13≈7 865>5 720.9,故D 正确.故选ABD .3.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.解:(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x -甲=10+13+12+14+165=13; x -乙=13+14+12+12+145=13, s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4; s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙,可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.4.(2020·广州市调研测试)某蔬果经销商销售某种蔬果,售价为每千克25元,成本为每千克15元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价以每千克10元处理完.根据以往的销售情况,按[0,100),[100,200),[200,300),[300,400),[400,500]进行分组,得到如图所示的频率分布直方图.(1)根据频率分布直方图计算该种蔬果日需求量的平均数x -(同一组中的数据用该组区间中点值代表);(2)该经销商某天购进了250千克该种蔬果,假设当天的需求量为x 千克(0≤x ≤500),利润为y 元.求y 关于x 的函数关系式,并结合频率分布直方图估计利润y 不小于1 750元的概率.解:(1)x -=50×0.001 0×100+150×0.002 0×100+250×0.003 0×100+350×0.0025×100+450×0.001 5×100=265.故该种蔬果日需求量的平均数为265千克.(2)当日需求量不低于250千克时,利润y =(25-15)×250=2 500(元),当日需求量低于250千克时,利润y =(25-15)x -(250-x )×5=15x -1 250(元),所以y =⎩⎨⎧15x -1 250,0≤x <2502 500,250≤x ≤500, 由y ≥1 750,得200≤x ≤500,所以P (y ≥1 750)=P (200≤x ≤500)=0.003 0×100+0.002 5×100+0.001 5×100=0.7. 故估计利润y 不小于1 750元的概率为0.7.。

用样本推断总体 知识讲解

用样本推断总体 知识讲解

用样本推断总体——知识讲解【学习目标】1.学会用样本平均数、样本方差去估计总体平均数、总体方差.2.了解用样本估计总体的过程.3.能用样本的某种“率”估计总体相应的“率”,用样本的频数、频率分布估计总体的频数、频率分布.4.能通过样本来预测总体在未来一段时间内的发展水平或发展趋势.【要点梳理】要点一、总体平均数与方差的估计从总体中抽取样本,然后通过对样本的分析,去推断总体的情况,这是统计的基本思想.用样本平均数、样本方差分别去估计总体平均数、总体方差就是这一思想的一个体现.实践和理论都证明:对于简单随机样本,在大多数情况下,当样本容量足够大时,这种思想是合理的.由于简单随机样本客观地反映了实际情况,能够代表总体,因此我们可以用简单随机样本的平均数与方差去估计总体的平均数与方差.要点二、统计的简单应用在实践中,我们常常通过简单随机抽样,用样本的“率”去估计总体相应的“率”,例如:收视率、合格率、达标率等等.通过科学调查,在取得真是可靠的数据后,我们可以运用正确的统计方法来推断总体,除此之外,还可以利用已有的统计数据对事物在未来一段时间内的发展趋势做出判断和预测,为正确的决策提供服务.要点诠释:样本是总体的一部分,一个总体中可以有许多样本,为了使样本能较好地反映总体情况,在选取样本时要注意使其具有一定的代表性和广泛性.要点三、利用样本推断总体利用样本推断总体的过程如下:【典型例题】类型一、总体平均数与方差的估计1.水资源越来越缺乏,全球提倡节约用水,水厂为了了解某小区居民的用水情况,随机抽查了该小区10户家庭的月用水量,有关数据如下表:月用水量(m3)10 13 14 17 18户数 2 2 3 2 1如果该小区有500户家庭,根据上面的统计结果,估计该小区居民每月需要用水多少立方米?(写出解答过程).【思路点拨】先根据样本求出10户家庭的平均用水量,再乘以该小区的总户数即可. 【答案与解析】 解:根据题意得:110(10×2+13×2+14×3+17×2+18×1)=14(立方米), 14×500=7000(立方米),答:该小区居民每月需要用水7000立方米.【总结升华】此题考查了用样本平均数估计总体平均数,进而估计总体. 举一反三: 【变式】“立定跳远”是我市初中毕业生体育测试项目之一.测试时,记录下学生立定跳远的成绩,然后按照评分标准转化为相应的分数,满分10分.其中男生立定跳远的评分标准如下:注:成绩栏里的每个范围,含最低值,不含最高值.成绩(米) … 1.80—1.86 1.86—1.94 1.94—2.02 2.02—2.18 2.18—2.34 2.34— 得分(分) …5678910某校九年级有480名男生参加立定跳远测试,现从中随机抽取10名男生测试成绩(单位:分)如下:1.962.38 2.56 2.04 2.34 2.17 2.60 2.26 1.87 2.32 请完成下列问题:(1)求这10名男生立定跳远成绩的平均数; (2)如果将9分以上定为“优秀”,请你估计这480名男生中得优秀的人数. 【答案】 解:(1)根据题意得:x =110(1.96+2.38+2.56+2.04+2.34+2.17+2.60+2.26+1.87+2.32)=2.25(米); (2)因为抽查的10名男生中得分(9分)(含9分)以上有6人,所以有480×610=288(人); 答:该校480名男生中得到优秀的人数是288人.2.从甲、乙两种玉米苗中随机各抽出10株,分别测得它们的株高如下:(单位:cm )甲 21 42 39 14 19 22 37 41 40 25 乙27164041164440402744(1)根据以上数据分别求出甲、乙两种玉米株高的平均数和方差. (2)估计哪种玉米的苗长得高些; (3)哪种玉米的苗长得齐?【思路点拨】本题考察平均数、方差的定义.利用平均数及方差的计算公式可以求得. 【答案与解析】 解:(1)甲的平均值:)()(甲cm x 3025404137221914394221101=+++++++++=乙的平均值:甲的方差:)(2.10410)3025()3042()3021(22222cm S =-++-+-=甲, 乙的方差:)(8.12810)3144()3116()3127(22222cm S =-++-+-=乙(2)从随机抽取的样本来看,甲种玉米的平均高度小于乙种玉米的平均高度,所以可以推断乙种玉米的苗长的高.(3)从随机抽取的样本来看,由于22S S 甲乙<,所以可以推断甲种玉米的苗长得整齐. 【总结升华】本题既是一道与平均数、方差计算有关的问题,又是利用样本平均数、样本方差估计总体平均数、总体方差的一道题目,关键是理解和掌握平均数、方差的求解公式. 举一反三:【变式】某公司对两名业务主管上半年六个月的工作业绩考核得分如下(每个月满分为10分):甲 5 6 8 7 9 7 乙3679107(1)分别求出甲、乙两人的平均得分.(2)根据所学方差知识,请你比较谁的工作业绩较稳定. 【答案】 解:(1)根据平均数的公式知:1(568797)76X =+++++=甲,1(3679107)76X =+++++=乙.(2)222222215[(57)(67)(87)(77)(97)(77)]63S =-+-+-+-+-+-=甲,22222221[(37)(67)(77)(97)(107)(77)]56S =-+-+-+-+-+-=乙.∵22SS <甲乙,∴甲的工作业绩较稳定.类型二、统计的简单应用3.为了解某校七,八年级学生的睡眠情况,随机抽取了该校七,八年级部分学生进行调查,已知抽取七年级与八年级的学生人数相同,利用抽样所得的数据绘制如下统计图表.睡眠情况分组表(单位:时)根据图表提供的信息,回答下列问题:(1)求统计图中的a;(2)抽取的样本中,八年级学生睡眠时间在C组的有多少人?(3)如果睡眠时间x(时)满足:7.5≤x≤9.5,称睡眠时间合格,请你估计该校七、八年级学生睡眠时间的合格率分别是多少?【思路点拨】(1)根据扇形统计图,确定出a的值即可;(2)根据图1求出抽取的人数,乘以C占的百分比即可得到结果;(3)七年级的合格率要用抽取的合格人数除以总人数,八年级的合格率只需要将B、C两组的百分率加起来即可.【答案与解析】解:(1)根据题意得:a=1-(35%+25%+25%+10%)=5%;(2)根据题意得:(6+19+17+10+8)×35%=21(人),则抽取的样本中,八年级学生睡眠时间在C组的有21人;(3)七年级的合格率:191761917108+++++×100%=60%,八年级的合格率:25%+35%=60%,答:该校七、八年级学生中睡眠时间合格率分别是60%、60%.【总结升华】此题考查了条形统计图,用样本估计总体,频数(率)分布表,以及扇形统计图,弄清题中的数据是解本题的关键.举一反三:【变式】为了了解我市某学校“书香校园”的建设情况,检查组在该校随机抽取40名学生,调查了解他们一周阅读课外书籍的时间,并将调查结果绘制成如图所示的频数分布直方图(每小组的时间包含最小值,不包含最大值),若规定学生一周课外阅读时间不少于4小时为达标,估计该校学生阅读时间的达标率为()A.50% B.55% C.60% D.65%【答案】C.4.某羽毛球商场经理对新进某一品牌几种号码的男式羽毛球鞋的销售情况进行了一周的统计,得到一组数据后,绘制了频数、频率统计表与频数分布直方图如图所示:一周销售数量统计表频数(双)根据图表中提供的信息回答下列问题:(1)本次共统计羽毛球鞋多少双?(2)求出销售42号鞋的双数,并补全统计图;(3)根据市场调查,该商场计划再进1000双这种品牌的男式羽毛球鞋,请你帮经理估计一下,需要进多少双41号的羽毛球鞋?【思路点拨】(1)用39码的频数除以其频率即可确定羽毛球鞋数量;(2)用总数减去其他尺码的鞋子的频数即可求得42码的鞋子的数量,从而补全频数直方图;(3)需要进41号旅游鞋的双数=1000×41号鞋的频率.【答案与解析】解:(1)10÷0.1=100(双)∴本次共统计羽毛球鞋100双.(2)100-10-15-30-15-5=25双补全统计图如下:(3)1000×30%=300双.答:根据市场调查,估计需要进300双41号的羽毛球鞋.【总结升华】本题考查了频数分布直方图和利用统计图获取信息的能力;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能做出正确的判断和解决问题.。

用样本估计总体

用样本估计总体

思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么?
0.2~4.3
思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
(4.3-0.2)÷0.5=8.2
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
思考4:样本数据的频率分布直方图是 根据频率分布表画出来的,一般地,频 率分布直方图的作图步骤如何?
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点, 在纵轴上标出 [153.5,156.5) [156.5,159.5) [159.5,162.5) [162.5,165.5) [165.5,168.5) [168.5,171.5) [171.5,174.5) [174.5,177.5) [177.5,180.5]
合计
频数 1 1 4 5 8 11 6 2 1 1 40
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点?
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2

2025版高考数学总复习第9章统计成对数据的统计分析第1讲随机抽样用样本估计总体提能训练

2025版高考数学总复习第9章统计成对数据的统计分析第1讲随机抽样用样本估计总体提能训练

第1讲 随机抽样 用样本估计总体A 组基础巩固一、单选题1.(2024·陕西汉中模拟)某射击运动员连续射击5次,命环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( B )A .7.6B .7.8C .8D .8.2[解析] 由题意可知该组数据为6,7,8,9,9,∴平均数x =6+7+8+9+95=7.8.故选B.2.(2023·陕西西安联考)某社区有1 500名老年居民、2 100名中青年居民和1 800名儿童居民.为了解该社区居民对社区工作的满意度,现采用分层抽样的方法从这些居民中抽取一个容量为n 的样本,若中青年居民比老年居民多抽取20人,则n =( C )A .120B .150C .180D .210[解析] 由题可知⎝ ⎛⎭⎪⎫2 1001 500+2 100+1 800- 1 5001 500+2 100+1 800×n =20,解得n =180.故选C.3.(2023·湖南部分学校联考)已知某班共有学生46人,该班语文老师为了了解学生每天阅读课外书籍的时长情况,决定利用随机数表法从全班学生中抽取10人进行调查.将46名学生按01,02,…,46进行编号.现提供随机数表的第7行至第9行:84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 56 57 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 32 21 12 34 29 78 64 56 07 82 82 42 07 44 38 15 51 00 13 42 99 66 02 79 54 若从表中第7行第41列开始向右依次读取2个数据,每行结束后,下一行依然向右读数,则得到的第8个样本编号是( D )A .07B .12C .39D .44 [解析] 依次抽取的样本编号为12,06,01,16,19,10,12,07,44,39,38.剔除重复号码12,故选D.4.(2024·江苏南京六校联合调研)已知样本数据3x 1+1,3x 2+1,3x 3+1,3x 4+1,3x 5+1,3x 6+1的平均数为16,方差为9,则另一组数据x 1,x 2,x 3,x 4,x 5,x 6,12的方差为( C )A.467B .477C .487D .7[解析] 设数据x 1,x 2,x 3,x 4,x 5,x 6的平均数为x ,方差为s 2,由3x +1=16,9s2=9,得x =16∑i =16x i =5,s 2=16∑i =16 (x i -5)2=1,则x 1,x 2,x 3,x 4,x 5,x 6,12的平均数为5×6+127=6,方差为∑i =16x i -62+12-627=∑i =16x i -5-12+367=∑i =16x i -52-2∑i =16x i -5+1×6+367=∑i =16x i -52-2∑i =16x i +1027=6s 2-2×6x +1027=487.故选C.5.(2022·全国高考甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识,为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( B )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差[解析] 讲座前中位数为70%+75%2>70%,所以A 错;讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B 对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C 错;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D 错.故选B.6.(2024·四川南充高级中学月考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( D )A.100,10 B.100,20C.200,10 D.200,20[解析]依题意可得样本容量为(3 500+2 000+4 500)×2%=200,其中高中生抽取2 000×2%=40人,因为样本中高中生的近视率为50%,所以抽取的高中生近视人数为40×50%=20人;故选D.7.(2024·江苏基地校大联考改编)如图为甲、乙两人在同一星期内每日步数的折线统计图,则下列结论错误的是( C )A.这一星期内甲的日步数的中位数为11 600B.这一星期内甲的日步数的极差大于乙的日步数的极差C.这一星期内乙的日步数的方差大于甲的日步数的方差D.这一星期内乙的日步数的下四分位数是7 030[解析]甲的步数从小到大排列为:2 435,7 965,9 500,11 600,12 700,16 000,16 800,中位数是11 600.故A正确;这一星期内甲的日步数的极差16 800-2 435=14 365,这一星期内乙的日步数的极差14 200-5 340=8 860,这一星期内甲的日步数的极差大于乙的日步数的极差,故B正确;由图知甲的波动程度大,故方差大故C错误;乙的步数从小到大排列为:5 340,7 030,10 060,11 600,12 300,12 970,14 200,7×25%=1.75,故这一星期内乙的日步数为25%分位数是7 030,故D正确.故选C.8.(2023·江西赣州模拟)某校随机抽取了100名学生测量体重,经统计,这些学生的体重数据(单位:kg)全部介于45至70之间,将数据整理得到如图所示的频率分布直方图,则下列结论错误的是( D )A .频率分布直方图中a 的值为0.07B .这100名学生中体重低于60 kg 的人数为70C .据此可以估计该校学生体重的第78百分位数约为62D .据此可以估计该校学生体重的平均数约为56.25[解析] 因为5×(0.01+0.02+0.04+0.06+a )=1,解得a =0.07,所以A 正确;体重低于60 kg 的频率为5×(0.01+0.06+0.07)=0.7,所以人数为0.7×100=70,所以B 正确;因为5×(0.01+0.06+0.07)=0.7,5×(0.01+0.06+0.07+0.04)=0.9,所以体重的第78百分位数位于[60,65)之间,设体重的第78百分位数为x ,则(0.01+0.07+0.06)×5+(x -60)×0.04=0.78,解得x =62,所以C 正确;体重的平均数约为0.01×5×47.5+0.07×5×52.5+0.06×5×57.5+0.04×5×62.5+0.02×5×67.5=57.25,所以D 错误.故选D.二、多选题9.(2024·安徽安庆、池州、铜陵部分学校联考)甲乙两名射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4 乙9578768677则A .甲乙两人射击成绩的平均数相同 B .甲乙两人射击成绩的中位数相同 C .甲命中环数的极差大于乙命中环数的极差 D .甲比乙射击成绩更稳定[解析] 可求甲乙平均数为x 1=x 2=7,中位数均为7,故A ,B 正确;甲的极差为6,乙的极差为4,故C 正确;甲的方差为:17×(1+4+4+9+4+9+9)=407,乙的方差为:17×(4+4+1+1+1+1)=127,故D 错误.10.(2024·湖北宜荆荆恩联考、广东深圳宝安区调研)下列说法正确的有( AC )A .从40个个体中随机抽取一个容量为10的样本,则每个个体被抽到的概率都是0.25B .已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是5C .数据26,11,14,31,15,17,19,23的50%分位数是18D .若样本数据x 1,x 2,…,x n 的标准差为4,则数据2x 1+1,2x 2+1,…,2x n +1的标准差为16[解析] 从40个个体中随机抽取一个容量为10的样本,则每个个体被抽到的概率都是1040=0.25,故A 正确;已知一组数据1,2,m,6,7的平均数为4,则m =4×5-(1+2+6+7)=4,这组数据的方差为15×[(1-4)2+(2-4)2+(4-4)2+(6-4)2+(7-4)2]=265,故B 错误;这组数据从小到大排列为:11,14,15,17,19,23,26,31,共8个,故其50%分位数为第4个数17和第5个数19的平均数,为18,故C 正确;若样本数据x 1,x 2,…,x n 的标准差为4,则方差为16,故数据2x 1+1,2x 2+1,…,2x n +1的方差为16×22=64,标准差为8,故D 错误.故选AC.11.(2024·江西南昌摸底)“未来之星”少儿才艺大赛,选手通过自我介绍和才艺表演,展示仪表形象、表达能力、风度气质等自身的整体形象,评委现场打分.若九位评委对某选手打分分别是x 1,x 2,…,x 9,记这组数据的平均分、中位数、标准差、极差分别为x ,z ,s ,j ,去掉这组数据的一个最高分和一个最低分后,其平均分、中位数、标准差、极差分别为x ′,z ′,s ′,j ′,则下列判断中一定正确的是( BCD )A.x =x ′ B .z =z ′ C .s ≥s ′D .j ≥j ′[解析] 根据平均数的性质可知x =x ′不一定成立,例如九个数一个90,其他都是80,显然该等式不成立,因此A 不正确;根据中位数的定义可知这九个数据从小到大排列,中间的一个数据是中位数,去掉最高和最低不影响中间的数据,所以B 正确;根据标准差的意义可知去掉最高和最低分,数据有可能会更集中,所以选项C 正确;因为去掉最高和最低分,极差有可能减小,所以选项D 正确,故选BCD.12.(2024·江西新余一中开学考)下列命题是真命题的有( BD )A .分层抽样调查后的样本中甲、乙、丙三种个体的比例为3∶1∶2,如果抽取的甲个体数为9,则样本容量为30B .某一组样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在区间[114.5,124.5]内的频率为0.4C .甲、乙两队队员体重的平均数分别为60,68,人数之比为1∶3,则甲、乙两队全部队员体重的平均数为67D .一组数6,5,4,3,3,3,2,2,2,1的85%分位数为5[解析] 根据样本的抽样比等于各层的抽样比,样本容量为9÷33+1+2=18,故选项A 错误;样本数据落在区间[114.5,124.5]内的有120,122,116,120共4个,所以样本数据落在区间[114.5,124.5]内的频率为410=0.4,故选项B 正确;甲、乙两队的人数之比为1∶3,则甲队队员在所有队员中所占权重为11+3=14,乙队队员在所有队员中所占权重为31+3=34,则甲、乙两队全部队员体重的平均数为x =14×60+34×68=66,故选项C 错误;将该组数据从小到大排列为:1,2,2,2,3,3,3,4,5,6,由10×85%=8.5,则该组数据的85%分位数是第9个数,该数为5,故选项D 正确.13.(2024·陕西西安、河北保定部分学校联考)某公司统计了2023年1月至6月的月销售额(单位:万元),并与2022年比较,得到同比增长率数据,绘制了如图所示的统计图,则下列说法正确的是( ACD )注:同比增长率=(今年月销售额-去年同期月销售额)÷去年同期月销售额×100%. A .2023年1月至6月的月销售额的极差为8B .2023年1月至6月的月销售额的第60百分位数为8C .2023年1月至6月的月销售额的中位数为9.5D .2022年5月的月销售额为10万元[解析] 2023年1月至6月的月销售额的极差为8,故A 正确;因为6×60%=3.6,所以2023年1月至6月的月销售额的第60百分位数为11,故B 错误;2023年1月至6月的月销售额的中位数为9.5,故C 正确;设2022年5月的月销售额为x 万元,则11-xx×100%=10%,解得x =10,故D 正确.故选ACD.三、填空题14.(2023·辽宁沈阳东北育才学校模拟)已知一组样本数据x 1,x 2,x 3…x 10,且x 21+x 22+x 23+…+x 210=185,平均数x =4,则该组数据的方差s 2= 2.5 .[解析] 由题意知x 1+x 2+x 3…+x 10=4×10=40,又s 2=x 1-42+x 2-42+x 3-42+…+x 10-4210=x 21+x 22+x 23+…+x 210-8x 1+x 2+x 3…+x 10+16×1010=185-8×40+16×1010=18.5-32+16=2.5.15.(2024·浙江名校联盟高考研究卷改编)从树人小学二年级学生中随机抽取100名学生,将他们的身高(单位:cm)数据绘制成频率分布直方图如图,则下列结论正确的是 ①② (填上所有正确结论的序号)①a =0.030②估计树人小学这100名二年级学生的平均身高为124.5 cm ③估计树人小学这100名二年级学生身高的中位数为122.5 cm ④估计树人小学这100名二年级学生身高的众数为120 cm[解析] a =0.1-(0.005+0.01+0.02+0.035)=0.03.①正确.平均身高:105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm),②正确.由(x -120)×0.03=0.1得x ≈123.3(cm),③错.身高的众数为115 cm.④错.故填①②.B 组能力提升1.(2024·山西大同质检)一组数据按从小到大的顺序排列为1,3,5,6,m,10,12,13,若该组数据的中位数是极差的58,则该组数据的第60百分位数是( C )A .7.5B .8C .9D .9.5[解析] 由题意得6+m 2=58×(13-1),∴m =9.故选C.2.(多选题)(2024·安徽皖东智校协作联盟联考)某学校共有学生2 000人,其中高一800人,高二高三各600人,学校为了了解学生在寒假期间每天的读书时间,按照分层随机抽样的方法从全校学生中抽取100人,其中高一学生,高二学生,高三学生每天读书时间的平均数分别为x 1=2.7,x 2=3.1,x 3=3.3,每天读书时间的方差分别为s 21=1,s 22=2,s 23=3,则下列正确的是( ACD )A.从高二年级抽取30人B.被抽取的学生中,高二年级每天的总读书时间比高一年级多15小时C.被抽取的学生每天的读书时间的平均数为3小时D.估计全体学生每天的读书时间的方差为s2=1.966[解析]根据分层抽样,分别从高一学生,高二学生,高三学生中抽取40人,30人,30人,故A正确;抽取的高二年级每天的总读书时间为x2×30=93,抽取的高一年级每天的总读书时间为x1×40=108,高二年级每天的总读书时间比高一年级少15小时,故B错误;被抽取的学生每天的读书时间的平均数为40100×2.7+30100×3.1+30100×3.3=3(小时),故C正确;被抽取的学生每天的读书时间的方差为40100×[1+(2.7-3)2]+30100×[2+(3.1-3)2]+30100×[3+(3.3-3)2]=1.966,∴估计全体学生每天的读书时间的方差为s2=1.966,故D正确.故选ACD.3.(多选题)(2023高考新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( BD )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差[解析]x2,x3,x4,x5的平均数不一定等于x1,x2,…,x6的平均数,A错误;x2,x3,x4,x5的中位数等于x3+x42,x1,x2,…,x6的中位数等于x3+x42,B正确;设样本数据x1,x2,…,x6为0,1,2,8,9,10,可知x1,x2,…,x6的平均数是5,x2,x3,x4,x5的平均数是5,x1,x2,…,x6的方差s21=16×[(0-5)2+(1-5)2+(2-5)2+(8-5)2+(9-5)2+(10-5)2]=503,x2,x3,x4,x5的方差s22=14×[(1-5)2+(2-5)2+(8-5)2+(9-5)2]=252,s21>s22,∴s1>s2,C错误;x6>x5,x2>x1,∴x6-x1>x5-x2,D正确.故选BD.4.(2023·陕西渭南模拟)2022年2月28日,国家统计局发布了我国2021年国民经济和社会发展统计公报,在以习近平同志为核心的党中央坚强领导下,实现了“十四五”良好开局.2021年,全国居民人均可支配收入和消费支出均较上一年有所增长,结合如下统计图表,下列说法中正确的是( B )A .2017~2021年全国居民人均可支配收入逐年递减B .2021年全国居民人均消费支出24 100元C .2020年全国居民人均可支配收入较前一年下降D .2021年全国居民人均消费支出构成中食品烟酒和居住占比超过60%[解析] 根据条形图可知,2017~2021年全国居民人均可支配收入逐年递增,A 错误.根据扇形图可知,2021年全国居民人均消费支出为:5 641+1 419+7 178+569+2 115+2 599+3 156+1 423=24 100元,B 正确.根据条形图可知,2020年全国居民人均可支配收入较前一年上升,C 错误.2021年全国居民人均消费支出构成中食品烟酒和居住占比:7 178+5 64124 100×100%≈53.2%<60%,D 错误.故选B.5.(2023·全国乙卷)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i ,y i (i =1,2,…,10).试验结果如下: 试验序号i 1 2 3 4 5 6 7 8 9 10 伸缩率x i 545 533 551 522 575 544 541 568 596 548 伸缩率y i536527543530560533522550576536记z i =x i -y i (i =1,2,…,10),记z 1,z 2,…,z 10的样本平均数为z ,样本方差为s2.(1)求z,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(如果z≥2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高) [解析](1)x=545+533+551+522+575+544+541+568+596+54810=552.3,y=536+527+543+530+560+533+522+550+576+53610=541.3,z=x-y=552.3-541.3=11,z i=x i-y i的值分别为:9,6,8,-8,15,11,19,18,20,12,∴s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知:z=11,2s210=2 6.1=24.4,故有z≥2s210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

上一页
返回导航
下一页
第十一章 统计与统计案例
3
(2)分层抽样 ①定义:在抽样时,将总体分成_互__不__交__叉___的层,然后按照一定的比例,从各层独立地 抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层 抽样. ②适用范围:适用于总体由差异比较明显的几个部分组成时.
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
解析:由题意得,从随机数表第 7 行第 8 列的数开始向右读,符合条件的前三个编号依
次是 331,455,068,故抽取的第 3 支疫苗的编号是 068. 答案:068
2x4,2x5 的标准差为________.
上一页
返回导航
下一页
第十一章 统计与统计案例
28
【解析】 (1)由题意得所剩数据:90,90,93,94,93. 所以平均数-x =90+90+953+94+93=92. 方差 s2=15[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8.
(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. (√ )
(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值. ( √ )
上一页
返回导航
下一页
第十一章 统计与统计案例
16
二、易错纠偏 常见误区 (1)随机数表法的规则不熟出错; (2)频率分布直方图识图不清;
上一页
返回导航
下一页
第十一章 统计与统计案例
4
2.统计图表 (1)频率分布直方图的画法步骤 ①求极差(即一组数据中_最__大__值___与_最__小__值___的差); ②决定_组__距___与__组__数__; ③将数据_分__组___; ④列_频__率__分__布__表___; ⑤画_频__率__分__布__直__方__图___.
26
考点二 样本的数字特征(应用型) 复习指导 1.通过实例理解样本数据的标准差的意义和作用,学会计算数据的标准差. 2.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均 数、标准差),并作出合理的解释. 核心素养:数据分析、数学运算
上一页
返回导航
下一页
第十一章 统计与统计案例
上一页
返回导航
下一页
第十一章 统计与统计案例
19
考点一 随机抽样(基础型) 复习指导 1.理解随机抽样的必要性和重要性. 2.学会用简单随机抽样的方法从总体中抽取样本. 3.通过对实例的分析,了解分层抽样的方法. 核心素养:数据分析
上一页
返回导航
下一页
第十一章 统计与统计案例
20
1.(2020·重庆中山外国语学校模拟)如饼图,某学校共有教师 120 人,从中选出一个 30
________.(下面摘取了随机数表的第 7 行至第 9 行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
27
(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,
94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为
()
A.92,2.8
B.92,2
C.93,2
D.93,2.8
(2)(2020·盐城模拟)已知一组数据 x1,x2,x3,x4,x5 的方差是 2,则数据 2x1,2x2,2x3,
上一页
返回导航
下一页
第十一章 统计与统计案例
18
2.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,
40),[40,60),[60,80),[80,100],若低于 60 分的人数是 15,则该班的学生人数是
_____.
解析:依题意得,成绩低于 60 分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的 学生人数是 15÷0.3=50. 答案:50
上一页
返回导航
下一页
第十一章 统计与统计案例
17
1.假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随机数法从 500 支疫苗中
抽取 50 支进行检验,利用随机数表抽取样本时,先将 500 支疫苗按 000,001,…,499
进行编号,若从随机数表第 7 行第 8 列的数开始向右读,则抽取的第 3 支疫苗的编号为
下一页
第十一章 统计与统计案例
12
3.某仪器厂从新生产的一批零件中随机抽取 40 个检测,如图是根据抽样检测后零件的 质量(单位:克)绘制的频率分布直方图,样本数据分 8 组,分别为[80,82),[82,84), [84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在第_____ 组.
(3)平均数:把________n__________称为 a1,a2,…,an 这 n 个数的平均数.
上一页
返回导航
下一页
第十一章 统计与统计案例
7
(4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均数为-x ,则这组数据的标准差 和方差分别是
s=
n1[(x1--x )2+(x2--x )2+…+(xn--x )2],
上一页
返回导航
下一页
第十一章 统计与统计案例
22
解析:4 次射击中有 1 次或 2 次击中目标的有:0371,6011,7610,1417,7140,所以 所求概率 P=1-250=1250=0.75. 答案:0.75
上一页
返回导航
下一页
第十一章 统计与统计案例
23
3.一支田径队有男运动员 56 人,女运动员 m 人,用分层抽样抽出一个容量为 n 的样本, 在这个样本中随机取一个当队长的概率为218,且样本中的男队员比女队员多 4 人,则 m =________.
解析:由题意知 n=28,设其中有男队员 x 人,女队员有 y 人. x+y=28,
则x-y=4, 解得 x=16,y=12,m=42. 5m6=xy.
答案:42
上一页
返回导航
下一页
第十一章 统计与统计案例
24
(1)抽签法与随机数法的适用情况 ①抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况. ②一个抽样试验能否用抽签法,关键看两点: 一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可 用抽签法.
上一页
返回导航
下一页
第十一章 统计与统计案例
5
(2)频率分布折线图和总体密度曲线 ①频率分布折线图:连接频率分布直方图中各小长方形上端的_中__点___,就得到频率分布 折线图; ②总体密度曲线:随着样本容量的增加,作图时_所__分__组__数___增加,_组__距___减小,相应的 频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
第十一章 统计与统计案例
第1讲 随机抽样、用样本估计总体
数学
第十一章 统计与统计案例
1
01
基础知识 自主回顾
02
学科素养 探究提升
03
高效演练 分层突破
上一页
返回导航
下一页
第十一章 统计与统计案例)简单随机抽样 ①定义:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本 (n≤N),且每次抽取时总体内的各个个体被抽到的_机__会__都__相__等___,就称这样的抽样方法 为简单随机抽样. ②常用方法:抽签法和_随__机__数__法___.
400+2 4200000+n×90=36,则
n=1
600,所以高三被抽取的人数
为 2
1 400+2
600 000+1
600×90=24.
答案:24
上一页
返回导航
下一页
第十一章 统计与统计案例
11
2.已知一组数据 6,7,8,8,9,10,则该组数据的方差是________. 答案:53
上一页
返回导航
上一页
返回导航
下一页
第十一章 统计与统计案例
13
解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075+0.1)×2=0.55,则其频数 为 40×0.55=22,且第四组的频数为 40×0.1×2=8,故中位数落在第 4 组. 答案:4
上一页
返回导航
下一页
第十一章 统计与统计案例
上一页
返回导航
下一页
第十一章 统计与统计案例
9
3.巧用四个有关的结论 -
(1)若 x1,x2,…,xn 的平均数为 x ,那么 mx1+a,mx2+a,…,mxn+a 的平均数为 m-x +a; (2)数据 x1,x2,…,xn 与数据 x′1=x1+a,x′2=x2+a,…,x′n=xn+a 的方差相等,即 数据经过平移后方差不变; (3)若 x1,x2,…,xn 的方差为 s2,那么 ax1+b,ax2+b,…,axn+b 的方差为 a2s2; (4)s2=n1i∑=n1 (xi--x )2=n1i∑=n1x2i --x 2,即各数平方的平均数减去平均数的平方.
一、思考辨析 判断正误(正确的打“√”,错误的打“×”) (1)简单随机抽样是一种不放回抽样. (2)在抽签法中,先抽的人抽中的可能性大. (3)一组数据的方差越大,说明这组数据的波动越大.
相关文档
最新文档