高中数学第二章统计2.2用样本估计总体(第2课时)预习导航新人教A版必修3讲义
人教新课标A版 高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体
人教新课标A版高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体同步测试(II)卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)(2014·广东理) 已知某地区中小学学生的近视情况分布如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A . 200,20B . 100,20C . 200,10D . 100,102. (2分)为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄作为样本,就这个问题来说,下列说法正确的是()A . 1000名运动员是总体B . 每个运动员是个体C . 抽取的100名运动员的年龄是样本D . 样本容量是10003. (2分)对某种电子元件使用寿命跟踪调查,抽取容量为1000的样本,其步率分布直方图如图所示,根据此图可知这样样本中电子元件的寿命在300-500小时的数量是()B . 640个C . 650个D . 660个4. (2分)在样本的频率分布直方图中,共有11个小长方形,若其中一个小长方形的面积等于其他10个小长方形面积和的四分之一,样本容量为160,则该小长方形这一组的频数为()A . 32B . 0.2C . 40D . 0.255. (2分) (2016高一下·龙岩期末) 为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出如图所示的频率分布直方图,已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在[100,120]之间的学生人数是()A . 32B . 24C . 18D . 126. (2分)要了解全市高一学生身高在某一身高范围的学生所占比例的大小,需知道相应样本的()B . 方差C . 众数D . 频率分布7. (2分)从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8人,其累计频率为0.4,则这样的样本容量是()A . 20人B . 40人C . 70人D . 80人8. (2分)为了解某社区物业部门对本小区业主的服务情况,随机访问了100位业主,根据这100位业主对物业部门的评分情况,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].由于某种原因,有个数据出现污损,请根据图中其他数据分析,评分不小于80分的业主有()位.A . 43B . 44C . 459. (2分)下列四个命题:①样本方差反映的是所有样本数据与样本平均值的偏离程度;②某只股票经历了10个跌停(下跌10%)后需再经过10个涨停(上涨10%)就可以回到原来的净值;③某校高三一级部和二级部的人数分别是m、n,本次期末考试两级部数学平均分分别是a、b,则这两个级部的数学平均分为;④某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查,现将800名学生从l到800进行编号.已知从497~513这16个数中取得的学生编号是503,则初始在第1小组1~16中随机抽到的学生编号是7.其中真命题的个数是()A . 0个B . 1个C . 2个D . 3个10. (2分) 5000辆汽车经过某一雷达测速区,其速度频率分布直方图如图所示,则时速超过70km/h的汽车数量为()A . 50B . 500D . 450011. (2分)某班学生在一次数学考试中成绩分布如下表:分数段[0,60)[60,70)[70,80)[80,90)人数6568分数段[90,100)[100,110)[110,120)[120,150)人数10645那么分数在[90,120)中的频率是(精确到0.01)()A . 0.18B . 0.40C . 0.50D . 0.3812. (2分)某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为()A . 6万元B . 8万元C . 10万元D . 12万元13. (2分)某地一种植物一年生长的高度如下表:则该植物一年生长在[30,40)内的频率是()A . 0.80B . 0.65C . 0.40D . 0.2514. (2分)采用随机抽样法抽到一个容量为20的样本数据,分组后,各组的频数如下表分组(10,20](20,30](30,40](40,50](50,60](60,70]频数23x5y2已知样本数据在(20,40]的频率为0.35,则样本数据在区间(50,60]上的频率为()A . 0.70B . 0.50C . 0.25D . 0.2015. (2分)某大学对名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图),则这名学生在该次自主招生水平测试中成绩不低于分的学生数是()A .B .C .D .二、填空题 (共5题;共5分)16. (1分)某中学举行了一次田径运动会,其中有50名学生参加了一次百米比赛,他们的成绩和频率如图所示.若将成绩小于15秒作为奖励的条件,则在这次百米比赛中获奖的人数共有________ 人.17. (1分)某网络公司为了调查一住宅区连接互联网情况,从该住宅区28000住户中随机抽取了210户进行调查,调查数据如右图,则估计该住宅区已接入互联网的住户数是________ .18. (1分) (2017高一下·丰台期末) 从某企业生产的某种产品中抽取100件样本,测量这些样本的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125]频数62638228则样本的该项质量指标值落在[105,125]上的频率为________.19. (1分)在我市2015年“创建文明城市”知识竞赛中,考评组从中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则分数在区间[60,70)上的人数大约有________ 人.20. (1分) (2016高一下·南市期中) 如图在某路段检测点,对200辆汽车的车速进行检测,检测结果表示为如下频率分布直方图,则车速不小于90km/h的汽车约有________辆.三、解答题 (共5题;共25分)21. (5分) (2017高一下·天津期末) 为了检测某种产品的质量(单位:千克),抽取了一个容量为N的样本,整理得到的数据作出了频率分布表和频率分布直方图如图:分组频数频率[17.5,20)100.05[20,225)500.25[22.5,25)a b[25,27.5)40c[27.5,30]200.10合计N1(Ⅰ)求出表中N及a,b,c的值;(Ⅱ)求频率分布直方图中d的值;(Ⅲ)从该产品中随机抽取一件,试估计这件产品的质量少于25千克的概率.22. (5分) (2018高二上·宜昌期末) 某班50名学生在一次数学测试中,成绩全部介于50与100之间,将测试结果按如下方式分成五组:第一组[50,60),第二组[60,70),…,第五组[90,100].如图所示是按上述分组方法得到的频率分布直方图.(Ⅰ)若成绩大于或等于60且小于80,认为合格,求该班在这次数学测试中成绩合格的人数;(Ⅱ)从测试成绩在[50,60)∪[90,100]内的所有学生中随机抽取两名同学,设其测试成绩分别为m、n,求事件“|m﹣n|>10”概率.23. (5分)因为样本是总体的一部分,是由某些个体所组成的,尽管对总体具有一定的代表性,但并不等于总体,为什么不把所有个体考查一遍,使样本就是总体?24. (5分)某校高一年级500名学生中,血型为O的有200人,血型为A的有125人,血型为B的有125人,血型为AB型的有50人.为了研究血型与色弱的关系,要从中抽取一个容量为40的样本,应如何抽样?写出血型为AB型的抽样过程.25. (5分) (2016高一下·永年期末) 某企业员工500人参加“学雷锋”志愿活动,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(1)下表是年龄的频数分布表,求正整数a,b的值;区间[25,30)[30,35)[35,40)[40,45)[45,50]人数5050a150b(2)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,年龄在第1,2,3组的人数分别是多少?(3)在(2)的前提下,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共5分)16-1、17-1、18-1、19-1、20-1、三、解答题 (共5题;共25分)21-1、22-1、23-1、24-1、25-1、25-2、25-3、。
人教新课标A版 高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体
人教新课标A版高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体同步测试C卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)某一网络公司为了调查一住宅区连接互联网情况,从该住宅区28000住户中随机抽取了210户进行调查,调查数据如右图,则估计该住宅区已接入互联网的住户数是()A . 90B . 1200C . 12000D . 140002. (2分)甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图所示,,分别表示甲、乙两名运动员这项测试成绩的平均数,,分别表示甲、乙两名运动员这项测试成绩的标准差,则有()A .B .C .D .3. (2分)数据﹣5,3,2,﹣3,3的平均数,众数,中位数,方差分别是()A . 0,3,3,11.2B . 0,3,2,56C . 0,3,2,11.2D . 0,2,3,564. (2分)某比赛中,七位评委为某个节目打出的分数如右图茎叶统计图所示,去掉一个最高分和一个最低分后所剩数据的平均数和方差分别是()A . 84,4.84B . 84, 16C . 85, 1.6D . 85, 45. (2分)甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数8.48.78.78.3方差s2 3.6 3.6 2.2 5.4从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是()A . 甲B . 乙C . 丙D . 丁6. (2分)(2020·鹤壁模拟) 中国铁路总公司相关负责人表示,到2018年底,全国铁路营业里程达到13.1万公里,其中高铁营业里程2.9万公里,超过世界高铁总里程的三分之二,下图是2014年到2018年铁路和高铁运营里程(单位:万公里)的折线图,以下结论不正确的是()A . 每相邻两年相比较,2014年到2015年铁路运营里程增加最显著B . 从2014年到2018年这5年,高铁运营里程与年价正相关C . 2018年高铁运营里程比2014年高铁运营里程增长80%以上D . 从2014年到2018年这5年,高铁运营里程数依次成等差数列7. (2分)(2017·海淀模拟) 北京市2016年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是()A . 第一季度C . 第三季度D . 第四季度8. (2分)右图实线是函数y=f(x)(0≤x≤2a)的图象,它关于点A(a,a)对称.如果它是一条总体密度曲线,则正数a的值为()A .B . 1C . 2D .9. (2分)对“小康县”的经济评价标准:①年人均收入不小于7000元;②年人均食品支出不大于收入的35%.某县有40万人,调查数据如下:年人均收入/元0200040006000800010 00012 00016 000人数/万人63556753则该县()B . 达到标准①,未达到标准②,不是小康县C . 达到标准②,未达到标准①,不是小康县D . 两个标准都未达到,不是小康县10. (2分)某人将一枚硬币连掷了10次,正面朝上出现了6次,若用A表示正面朝上这一事件,则A的频率为()A .B .C . 6D . 接近11. (2分) (2017高一下·中山期末) 从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为,,中位数分别为m甲, m乙,则()A . ,m甲>m乙B . ,m甲<m乙C . ,m甲>m乙D . ,m甲<m乙12. (2分)给出下列五个命题:①某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23;②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;③一组数据为a,0,1,2,3,若该组数据的平均值为1,则样本标准差为2;④根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y=a+bx中,则a=1;⑤如图是根据抽样检测后得出的产品样本净重(单位:克)数据绘制的频率分布直方图,已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是90.其中真命题为()A . ①②④B . ②④⑤C . ②③④D . ③④⑤13. (2分)如图1是2013年某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为()A . 、B . 、C . 、D . 、14. (2分) (2019高三上·双鸭山月考) 为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为200的调查样本,其中城镇户籍与农村户籍各100人;男性120人,女性80人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图,如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是()A . 是否倾向选择生育二胎与户籍有关B . 是否倾向选择生育二胎与性别有关C . 倾向选择生育二胎的人群中,男性人数与女性人数相同D . 倾向选择不生育二胎的人群中,农村户籍人数少于城镇户籍人数15. (2分) (2019高二上·齐齐哈尔期末) 将甲、乙两名同学5次物理测验的成绩用茎叶图表示如图,若甲、乙两人成绩的中位数分别为,则下列说法正确的是()A . ;乙比甲成绩稳定B . ;甲比乙成绩稳定C . ;乙比甲成绩稳定D . ;甲比乙成绩稳定二、填空题 (共5题;共6分)16. (1分) (2017高二上·伊春月考) 数据,,…,平均数为6,标准差为2,则数据,,…,的方差为________.17. (1分)从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的方差为________分数54321人数201030301018. (1分) (2016高二上·枣阳期中) 如图是某赛季甲乙两名篮球运动员每场比赛得分的茎叶图,则甲乙两人比赛得分的中位数之和是________19. (1分)统计的基本思想是:________ .20. (2分) (2016高一下·南市期末) 某公司13个部门接受的快递的数量如茎叶图所示,则这13个部门接收的快递的数量的中位数为________.三、解答题 (共5题;共25分)21. (5分)(2018·河北模拟) 某市政府为了引导居民合理用水,决定全面实施阶梯水价,阶梯水价原则上以住宅(一套住宅为一户)的月用水量为基准定价:若用水量不超过12吨时,按4元/吨计算水费;若用水量超过12吨且不超过14吨时,超过12吨部分按6.60元/吨计算水费;若用水量超过14吨时,超过14吨部分按7.8元/吨计算水费.为了了解全市居民月用水量的分布情况,通过抽样,获得了100户居民的月用水量(单位:吨),将数据按照分成8组,制成了如图1所示的频率分布直方图.(Ⅰ)假设用抽到的100户居民月用水量作为样本估计全市的居民用水情况.(ⅰ)现从全市居民中依次随机抽取5户,求这5户居民恰好3户居民的月用水量都超过12吨的概率;(ⅱ)试估计全市居民用水价格的期望(精确到0.01);(Ⅱ)如图2是该市居民李某2016年1~6月份的月用水费(元)与月份的散点图,其拟合的线性回归方程是.若李某2016年1~7月份水费总支出为294.6元,试估计李某7月份的用水吨数.22. (5分) (2018高一下·渭南期末) 从全校参加数学竞赛的学生的试卷中抽取一个样本,考察竞赛的成绩分布情况,将样本分成5组,绘成频率分布直方图,图中从左到右各小组的小长方形的高之比为1:3:6:4:2,最右边一组频数是6,请结合直方图提供的信息,解答下列问题:(1)样本的容量是多少?(2)列出频率分布表;(3)估计这次竞赛中,成绩高于60分的学生占总人数的百分比;(4)成绩落在哪个范围内的人数最多?并求出该小组的频数,频率.23. (5分) (2017高二下·黑龙江期末) “微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:(1)若采用样本估计总体的方式,试估计小王的所有微信好友中每日走路步数超过5000步的概率;(2)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关?附:,0.100.050.0250.0102.7063.8415.0246.63524. (5分)“中国人均读书4.3本(包括网络文学和教科书),比韩国的11本、法国的20本、日本的40本、犹太人的64本少得多,是世界上人均读书最少的国家.”这个论断被各种媒体反复引用.出现这样的统计结果无疑是令人尴尬的,而且和其他国家相比,我国国民的阅读量如此之低,也和我国是传统的文明古国、礼仪之邦的地位不相符.某小区为了提高小区内人员的读书兴趣,特举办读书活动,准备进一定量的书籍丰富小区图书站,由于不同年龄段需看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了一天名读书者进行调查,将他们的年龄分成6段:,,,,,后得到如图所示的频率分布直方图.问:(1)估计在40名读书者中年龄分布在的人数;(2)求40名读书者年龄的平均数和中位数;(3)若从年龄在的读书者中任取2名,求这两名读书者年龄在的人数的分布列及数学期望.25. (5分) (2018高二下·衡阳期末) 某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)水量频数13249265使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共6分)16-1、17-1、18-1、19-1、20-1、三、解答题 (共5题;共25分)21-1、22-1、22-2、22-3、22-4、23-1、23-2、24-1、24-2、24-3、25-1、25-2、25-3、。
高中数学 第二章 统计 2.2 用样本估计总体(第2课时)课
高中数学 第二章 统计 2.2 用样本估计总体(第2课时)课堂探究新人教A 版必修31.众数、中位数、平均数与频率分布直方图的关系剖析:(1)在样本数据的频率分布直方图中,众数的估计值就是最高矩形上端中点的横坐标.(2)在频率分布直方图中,中位数左右两侧的直方图的面积相等,但是因为样本数据的频率分布直方图只是直观地表明分布的特征,因而从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数的值不一致.(3)平均数显然是频率分布直方图的“重心”.在频率分布直方图中,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.理解方差与标准差剖析:(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围是[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.题型一 计算方差(标准差)【例题1】从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为________.解析:这100人的总成绩为5×20+4×10+3×30+2×30+1×10=300,平均成绩为300100=3,则该100人成绩的标准差为1100[(5-3)2×20+(4-3)2×10+(3-3)2×30+(2-3)2×30+(1-3)2×10] =2105. 答案:2105 反思 求一组数据的方差和标准差的步骤如下:①先求平均数x .②代入公式得方差和标准差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2], s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 题型二 众数、中位数、平均数的应用【例题2】某工厂人员及月工资构成如下:(1)(2)这个问题中,平均数能客观地反映该工厂的月工资水平吗?为什么?解:(1)由表格可知,众数为2 000元.把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.平均数为(22 000+15 000+11 000+20 000+1 000)÷23=69 000÷23=3 000(元).(2)虽然平均数为3 000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.反思 (1)如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.题型三 方差的应用【例题3】甲、乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋,测得其实际质量分别如下(单位:克):甲:203 204 202 196 199 201 205 197 202 199乙:201 200 208 206 210 209 200 193 194 194(1)分别计算两个样本的平均数与方差.(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近于200克?哪台包装机包装的10袋糖果的质量比较稳定?解:(1)x 甲=110(3+4+2-4-1+1+5-3+2-1)+200=200.8. x 乙=110(1+0+8+6+10+9+0-7-6-6)+200=201.5.s 2甲=7.96,s 2乙=38.05.(2)∵200<x 甲<x 乙,∴甲台包装机包装的10袋糖果的平均质量更接近于200克.∵s 2甲<s 2乙,∴甲台包装机包装的10袋糖果的质量比较稳定.反思 研究两个样本的波动情况或比较它们的稳定性、可靠性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准.若平均数相等,则再比较两个样本方差的大小来作出判断.在计算过程中,要仔细观察所给样本数据的特征,选择恰当的公式来计算平均数和方差,这样可避免计算的烦琐,降低错误率.题型四 易错辨析【例题4】小明是班里的优秀学生,他的历次数学成绩是96,98,95,93分,但最近的一次考试成绩只有45分,原因是他带病参加了考试.期末评价时,怎样给小明评价?错解:这五次数学考试的平均分是96+98+95+93+455=85.4,则按平均分给小明一个“良好”.错因分析:这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响.本题中的5个成绩从小到大排列为:45,93,95,96,98,中位数是95,较为合理地反映了小明的数学水平,因而应该用中位数来衡量小明的数学成绩.正解:小明5次考试成绩,从小到大排列为45,93,95,96,98,中位数是95,应评定为“优秀”.。
人教新课标A版 高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体
人教新课标A版高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体同步测试(II)卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)为了估计某水池中鱼的尾数,先从水池中捕出2000尾鱼,并给每尾鱼做上标记(不影响存活),然后放回水池,经过适当的时间,再从水池中捕出500尾鱼,其中有标记的鱼为40尾,根据上述数据估计该水池中鱼的尾数为()A . 10000B . 20000C . 25000D . 300002. (2分)样本数据:2,4,6,8,10的标准差为()A . 40B . 8C . 2D . 23. (2分)一组数据12,15,24,25,31,31,36,36,37,39,44,49,50的中位数是()A . 31B . 36C . 35D . 345. (2分) (2018高一下·枣庄期末) 已知数据,,,…,是枣强县普通职工(,)个人的年收入,设个数据的中位数为,平均数为,方差为,如果再加上世界首富的年收入,则这个数据中,下列说法正确的是()A . 年收入平均数大大增加,中位数一定变大,方差可能不变B . 年收入平均数大大增加,中位数可能不变,方差变大C . 年收入平均数大大增加,中位数可能不变,方差也不变D . 年收入平均数可能不变,中位数可能不变,方差可能不变8. (2分)为了让人们感知丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢的塑料袋的数量,结果如下(单位:个):33、25、28、26、25、31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家共丢弃塑料袋()A . 900个B . 1080个C . 1260个D . 1800个10. (2分)小波一星期的总开支分布图如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为()A . 30%B . 10%C . 3%D . 不能确定11. (2分)已知一组数据、、、、的平均数是,方差是,那么另一组数、、、、的平均数,方差分别是()A .B .C .D .14. (2分)某住宅小区有居民2万户,从中随机抽取200户,调查是否已安装电话,调查结果如下表所示:则该小区已安装电话的住户估计有()A . 6 500户B . 3 000户C . 19 000户D . 9 500户15. (2分)(2019·全国Ⅱ卷理) 演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A . 中位数B . 平均数C . 方差D . 极差二、填空题 (共5题;共6分)16. (1分) (2018高一下·安徽期末) 数据,,…,的平均数是3,方差是1,则数据,,…,的平均数和方差之和是________.17. (1分)已知数据x1 , x2 ,…,x8的方差为16,则数据2x1+1,2x2+1,…,2x8+1的标准差为________19. (1分) (2016高一下·湖南期中) 为了了解学生遵守《中华人民共和国交通安全法》的情况,调查部门在某学校进行了如下的随机调查:向被调查者提出两个问题:(1)你的学号是奇数吗?(2)在过路口的时候你是否闯过红灯?要求被调查者背对调查人抛掷一枚硬币,如果出现正面,就回答第(1)个问题;否则就回答第(2)个问题.被调查者不必告诉调查人员自己回答的是哪一个问题,只需要回答“是”或“不是”,因为只有被调查本人知道回答了哪个问题,所以都如实做了回答.如果被调查的600人(学号从1到600)中有180人回答了“是”,由此可以估计在这600人中闯过红灯的人数是________.20. (2分)(2020·随县模拟) 2020年年初,新冠肺炎疫情袭击全国.口罩成为重要的抗疫物资,为了确保口罩供应,某工厂口罩生产线高速运转,工人加班加点生产.设该工厂连续5天生产的口罩数依次为,,,,(单位:十万只),若这组数据,,,,的方差为1.44,且,,,,的平均数为4,则该工厂这5天平均每天生产口罩________十万只.三、解答题 (共5题;共25分)23. (5分) (2017高二下·瓦房店期末) 为了研究家用轿车在高速公路上的车速情况,交通部门对100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过100km/h的有40人,不超过100km/h的有15人.在45名女性驾驶员中,平均车速超过100km/h的有20人,不超过100km/h的有25人.(1)完成下面的列联表,并判断是否有99.5%的把握认为平均车速超过100km/h的人与性别有关.100km/h人数100km/h人数男性驾驶员人数女性驾驶员人数合计(2)以上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取3辆,记这3辆车中驾驶员为男性且车速超过100km/h的车辆数为,若每次抽取的结果是相互独立的,求的分布列和数学期望.参考公式与数据:,其中0.1500.1000.0500.0250.0100.0050.0012.072 2.7063.841 5.024 6.6357.87910.82825. (5分)(2018·吉林模拟) 某高中一年级600名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:(1)从总体的600名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、5-1、8-1、10-1、11-1、14-1、15-1、二、填空题 (共5题;共6分)16-1、17-1、19-1、20-1、三、解答题 (共5题;共25分)23-1、23-2、25-1、25-2、25-3、。
人教A版高中数学必修3第二章 统计2.2 用样本估计总体教案
2.2.1用样本的频率分布估计总体分布一、教学目标分析1.知识与技能目标(1)通过实例体会分布的意义和作用。
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。
(3)通过实例体会频率分布直方图的特征,能准确地做出总体估计。
2、过程与方法目标:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
3、情感态度与价值观目标:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
二、教学的重点和难点重点:会列频率分布表,画频率分布直方图。
难点:能通过样本的频率分布估计总体的分布。
三、教法与学法分析1、教法:遵循观察、探究、发现、总结式的教学模式。
重点以引导学生为主,让他们能积极、主动的进行探索,获取知识。
由于内容较繁琐,所以要借助多媒体辅助教学。
2、学法:根据本节知识的特点,由于学生已具备一定的基础知识,可采取研究性学习的学习方法。
四、教学过程(一)情境引入1.随机抽样有哪几种基本的抽样方法?简单随机抽样、系统抽样、分层抽样.2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.3.高二某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下:82,75,61,93,62,55,70,68,85,78.如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布.(二)新课讲解知识探究(一):频率分布表【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.20.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.21.7 1.3 3.6 1.7 0.6 4.1 3.22.9 2.4 2.3 1.8 1.43.5 1.9 0.84.3 3.02.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.60.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.61.0 1.0 1.7 0.82.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?0.2~4.3思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?(4.3-0.2)÷0.5=8.2思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?分组频数累计频数频率[0,0.5) 4 0.04[0.5,1)8 0.08[1,1.5)正正正15 0.15[1.5,2)正正正正22 0.22[2,2.5)正正正正正25 0.25[2.5,3)正正14 0.14[3,3.5)正一 6 0.06[3.5,4) 4 0.04[4,4.5] 2 0.02合计100 1.00思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?用样本的频率分布估计总体分布.思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?88%的居民月用水量在3t以下,可建议取a=3思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的.思考8:对样本数据进行分组,其组数是由哪些因素确定的?思考9:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.按统计原理,若样本的容量为n,分组数一般在(1+3.3lg n)附近选取.当样本容量不超过100时,按照数据的多少,常分成5~12组.若以0.1或1.5为组距对上述100个样本数据分组合适吗?思考10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?第一步,求极差.(极差=样本数据中最大值与最小值的差)第二步,决定组距与组数.(设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1)第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格.(频数=样本数据落在各小组内的个数,频率=频数÷样本容量)知识探究(二):频率分布直方图思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高度在数量上有何特点?思考2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=频率各小长方形的面积之和=1思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民月均用水量集中在一个中间值附近,只有少数居民月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?第一步,画平面直角坐标系.第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.思考5:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?(三)例题讲解例1、 某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在32~52岁的知识分子所占的比例约是多少.(1)极差为67-28=39,取组距为5,分为8组.样本频率分布表:分 组 频数 频率[27,32) 3 0.06[32,37) 3 0.06[37,42) 9 0.18[42,47) 16 0.32[47,52) 7 0.14[52,57) 5 0.10[57,62) 4 0.08[62,67) 3 0.06合 计 50 1.00(2)样本频率分布直方图:频率(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32例 2、为了了解小学生的体能情况,抽取了某小 学同年级部分学生进行跳绳测试,将所得的数据 整理后画出频率分布直方图(如图),已知图中从 左到右的前三个小组的频率分别是0.1,0.3,0.4。
高中数学第二章统计2.2.2用样本的数字特征估计总体的数字特征预习导航新人教B版必修3
高中数学 第二章 统计 2.2.2 用样本的数字特征估计总体的数字特征预习导航 新人教B 版必修31.通过随机抽样,会用样本平均数估计总体平均数,会用样本标准差估计总体标准差.2.掌握几个数据的标准差及方差的计算方法,理解数据标准差的意义和作用.1.众数、中位数、平均数(1)在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.(3)如果有n 个数x 1,x 2,x 3,…,x n ,那么x =1n(x 1+x 2+…+x n ),叫做这n 个数的平均数. 总体中所有个体的平均数叫做总体平均数. 样本中所有个体的平均数叫做样本平均数.【做一做1】10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设平均数为a ,中位数为b ,众数为c ,则有( )A .a <b <cB .a >b >cC .a <c <bD .c >a >b解析:众数c =17,中位数b =15,平均数a =110×(10+12+14×2+15×2+16+17×3)=14.7,所以a <b <c .答案:A2.样本方差、样本标准差 数据的离散程度可以用极差、方差或标准差来描述.我们知道,样本方差描述了一组数据围绕平均数波动的大小.一般地,设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,定义s 2= x 1-x 2+ x 2-x 2+…+ x n -x 2n, s =x 1-x 2+ x 2-x 2+…+ x n -x2n . 其中s 2表示样本方差,s 表示样本标准差.归纳总结 因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.【做一做2-1】 样本101,98,102,100,99的标准差为( )A . 2B .0C .1D .2解析:样本平均数x =15×(101+98+102+100+99)=100,方差s 2=15×[(101-100)2+(98-100)2+(102-100)2+(100-100)2+(99-100)2]=2, ∴s=2.答案:A【做一做2-2】 若k 1,k 2,…,k 6的方差为3,则2(k 1-3),2(k 2-3),…,2(k 6-3)的方差为__________.解析:设k 1,k 2,…,k 6的平均数为k ,则16[(k 1-k )2+(k 2-k )2+…+(k 6-k )2]=3, 而2(k 1-3),2(k 2-3),…,2(k 6-3)的平均数为2(k -3),则所求方差为16[4(k 1-k )2+4(k 2-k )2+…+4(k 6-k )2]=4×3=12.答案:12。
新人教版高中数学必修三 第二章统计教案:2.2用样本估计总体
2.2 用样本估计总体【知识要点】1. 用样本的频率分布估计总体分布a. 频数:将一批数据按要求分为若干个组,各组内数据的个数,叫改组的频数。
频率:每组数除以全体数据的个数的商叫改组的频率。
b. 样本的频率分布:根据随机所抽样本大小,分别计算某一事件出现的频率,这些频率的分布规律(取值情况),就叫做样本的频率分布。
c. 样本频率分布表:将样本的容量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,叫做样本频率分布表。
d. 频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直直方图。
e. 频率分布折线图:把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图。
f. 总体密度曲线:如果样本容量无限增大,分组的组距无限减小,曲线中所表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小。
这条光滑的曲线就叫做总体密度曲线。
2. 用样本的数字特征估计总体的数字特征a. 平均数:平均数是指在一组数据中所有数据之和再除以数据的个数。
b. 众数:一组数据中出现次数最多的那个数据叫这组数据的众数。
c. 中位数:将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数或当数据有偶数个时,处在最中间的两个数的平均数是这组数据的中位数。
d. 方差:方差是各个数据与平均数之差的平方的平均数。
e. 标准差:标准差是方差的算术平方根。
3. 茎叶图:它是一种将样本将数组中数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
4. 求一组数据的频率分布的步骤及频率分布直方图的画法 a. 求一组数据的频率分布的步骤:(1)计算极差 (2)决定组距与组数 (3)决定分点 (4)列频率分布表b. 频率分布直方图画法:(1)先制作频率分布表,然后作直角坐标系,以横轴表示样本数据,纵轴表述频率与组距的比值 (2)把横轴分成若干段,每一段对应一个组的组距,得到频率分布直方图。
人教新课标A版 高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体
人教新课标A版高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体同步测试A卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分) (2018高二上·宾阳月考) 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A . 0.27,78B . 0.27,83C . 2.7,78D . 2.7,832. (2分)(2020·重庆模拟) 为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为()A . 0B . 1C . 2D . 33. (2分)某校从参加高二年级学业水平测试的学生中抽出100名学生,其数学成绩的频率分布直方图如图所示.其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90) ,[90,100].则成绩在[80 ,100]上的人数为A . 70B . 60C . 35D . 304. (2分) (2018高二下·保山期末) 某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数()A . 40B . 45C . 48D . 505. (2分)统计某校1000名学生的数学水平测试成绩,得到样本频率分布直方图如图所示,若满分为100分,规定不低于60分为及格,则及格率是()A . 20%B . 25%C . 6%D . 80%6. (2分)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克的产品的个数是()A . 120B . 108C . 90D . 457. (2分) (2016高一下·驻马店期末) 某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机抽取24名笔试者的成绩,如表所示:分数段[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数234951据此估计允许参加面试的分数线大约是()A . 90B . 85C . 80D . 758. (2分)某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,已知130~140分数段的人数为90,90~100分数段的人数为a,则下图所示程序框图的运算结果为(注:n!=1×2×3×…×n,如5!=1×2×3×4×5)()A . 800!B . 810!C . 811!D . 812!9. (2分) (2016高二上·孝感期中) 近年来,随着私家车数量的不断增加,交通违法现象也越来越严重,孝感市交警大队在某天17:00~20:00这一时段内,开展整治酒驾专项行动,采取蹲点守候随机抽查的方式,每隔3分钟检查一辆经过的私家车.这种抽样方法属于()A . 简单随机抽样B . 系统抽样C . 分层抽样D . 定点抽样10. (2分)已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,20,那么这组数据落在8.5~11.5的频率为()A . 0.5B . 0.4C . 0.3D . 0.211. (2分)(2020·阜阳模拟) 某单位去年的开支分布的折线图如图1所示,在这一年中的水、电、交通开支(单位:万元)如图2所示,则该单位去年的水费开支占总开支的百分比为()A .B .C .D .12. (2分)从一堆苹果中任取20粒,称得各粒苹果的质量(单位:克)数据分布如下表所示:分组[100,110](110,120](120,130](130,140](140,150](150,160]频数1346a2根据频数分布表,可以估计在这堆苹果中,质量大于130克的苹果数约占苹果总数的()A . 10%B . 30%C . 60%D . 80%13. (2分)为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生的成绩进行统计分析.在这个问题中,5000名学生成绩的全体是()A . 总体B . 个体C . 从总体中抽取的一个样本D . 样本的容量14. (2分)在投掷一枚硬币的试验中,共投掷了100次,“正面朝上”的频数49,则“正面朝上”的频率为()A . 0.49B . 0.5C . 0.51D . 4915. (2分)下列说法正确的是()A . 根据样本估计总体,其误差与所选择的样本容量无关B . 方差和标准差具有相同的单位C . 从总体中可以抽取不同的几个样本D . 如果容量相同的两个样本的方差满足S12<S22 ,那么推得总体也满足S12<S22二、填空题 (共5题;共5分)16. (1分)某网络公司为了调查一住宅区连接互联网情况,从该住宅区28000住户中随机抽取了210户进行调查,调查数据如右图,则估计该住宅区已接入互联网的住户数是________ .17. (1分)某中学举行了一次田径运动会,其中有50名学生参加了一次百米比赛,他们的成绩和频率如图所示.若将成绩小于15秒作为奖励的条件,则在这次百米比赛中获奖的人数共有________ 人.18. (1分)(2017·茂名模拟) 如图为某工厂工人生产能力频率分布直方图,则估计此工厂工人生产能力的平均值为________19. (1分) (2016高一下·中山期中) 超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图所示,则违规的汽车大约为________辆.20. (1分)对某文科班50名同学的一次数学成绩进行了统计,全年级文科数学平均分是100分,这个班数学成绩的频率分布直方图如图:(总分150分)从这个班中任取1人,其数学成绩达到或超过年级文科平均分的概率是________.三、解答题 (共5题;共25分)21. (5分)某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm)分组[140,145)[145,150)[150,155)[155,160)[160,165)[165,170)[170,175)[175,180)合计人数12591363140(1)列出频率分布表;(2)画出频率分布直方图;(3)估计数据落在[150,170]范围内的概率.22. (5分) (2018高二上·宜昌期末) 某班50名学生在一次数学测试中,成绩全部介于50与100之间,将测试结果按如下方式分成五组:第一组[50,60),第二组[60,70),…,第五组[90,100].如图所示是按上述分组方法得到的频率分布直方图.(Ⅰ)若成绩大于或等于60且小于80,认为合格,求该班在这次数学测试中成绩合格的人数;(Ⅱ)从测试成绩在[50,60)∪[90,100]内的所有学生中随机抽取两名同学,设其测试成绩分别为m、n,求事件“|m﹣n|>10”概率.23. (5分)空气质量指数PM2.5(单位:μg/m3)表示每立方米空气中可入肺颗粒物的含量,这个值越高,解代表空气污染越严重:PM2.5日均浓度0~3535~7575~115115~150150~250>250空气质量级别一级二级三级四级五级六级空气质量类别优良轻度污染中度污染重度污染严重污染某市2012年3月8日﹣4月7日(30天)对空气质量指数PM2.5进行检测,获得数据后整理得到如图条形图:(1)估计该城市一个月内空气质量类别为良的概率;(2)从空气质量级别为三级和四级的数据中任取2个,求至少有一天空气质量类别为中度污染的概率.24. (5分)写出下列各题的抽样过程(1)请从拥有500个分数的总体中用简单随机抽样方法抽取一个容量为30的样本.(2)某车间有189名职工,现在要按1:21的比例选派质量检查员,采用系统抽样的方式进行.(3)一个电视台在因特网上就观众对某一节目喜爱的测得进行得出,车间得出的总人数为12000人,其中持各种态度的人数如下:很喜爱喜爱一般不喜爱2435456739261072打算从中抽取60人进行详细调查,如何抽取?25. (5分)(2020·漳州模拟) 某市场研究人员为了了解产业园引进的甲公司前期的经营状况,对该公司2018年连续六个月的利润进行了统计,并根据得到的数据绘制了相应的折线图,如图所示参考数据:参考公式:回归直线方程,其中(1)由折线图可以看出,可用线性回归模型拟合月利润(单位:百万元)与月份代码之间的关系,求关于的线性回归方程,并预测该公司2019年3月份的利润;(2)甲公司新研制了一款产品,需要采购一批新型材料,现有两种型号的新型材料可供选择,按规定每种新型材料最多可使用个月,但新材料的不稳定性会导致材料损坏的年限不同,现对两种型号的新型材料对应的产品各件进行科学模拟测试,得到两种新型材料使用寿命的频数统计如下表:如果你是甲公司的负责人,你会选择采购哪款新型材料?参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共5分)16-1、17-1、18-1、19-1、20-1、三、解答题 (共5题;共25分)21-1、21-2、21-3、22-1、23-1、24-1、25-1、25-2、。
人教新课标A版 高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体
人教新课标A版高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体同步测试D卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)某公司从代理的A,B,C,D四种产品中,按分层抽样的方法抽取容量为110的样本,已知A,B,C,D四种产品的数量比是2:3:2,:4,则该样本中D类产品的数量为()A . 22B . 33C . 44D . 552. (2分) (2019高二下·新城期末) 现行普通高中学生在高一升高二时面临着选文理科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列统计结论是不正确的是()A . 样本中的女生数量多于男生数量B . 样本中有理科意愿的学生数量多于有文科意愿的学生数量C . 样本中的男生偏爱理科D . 样本中的女生偏爱文科3. (2分) (2018高二下·陆川月考) 容量为100的样本,其数据分布在,将样本数据分为4组:,,,,得到频率分布直方图如图所示.则下列说法不正确的是()A . 样本数据分布在的频率为B . 样本数据分布在的频数为40C . 样本数据分布在的频数为40D . 估计总体数据大约有分布在4. (2分)某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是()A . 31.6岁B . 32.6岁C . 33.6岁D . 36.6岁5. (2分)一批产品抽50件测试,其净重介于13克与19克之间,将测试结果按如下方式分成六组:第一组,净重大于等于13克且小于14克;第二组,净重大于等于14克且小于15克; ... 第六组,净重大于等于18克且小于19克.如图是按上述分组方法得到的频率分布直方图.设净重小于17克的产品数占抽取数的百分比为x,净重大于等于15克且小于17克的产品数为y,则从频率分布直方图中可分析出x和y分别为()A . 0.1,45B . 0.9,45C . 0.1,35D . 0.9,356. (2分)对“小康县”的经济评价标准:①年人均收入不小于7000元;②年人均食品支出不大于收入的35%.某县有40万人,调查数据如下:年人均收入/元0200040006000800010 00012 00016 000人数/万人63556753则该县()A . 是小康县B . 达到标准①,未达到标准②,不是小康县C . 达到标准②,未达到标准①,不是小康县D . 两个标准都未达到,不是小康县7. (2分)有一个容量为50的样本,其分组以及各组的频数如下:[12.5,15.5],3;[15.5,18.5],8;[18.5,21.5],9;[21.5,24.5],11;[24.5,27.5],10;[27.5,30.5],5;[30.5,33.5],4,根据累计频率分布,估计小于30的数据大约占样本总数A . 5%B . 10%C . 30%D . 93%8. (2分) (2017高二上·长春期末) 某班名学生在一次考试中数学成绩的频率分布直方图如图,若在这名学生中,数学成绩不低于100分的人数为33,则等于()A . 45B . 48D . 559. (2分) (2020高二上·黄陵期末) 如图是某超市一年中各月份的收入与支出单位:万元情况的条形统计图已知利润为收入与支出的差,即利润收入一支出,则下列说法正确的是A . 利润最高的月份是2月份,且2月份的利润为40万元B . 利润最低的月份是5月份,且5月份的利润为10万元C . 收入最少的月份的利润也最少D . 收入最少的月份的支出也最少10. (2分)为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生的成绩进行统计分析.在这个问题中,5000名学生成绩的全体是()A . 总体B . 个体C . 从总体中抽取的一个样本D . 样本的容量11. (2分)某地一种植物一年生长的高度如下表:则该植物一年生长在[30,40)内的频率是()B . 0.65C . 0.40D . 0.2512. (2分)如图是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若80分以上为优秀,根据图形信息可知:这次考试的优秀率为()A . 25%B . 30%C . 35%D . 40%13. (2分)某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是()A . 31.6岁B . 32.6岁D . 36.6岁14. (2分)容量为20的样本,数据的分组及各组的频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在区间(10,50]上的频率为()A . 0.5B . 0.7C . 0.25D . 0.0515. (2分)已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,20,那么这组数据落在8.5~11.5的频率为()A . 0.5B . 0.4C . 0.3D . 0.2二、填空题 (共5题;共5分)16. (1分)某网络公司为了调查一住宅区连接互联网情况,从该住宅区28000住户中随机抽取了210户进行调查,调查数据如右图,则估计该住宅区已接入互联网的住户数是________ .17. (1分)一个高中研究性学习小组对本地区2002年至2004年快餐公司发展情况进行了调查,根据图中的信息可以得出这三年中该地区每年平均销售盒饭________ 万盒.18. (1分) (2015高三上·连云期末) 交通部门对某路段公路上行驶的汽车速度实施监控,从速度在50﹣90km/h的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在70km/h以下的汽车有________辆.19. (1分) (2016高一下·中山期中) 超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图所示,则违规的汽车大约为________辆.20. (1分)对某校400名学生的体重(单位:kg)进行统计,得到如图所示的频率分布直方图,则学生体重在60kg以上的人数为________三、解答题 (共5题;共25分)21. (5分) (2018高二上·汕头期末) 某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:上年度出险次数01234保费a 1.25a 1.5a 1.75a2a 随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:出险次数01234频数605030302010(Ⅰ)记A为事件:“一续保人本年度的保费不高于基本保费”.求的估计值;(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求的估计值;(Ⅲ)求续保人本年度的平均保费估计值.22. (5分)为了研究某种农作物在特定温度下(要求最高温度t满足:27℃≤t≤30℃)的生长状况,某农学家需要在十月份去某地进行为期十天的连续观察试验.现有关于该地区10月份历年10月份日平均最高温度和日平均最低温度(单位:℃)的记录如下:(Ⅰ)根据本次试验目的和试验周期,写出农学家观察试验的起始日期.(Ⅱ)设该地区今年10月上旬(10月1日至10月10日)的最高温度的方差和最低温度的方差分别为D1 , D2 ,估计D1 , D2的大小?(直接写出结论即可).(Ⅲ)从10月份31天中随机选择连续三天,求所选3天每天日平均最高温度值都在[27,30]之间的概率.23. (5分)某校有教职员工150人,为了丰富教工的课余生活,每天下午4:00~5:00同时开放健身房和娱乐室,要求所有教工每天必须参加一个活动.据调查统计,每次去健身房的人有10%下次去娱乐室,而在娱乐室的人有20%下次去健身房.请问,随着时间的推移,去健身房的人数能否趋于稳定?24. (5分) (2017高二下·太原期中) 某大学餐饮中心为了了解新生的饮食习惯,利用简单随机抽样的方法在全校一年级学生中进行了抽样调查,调查结果如表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(2)根据(1)的结论,你能否提出更好的调查方法来了解该校大学新生的饮食习惯,说明理由.25. (5分)(2017·新课标Ⅲ卷文) 某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:以最高气温位于各区间的频率估计最高气温位于该区间的概率.(12分)(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共5分)16-1、17-1、18-1、19-1、20-1、三、解答题 (共5题;共25分)21-1、22-1、23-1、24-1、24-2、25-1、25-2、。
人教新课标A版 高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体
人教新课标A版高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体同步测试B卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)为了估计某水池中鱼的尾数,先从水池中捕出2000尾鱼,并给每尾鱼做上标记(不影响存活),然后放回水池,经过适当的时间,再从水池中捕出500尾鱼,其中有标记的鱼为40尾,根据上述数据估计该水池中鱼的尾数为()A . 10000B . 20000C . 25000D . 300002. (2分) (2019高二上·长沙期中) 已知样本,,,…,的平均数为,标准差为,那么样本,,,…,的平均数和标准差分别是()A . ,B . ,C . ,D . ,3. (2分)(2016·中山模拟) 某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如表所示:序号1234567891011121314151617181920数学成绩9575809492656784987167936478779057837283物理成绩9063728791715882938177824885699161847886若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀.有多少把握认为学生的数学成绩与物理成绩之间有关系()A . 99.5%B . 99.9%C . 97.5%D . 95%4. (2分) (2017·新课标Ⅰ卷文) 为评估一种农作物的种植效果,选了n块地作试验田,这n块地的亩产量(单位:kg)分别是x1 , x2 ,…,xn ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A . x1 , x2 ,…,xn的平均数B . x1 , x2 ,…,xn的标准差C . x1 , x2 ,…,xn的最大值D . x1 , x2 ,…,xn的中位数5. (2分)(2017·包头模拟) 在某中学举行的环保知识竞赛中,将三个年级参赛的学生的成绩进行整理后分为5组,绘制出如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是()A . 15B . 18C . 20D . 256. (2分)(2020·鹤壁模拟) 中国铁路总公司相关负责人表示,到2018年底,全国铁路营业里程达到13.1万公里,其中高铁营业里程2.9万公里,超过世界高铁总里程的三分之二,下图是2014年到2018年铁路和高铁运营里程(单位:万公里)的折线图,以下结论不正确的是()A . 每相邻两年相比较,2014年到2015年铁路运营里程增加最显著B . 从2014年到2018年这5年,高铁运营里程与年价正相关C . 2018年高铁运营里程比2014年高铁运营里程增长80%以上D . 从2014年到2018年这5年,高铁运营里程数依次成等差数列7. (2分) (2018高一下·渭南期末) 样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为()A .B .C .D . 28. (2分)某一网络公司为了调查一住宅区连接互联网情况,从该住宅区28000住户中随机抽取了210户进行调查,调查数据如右图,则估计该住宅区已接入互联网的住户数是()A . 90B . 1200C . 12000D . 140009. (2分)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克的产品的个数是()A . 120B . 108C . 90D . 4510. (2分) 2005年底,某地区经济调查队对本地区居民收入情况进行抽样调查,抽取1000户,按本地区确定的标准,情况如图:本地区在“十一五”规划中明确提出要缩小贫富差距,到2010年要实现一个美好的愿景,由如下表格显示,则中等收入家庭的数量在原有的基础要增加的百分比和低收入家庭的数量在原有的基础要降低的百分比分别为()高收入中等收入低收入150户650户200户A . 25%,27.5%B . 62.5%,57.9%C . 25%,57.9%D . 62.5%,42.1%11. (2分)对某商店一个月30天内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A . 46,45,56B . 46,45,53C . 47,45,56D . 45,47,5313. (2分) (2016高一下·抚顺期末) 甲、乙两名同学8次数学测验成绩如茎叶图所示, 1 , 2分别表示甲、乙两名同学8次数学测验成绩的平均数,s1 , s2分别表示甲、乙两名同学8次数学测验成绩的标准差,则有()A . 1> 2 , s1<s2B . 1= 2 , s1<s2C . 1= 2 , s1=s2D . 1< 2 , s1>s214. (2分)对一个样本容量为100的数据分组,各组的频数如表:区间[17,19)[19,21)[21,23)[23,25)[25,27)[27,29)[29,31)[31,33]频数113318162830估计小于29的数据大约占总体的()A . 42%B . 58%C . 40%D . 16%15. (2分)数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5,这个小组的平均分是()A . 97.2B . 87.29C . 92.32D . 82.86二、填空题 (共5题;共6分)16. (1分)(2017·成都模拟) 在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未污损,即9,10,11,,那么这组数据的方差s2可能的最大值是________.17. (1分) (2017高二上·伊春月考) 数据,,…,平均数为6,标准差为2,则数据,,…,的方差为________.18. (1分)如图是小王所做的六套数学附加题得分(满分40)的茎叶图则其平均得分为________.19. (1分)统计的基本思想是:________ .20. (2分) (2018高一下·河南月考) 已知一组样本数据按从小到大的顺序排列为-1,0,4. ,这组数据的平均数与中位数均为5,则其方差为________.三、解答题 (共5题;共25分)21. (5分)研究“刹车距离”对于安全行车及分析交通事故责任都有一定的作用,所谓“刹车距离”就是指行驶中的汽车,从刹车开始到停止,由于惯性的作用而又继续向前滑行的一段距离.为了测定某种型号汽车的刹车性能(车速不超过140km/h),对这种汽车进行测试,测得的数据如表:刹车时的车速0102030405060(km/h)刹车距离(m)00.3 1.0 2.1 3.6 5.57.8(1)以车速为x轴,以刹车距离为y轴,在给定坐标系中画出这些数据的散点图;(2)观察散点图,估计函数的类型,并确定一个满足这些数据的函数表达式;(3)该型号汽车在国道上发生了一次交通事故,现场测得刹车距离为46.5m,请推测刹车时的速度为多少?请问在事故发生时,汽车是超速行驶还是正常行驶?22. (5分) (2018高一下·渭南期末) 从全校参加数学竞赛的学生的试卷中抽取一个样本,考察竞赛的成绩分布情况,将样本分成5组,绘成频率分布直方图,图中从左到右各小组的小长方形的高之比为1:3:6:4:2,最右边一组频数是6,请结合直方图提供的信息,解答下列问题:(1)样本的容量是多少?(2)列出频率分布表;(3)估计这次竞赛中,成绩高于60分的学生占总人数的百分比;(4)成绩落在哪个范围内的人数最多?并求出该小组的频数,频率.23. (5分)某城市100户居民的月平均用电量(单位:度)以[160,180),[180,200),[200,220),[220,240)[240,260),[260,280),[280,300]分组的频率分布直方图如图(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则越平均用电量在[220,240)的用户中应抽取多少户?24. (5分)“中国人均读书4.3本(包括网络文学和教科书),比韩国的11本、法国的20本、日本的40本、犹太人的64本少得多,是世界上人均读书最少的国家.”这个论断被各种媒体反复引用.出现这样的统计结果无疑是令人尴尬的,而且和其他国家相比,我国国民的阅读量如此之低,也和我国是传统的文明古国、礼仪之邦的地位不相符.某小区为了提高小区内人员的读书兴趣,特举办读书活动,准备进一定量的书籍丰富小区图书站,由于不同年龄段需看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了一天名读书者进行调查,将他们的年龄分成6段:,,,,,后得到如图所示的频率分布直方图.问:(1)估计在40名读书者中年龄分布在的人数;(2)求40名读书者年龄的平均数和中位数;(3)若从年龄在的读书者中任取2名,求这两名读书者年龄在的人数的分布列及数学期望.25. (5分) (2017高二下·瓦房店期末) 为了研究家用轿车在高速公路上的车速情况,交通部门对100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过100km/h的有40人,不超过100km/h的有15人.在45名女性驾驶员中,平均车速超过100km/h的有20人,不超过100km/h的有25人.(1)完成下面的列联表,并判断是否有99.5%的把握认为平均车速超过100km/h的人与性别有关.平均车速超过100km/h人数平均车速不超过100km/h人数合计男性驾驶员人数女性驾驶员人数合计(2)以上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取3辆,记这3辆车中驾驶员为男性且车速超过100km/h的车辆数为,若每次抽取的结果是相互独立的,求的分布列和数学期望.参考公式与数据:,其中0.1500.1000.0500.0250.0100.0050.0012.072 2.7063.841 5.024 6.6357.87910.828参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、13-1、14-1、15-1、二、填空题 (共5题;共6分)16-1、17-1、18-1、19-1、20-1、三、解答题 (共5题;共25分)21-1、21-2、21-3、22-1、22-2、22-3、22-4、23-1、24-1、24-2、24-3、25-1、25-2、。
高中数学 第二章 统计 2.2 用样本估计总体预习案(无答案)新人教A版必修3(2021年整理)
山西省忻州市2016-2017学年高中数学第二章统计2.2 用样本估计总体预习案(无答案)新人教A版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(山西省忻州市2016-2017学年高中数学第二章统计2.2 用样本估计总体预习案(无答案)新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为山西省忻州市2016-2017学年高中数学第二章统计2.2 用样本估计总体预习案(无答案)新人教A版必修3的全部内容。
2。
2 用样本的频率分布估计总体分布【教学目标】1.知识与技能①在表示样本数据的过程中,学会列频率分布表,画频率分布直方图;②能利用样本的频率分布对总体的一些情况作出估计.2.过程与方法通过对现实生活的探究,进一步感知应用数学知识解决问题的方法.3。
情感、态度、价值观通过对样本分析和总体估计的过程,认识到数学知识源于生活并指导生活的事实,体会用样本的频率分布估计总体的分布.【预习任务】1.阅读教材P65的引言,思考回答①用样本估计总体的基本方法是什么?②为什么要借助图标分析数据?2。
阅读教材P65-P67有关内容,思考回答下列问题:①分步写出画频率分布直方图的步骤.②在频率分布直方图中,纵轴表示什么?数据在各小组内的频率如何计算?各小长方形的面积表示什么?各长方形的面积总和等于多少?③频率分布直方图的横轴与纵轴的单位长度是否相同?【自主检测】1.一个容量为n 的样本,已知某组的频率为0.25,频数为5,则n=_____.2。
已知样本容量为100,在频率分布直方图中,各小矩形的高之比为1:2:5:2,则第3组的频率为_____,第四组的频数为_____。
高中数学第二章统计2.2.2用样本的数字特征估计总体的
【探究总结】 知识归纳:
注意事项:方差与标准差的关注点 (1)标准差、方差描述了一组数据围绕平均数波动的大 小.标准差、方差越大,数据的离散程度越大;标准差、 方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围是:[0,+∞). (3)因为方差与原始数据的单位相同,且平方后可能夸
100)2+(100-100)2+(99-100)2]=2,所以标准差为s=
2.
3.下列判断正确的是
(
)
A.样本平均数一定小于总体平均数
B.样本平均数一定大于总体平均数
C.样本平均数一定等于总体平解析】选D.因为样本平均数只是估计总体的平均数, 它与总体平均数的关系不确定,因此只有选项D正确.
则:(1)平均命中环数为________. (2)命中环数的标准差为________.
【解析】(1) x 7 8 7 9 5 4 9 10 7 4 7. (2)因为s2= 1 [(7-7)2+(8-7)2+(7-7)2+(9-7)2+(510
10
7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,所以
距离.
3.一般意义下的平均距离是什么? 提示:S= x1 x x 2 x …… x n x .
n
通过以上探究,试着写出方差与标准差公式: 假设样本数据是x1,x2,x3,…,xn, x 是平均数,则
2 2 2 1 [ x1 x x 2 x x n x ] 方差:s2=__________________________________. n
人教新课标A版 高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体
人教新课标A版高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体同步测试D卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则说法正确的是()A . 甲的成绩的平均数小于乙的成绩的平均数B . 甲的成绩的中位数等于乙的成绩的中位数C . 甲的成绩的方差小于乙的成绩的方差D . 甲的成绩的极差小于乙的成绩的极差2. (2分) (2017高一下·桃江期末) 一个样本M的数据是x1 , x2 ,…,xn ,它的平均数是5,另一个样本N的数据x12 , x22 ,…,xn2它的平均数是34.那么下面的结果一定正确的是()A . SM2=9B . SN2=9C . SM2=3D . Sn2=33. (2分) (2020高一上·石景山期末) 甲、乙两人在一次射击比赛中各射靶5次,两人成绩的统计表如下表所示,则有以下四种说法:甲环数45678频数11111乙环数569频数311①甲成绩的平均数小于乙成绩的平均数;②甲成绩的中位数等于乙成绩的中位数;③甲成绩的方差小于乙成绩的方差;④甲成绩的极差小于乙成绩的极差.其中正确命题的个数是()(注:,其中为数据的平均数)A . 1B . 2C . 3D . 44. (2分) (2018高一下·汕头期末) 下面茎叶图记录了在某项体育比赛中,九位裁判为一名选手打出的分数情况,则去掉一个最高分和最低分后,所剩数据的方差为()A .B .C .D .5. (2分)某住宅小区有居民2万户,从中随机抽取200户,调查是否已安装电话,调查结果如下表所示:则该小区已安装电话的住户估计有()A . 6 500户B . 3 000户C . 19 000户D . 9 500户6. (2分)(2020·漳州模拟) 某学校运动会的立定跳远和秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为名学生的预赛成绩,其中有三个数据模糊.学生序号立定跳远(单位:米)30秒跳绳(单位:次)在这名学生中,进入立定跳远决赛的有人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则()A . 号学生进入秒跳绳决赛B . 号学生进入秒跳绳决赛C . 号学生进入秒跳绳决赛D . 号学生进入秒跳绳决赛7. (2分) (2017高二下·临川期末) 设a , b , c是正整数,且a∈[70,80),b∈[80,90),c∈[90,100],当数据a , b , c的方差最小时,a+b+c的值为()A . 252或253B . 253或254C . 254或255D . 267或2688. (2分)某高校进行自主招生,先从报名者筛选出400人参加考试,再按笔试成绩择优选出100人参加面试.现随机抽取24名笔试者的成绩,如下表所示:据此估计参加面试的分数线大约是()A . 75B . 80C . 85D . 909. (2分)用样本的频率分布来估计总体情况时,下列选项中正确的是()A . 估计准确与否值与所分组数有关B . 样本容量越大,估计结果越准确C . 估计准确与否值域总体容量有关D . 估计准确与否与样本容量无关10. (2分)对“小康县”的经济评价标准:①年人均收入不小于7000元;②年人均食品支出不大于收入的35%.某县有40万人,调查数据如下:则该县()A . 是小康县B . 达到标准①,未达到标准②,不是小康县C . 达到标准②,未达到标准①,不是小康县D . 两个标准都未达到,不是小康县11. (2分) (2017高二下·南昌期末) 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是()A . 人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B . 人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C . 人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D . 人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%12. (2分)已知一组数据a1 , a2 , a3 , a4 , a5的平均数为8,则另一组数据a1+10,a2﹣10,a3+10,a4﹣10,a5+10的平均数为()A . 6B . 8C . 10D . 1213. (2分)(2017·山西模拟) 为了解甲、乙两厂产品的质量,从甲厂生产的产品中随机抽取3件样品,从乙厂生产的产品中随机抽取4件样品,测量产品中某种元素的含量(单位:毫克),如图是测量数据的茎叶图.若它们的中位数相同,平均数也相同,则图中的m,n的比值 =()A . 1B .C .D .14. (2分) (2019高三上·双鸭山月考) 为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为200的调查样本,其中城镇户籍与农村户籍各100人;男性120人,女性80人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图,如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是()A . 是否倾向选择生育二胎与户籍有关B . 是否倾向选择生育二胎与性别有关C . 倾向选择生育二胎的人群中,男性人数与女性人数相同D . 倾向选择不生育二胎的人群中,农村户籍人数少于城镇户籍人数15. (2分) (2018高二上·安庆期中) 如果数据x1 , x2 ,…xn的平均数为,方差为s2 ,则5x1+2,5x2+2,…,5xn+2的平均数和方差分别为()A . ,s2B . 5 +2,s2C . 5 +2,25s2D . ,25s2二、填空题 (共5题;共6分)16. (1分) (2018高一下·北京期中) 下面茎叶图记录了在某项体育比赛中,九位裁判为一名选手打出的分数情况,则去掉一个最高分和一个最低分后,所剩数据的平均值为________,方差为________.17. (1分) (2017高二上·伊春月考) 数据,,…,平均数为6,标准差为2,则数据,,…,的方差为________.18. (1分)下面的伪代码执行后的结果是________.19. (1分)一个容量为n的样本分成若干组,已知某组的频数和频率分别是30和0.25,则n=________ .20. (2分)若样本数据x1 , x2 ,…,x10的平均数为8,则数据2x1﹣1,2x2﹣1,…,2x10﹣1的平均数为________三、解答题 (共5题;共25分)21. (5分) (2017高二上·阳高月考) 某种产品的广告费支出(百万元)与销售额(百万元)之间有如下对应数据:245683040506070如果与之间具有线性相关关系.(1)作出这些数据的散点图;(2)求这些数据的线性回归方程 ;(3)预测当广告费支出为9百万元时的销售额。
高中数学 第二章 统计 2.2.2 用样本的数字特征估计总体的数字特征教案 新人教A版必修3(20
福建省莆田市高中数学第二章统计2.2.2 用样本的数字特征估计总体的数字特征教案新人教A版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(福建省莆田市高中数学第二章统计2.2.2 用样本的数字特征估计总体的数字特征教案新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为福建省莆田市高中数学第二章统计2.2.2 用样本的数字特征估计总体的数字特征教案新人教A版必修3的全部内容。
2.2.2用样本的数字特征估计总体的数字特征一、三维目标:1、知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识.2、过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
3、情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.二、重点与难点重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
三、教学设想【创设情境】在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7。
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
人教新课标A版 高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体
人教新课标A版高中数学必修3 第二章统计 2.2样本估计总体 2.2.1用样本的频率分布估计总体同步测试C卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,已知130~140分数段的人数为90,90~100分数段的人数为a,则下图所示程序框图的运算结果为(注:n!=1×2×3×…×n,如5!=1×2×3×4×5)()A . 800!B . 810!C . 811!D . 812!2. (2分)从一批电视机中随机抽出10台进行检验,其中有1台次品,则关于这批电视机,下列说法正确的是()A . 次品率小于10%B . 次品率大于10%C . 次品率等于10%D . 次品率接近10%3. (2分)在频率分布直方图中各小长方形的面积表示()A . 落在相应各组内的数据的频数B . 相应各组的频率C . 该样本所分成的组数D . 该样本的容量4. (2分)一个容量为20的样本数据分组后,组距与频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4,(60,70),2.则样本在区间(-∞,50)上的频率是()A . 0.20B . 0.25C . 0.50D . 0.705. (2分)在样本颇率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于它8个长方形的面积和的,且祥本容量为140,则中间一组的频数为()A . 28B . 40C . 56D . 606. (2分)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克的产品的个数是()A . 120B . 108C . 90D . 457. (2分)有一个样本容量为50的样本数据分布如下,估计不大于30的数据大约占有()[12.5,15.5)3;[15.5,18.5)8;[18.5,21.5)9;[21.5,24,5)11;[24.5,27.5)10;[27.5,30.5)6;[30.5,33.5)3.A . 94%B . 6%C . 88%D . 12%8. (2分)某商场在今年元霄节的促销活动中,对3月5日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为5万元,则11时至12时的销售额为()A . 10万元B . 15万元C . 20万元D . 25万元9. (2分)某校为了了解高一学生的身体发育情况,打算在高一年级16个班中某两个班男女生比例抽取样本,正确的是()A . 随机抽样B . 分成抽样C . 先用抽签法,再用分层抽样D . 先用分层抽样,再用随机数表法10. (2分)下列说法正确的是()A . 根据样本估计总体,其误差与所选择的样本容量无关B . 方差和标准差具有相同的单位C . 从总体中可以抽取不同的几个样本D . 如果容量相同的两个样本的方差满足S12<S22 ,那么推得总体也满足S12<S2211. (2分)某地一种植物一年生长的高度如下表:则该植物一年生长在[30,40)内的频率是()A . 0.80B . 0.65C . 0.40D . 0.2512. (2分)某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是()A . 31.6岁B . 32.6岁C . 33.6岁D . 36.6岁13. (2分)如图是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若80分以上为优秀,根据图形信息可知:这次考试的优秀率为()A . 25%B . 30%C . 35%D . 40%14. (2分)一个容量为20的数据样本,分组与频数为:[10,20]2个,(20,30]3个,(30,40]4个,(40,50]5个,(50,60]4个,(60,70]2个,则样本数据在区间(﹣∞,50)上的可能性为()A . 5%B . 25%C . 50%D . 70%15. (2分)某班学生在一次数学考试中成绩分布如下表:那么分数在[90,120)中的频率是(精确到0.01)()A . 0.18B . 0.40C . 0.50D . 0.38二、填空题 (共5题;共5分)16. (1分)某单位招聘员工,有200名应聘者参加笔试,随机抽查了其中20名应聘者笔试试卷,统计他们的成绩如下表:若按笔试成绩择优录取40名参加面试,由此可预测参加面试的分数线为________ 分.17. (1分)某中学举行了一次田径运动会,其中有50名学生参加了一次百米比赛,他们的成绩和频率如图所示.若将成绩小于15秒作为奖励的条件,则在这次百米比赛中获奖的人数共有________ 人.18. (1分) (2016高二下·姜堰期中) 如图,从2009年参加奥运知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图所示.观察图形,估计这次奥运知识竞赛的及格率(大于或等于60分为及格)为________.19. (1分) (2016高一下·中山期中) 超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图所示,则违规的汽车大约为________辆.20. (1分)某次射击训练中,一小组的成绩如下表所示:若该小组的平均成绩为8.7环,则成绩为9环的人数是________.三、解答题 (共5题;共25分)21. (5分)某单位组织职工开展构建绿色家园活动,在今年3月份参加义务植树活动的职工中,随机抽取M名职工为样本,得到这些职工植树的株数,根据此数据作出了频数与频率统计表和频率分布直方图如图:(1)求出表中M,p及图中a的值;(2)单位决定对参加植树的职工进行表彰,对植树株数在[25,30)区间的职工发放价值800元的奖品,对植树株数在[20,25)区间的职工发放价值600元的奖品,对植树株数在[15,20)区间的职工发放价值400元的奖品,对植树株数在[10,15)区间的职工发放价值200元的奖品,在所取样本中,任意取出2人,并设X为此二人所获得奖品价值之差的绝对值,求X的分布列与数学期望E(X).分组频数频率[10,15)50.25[15,20)12n[20,25)m p[25,30)10.05合计M122. (5分) (2016高二上·凯里期中) 某种零件按质量标准分为1,2,3,4,5五个等级,现从一批该零件巾随机抽取20个,对其等级进行统计分析,得到频率分布表如下等级12345频率0.05m0.150.35n(1)在抽取的20个零件中,等级为5的恰有2个,求m,n;(2)在(1)的条件下,从等级为3和5的所有零件中,任意抽取2个,求抽取的2个零件等级恰好相同的概率.23. (5分)某校有教职员工150人,为了丰富教工的课余生活,每天下午4:00~5:00同时开放健身房和娱乐室,要求所有教工每天必须参加一个活动.据调查统计,每次去健身房的人有10%下次去娱乐室,而在娱乐室的人有20%下次去健身房.请问,随着时间的推移,去健身房的人数能否趋于稳定?24. (5分)一个地区共有5个乡镇,共30万人,其人口比例为3∶2∶5∶2∶3,从这30万人中抽取一个300人的样本,分析某种疾病的发病率.已知这种疾病与不同的地理位置及水土有关,则应采取什么样的抽样方法?并写出具体过程.25. (5分) (2016高二下·南阳期末) 某校为了探索一种新的教学模式,进行了一项课题实验,甲班为实验班,乙班为对比班,甲乙两班的人数均为50人,一年后对两班进行测试,测试成绩的分组区间为[80,90)、[90,100)、[100,110)、[110,120)、[120,130),由此得到两个班测试成绩的频率分布直方图:(1)完成下面2×2列联表,你能有97.5%的把握认为“这两个班在这次测试中成绩的差异与实施课题实验有关”吗?并说明理由;成绩小于100分成绩不小于100分合计甲班a=________b=________50乙班c=24d=2650合计e=________f=________100(2)现从乙班50人中任意抽取3人,记ξ表示抽到测试成绩在[100,120)的人数,求ξ的分布列和数学期望Eξ.附:K2= ,其中n=a+b+c+dP(K2≥k0)0.150.100.050.0250.0100.0050.001 k0 2.072 2.706 3.841 5.204 6.6357.87910.828参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共5分) 16-1、17-1、18-1、19-1、20-1、三、解答题 (共5题;共25分) 21-1、22-1、22-2、23-1、24-1、25-1、25-2、。
高中数学人教版A版必修三课时作业习题及答案:第二章2-2 用样本估计总体
第二章统计2.2 用样本估计总体2.2.1用样本的频率分布估计总体分布课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图,频率分布折线图,茎叶图.3.能够利用图形解决实际问题.1,用样本估计总体的两种情况(1)用样本的____________估计总体的分布.(2)用样本的____________估计总体的数字特征.2,数据分析的基本方法(1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.(2)借助于表格分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.3,频率分布直方图在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.4,频率分布折线图和总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.(2)总体密度曲线随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.5,茎叶图(1)适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.(2)优点:它不但可以____________,而且可以__________,给数据的记录和表示都带来方便.(3)缺点:当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.一、选择题1,下列说法不正确的是()A,频率分布直方图中每个小矩形的高就是该组的频率B,频率分布直方图中各个小矩形的面积之和等于1C,频率分布直方图中各个小矩形的宽一样大D,频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的2,一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数12 13 24 15 16 13 7 则样本数据落在(10,40]上的频率为()A,0.13 B.0.39 C.0.52 D.0.643,100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有()A.30辆B.40辆C,60辆D.80辆4,如图是总体密度曲线,下列说法正确的是()A,组距越大,频率分布折线图越接近于它B,样本容量越小,频率分布折线图越接近于它C,阴影部分的面积代表总体在(a,b)内取值的百分比D,阴影部分的平均高度代表总体在(a,b)内取值的百分比5,一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A,20% B.69%C,31% D.27%6,某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A,90 B.75 C.60 D.45题号 1 2 3 4 5 6答案二、填空题7,将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 8,在如图所示的茎叶图中,甲,乙两组数据的中位数分别是________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10,抽查100袋洗衣粉,测得它们的重量如下(单位:g):494498493505496492485483508 511495494483485511493505488 501491493509509512484509510 495497498504498483510503497 502511497500493509510493491 497515503515518510514509499 493499509492505489494501509 498502500508491509509499495 493509496509505499486491492 496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升11,在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?12,某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.答案: 2.2.1 用样本的频率分布估计总体分布 知识梳理1,(1)频率分布 (2)数字特征 2.(1)提取信息 传递 (2)表格 构成形式 3.频率/组距 小长方形的面积 1 4.(1)上端的中点 (2)组数 光滑曲线5,(2)保留所有信息 随时记录 (3)较多作业设计1,A 2,C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.] 3,B [时速在[60,70)的汽车的频率为:0,04×(70-60)=0.4,又因汽车的总辆数为100, 所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4,C5,C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.]6,A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36, ∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 7,60解析 ∵n·2+3+42+3+4+6+4+1=27, ∴n =60.8,45,46解析 由茎叶图及中位数的概念可知x 甲中=45,x 乙中=46. 9.m h解析频率组距=h ,故|a -b|=组距=频率h =m h . 10,解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计 频数 频率 累积频率 [482.5,486.5) 正 8 0.08 0.08 [486.5,490.5) 3 0.03 0.11[490.5,494.5) 正正正 17 0.17 0.28 [494.5,498.5) 正正正正- 21 0.21 0.49 [498.5,502.5) 正正 14 0.14 0.63 [502.5,506.5) 正 9 0.09 0.72[506.5,510.5) 正正正 19 0.19 0.91 [510.5,514.5) 正- 6 0.06 0.97[514.5,518.5] 3 0.03 1.00合计 100 1.00(2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44.设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55. 11,解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.12,解 (1)(2)(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.2.2.2用样本的数字特征估计总体的数字特征课时目标 1.会求样本的众数,中位数,平均数,标准差,方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.1,众数,中位数,平均数(1)众数的定义:一组数据中重复出现次数________的数称为这组数的众数.(2)中位数的定义及求法把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.②当数据个数为偶数时,中位数为排列的最中间的两个数的________.(3)平均数①平均数的定义:如果有n个数x1,x2,…,x n,那么x=____________,叫做这n个数的平均数.②平均数的分类:总体平均数:________所有个体的平均数叫总体平均数.样本平均数:________所有个体的平均数叫样本平均数.2,标准差,方差(1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=________________________________________________________________________.(2)方差的求法:标准差的平方s2叫做方差.s2=________________________________________________________________________.一、选择题1,下列说法正确的是()A,在两组数据中,平均值较大的一组方差较大B,平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C,方差的求法是求出各个数据与平均值的差的平方后再求和D,在记录两个人射击环数的两组数据中,方差大的表示射击水平高2,已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有()A,a>b>c B.a>c>bC,c>a>b D.c>b>a3,甲,乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲,乙两同学在这次篮球比赛活动中,发挥得更稳定的是()A,甲B.乙C,甲,乙相同D.不能确定4,一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是()A.13s2B.s2C,3s2D.9s25,如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为()A,84,4.84 B.84,1.6C,85,1.6 D.85,0.46,如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B则()A.x A>x B,s A>s BB.x A<x B,s A>s BC.x A>x B,s A<s BD.x A<x B,s A<s B题号 1 2 3 4 5 6答案二、填空题7,已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.8,甲,乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲10 8 9 9 9乙10 10 7 9 9如果甲,乙两人只能有1人入选,则入选的应为________.9,若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,x这21个数据的方差为________.三、解答题10,甲,乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:(1)请填写表:平均数方差中位数命中9环及9环以上的次数甲乙(2)请从下列四个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和中位数相结合看(分析谁的成绩好些);③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);④从折线图上两人射击命中环数的走势看(分析谁更有潜力).能力提升11,下面是一家快餐店所有工作人员(共7人)一周的工资表:总经理大厨二厨采购员杂工服务员会计3 000元450元350元400元320元320元410元(1)计算所有人员一周的平均工资;(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?12,1,平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.2,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3,极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.答案:2,2.2用样本的数字特征估计总体的数字特征知识梳理1,(1)最多 (2)中间 ①中间位置的 ②平均数 (3)①x 1+x 2+…+x n n ②总体中 样本中2,(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2] 作业设计1,B [A 中平均值和方差是数据的两个特征,不存在这种关系;C 中求和后还需取平均数;D 中方差越大,射击越不平稳,水平越低.]2,D [由题意a =110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,即b =16,c =18,∴c>b>a.]3,B [方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B .]4,D [s 20=1n [9x 21+9x 22+…+9x 2n -n(3x )2]=9·1n(x 21+x 22+…+x 2n -n x 2)=9·s 2(s 20为新数据的方差).]5,C [由题意x =15(84+84+86+84+87)=85.s 2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=15(1+1+1+1+4)=85=1.6.]6,B [样本A 数据均小于或等于10,样本B 数据均大于或等于10,故x A <x B , 又样本B 波动范围较小,故s A >s B .] 7,91解析 由题意得8,甲解析 x 甲=9,2S 甲=0.4,x 乙=9,2S 乙=1.2,故甲的成绩较稳定,选甲.9,0.19 解析 这21个数的平均数仍为20,从而方差为121×[20×0.2+(20-20)2]≈0.19. 10,解 由折线图,知甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为: 2,4,6,8,7,7,8,9,9,10.也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.(1)x 甲=110×(5+6×2+7×4+8×2+9)=7010=7(环), x 乙=110×(2+4+6+7×2+8×2+9×2+10)=7010=7(环),s 2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s 2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2] =110×(25+9+1+0+2+8+9)=5.4. 根据以上的分析与计算填表如下:平均数 方差 中位数 命中9环及9环以上的次数甲 7 1.2 7 1乙 7 5.4 7.5 3 (2)①∵平均数相同,2S 甲<2S 乙,∴甲成绩比乙稳定. ②∵平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好些.③∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.11,解 (1)平均工资即为该组数据的平均数 x =17×(3 000+450+350+400+320+320+410)=17×5 250=750(元).(2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.(3)除去总经理的工资后,其他工作人员的平均工资为:x ′=16×(450+350+400+320+320+410)=16×2 250=375(元).这个平均工资能代表一般工作人员一周的收入水平.12,解 设第一组20名学生的成绩为x i (i =1,2,…,20),第二组20名学生的成绩为y i (i =1,2,…,20), 依题意有:x =120(x 1+x 2+…+x 20)=90,y =120(y 1+y 2+…+y 20)=80,故全班平均成绩为:140(x 1+x 2+…+x 20+y 1+y 2+…+y 20)=140(90×20+80×20)=85;又设第一组学生成绩的标准差为s 1,第二组学生成绩的标准差为s 2,则s 21=120(x 21+x 22+…+x 220-20x 2),s 22=120(y 21+y 22+…+y 220-20y 2) (此处,x =90,y =80),又设全班40名学生的标准差为s ,平均成绩为z (z =85),故有s 2=140(x 21+x 22+…+x 220+y 21+y 22+…+y 220-40z 2) =140(20s 21+20x 2+20s 22+20y 2-40z 2) =12(62+42+902+802-2×852)=51. s =51.所以全班同学的平均成绩为85分,标准差为51.。
人教版高中数学 A版 必修三 第二章 《2.2.2用样本的数字特征估计总体的数字特征》
知识点三 平均数 定义 如果有 n 个数
x1,x2,x3,…,xn,那么
x
=
1n(x1+x2+…+xn)
叫做
这 n 个数的平均数.
特点 (1)一组数据有且仅有一个平均数.(2)平均数是频率分布直方图的
“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中
点的横坐标的乘积之和为平均数.(3)由于平均数与每一个样本的数据有关,
度.
3.现实中的总体所包含的个体数往往是很多的,虽然总体的平均数与标准
差客观存在,但是我们无从知道.所以通常的做法随是机用样本的平均数和标准
差去估计总体的平均数与标准差.虽然样本具有
性,不代同表的性样本测
得的数据不一样,与总体的数字特征也可能不同,但只要样本的
答案
返回
题型探究
重点难点 个个击破
类型一 感受数据的离散程度
3.利用直方图求数字特征:①众数是最高的矩形的底边的中点.②中位数 左右两边直方图的面积应相等.③平均数等于每个小矩形的面积乘以小矩 形底边中点的横坐标之和.
返回
第二章 § 2.2 用样本估计总体
2.2.2 用样本的数字特征估计总体的数字 特征(二)
学习目标
1.理解样本数据方差、标准差的意义,会计算方差、标准差; 2.会用样本的基本数字特征(平均数、标准差)估计总体的基本数字特征; 3.体会用样本估计总体的思想.
知识点二 用样本的基本数字特征估计总体的基本数字特征
1.样本的基本数字特征包括众数 、中位数 平、均数 标、准差
.
2.平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们
作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些
高中数学人教A版必修3第二章 统计2.2 用样本估计总体 课件
0.15
在0.5
,1
内的8个数据的和为:
0.75
8;
0.22 0.25
所以在平1均,1数.为5 内的15个数据的和为 :1.25
15 ;
平均数的估计值等 于频率分布直方图
0.14 0.06 0.04
x
0.25 4
0.75 8
1.25 15 4.25 2 100
中每个小矩形的面 积乘以小矩形底边 中点的横坐标之和。
探究新课:
样本的数字特征 估计 总体的数字特征
什么是样本的数字 特征?
众数
中位数 平均数等
这些数据都是反映样本信息的数字特征,对一组样本 数据如何求众数、中位数和平均数?
一.众数、中位数、平均数的概念
众数:在一组数据中,出现次数最多的数据叫做
这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最
得出的结论有偏差,你能解释一下原因吗?
众数 中位数 平均数
样本数据
2.3 2.0 1.973
频率分布直方图 2.25 2.02 2.02
高中数学人教A版必修3第二章 统计2.2 用样本估计总体 课件
高中数学人教A版必修3第二章 统计2.2 用样本估计总体 课件
答:因为样本数据的频率分布直方图, 只是直观地表明分布的形状,但是从 直方图本身看不出原始的数据内容, 直方图已经损失一些样本信息。且所 得估计值与数据分组有关.
中位数:使频率分布直方图左右两边 相等面积的分界线与 x 轴交点的横坐 标。
平均数:频率分布直方图中每个小矩形的面积 乘以小矩形底边中点的横坐标之和。
高中数学人教A版必修3第二章 统计2.2 用样本估计总体 课件
高中数学人教A版必修3第二章 统计2.2 用样本估计总体 课件
人教版数学高一A版必修3预习学案 2.2用样本估计总体(第2课时)
预习导航1.掌握众数、中位数、平均数、标准差、方差的定义和特征.2.会求众数、中位数、平均数、标准差、方差,并能用来解决有关问题.1.众数(1)定义:一组数据中出现次数最多的数称为这组数据的众数.(2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势. 名师点拔 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.【做一做1】数据组8,-1,0,4,17,4,3的众数是__________.答案:4 2.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.名师点拔 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.【做一做2】数据组-5,7,9,6,-1,0的中位数是__________.解析:将该组数据按从小到大排列为-5,-1,0,6,7,9,则中位数是0+62=3.答案:3 3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为x =x 1+x 2+…+x nn.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低.【做一做3】10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,则其平均数是__________.解析:平均数是110(15+17+14+10+15+17+17+16+14+12)=14.7.答案:14.7 4.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算s 可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.【做一做4】一组数据的单位是m ,平均数是x ,标准差为s ,则( ) A .x 与s 的单位都是km B .x 与s 的单位都是cm C .x 与s 的单位都是m D .x 与s 的单位不同解析:x 与s 的单位都与数据组中的数据单位相同,是m. 答案:C 5.方差(1)定义:标准差的平方,即s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].(2)特征:与标准差的作用相同,描述一组数据围绕平均数波动程度的大小. (3)取值范围:[0,+∞). 知识拓展A.平均数B.方差C.中位数D.众数解析:方差刻画一组数据离散程度的大小.答案:B6.用样本估计总体现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用样本的平均数、众数、中位数、标准差、方差来估计.这与上一节用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.归纳总结用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差.样本容量越大,估计就越精确.【做一做6-1】下列判断正确的是()A.样本平均数一定小于总体平均数B.样本平均数一定大于总体平均数C.样本平均数一定等于总体平均数D.样本容量越大,样本平均数越接近总体平均数答案:D【做一做6-2】电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该日生产电池的平均寿命估计为() A.27 B.28C.29 D.30解析:这10个数据的平均数是110(30+35+25+25+30+34+26+25+29+21)=28,则该日生产的电池的平均寿命估计为28小时.答案:B。
高中数学 第二章 统计 2.2 用样本估计总体(第1课时)预
高中数学 第二章 统计 2.2 用样本估计总体(第1课时)预习导航新人教A 版必修31.了解分析数据的方法,知道估计总体频率分布的方法.2.了解频率分布折线图和总体密度曲线,会画频率分布直方图和茎叶图.3.理解频率分布直方图和茎叶图及其应用.1.分析数据的方法(1)借助于图形.用图将各个数据画出来,作图可以达到两个目的,一是从数据中提取信息;二是利用图形传递信息.(2)借助于表格.用紧凑的表格改变数据的构成方式,为我们提供解释数据的新方式.【做一做1】在2010年第十六届亚运会中,各个国家和地区代表队金牌获得情况的条形统计图,如图所示.第十六届亚运会各个国家和地区代表队金牌获得情况统计图从图中可以看出中国队所获得金牌数占全部金牌数的比例约是( )A .41.7%B .59.8%C .67.3%D .94.8%解析:金牌总数为477,我国获得199块金牌,所占比例为199477≈41.7%. 答案:A2.频率分布直方图(1)绘制步骤:①求极差,即一组数据中的最大值与最小值的差.②决定组距与组数.组距与组数的确定没有具体的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分为5~12组.③将数据分组.④列出频率分布表.⑤画出频率分布直方图.其中横轴表示数据,纵轴表示频率与组距的比.(2)意义:频率分布直方图中,每个小矩形的面积表示相应组的频率,所有小矩形的面积的总和等于1.(3)频率分布的估计:频率分布是指各个小组数据在容量中所占比例的大小,可以用样本的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.归纳总结 频率分布直方图的特征:直观、形象地反映了样本的分布规律;可以大致估计出总体的分布.但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.【做一做2】在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该组的频率是( )A .15B .16C .110D .不确定 解析:该组的频率是1050=15. 答案:A3.频率分布折线图和总体密度曲线(1)类似于频数分布折线图,连接频率分布直方图中各个小长方形上端的中点,就得到频率分布折线图.一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.例如,如果要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一个城市的时候大.可以想象,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.归纳总结 频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(2)估计方法:实际上,尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用样本来估计.由于样本是随机的,不同的样本得到的频率分布折线图不同;即使对于同一个样本,不同的分组情况得到的频率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变化而变化的,因此不能用样本的频率分布折线图得到准确的总体密度曲线.【做一做3】对于频率分布折线图与总体密度曲线的关系,下列说法中正确的是( ) A.频率分布折线图与总体密度曲线无关B.频率分布折线图就是总体密度曲线C.样本容量很大的频率分布折线图就是总体密度曲线D.如果样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近于一条光滑曲线,即为总体密度曲线答案:D4.茎叶图(1)制作方法:将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).(2)优缺点:在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.归纳总结茎叶图的特征:统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数据可以随时记录,随时添加,方便记录与表示.但是茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两位以上的数据虽然能够记录,但是没有表示两位数记录那么直观、清晰.【做一做4】没有信息的损失,所有的原始数据都可以从图中得到的统计图是( ) A.总体密度曲线B.茎叶图C.频率分布折线图D.频率分布直方图解析:所有的统计图中,仅有茎叶图完好无损地保存着所有原始数据的信息.答案:B。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学 第二章 统计 2.2 用样本估计总体(第2课时)预习导航
新人教A 版必修3
1.掌握众数、中位数、平均数、标准差、方差的定义和特征.
2.会求众数、中位数、平均数、标准差、方差,并能用来解决有关问题.
1.众数
(1)定义:一组数据中出现次数最多的数称为这组数据的众数.
(2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势. 名师点拔 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.
【做一做1】数据组8,-1,0,4,17
,4,3的众数是__________. 答案:4
2.中位数
(1)定义:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数.
(2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.
名师点拔 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.
【做一做2】数据组-5,7,9,6,-1,0的中位数是__________.
解析:将该组数据按从小到大排列为-5,-1,0,6,7,9,则中位数是0+62
=3. 答案:3
3.平均数
(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为x =x 1+x 2+…+x n n
. (2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低.
【做一做3】10名工人某天生产同一零件,生产的件数是
15,17,14,10,15,17,17,16,14,12,则其平均数是__________.
解析:平均数是110
(15+17+14+10+15+17+17+16+14+12)=14.7. 答案:14.7
4.标准差
(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算
s 可以用计算器或计算机计算标准差.
(2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.
【做一做4】一组数据的单位是m ,平均数是x ,标准差为s ,则( )
A .x 与s 的单位都是km
B .x 与s 的单位都是cm
C .x 与s 的单位都是m
D .x 与s 的单位不同 解析:x 与s 的单位都与数据组中的数据单位相同,是m.
答案:C
5.方差 (1)定义:标准差的平方,即
s 2=1n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)特征:与标准差的作用相同,描述一组数据围绕平均数波动程度的大小.
(3)取值范围:[0,+∞).
知识拓展
A.平均数 B.方差
C.中位数 D.众数
解析:方差刻画一组数据离散程度的大小.
答案:B
6.用样本估计总体
现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用样本的平均数、众数、中位数、标准差、方差来估计.这与上一节用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.
归纳总结用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差.样本容量越大,估计就越精确.
【做一做6-1】下列判断正确的是( )
A.样本平均数一定小于总体平均数
B.样本平均数一定大于总体平均数
C.样本平均数一定等于总体平均数
D.样本容量越大,样本平均数越接近总体平均数
答案:D
【做一做6-2】电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该日生产电池的平均寿命估计为( ) A.27 B.28
C.29 D.30
解析:这10个数据的平均数是1
10
(30+35+25+25+30+34+26+25+29+21)=28,则该日生产的电池的平均寿命估计为28小时.
答案:B。