专题5.1 统计(精讲精析篇)(解析版)
专题五 第1讲 统计与统计案例(解析版)
第1讲 统计与统计案【典例】【要点提炼】考点一 统计图表1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.【热点突出】【典例】1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )A .这11天复工指数和复产指数均逐日增加B .这11天期间,复产指数增量大于复工指数的增量C .第3天至第11天复工复产指数均增大都超过80%D .第9天至第11天复产指数增量大于复工指数的增量 【答案】 CD(2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是( ) A.抽样表明,该校约有一半学生为阅读霸B.该校只有50名学生不喜欢阅读C.该校只有50名学生喜欢阅读D.抽样表明,该校有50名学生为阅读霸【答案】 A【解析】根据频率分布直方图可列下表:阅读时间(分钟) [0,10)[10,20) [20,30) [30,40) [40,50) [50,60]抽样人数(名) 10 18 22 25 20 5抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸.易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误以为频率.【拓展训练】1 (1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温不低于20 ℃的月份有5个【答案】 D【解析】由题中雷达图易知A,C正确.七月份平均最高气温超过20 ℃,平均最低气温约为13 ℃;一月份平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月平均温差大,故B正确.由题图知平均最高气温不低于20 ℃的月份为六、七、八月,有3个.(2)(多选)(2020·重庆模拟)新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考),其中“选择考”成绩将计入高考总成绩,即将学生考试时的原始卷面分数由高到低进行排序,评定为A,B,C,D,E五个等级,再转换为分数计入高考总成绩.某试点高中2020年参加“选择考”总人数是2018年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2018年和2020年“选择考”成绩等级结果,得到如图所示的统计图.针对该校“选择考”情况,2020年与2018年比较,下列说法正确的是( ) A .获得A 等级的人数增加了 B .获得B 等级的人数增加了1.5倍 C .获得D 等级的人数减少了一半 D .获得E 等级的人数相同 【答案】 AB【解析】 设2018年参加“选择考”的总人数为x ,则2020年参加“选择考”的总人数为2x ,根据图表得出2018年和2020年各个等级的人数如表所示.由表可知,获得A 等级的人数增加了,故A 正确;获得B 等级的人数增加了0.8x -0.32x0.32x =1.5倍,故B 正确;获得D 等级的人数增加了,故C 错误;获得E 等级的人数不相同,故D 错误.【要点提炼】考点二 回归分析在分析两个变量的相关关系时,可根据样本数据作出散点图来判断两个变量之间是否具有相关关系.若具有线性相关关系,则回归直线过样本点的中心(x ,y ),并且可通过线性回归方程估计预报变量的值.【热点突破】【典例】2 (2020·全国Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=60,i=1 200,(x i-x)2=80,(y i-y)2=9 000,(x i-x)(y i-y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i,y i)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.【解析】解(1)由已知得样本平均数y=120i=60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i,y i)(i=1,2,…,20)的相关系数r=80080×9 000=223≈0.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.规律方法样本数据的相关系数r=∑ni=1x i-x y i-y∑ni=1x i-x2∑ni=1y i-y2,反映样本数据的相关程度,|r|越大,则相关性越强.【拓展训练】2 (1)已知某产品的销售额y与广告费用x之间的关系如下表:x(单位:万元) 0 1 2 3 4y(单位:万元)10 15 20 30 35若求得其线性回归方程为y ^=6.5x +a ^,则预计当广告费用为6万元时的销售额为( ) A .42万元 B .45万元 C .48万元 D .51万元 【答案】 C【解析】 由题意,根据上表中的数据, 可得x =2,y =22, 即样本点的中心为(2,22),又线性回归方程y ^=6.5x +a ^经过样本点的中心,所以22=6.5×2+a ^,解得a ^=9,所以y ^=6.5x +9,当x =6时,y ^=48.(2)(2020·河北衡水中学月考)有一散点图如图所示,在5个(x ,y)数据中去掉D(3,10)后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数R 2变小D .解释变量x 与预报变量y 的相关性变弱 【答案】 A【解析】 ∵从散点图可分析得出:只有D 点偏离直线远,去掉D 点,解释变量x 与预报变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差平方和变小,故选A.【要点提炼】考点三独立性检验假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dK2=n ad-bc2a+b a+c b+d c+d(其中n=a+b+c+d为样本容量).【热点突破】【典例】3 (2020·新高考全国Ⅰ)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:SO2PM2.5[0,50] (50,150] (150,475][0,35] 32 18 4(35,75] 6 8 12(75,115] 3 7 10(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:SO2PM2.5[0,150] (150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=n ad-bc2a+b c+d a+c b+d,P(K2≥k0) 0.050 0.010 0.001k0 3.841 6.635 10.828【解析】解(1)由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+6+18+8=64,所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.(2)由所给数据,可得2×2列联表:SO2PM2.5[0,150] (150,475][0,75] 64 16(75,115] 10 10(3)根据2×2列联表中的数据可得K2=n ad-bc2a+b c+d a+c b+d=100×64×10-16×102 80×20×74×26≈7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.规律方法独立性检验的关键(1)根据2×2列联表准确计算K 2,若2×2列联表没有列出来,要先列出此表. (2)K 2的观测值k 越大,对应的假设H 0成立的概率越小,H 0不成立的概率越大.【拓展训练】3 (1)随着国家二胎政策的全面放开,为了调查一线城市和非一线城市的二胎生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线城市一线城市 总计 愿生 45 20 65 不愿生 13 22 35 总计5842100附表:P(K 2≥k 0)0.100 0.050 0.010 0.001 k 02.7063.8416.63510.828由K 2=n ad -bc 2a +bc +d a +cb +d计算得,K 2的观测值k =100×45×22-20×13258×42×35×65≈9.616,参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关” 【答案】 C【解析】 由题意知, K 2的观测值k ≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”.(2)某校团委对“学生性别和喜欢某视频APP 是否有关”做了一次调查,其中被调查的女生人数是男生人数的一半,男生喜欢某视频APP 的人数占男生人数的16,女生喜欢某视频APP 的人数占女生人数的23,若有95%的把握认为喜欢某视频APP 和性别有关,则男生至少有( )附:P(K 2≥k 0)0.050 0.010 k 03.8416.635K 2=n ad -bc2a +bc +d a +cb +d.A .12人B .6人C .10人D .18人 【答案】 A【解析】 设被调查的男生人数为x ,则被调查的女生人数为x2,则2×2列联表为喜欢某视频APP不喜欢某视频APP总计男生 x 6 5x 6 x女生x 3 x 6x 2 总计 x 2x3x 2若有95%的把握认为喜欢某视频APP 和性别有关,则K 2≥3.841,即K 2=3x 2⎝ ⎛⎭⎪⎫x 6×x 6-5x 6×x 32x ×x 2×x 2×x =3x 8≥3.841,则x≥3.841×83≈10.243,又x 2,x 3,x6均为整数,所以男生至少有12人.专题训练一、单项选择题1.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x -y|的值为( ) A .4 B .3 C .2 D .1 【答案】 A【解析】 依题意有x +y +10+11+95=10,(x -10)2+(y -10)2+(10-10)2+(11-10)2+(9-10)2=5×2,解得x =8,y =12或x =12,y =8,故|x -y|=4.2.(2019·全国Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A .0.5 B .0.6 C .0.7 D .0.8 【答案】 C【解析】 根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.3.(2020·全国Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i =1,2,…,20)得到下面的散点图:由此散点图可以看出,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y =a +bx B .y =a +bx 2C .y =a +be xD .y =a +bln x【答案】 D【解析】 由散点图可以看出,点大致分布在对数型函数的图象附近.4.某生产车间的甲、乙两位工人生产同一种零件,这种零件的标准尺寸为85 mm ,现分别从他们生产的零件中各随机抽取8件进行检测,其尺寸(单位:mm)用茎叶图表示如图所示,则估计( )A .甲、乙生产的零件尺寸的中位数相等B .甲、乙生产的零件质量相当C .甲生产的零件质量比乙生产的零件质量好D .乙生产的零件质量比甲生产的零件质量好 【答案】 D【解析】 甲生产的零件尺寸是93,89,88,85,84,82,79,78;乙生产的零件尺寸是90,88,86,85,85,84,84,78.故甲生产的零件尺寸的中位数是85+842=84.5,乙生产的零件尺寸的中位数是85+852=85,故A 错误;根据数据分析,乙的数据较稳定,故乙生产的零件质量比甲生产的零件质量好,故B ,C 错误.5.某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图所示,则下列结论错误的是( )A .得分在[40,60)之间的共有40人B .从这100名参赛者中随机选取1人,其得分在[60,80)之间的概率为0.5C .估计得分的众数为55D .这100名参赛者得分的中位数为65 【答案】 D【解析】 根据频率和为1,计算(a +0.035+0.030+0.020+0.010)×10=1,解得a =0.005, 得分在[40,60)之间的频率是0.4,估计得分在[40,60)之间的有100×0.4=40(人),A 正确;得分在[60,80)之间的频率为0.5,可得从这100名参赛者中随机选取1人,得分在[60,80)之间的概率为0.5,B 正确;根据频率分布直方图知,最高的小矩形对应的底边中点为50+602=55,即估计众数为55,C 正确;根据频率分布直方图知,得分低于60分的直方图面积为(0.005+0.035)×10=0.4<0.5,而得分低于70分的直方图面积为(0.005+0.035+0.030)×10=0.7>0.5,所以100名参赛者得分的中位数估计为60+0.5-0.40.030≈63.3,D 错误. 二、多项选择题6.(2020·烟台模拟)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表,经计算K 2的观测值k ≈4.762,则可以推断出( )A.该学校男生对食堂服务满意的概率的估计值为35B .调研结果显示,该学校男生比女生对食堂服务更满意C .有95%的把握认为男、女生对该食堂服务的评价有差异D.有99%的把握认为男、女生对该食堂服务的评价有差异【答案】AC【解析】对于选项A,该学校男生对食堂服务满意的概率的估计值为3030+20=35,故A正确;对于选项B,该学校女生对食堂服务满意的概率的估计值为4040+10=45>35,故B错误;因为k≈4.762>3.841,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C正确,D错误.7.(2020·河北衡水中学月考)5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业经济的快速增长,进而对GDP增长产生直接贡献,并通过产业间的关联效应和波及效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图是某单位结合近几年数据,对今后几年的5G经济产出所做的预测.结合上图,下列说法正确的是( )A.5G的发展带动今后几年的总经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.信息服务商与运营商的经济产出的差距有逐步拉大的趋势D.设备制造商在各年的经济产出中一直处于领先地位【答案】ABC【解析】由图易知A,B,C正确,而设备制造商的经济产出在2029年和2030年将低于信息服务商的经济产出,故D错误.8.(2020·青岛模拟)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,则下列结论正确的是( )注:90后指1990年及以后出生,80后指1980-1989年之间出生,80前指1979年及以前出生.A .互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B .互联网行业中从事技术岗位的人数超过总人数的20%C .互联网行业中从事运营岗位的人数90后比80前多D .互联网行业中从事技术岗位的人数90后比80后多 【答案】 ABC【解析】 选项A ,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占的比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A 正确; 选项B ,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B 正确;选项C ,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C 正确;选项D ,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数所占比为41%,条件中未给出“80后”从事技术岗位的占比,故不能判断,所以选项D 错误. 三、填空题9.某企业的一种商品的产量与成本数据如下表:产量x(万件) 14 16 18 20 22 成本y(元/件)12107a3若根据表中提供的数据,求出y 关于x 的线性回归方程为y ^=-1.15x +28.1,则a 的值为________. 【答案】 5【解析】 由题意知x =14+16+18+20+225=905=18,y =12+10+7+a +35=32+a5,又y =-1.15×18+28.1=7.4, 所以32+a5=7.4,解得a =5.10.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量为________,抽取的高中生近视人数为________.【答案】 200 20【解析】 由题图甲知,总人数为3 500+2 000+4 500=10 000,所以样本容量为10 000×2%=200,抽样比【典例】为150,所以高中生抽取的学生数为40,所以抽取的高中生近视人数为40×50%=20.11.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________.(填序号)【答案】 ①②③【解析】 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故①正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故②正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故③正确;通过折线图可得乙在6月到8月明显是下降趋势,故④错误.12.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是________.(填序号)①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x ,y );③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 【答案】 ④【解析】 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故①正确;因为回归直线必过样本点的中心(x ,y ),所以②正确;由线性回归方程的意义知,某女生的身高增加 1 cm ,其体重约增加0.85 kg ,故③正确;当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,这不是确定值,因此④不正确. 四、解答题13.某公司为了了解广告投入对销售收益的影响,在若干地区各投入3.5万元广告费用,并将各地的销售收益绘制成频率分布直方图,如图所示,由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.(1)根据频率分布直方图计算图中各小长方形的宽度;(2)估计该公司投入3.5万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值); (3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入x(单位:万元) 1 2 3 4 5 销售收益y(单位:万元)2327表中的数据显示,x 与y 之间存在线性相关关系,请将(2)中的结果填入空白栏,并计算y 关于x 的线性回归方程.【解析】解 (1)设各小长方形的宽度为m ,由频率分布直方图中各小长方形面积总和为1,可知(0.08+0.10+0.14+0.12+0.04+0.02)·m =0.5m =1,故m =2.(2)由(1)知,各分组依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],其中点值分别为1,3,5,7,9,11,对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04,故可估计平均值为1×0.16+3×0.20+5×0.28+7×0.24+9×0.08+11×0.04=5. (3)空白栏中填5.由题意可知,x =1+2+3+4+55=3,y =2+3+2+5+75=3.8,∑5i =1x i y i =1×2+2×3+3×2+4×5+5×7=69,∑5i =1x 2i =12+22+32+42+52=55. 根据公式可求得b ^=69-5×3×3.855-5×32=1210=1.2, a ^=3.8-1.2×3=0.2,即线性回归方程为y ^=1.2x +0.2.14.(2020·全国Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):4(中度污染)7 2 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好 空气质量不好附:K 2=n ad -bc2a +bc +d a +cb +d .P(K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828【解析】解 (1)由频数分布表可知,该市一天的空气质量等级为1的概率为2+16+25100=0.43,等级为2的概率为5+10+12100=0.27,等级为3的概率为6+7+8100=0.21,等级为4的概率为7+2+0100=0.09.(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100×20+300×35+500×45100=350.(3)2×2列联表如下:人次≤400人次>400 总计 空气质量好 33 37 70 空气质量不好22 8 30 总计5545100K 2=100×33×8-37×22255×45×70×30≈5.820>3.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.。
第22讲 统计—2021-2022学年小升初数学精讲精练专题汇编(知识点精讲+达标检测)
提高版(通用)2020-2021学年小升初数学精讲精练专题讲义第22讲统计学问精讲学问点一:统计表1.简洁数据的统计过程:①收集数据:依据实际问题设计简洁的调查表,常用的数据收集方法有调查、试验、测量等。
②整理数据:把收集到的原始数据进行整理。
③描述数据:把整理好的数据呈现出来。
④分析数据:通过观看、比较、计算等方法从数据中发觉并提取信息,进行简洁的推断或猜测,为我们解决问题供应挂念。
2.统计表:把收集到的资料进行数据整理后制成表格,用来分析状况,反映问题,这种表格叫做统计表。
3.统计表分类:单式统计表、复式统计表.只有一个统计项目就用单式统计表,含有两个或两个以上的统计项目就用复式统计表。
学问点二:统计图1.统计图的种类:①条形统计图:单式条形统计图、复式条形统计图②折线统计图:单式折线统计图、复式折线统计图③扇形统计图2. 统计图的类型、意义、特点及作用:重要提示:在绘制统计图时,都要写出标题,写明调查日期或制图日期。
若是复式条形统计图或复式折线统计图,还应有图例3. 统计图的选择:一般来说,假如几个数量是并列的,只要求表示数量的多少,就用条形统计图;假如要表示一个量或几个量的数量增减变化状况和进展变化趋势,就用折线统计图;假如要表示各部分数量与总体数量之间的关系,就用扇形统计图学问点三:平均数1.平均数的意义:平均数是对数据进行计算处理后得到的一个统计量;一组数据之和再除以这组数据的个数,就得到了这组数据的平均数;它表示一组数据的集中趋势或一般水平。
2.常用的数量关系式:平均数=总数量÷总份数总数量=平均数×总份数。
力量提高百分练一、精挑细选(共5题;共5分)1.(1分)(2021·合肥)为了调查某小区居民的用水状况,随机抽取了若干户家庭的月用水量,结果如下表,则关于这若干户家庭的月用水量,下列说法错误的是()。
月用水量(吨) 3 4 5 8户数 2 3 4 1A.平均数是 4.6 B.调查了10户家庭的月用水量C.中位数是4 D.众数是 52.(1分)(2021·苏州)联合国规定每年的6月5日是“世界环境日”,为了协作2021年的“世界环境日”,某校课外活动小组对全校师生开展了以“疼惜环境,从我做起”为主题的问卷调查活动,将调查结果分析整理后,制成了右面统计图。
专题5.1 统计(精讲精析篇)(原卷版)
专题5.1统计(精讲精析篇)提纲挈领点点突破热门考点01 随机抽样1.简单随机抽样的特点(1)抽取的个体数较少;(2)是逐个抽取;(3)是不放回抽取;(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.2.抽签法与随机数法的适用情况(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况. (2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法. 3.分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算. (3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量总体容量=各层样本数量各层个体数量”.70 29 17 12 13 40 33 12 38 26 13 89 51 03 56 62 18 37 35 96 83 50 87 75 97 12 55 93A.12 B.13 C.03 D.40A.1260 B.1230 C.1200 D.1140【典例3】下列抽取样本的方式属于简单随机抽样的个数为()①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0B.1 C.2 D.3【总结提升】1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.分层抽样的前提和遵循的两条原则(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.(2)遵循的两条原则:①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.3. 两种抽样方法的特点、联系及适用范围热门考点02 茎叶图及其应用1.当数据个数较少时,用茎叶图可精确地记录每个数据.如果数据是两位数,那么茎表示十位数,叶表示个位数,如果数据是三位数,那么茎表示百位数和十位数,叶表示个位数.2.茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(3)数据分布一般是茎从上到下由小到大,叶从茎侧向外按从小到大排列.3.茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.A.3,5B.5,5C.3,7D.5,7A.2 B.4C.5 D.6【特别提醒】茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.①“叶”位置只有一个数字,而“茎”位置的数字位数一般不需要统一;②茎叶图上重复出现的数据要重复记录,不能遗漏.热门考点03 频率分布直方图1.频率、频数、样本容量的计算方法 (1)频率组距×组距=频率. (2)频数样本容量=频率,频数频率=样本容量, 样本容量×频率=频数. (3)各个小方形的面积总和等于1 . 2.频率分布表的画法第一步:求极差,决定组数和组距,组距=极差/组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.(4)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.【典例6】(2017北京,文17)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数学.科网不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【典例7】(2016高考四川文科)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……[4,4.5]分成9组,制成了如图所示的频率分布直方图.(I)求直方图中的a值;(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;(Ⅲ)估计居民月均用水量的中位数.【总结提升】1.两个主要考查角度:(1)利用频率分布直方图求频率、频数.(2)利用频率分布直方图估计总体2.熟记结论:(1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1;(2) 频率组距×组距=频率;(3)频数/样本容量=频率,此关系式的变形为频数/频率=样本容量,样本容量×频率=频数3.易错防范:频率分布直方图的纵坐标是频率组距,而不是频率热门考点04 样本的数字特征众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定. 标准差是方差的算术平方根,意义在于反映一个数据集的离散程度. A .0.01 B .0.1C .1D .10A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====【典例10】(2019年高考全国Ⅱ卷文)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈. 【总结提升】1.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-n x 2]或写成s 2=1n (x 21+x 22+…+x 2n )-x 2,即方差等于原数据平方的平均数减去平均数的平方. 2.主要命题角度:(1)样本的数字特征与频率分布直方图交汇 (2)样本的数字特征与茎叶图交汇①在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.②茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.(3)样本的数字特征与优化决策问题交汇:利用样本的数字特征解决优化决策问题的依据①平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.②用样本估计总体就是利用样本的数字特征来描述总体的数字特征.巩固提升A.96 B.72 C.48 D.362.(2017课标1,文2)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数3.(河南省洛阳市2019届高三第三次统考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为A.100,10 B.100,20C.200,10 D.200,20A .样本容量为240B .若样本中对平台三满意的人数为40,则40%m =C .总体中对平台二满意的消费者人数约为300D .样本中对平台一满意的人数为24人 A .52B .3C .72D .46.(广东省汕头市2019届高三第二次模拟(B 卷))在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是A .成绩在[70,80]分的考生人数最多B .不及格的考生人数为1000人C .考生竞赛成绩的平均分约70.5分D .考生竞赛成绩的中位数为75分7.(福建省泉州市2019届高三第二次(5月)质检)已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则 A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s ><以下关于四名同学射击成绩的数字特征判断不正确...的是( ) A .平均数相同B .中位数相同C .众数不完全相同D .丁的方差最大9.(河南省郑州市2019届高三第三次质量检测)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y 的值是( )A .12B .14C .16D .18A .从2013年到2016年,该校纸质书人均阅读量逐年增长B .2013年至2018年,该校纸质书人均阅读量的中位数是46.7本C .2013年至2018年,该校纸质书人均阅读量的极差是45.3本D .2013年至2018年,该校后三年纸质书人均阅读量总和是前三年纸质书人均阅读量总和的2倍A .B .C .D .12. 已知一组正数x 1,x 2,x 3的方差s 2=13(x 21+x 22+x 23-12),则数据x 1+1,x 2+1,x 3+1的平均数为 .(1)求m的值;(2)成绩不低于90分的人就能获得积分奖励,求所有参赛者中获得奖励的人数;(3)根据频率分布直方图,估计这次知识竞赛成绩的平均分(用组中值代替各组数据的平均值).(1)求直方图的a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月用水量的中位数.。
专题5.1-4轴对称图形及其性质精讲(解析版)
B.角平分线的交点为三角形的内心,到各边距离相等,不符合题意;
C.高的交点为垂心,而到各顶点相等的只能是垂直平分线的交点,不符合题意;
D.△ABC 三边垂直平分线的交点上,符合题意.
故选 D.
2.(2020·湖北宜昌)如图,点 E,F,G,Q,H 在一条直线上,且 EF GH ,我们知道按如图所作的直
【答案】1:3 【解析】解:∵DE 垂直平分 AB, ∴AD=BD, ∴S△ADE=S△BDE, ∵∠1=∠2,∠C=∠BDE=90°,BE=BE, ∴△BDE≌△BCE(AAS), ∴S△BDE=S△BCE, ∴S△AED:S△ABC=1:3, 故答案为:1:3. 4.(2020·安徽砀山初二期末)如图,在△ABC 中,AC=5 cm,AB 的垂直平分线交 AC 于点 N,△BCN 的周长是 8 cm,则线段 BC 的长为________ cm.
二、考点点拨与训练
考点 1:轴对称图形的识别 典例:(2020·江苏新沂初三一模)剪纸艺术是我国古老的民间艺术之一,作为一种镂空艺术,它能给人以视 觉上的透空感觉和艺术享受.下列剪纸作品中,是轴对称图形的是( )
A.
B.
C.
D.
【答案】A 【解析】 解:A 选项能够关于一条直线对称,是轴对称图形,故 A 正确; B 选项不是轴对称图形,故 B 错误; C 选项不是轴对称图形,故 C 错误;
D.
【答案】C 【解析】解:A、B、D 中的图形不是轴对称图形, C 中的图形是轴对称图形, 故选:C. 6.(2020·全国初二课时练习)我们理应对我们所得的一切心怀感恩,这是我们强大的基础.少年强则国强, 中国强则中国少年更强,中国强就是因为少年强.为了庆祝祖国生日小强做了以下几幅剪纸作品,其中是轴 对称图形的是( )
初中统计题目讲解教案
初中统计题目讲解教案教学目标:1. 让学生掌握统计的基本概念和方法,能够运用统计学知识解决实际问题。
2. 通过讲解初中统计题目,帮助学生理解统计学的基本原理和方法,提高解决问题的能力。
3. 培养学生的逻辑思维能力和数据分析能力,使他们在面对复杂问题时能够运用统计学方法进行解决。
教学重点:1. 统计的基本概念和方法。
2. 初中统计题目的解题思路和方法。
教学难点:1. 统计学的基本原理和方法的理解。
2. 初中统计题目的解题技巧和策略。
教学准备:1. 统计学的基本教材或教辅资料。
2. 初中统计题目及其解答。
教学过程:一、导入(5分钟)1. 引导学生思考:什么是统计?统计学在生活中的应用有哪些?2. 学生回答后,教师总结:统计是一种收集、整理、分析和解释数据的方法,它在生活中的应用非常广泛,如调查问卷、数据分析、概率计算等。
二、讲解统计的基本概念和方法(15分钟)1. 介绍统计学的基本概念,如数据、变量、样本、总体等。
2. 讲解统计学的基本方法,如描述性统计、推断性统计、概率计算等。
3. 通过实例演示统计学方法在实际问题中的应用。
三、讲解初中统计题目(20分钟)1. 选取几个典型的初中统计题目,如频数分布表、平均数、中位数、众数、概率计算等。
2. 引导学生思考解题思路和方法,如如何收集和整理数据、如何计算统计量、如何进行概率计算等。
3. 逐个讲解题目的解题步骤和答案。
四、练习和讨论(10分钟)1. 让学生独立完成几个初中统计题目,并解释解题思路和方法。
2. 引导学生进行小组讨论,分享解题心得和经验。
3. 教师对学生的解答和讨论进行指导和评价。
五、总结和拓展(5分钟)1. 总结本节课的重点内容,强调统计学的基本概念和方法的重要性。
2. 提醒学生要注意统计学在实际问题中的应用,培养解决问题的能力。
3. 拓展统计学的学习,如参考统计学教材或教辅资料,参加统计学竞赛等。
教学反思:本节课通过讲解初中统计题目,使学生掌握了统计学的基本概念和方法,并能够运用统计学知识解决实际问题。
高考数学最新真题专题解析—统计(新高考卷)
高考数学最新真题专题解析—统计(新高考卷)【母题来源】2022年新高考I 卷 【母题题文】一支医疗团队研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好 良好 病例组 40 60 对照组1090异⋅(2)从该地的人群中任选一人,A 表示事件“选到的人卫生习惯不够良好”,B 表示事件“选到的人患有该疾病”,P(B|A)与P(B|A)P(B|A)的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R . (i)证明:R =P(A|B).P(A|B)P(A|B)(ii)利用该调查数据,给出P(A|B),P(A|B)的估计值,并利用(i)的结果给出R 的估计值.附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),P(K 2≥k)0.050 0.010 0.001 k3.8416.63510.828【答案】解:(1)得到2×2联表如下:不够良好 良好 总计 病例组 40 60 100 对照组 10 90 100 总计50150200∵K 2=200×(40×90−60×10)2100×100×50×150=24>10.828∴有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异; (2)(i)证明:∵P(B|A)=P(BA)P(A),P(B|A)=P(BA)P(A),P(B|A)=P(BA)P(A),P(B|A)=P(B A)P(A), ∴R =P(B|A)P(B|A)P(B|A)P(B|A)=P(BA)P(A)P(BA)P(A)÷P(BA)P(A)P(B A)P(A)=P(BA)P(BA)·P(B A)P(BA)又∵P(A|B)=P(AB)P(B),P(A|B)=P(AB)P(B),P(A|B)=P(A B)P(B),P(A|B)=P(AB)P(B),∴P(A|B)·P(A|B)P(A|B)=P(AB)P(B)P(AB)P(B)·P(A B)P(B)P(AB)P(B)=P(AB)·P(A B)P(AB)=P(BA)·P(B A)P(BA),∴R =P(A|B)·P(A|B)P(A|B)(ii)∵P(A|B)=P(AB)P(B)=40100=25,P(A|B)=P(AB)P(B)=60100=35,P(A|B)=P(A B)P(B)=90100=910,P(A|B)=P(AB)P(B)=10100=110∴P(A|B)P(A|B)⋅P(A|B)P(A|B)=2535×910110=6∴R =P(A|B).P(A|B)P(A|B)=6即P(A|B)=25,P(A|B)=110,R 的估计值为6. 【母题来源】2022年新高考II 卷 【母题题文】在某地区进行某种疾病调查,随机调查了100位这种疾病患者的年龄,得到如下样本数据频率分布直方图.(1)估计该地区这种疾病患者的平均年龄; (同一组数据用该区间的中点值作代表)(2)估计该地区以为这种疾病患者年龄位于区间[20,70)的概率;(3)已知该地区这种疾病患者的患病率为0.1%,该地区年龄位于区间[40,50)的人口数占该地区总人口数的16%,从该地区选出1人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率(精确到0.0001).【答案】解:(1)平均年龄x=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁)(2)设A={一人患这种疾病的年龄在区间[20,70)},则P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},则由条件概率公式,得P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014.【命题意图】1.考察频率分布直方图。
2024中考数学一轮复习核心知识点精讲—统计
2024中考数学一轮复习核心知识点精讲—统计1.能通过实际问题,辨认总体、个体、样本等基本概念.2.掌握三种统计图的画法,明确它们的优缺点及相互关系.特别是扇形统计图与条形统计图结合应用.3.会求一组数据的样本平均数、方差、标准差、中位数、众数等.能根据统计结果作出合理的判断和预测,体会统计对决策的作用,能比较清晰地表达自己的观念。
考点1:全面调查与抽样调查1.有关概念1)全面调查:为一特定目的而对所有考察对象进行的全面调查叫做全面调查.2)抽样调查:为一特定目的而对部分考察对象进行的调查叫做抽样调查.2.调查的选取:当受客观条件限制,无法对所有个体进行全面调查时,往往采用抽样调查.3.抽样调查样本的选取:1)抽样调查的样本要有代表性;2)抽样调查的样本数目要足够大.总体、个体、样本及样本容量总体:所要考察对象的全体叫做总体.个体:总体中的每一个考察对象叫做个体.样本:从总体中抽取的部分个体叫做样本.样本容量:样本中个体的数目叫做样本容量。
考点2:几种常见的统计图表1.条形统计图:条形统计图就是用长方形的高来表示数据的图形.特点:(1)能够显示每组中的具体数据;(2)易于比较数据之间的差别.2.折线统计图:用几条线段连成的折线来表示数据的图形.特点:易于显示数据的变化趋势.3.扇形统计图:用一个圆代表总体,圆中的各个扇形分别代表总体中的不同部分,扇形的大小反映部分在总体中所占百分比的大小,这样的统计图叫扇形统计图.百分比的意义:在扇形统计图中,每部分占总体的百分比等于该部分所对扇形的圆心角的度数与360°的比.扇形的圆心角=360°×百分比.4.频数分布直方图1)每个对象出现的次数叫频数.2)每个对象出现的次数与总次数的比(或者百分比)叫频率,频数和频率都能够反映每个对象出现的频繁程度.3)频数分布表、频数分布直方图和频数折线图都能直观、清楚地反映数据在各个小范围内的分布情况.4)频数分布直方图的绘制步骤:①计算最大值与最小值的差;②决定组距与组数;③确定分点,常使分点比数据多一位小数,并且把第一组的起点稍微减小一点;④列频数分布表;⑤画频数分布直方图:用横轴表示各分段数据,纵轴反映各分段数据的频数,小长方形的高表示频数,绘制频数分布直方图.考点3:众数、中位数、平均数、方差1.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.2.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.3.平均数1)平均数:一般地,如果有n 个数1x ,2x ,…,n x ,那么,121()n x x x x n=+++…叫做这n 个数的平均数,x 读作“x 拔”.2)加权平均数:如果n 个数中,1x 出现f 1次,x 2出现f 2次,…,x k 出现f k 次(这里12k f f f n +++=…),那么,根据平均数的定义,这n 个数的平均数可以表示为1122k kx f x f x f x n+++=…,这样求得的平均数x叫做加权平均数,其中f 1,f 2,…,f k 叫做权.4.方差.通常用“2s ”表示,即2222121[()()()]n s x x x x x x n=-+-++-….在一组数据1x ,2x ,…,n x 中,各数据与它们的平均数x 的差的平方的平均数,叫做这组数【题型1:数据的收集方式】【典例1】(2020•贵阳)2020年为阻击新冠疫情,某社区要了解每一栋楼的居民年龄情况,以便有针对性进行防疫,一志愿者得到某栋楼60岁以上人的年龄(单位:岁)数据如下:62,63,75,79,68,85,82,69,70.获得这组数据的方法是()A .直接观察B .实验C .调查D .测量【答案】C【解答】解:一志愿者得到某栋楼60岁以上人的年龄(单位:岁)数据如下:62,63,75,79,68,85,82,69,70.获得这组数据的方法是:调查.故选:C .【变式1-1】(2020•扬州)某班级组织活动,为了解同学们喜爱的体育运动项目,设计了如图尚不完整的调查问卷:准备在“①室外体育运动,②篮球,③足球,④游泳,⑤球类运动”中选取三个作为该调查问卷问题的备选项目,选取合理的是()A .①②③B .①③⑤C .②③④D .②④⑤【答案】C【解答】解:根据体育项目的隶属包含关系,选择“篮球”“足球”“游泳”比较合理,故选:C.【题型2:与统计有关的概念】【变式1-2】(2023•辽宁)下列调查中,适宜采用全面调查方式的是()A.了解某种灯泡的使用寿命B.了解一批冷饮的质量是否合格C.了解全国八年级学生的视力情况D.了解某班同学中哪个月份出生的人数最多【答案】D【解答】解:A、了解某种灯泡的使用寿命,适宜采用抽样调查方式,故此选项不符合题意;B、了解一批冷饮的质量是否合格,适宜采用抽样调查方式,故此选项不符合题意;C、了解全国八年级学生的视力情况,适宜采用抽样调查方式,故此选项不符合题意;D、了解某班同学中哪个月份出生的人数最多,适宜采用全面调查方式,故此选项符合题意;故选:D.【变式1-3】(2023•郴州)下列问题适合全面调查的是()A.调查市场上某品牌灯泡的使用寿命B.了解全市人民对湖南省第二届旅发大会的关注情况C.了解郴江河的水质情况D.神舟十六号飞船发射前对飞船仪器设备的检查【答案】D【解答】解:A.调查市场上某品牌灯泡的使用寿命,适合抽样调查,故选项不符合题意;B.了解全市人民对湖南省第二届旅发大会的关注情况,适合抽样调查,故选项不符合题意;C.了解郴江河的水质情况,适合抽样调查,故选项不符合题意;D.神舟十六号飞船发射前对飞船仪器设备的检查,适合全面调查,故选项符合题意;故选:D.【变式1-4】(2023•聊城)4月15日是全民国家安全教育日.某校为了摸清该校1500名师生的国家安全知识掌握情况,从中随机抽取了150名师生进行问卷调查.这项调查中的样本是()A.1500名师生的国家安全知识掌握情况B.150C.从中抽取的150名师生的国家安全知识掌握情况D.从中抽取的150名师生【答案】C【解答】解:样本是所抽取的150名师生的国家安全知识掌握情况.故选:C.【题型3:用各种统计图描述数据】【典例3】(2023•成都)文明是一座城市的名片,更是一座城市的底蕴.成都市某学校于细微处着眼,于贴心处落地,积极组织师生参加“创建全国文明典范城市志愿者服务”活动,其服务项目有“清洁卫生”“敬老服务”“文明宣传”“交通劝导”,每名参加志愿者服务的师生只参加其中一项.为了解各项目参与情况,该校随机调查了参加志愿者服务的部分师生,将调查结果绘制成如下两幅不完整的统计图.根据统计图信息,解答下列问题:(1)本次调查的师生共有300人,请补全条形统计图;(2)在扇形统计图中,求“敬老服务”对应的圆心角度数;(3)该校共有1500名师生,若有80%的师生参加志愿者服务,请你估计参加“文明宣传”项目的师生人数.【答案】(1)300,补全条形统计图见解答;(2)144°;(3)360名.【解答】解:(1)本次调查的师生共有:60÷20%=300(人),“文明宣传”的人数为:300﹣60﹣120﹣30=90(人),补全条形统计图如下:故答案为:300;(2)在扇形统计图中,“敬老服务”对应的圆心角度数为:360°×=144°;(3)1500×80%×=360(名),答:估计参加“文明宣传”项目的师生人数大约为360名.【变式3-1】(2023•扬州)空气的成分(除去水汽、杂质等)是:氮气约占78%,氧气约占21%,其他微量气体约占1%.要反映上述信息,宜采用的统计图是()A.条形统计图B.折线统计图C.扇形统计图D.频数分布直方图【答案】C【解答】解:氮气约占78%,氧气约占21%,其他微量气体约占1%.要反映上述信息,宜采用的统计图是扇形统计图.故选:C.【变式3-2】(2022•福建)2021年福建省的环境空气质量达标天数位居全国前列.如图是福建省10个地区环境空气质量综合指数统计图.综合指数越小,表示环境空气质量越好.依据综合指数,从图中可知环境空气质量最好的地区是()A.F1B.F6C.F7D.F10【答案】D【解答】解:根据题意可得,F10地区环境空气质量综合指数约为1.9,是10个地区中最小值.故选:D.【变式3-3】(2023•大连)2023年5月18日,《大连日报》公布《下一站,去博物馆!》问卷调查结果.本次调查共收回3666份有效问卷,其中将“您去博物馆最喜欢看什么?”这一问题的调查数据制成扇形统计图,如图所示.下列说法错误的是()A.最喜欢看“文物展品”的人数最多B.最喜欢看“文创产品”的人数占被调查人数的14.3%C.最喜欢看“布展设计”的人数超过500人D.统计图中“特效体验及其他”对应的圆心角是23.76°【答案】C【解答】解:由题意得:A.最喜欢看“文物展品”的人数最多,占58.25%,说法正确,故本选项不符合题意;B.最喜欢看“文创产品”的人数占被调查人数的14.3%,说法正确,故本选项不符合题意;C.最喜欢看“布展设计”的人数为:3666×9.82%≈360(人),原说法错误,故本选项符合题意;D.统计图中“特效体验及其他”对应的圆心角是:360°×6.6%=23.76°,说法正确,故本选项不符合题意.故选:C.【题型4:平均数】【典例4】(2023•湖州)某住宅小区6月1日~6月5日每天用水量情况如图所示,那么这5天平均每天的用水量是()A.25立方米B.30立方米C.32立方米D.35立方米【答案】B【解答】解:由折线图可知,该小区五天的用水量分别是:30、40、20、30、30.所以5天的平均用水量为:=30(立方米).故选:B.【变式4-1】(2023•镇江)一组数据:2、3、3、4、a,它们的平均数为3,则a为3.【答案】3.【解答】解:由题意(2+3+3+4+a)=3,∴a=3.故答案为:3.【变式4-2】(2023•长沙)睡眠管理作为“五项管理”中重要的内容之一,也是学校教育重点关注的内容.某老师了解到班上某位学生的5天睡眠时间(单位:小时)如下:10,9,10,8,8,则该学生这5天的平均睡眠时间是9小时.【答案】见试题解答内容【解答】解:(10+9+10+8+8)÷5=9(小时).即该学生这5天的平均睡眠时间是9小时.故答案为:9.【变式4-3】(2023•湘潭)某校组织青年教师教学竞赛活动,包含教学设计和现场教学展示两个方面.其中教学设计占20%,现场展示占80%.某参赛教师的教学设计90分,现场展示95分,则她的最后得分为()A.95分B.94分C.92.5分D.91分【答案】B【解答】解:由题意可得,90×20%+95×80%=94(分),即她的最后得分为94分,故选:B.【题型5:中位数与众数的计算】【典例5】(2023•甘孜州)在一次中学生田径运动会上,参加男子跳高的15名运动员的成绩如表所示.成绩/米 1.50 1.60 1.65 1.70 1.75人数23541这些运动员成绩的众数和中位数分别为()A.1.65米,1.65米B.1.65米,1.70米C.1.75米,1.65米D.1.50米,1.60米【答案】A【解答】解:由表可知1.65m出现次数最多,有5次,所以众数为1.65m,这15个数据最中间的数据是第8个,即1.65m,所以中位数为1.65m,故选:A.【变式5-1】(2023•达州)一组数据2,3,5,2,4,则这组数据的众数和中位数分别为()A.3和5B.2和5C.2和3D.3和2【答案】C【解答】解:数据从小到大排列为:2,2,3,4,5,所以中位数为3;数据2出现了2次,最多,所以这组数据的众数为2.故选:C.【变式5-2】(2023•黄石)我市某中学开展“经典诵读”比赛活动,810班在此次比赛中的得分分别是:9.1,9.8,9.1,9.2,9.9,9.1,9.9,9.1,这组数据的众数和中位数分别是()A.9.1,9.1B.9.1,9.15C.9.1,9.2D.9.9,9.2【答案】B【解答】解:将数据9.1,9.8,9.1,9.2,9.9,9.1,9.9,9.1按照从小到大排列是:9.1,9.1,9.1,9.1,9.2,9.8,9.9,9.9,则这组数据的众数是9.1,中位数是(9.1+9.2)÷2=9.15,故选:B.【变式5-3】(2023•黑龙江)已知一组数据1,0,﹣3,5,x,2,﹣3的平均数是1,则这组数据的众数是()A.﹣3B.5C.﹣3和5D.1和3【答案】C【解答】解:∵数据1,0,﹣3,5,x,2,﹣3的平均数是1,∴1+0﹣3+5+x+2﹣3=7×1,解得x=5,则这组数据为1,0,﹣3,5,5,2,﹣3,∴这组数据的众数为﹣3和5,故选:C.【变式5-4】(2023•盘锦)为了解全市中学生的视力情况,随机抽取某校50名学生的视力情况作为其中一个样本,整理样本数据如图.则这50名学生视力情况的中位数和众数分别是()A.4.8,4.8B.13,13C.4.7,13D.13,4.8【答案】A【解答】解:把这50名学生视力情况从小到大排列,排在中间的两个数分别是4.8、4.8,故中位数为=4.8;在这50名学生视力情况中,4.8出现的次数最多,故众数为4.8.故选:A.【题型6:方差】【典例6】(2023•广西)甲、乙、丙、丁四名同学参加立定跳远训练,他们成绩的平均数相同,方差如下:S甲2=2.1,S乙2=3.5,S丙2=9,S丁2=0.7,则成绩最稳定的是()A.甲B.乙C.丙D.丁【答案】D【解答】解:∵,,,,∴丁的方差最小,∴成绩最稳定的是丁,故选:D.【变式6-1】(2023•眉山)已知一组数据为2,3,4,5,6,则该组数据的方差为()A.2B.4C.6D.10【答案】A【解答】解:=×(2+3+4+5+6)=4,s2=×[(2﹣4)2+(3﹣4)2+(4﹣4)2+(5﹣4)2+(6﹣4)2]=2.故选:A.【变式6-2】(2023•朝阳)某校在甲、乙、丙、丁四名同学中选中一人参加今年5月份举办的教育系统文艺展演独唱大赛,经过三轮初赛,他们的平均成绩都是88.5分,方差分别是s甲2=1.5,s乙2=2.6,s丙2=1.7,s丁2=2.8,则这四名同学独唱成绩最稳定的是甲.【答案】甲.【解答】解:∵S甲2=1.5,S乙2=2.6,S丙2=1.7,S丁2=2.8,∴S甲2<S丙2<S乙2<S丁2,∴在平均成绩相等的情况下,这四名同学独唱成绩最稳定的是甲.故答案为:甲.【变式6-3】(2023•凉山州)若一组数据x1,x2,x3,…,x n的方差为2,则数据x1+3,x2+3,x3+3,…,x n+3的方差是()A.2B.5C.6D.11【答案】A【解答】解:设一组数据x1,x2,x3,…,x n的平均数为,则方差为[...+]=2,∴数据x1+3,x2+3,x3+3,…,x n+3的平均数为(+3),方差为[+...+]=[...+]=2.故选:A.一.选择题(共9小题)1.为了了解2015年我县九年级学生学业水平考试的数学成绩,从中随机抽取了1000名学生的数学成绩,下列说法正确的是()A.2015年我县九年级学生是总体B.样本容量是1000C.1000名九年级学生是总体的一个样本D.每一名九年级学生是个体【答案】B【解答】解:A、2015年我县九年级学生是总体,说法错误,应为2015年我县九年级学生学业水平考试的数学成绩是总体,故此选项错误;B、样本容量是1000,说法正确,故此选项正确;C、1000名九年级学生是总体的一个样本,说法错误,应为1000名九年级学生学业水平考试的数学成绩是总体的一个样本,故此选项错误;D、每一名九年级学生是个体,说法错误,应为每一名九年级学生学业水平考试的数学成绩是个体,故此选项错误;故选:B.2.从全市5000份数学试卷中随机抽取400份试卷,其中360份成绩合格,那么可以估计全市数学成绩合格的学生大约有多少人?()A.4500B.4000C.3600D.4800【答案】A【解答】解:5000×=4500(人).故选:A.3.小东5分钟内共投篮60次,共进球15个,则小东进球的频率是()A.0.25B.60C.0.26D.15【答案】A【解答】解:∵小东5分钟内共投篮60次,共进球15个,∴小东进球的频率是:=0.25.故选:A.4.学校食堂午餐供应6元、8元和10元三种价格的盒饭,如图是食堂某月销售三种午餐盒饭数量的统计图,则该月食堂销售午餐盒饭的平均价格为()A.7.9元B.8元C.8.9元D.9.2元【答案】C【解答】解:10×60%+8×25%+6×15%=6+2+0.9=8.9(元).故该月食堂销售午餐盒饭的平均价格为8.9元.故选:C.5.下列调查中,最适合采用全面调查(普查)的是()A.调查全国中小学生对第二次太空授课的满意度B.调查全国人民,掌握新冠防疫知识情况C.了解某类型医用口罩的质量D.检查神舟飞船十三号的各零部件【答案】D【解答】解:A.调查全国中小学生对第二次太空授课的满意度,适合抽样调查,故本选项不符合题意;B.调查全国人民,掌握新冠防疫知识情况,适合抽样调查,故本选项不符合题意;C.了解某类型医用口罩的质量,适合抽样调查,故本选项不符合题意;D.检查神舟飞船十三号的各零部件,事件重大,适合全面调查,故本选项符合题意.故选:D.6.一组数据2,1,4,x,6的平均值是4,则x的值为()A.3B.5C.6D.7【答案】D【解答】解:∵一组数据2,1,4,x,6的平均值是4,∴(2+1+4+x+6)÷5=4,解得x=7,故选:D.7.小雨同学参加了学校举办的“抗击疫情,你我同行”主题演讲比赛,她的演讲内容、语言表达和形象风度三项得分分别为80分,90分,85分,若这三项依次按照50%,30%,20%的百分比确定成绩,则她的成绩是()A.82分B.83分C.84分D.85分【答案】C【解答】解:根据题意得:80×50%+90×30%+85×20%=40+27+17=84(分).故选:C.8.某车间20名工人日加工零件数如表所示:日加工零件数45678人数26543这些工人日加工零件数的众数、中位数分别是()A.5、6B.5、5C.6、5D.6、6【答案】A【解答】解:因为5出现的次数最多,所以众数是5,将这组数据按从小到大进行排序后,第9个数和第10个数的平均数即为中位数,所以中位数是,故选:A.9.某鞋店在做市场调查时,为了提高销售量,商家最应关注鞋子型号的()A.众数B.平均数C.中位数D.极差【答案】A【解答】解:由于众数是数据中出现最多的数,故鞋业销售商最关注的是销售量最多的鞋号即众数.故选:A.二.填空题(共6小题)10.要统计某城市2021年1﹣12月的天气变化情况,选择折线统计图较好.【答案】折线.【解答】解:要统计某城市2021年1﹣12月的天气变化情况,选择折线统计图较好.故答案为:折线.11.有60个数据,共分成4组,第1、2组的频数分别为25,19,第4组的频率是0.15,则第3组的频数是7.【答案】7.【解答】解:∵有60个数据,共分成4组,第4组的频率是0.15,∴第4组的频数是:60×0.15=9,故第3组的频数是:60﹣25﹣19﹣9=7.故答案为:7.12.如图是某同学6次数学测验成绩的折线统计图,则该同学这6次成绩的最低分是60分.【答案】60.【解答】解:由折线统计图得,该同学这6次成绩的最低分是60分.故答案为:60.13.跳高训练时,甲、乙两名同学在相同条件下各跳了10次,统计他们的平均成绩都是1.36米,且方差为S2甲=0.4,S2乙=0.3,则成绩较为稳定的是乙(填“甲”或“乙”).【答案】见试题解答内容【解答】解:∵S2甲=0.4,S2乙=0.3,∴S2甲>,S2乙,∴乙同学的成绩较为稳定.故答案为乙.14.某班学生参加学校组织的“垃圾分类”知识竞赛,将学生成绩制成如图所示的频数分布直方图(每组数据包括左端值不包括右端值),其中成绩为“优良”(80分及80分以上)的学生有26人.【答案】见试题解答内容【解答】解:由图象可得,成绩为“优良”(80分及80分以上)的学生有:14+12=26(人),故答案为:26.15.一个容量为100的样本,最大值为142,最小值是60,取组距为10,则可以分为9组.【答案】9.【解答】解:(142﹣60)÷10=8余2,所以分成9组,故答案为:9.三.解答题(共2小题)16.为落实“双减”政策,某校利用课后服务开展了“书香校园”的读书活动,活动中,为了解学生对书籍种类(A:艺术类,B:科技类,C:文学类,D:体育类)的喜欢情况,在全校范围内随机抽取若干名学生,进行问卷调查(每个被调查的学生必须选择而且只能在这四种类型中选择一项)将数据进行整理并绘制成两幅不完整的统计图.(1)这次调查中,一共调查了200名学生;(2)在扇形统计图中,“D”部分所对应的圆心角的度数为54度;并补全条形统计图.(3)若全校有4800名学生,请估计喜欢B(科技类)的学生有多少名?【答案】(1)200名;(2)54°;补全条形统计图见解答;(3)1680名.【解答】解:(1)40÷20%=200(名),故答案为:200;(2)D所占百分比为×100%=15%,扇形统计图中“D”所在扇形的圆心角的度数为:360°×15%=54°,C的人数是:200×30%=60(名),补图如下:故答案为:54;(3)4800×=1680(名),答:估计喜欢B(科技类)的学生有1680名.17.某地旅游部门为了促进本地生态特色城镇和新农村建设,将甲、乙,丙三家民宿的相关资料放到某网络平台上进行推广宣传.该平台邀请部分曾在这三家民宿体验过的游客参与调查,得到了这三家民宿的“综合满意度”评分,评分越高表明游客体验越好,现从这三家民宿“综合满意度”的评分中各随机抽取10个评分数据,并对所得数据进行整理、描述和分析,下面给出了部分信息.a.甲、乙两家民宿“综合满意度”评分的折线图:b.丙家民宿“综合满意度”评分:2.6,4.7,4.5,5.0,4.5,4.8,4.5,3.8,4.5,3.1c.甲、乙、丙三家民宿“综合满意度”评分的平均数、中位数:甲乙丙平均数m 4.5 4.2中位数 4.5 4.7n根据以上信息,回答下列问题:(1)表中m的值是 4.5,n的值是 4.5;(2)设甲、乙、丙三家民宿“综合满意度”评分的方差分别是s甲2,s乙2,s丙2,直接写出s甲2,s乙2,s丙2之间的大小关系;(3)根据“综合满意度”的评分情况,该平台打算将甲、乙、丙三家民宿中的一家置顶推荐,你认为该平台会将这三家民宿中的哪家置顶推荐?说明理由(至少从两个方面说明).【答案】(1)4.5,4.5;(2)<;(3)推荐乙,理由:乙的方差最小,数据稳定,平均分比丙高.【解答】解:(1)甲家民宿“综合满意度”评分:3.2,4.2,5.0,4.5,5.0,4.9,4.5,4.2,5.0,4.5,∴m=(3.2+4.2+5.0+4.5+5.0+4.9+4.5+4.2+5.0+4.5)=4.5,丙家民宿“综合满意度”评分:2.6,4.7,4.5,5.0,4.5,4.8,4.5,3.8,4.5,3.1,从小到大排列为:2.6.3.1.3.8.4.5.4.5.4.5.4.5.4.7.4.8.5.∴中位数n==4.5,故答案为:4.5,4.5;(2)根据折线统计图可知,乙的评分数据在4分与5分之间波动,甲的数据在3.2分和5分之间波动,根据丙的数据可以在2.6至5分之间波动,∴<;(3)推荐乙,理由:乙的方差最小,数据稳定,平均分比丙高,答案不唯一,合理即可.一.选择题(共11小题)1.今年3月份某校举行学雷锋志愿服务活动,为了解全校学生一周学雷锋志愿服务的次数,随机抽取了50名学生进行调查,依据调查结果绘制了如图所示的折线统计图,下列关于该校学生一周学雷峰志愿服务次数说法正确的是()A.众数是5B.中位数是7C.中位数是9D.众数是13【答案】A【解答】解:因为5出现了13次,出现的次数最多,所以该校一周学雷峰志愿服务次数的众数是5;该校一周学雷峰志愿服务次数最中间的两个数字都为6,所以该组数据的中位数为6;故选项A正确,符合题意.故选:A.2.如图是甲、乙两名射击运动员10次射击成绩的折线统计图,记甲10次成绩的方差为S,乙10次成绩的方差为S,根据折线图判断下列结论中正确的是()A.S>S B.S<SC.S=S D.无法判断【答案】A【解答】解:由折线统计图得乙运动员的成绩波动较大,所以S>S.故选:A.3.某次数学测试,抽取部分同学的成绩(得分为整数),整理制成如图所示的频数分布直方图,根据图示信息,下列对这次数学测试描述不正确的是()A.本次抽查了50名学生的成绩B.估计测试及格率(60分以上为及格)为92%C.抽取学生的成绩的中位数落在第三组D.抽取学生的成绩的众数是第三组的数【答案】D【解答】解:本次抽取的学生人数为4+10+18+12+6=50(人),则选项A正确,不符合题意;估计测试及格率(6(0分)以上为及格)为,则选项B正确,不符合题意;将抽取学生的成绩从小到大进行排序后,第25个数和第26个数的平均数即为中位数,∵4+10=14<25,4+10+18=32>26,∴抽取学生的成绩的中位数落在第三组,选项C正确,不符合题意;因为不能确定出现次数最多的数在哪一组,所以抽取学生的成绩的众数不一定是第三组的数,选项D不正确,不符合题意;故选:D.4.如图,是九(1)班45名同学每周课外阅读时间的频数分布直方图(每组含前一个边界值,不含后一个边界值),由图可知,每周课外阅读时间不小于6小时的人数是()A.6人B.8人C.14人D.36人【答案】C【解答】解:由频数分布直方图知,每周课外阅读时间不小于6小时的人数是8+6=14(人),故选:C.5.为了解某市九年级男生的身高情况,随机抽取了该市100名九年级男生,他们的身高x(cm)统计如下:组别(cm)x≤160160<x≤170170<x≤180x>180人数1542385根据以上结果,全市约有3万名男生,估计全市男生的身高不高于180cm的人数是()A.28500B.17100C.10800D.1500【答案】A【解答】解:估计全市男生的身高不高于180cm 的人数是30000×=28500(名),故选:A .6.一个不透明的盒子中装有10个小球(白色或黑色),它们除了颜色外其余都相同,每次摸球试验前,都将盒子中的小球摇匀,随机摸出一个球记下颜色后再放回盒中,如表是一组统计数据:摸球次数(n )50100150200250300500摸到白球的次数(m )286078104123152251摸到白球的频率(m /n )0.560.600.520.520.490.510.50由表可以推算出盒子白色小球的个数是()A .4个B .5个C .6个D .7个【答案】B【解答】解:∵通过大量重复试验后发现,摸到白球的频率稳定于0.5,∴10×0.5=5,即白色小球的个数是5个.故选:B .7.一组数据:3,4,4,5,如果再添加一个数据4,那么会发生变化的统计量是()A .平均数B .中位数C .众数D .方差【答案】D【解答】解:原数据的3,4,5,4的平均数为=4,中位数为4,众数为4,方差为×[(3﹣4)2+(4﹣4)2×2+(5﹣4)2]=0.5;新数据3,4,4,4,5的平均数为=4,中位数为4,众数为4,方差为×[(3﹣4)2+(4﹣4)2×3+(5﹣4)2]=0.4;故选:D.8.如图,在“经典诵读”比赛活动中,某校10名学生参赛成绩如图所示,对于这10名学生的参赛成绩,下列说法错误的是()A.众数是90分B.方差是10C.平均数是91分D.中位数是90分【答案】B【解答】解:∵90出现了5次,出现的次数最多,∴众数是90;故A正确;∵共有10个数,∴中位数是第5、6个数的平均数,∴中位数是(90+90)÷2=90;故D正确;∵平均数是(85×2+100×1+90×5+95×2)÷10=91;故C正确;方差是:×(90﹣91)2+(100﹣91)2]=19≠10;故B错误.综上所述,B选项符合题意,故选:B.9.已知5个正数a1,a2,a3,a4,a5的平均数是a,且a1>a2>a3>a4>a5,则数据:a1,a2,a3,0,a4,a5的平均数和中位数是()A.a,a3B.a,C.,D.,【答案】D【解答】解:由平均数定义可知:,因为a1,a2,a3,a4,a5是5个正数,且a1>a2>a3>a4>a5,所以将这组数据按从小到大排列为0,a5,a4,a3,a2,a1,由于有偶数个数,取最中间两个数的平均数,∴其中位数为,故选:D.10.超市里五种型号的书包价格分别为50,60,80,90,110(单位:元),降价促销后,每种型号书包价格都降了10元.降价前的五个数据与降价后的五个数据相比,不变的是()A.众数B.中位数C.方差D.平均数【答案】C【解答】解:降价前书包价格分别为50,60,80,90,110,中位数是80,平均数是=78,方差是×[(78﹣50)2+(78﹣60)2+(78﹣80)2+(78﹣90)2+(78﹣110)2]=456,没有众数,降价后书包价格分别为40,50,70,80,100,中位数是70,。
专题03 统计(知识点串讲)解析版
知识网络重难点突破知识点一 简单随机抽样(1)定义:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:抽签法和随机数法.(注:以下是随机数表的第8行和第9行)第8行:63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 第9行:33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 【答案】38【变式训练1-1】、 (江苏省连云港一中2019届模拟)利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )A.14 B.13 C.514 D.1027【答案】C【解析】根据题意,9n -1=13,解得n =28.故在整个抽样过程中每个个体被抽到的概率为1028=514.知识点二 分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. (2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.【答案】18【解析】因为样本容量n =60,样本总体N =200+400+300+100=1 000,所以抽取比例为n N =601 000=350.,因此应从丙种型号的产品中抽取300×350=18(件)。
【变式训练2-1】、(南京联合体学校2019届调研)为检验某校高一年级学生的身高情况,现采用先分层抽样后简单随机抽样的方法,抽取一个容量为210的样本,已知每个学生被抽到的概率为0.3,且男女生的比是4∶3,则该校高一年级女生的人数是________. 【答案】300【解析】抽取的高一年级女生的人数为210×37=90,则该校高一年级女生的人数为90÷0.3=300.知识点三 系统抽样(1)定义:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样. (2)系统抽样的操作步骤假设要从容量为N 的总体中抽取容量为n 的样本.A.73B.78C.77D.76【答案】B【答案】3知识点四 用样本的频率估计总体的频率(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率.1.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例4. (浙江省绍兴一中2019届期中)某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45B.50C.55D.60 【答案】B【解析】由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n =150.3=50.【变式训练4-1】、(广东省佛山一中2019届期中)对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________. 【答案】(1)0.04 (2)440【解析】设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h +0.07+0.06+0.02)=1,解得h =0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.知识点五 用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a nn称为a 1,a 2,…,a n 这n个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是 s =1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. 例5. (广西省贵港一中2019届模拟)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105) [105,115)[115,125]频数62638228(1)作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);【解析】(1)样本数据的频率分布直方图如图所示:(2)质量指标值的样本平均数为x -=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100. 质量指标值的样本方差为s 2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104. 所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104. (3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【变式训练5-1】、(山西太原五中2019届模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x ;(2)求抽取的x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想. 【解析】(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x=0.05,∴x =120. (2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5,∴a =953≈32,则中位数为32.(3)(ⅰ)5个年龄组成绩的平均数为x -1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x -2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可). 知识点六 线性回归分析 1、 相关关系与回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.2、线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:()()()1122,,,,,,n n x y x y x y ,其回归方程为a bx y +=∧,则1221,.ni i i ni i x y nx y b x nx a y bx ==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑注意:线性回归直线经过定点(),x y .(3)相关系数:()()nii xx y y r --=∑ni ix y nxy-=∑3、 回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心:对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x -,y -)称为样本点的中心. (3)相关系数当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.(4)相关指数:R 2=1-∑n i =1(y i -y ^i )2∑ni =1(y i -y -)2.其中∑n i =1(y i -y ^i )2是残差平方和,其值越小,则R 2越大(接近1),模型的拟合效果越好.例6、(衡水中学2019届调研)已知变量x ,y 之间的线性回归方程为y ^=-0.7x +10.3,且变量x ,y 之间的一组相关数据如下表所示,则下列说法错误的是( )A.变量x ,y 之间呈负相关关系B.可以预测,当x =20时,y ^=-3.7 C.m =4D.该回归直线必过点(9,4) 【答案】C【解析】由-0.7<0,得变量x ,y 之间呈负相关关系,故A 正确;当x =20时,y ^=-0.7×20+10.3=-3.7,故B 正确;由表格数据可知x -=14×(6+8+10+12)=9,y -=14(6+m +3+2)=11+m 4,则11+m 4=-0.7×9+10.3,解得m =5,故C 错;由m =5,得y -=6+5+3+24=4,所以该回归直线必过点(9,4),故D 正确.故选C. 【变式训练6-1】、(四川省绵阳中学2019届期中)调查某公司的五名推销员,其工作年限与年推销金额如下表:推销员 A B C D E 工作年限x (年)23 5 7 8 年推销金额y (万元) 33.546.58(1)在图中画出年推销金额关于工作年限的散点图,并从散点图中发现工作年限与年推销金额之间关系的一般规律;(2)利用最小二乘法求年推销金额关于工作年限的回归直线方程; (3)利用(2)中的回归方程,预测工作年限为10年的推销员的年推销金额. 附:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2,a ^=y --b ^x -. 【解析】(1)年推销金额关于工作年限的散点图如图:从散点图可以看出,各点散布在从左下角到右上角的区域里,因此, 工作年限与年推销金额正相关,即工作年限越长,年推销金额越大.(2)由表中数据可得:x -=15×(2+3+5+7+8)=5,y -=15×(3+3.5+4+6.5+8)=5,b ^=∑ni =1(x i -x -)(y i -y -)∑n i =1(x i -x -)2=(-3)×(-2)+(-2)×(-1.5)+0+2×1.5+3×39+4+0+4+9=2126, a ^=y --b ^x -=5-2126×5=2526,∴年推销金额关于工作年限的回归直线方程为y ^=2126x +2526.(3)当x =10时,y ^=2126×10+2526=23526,∴预测工作年限为10年的推销员的年推销金额为23526万元.。
高中数学第九章统计之统计分析案例(精讲)(必修第二册)(教师版含解析)
9.3 统计分析案例(精讲)考法一数据分析【例1】(多选)(2021·福建泉州市·高三其他模拟)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述正确的有( )A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个【答案】ABC【解析】对于选项A,由图易知各月的平均最低气温都在0℃以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10℃,所以C正确;对于选项D,平均最高气温高于20℃的月份有七月、八月,共2个月份,故D错误.故选:ABC.【举一反三】1.(多选)(2020·全国专题练习)某装修公司为了解客户对照明系统的需求,对照明系统的两种设计方明系统评分面达图案在稳固性、创新性、外观造型、做工用料以及成本五个方面的满意度评分进行统计,根据常见考法统计结果绘制出如图所示的雷达图,则下列说法错误的是( )A.客户对两种设计方案在外观造型上没有分歧B.客户对设计一的满意度的总得分高于设计二的满意度的总得分C.客户对设计二在创新性方面的满意度高于设计一在创新性方面的满意度D.客户对两种设计方案在稳固性和做工用料方面的满意度相同【答案】ACD【解析】根据雷达图可列表如下:评分类别稳固性创新性外观造型做工用料成本设计一得分8分8分8分10分10分设计二得分8分8分10分8分9分根据表格分析可得A、C、D错误,选项B正确.故选:ACD.2.(多选)(2020·全国专题练习)如图是某公司2018年1月至12月空调销售任务及完成情况的统计图,如10月份销售任务是400台,完成率为90%,下列叙述正确的是( )A .2018年3月的销售任务是400台 B .2018年月销售任务的平均值不超过600台 C .2018年总销售量为4870台 D .2018年月销售量最大的是6月份 【答案】ABC【解析】由题图可知选项A 正确; 2018年月销售任务的平均值为10020033003400500700800100045060012++⨯+⨯++++=<,故选项B 正确;2018年总销售量为1000.82001300(0.5 1.50.6)400(1.20.90.9)500 1.17000.8⨯+⨯+⨯+++⨯+++⨯+⨯800110000.74870+⨯+⨯=,故选项C 正确;2018年月销售量最大的是5月份,为800台,故选项D 不正确. 故选:ABC3.(多选)(2020·湖南永州市)某地区城乡居民储蓄存款年底余额(单位:亿元)变化情况如图所示,下列判断一定正确的是()A .该地区城乡居民储蓄存款年底余额总数逐年上升B.到2019年农村居民存款年底总余额已超过了城镇居民存款年底总余额C.城镇居民存款年底余额逐年下降D.2017年城乡居民存款年底余额增长率大约为225%【答案】AD【解析】由条形图可知,余额总数逐年上升,故A项正确;由城乡储蓄构成百分比可知,2019年农村居民存款年底总余额占36.1%,城镇居民存款年底总余额占63.9%,没有超过,故B项错误;城镇居民存款年底余额所占的比重逐年下降,但城镇居民存款年底余额2014年,2017年,2019年分别为6.8198(亿元),155.085(亿元),973.197(亿元),总体不是逐年下降的,故C项错误,2017年城乡居民存款年底余额增长率大约为21165225%65-≈,故D项正确.故选:AD.考法二统计案例运用【例2】(2020·全国高一专题练习)某制造商3月生产了一批乒乓球,随机抽样100个进行检查,测得每个球的直径(单位:mm),将数据分组如下表分组频数频率)39953997,,,⎡⎣10)39973999⎡⎣,,,20)39994001⎡⎣,,,50[]40014003,,,20合计100(1)请在上表中补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值(例如区间[)39.9940.01,的中点值是40.00作为代表.据此估计这批乒乓球直径的平均值(结果保留两位小数). 【答案】(1)见解析;(2) 40.00(mm) 【解析】(1)频率分布表如下:分组频数频率频率组距[39.95,39.97)10 0.10 5 [39.97,39.99)20 0.20 10 [39.99,40.01)50 0.50 25 [40.01,40.03] 20 0.20 10 合计 1001注:频率分布表可不要最后一列,这里列出,只是为画频率分布直方图方便. 频率分布直方图如下:(2)整体数据的平均值约为39.96×0.10+39.98×0.20+40.00×0.50+40.02×0.20≈40.00(mm). 【举一反三】1.(2020·全国高一课时练习)深夜,一辆出租车被牵涉进一起交通事故,该市有两家出租车公司——红色出租车公司和蓝色出租车公司,其中蓝色出租车公司和红色出租车公司分别占整个城市出租车的85%和15%.据现场目击证人说,事故现场的出租车是红色的,并对证人的辨别能力进行了测试,测得他辨认的正确率为80%,于是警察就认定红色出租车具有较大的肇事嫌疑.请问警察的认定对红色出租车公平吗?试说明理由.【答案】不公平的.【解析】设城市的出租车有1000辆,那么依题意可得如下信息:从表中可以看出,当证人说出租车是红色的,它确定是红色的概率为1200.41290≈,而它是蓝色的概率为1700.59290≈,在实际数据面前,作为警察以证人的证词作为推断的依据,对红色出租车来说显然是不公平的.2.某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了M名学生进行检测,实行百分制,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100)分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.分组 频数 频率 [40,50)[50,60) 25p[60,70)s0.30[70,80) mn[80,90)100.10[90,100]合计M1(1)求出表中,M p 及图中a 的值;(2)估计该校学生阅读素养的成绩中位数以及平均数. 【答案】(1)100,0.25,0.02M p a ===;(2)中位数是2003,平均数是68.5. 【解析】(1)由频率统计表可知:101000.1M ==,250.25100p ∴== 由频率分布直方图可知:(0.0050.0250.030.010.01)101a +++++⨯=,解得0.02a = (2)∵前两组的频率和为0.050.250.30.5+=<,前三组的频率和为0.050.250.30.60.5++=> ∴中位数在[60,70)内,设中位数为x ,则0.050.25(60)0.030.5x ++-⨯=,解得2003x =,即中位数为2003. 平均数为450.05550.25650.3750.2850.1950.168.5⨯+⨯+⨯+⨯+⨯+⨯= ∴估计该校学生阅读素养的成绩中位数是2003,平均数是68.5.。
统计基础知识ppt课件
目录
• 统计概述 • 描述性统计方法 • 概率论基础 • 推断性统计方法 • 方差分析与回归分析 • 时间序列分析与预测 • 统计软件应用与实例分析
01
统计概述
统计定义与作用
统计定义
统计是收集、整理、分析和解释数据 ,以揭示其数量特征和规律性的科学 。
统计作用
统计在各个领域都有广泛应用,如经 济、社会、医学、环境等。通过统计 ,我们可以更好地了解事物的数量特 征和规律,为决策提供依据。
演示如何对数据进行编码、转换 和标准化等预处理操作,以便进
行后续的统计分析。
基于实例数据的描述性统计结果展示
01
集中趋势度量
计算并展示实例数据的均值、中 位数和众数等集中趋势指标。
03
分布形态描述
通过绘制直方图、箱线图等图形 ,直观展示实例数据的分布形态
。
02
离散程度度量
计算并展示实例数据的标准差、 方差和四分位距等离散程度指标
03
概率论基础
事件与概率概念
事件定义与分类
事件是在一定条件下,所关心的某种 结果或某种现象的发生。根据事件之 间的关系,可以将其分为互斥事件、 对立事件、独立事件等。
概率定义与性质
古典概型与几何概型
古典概型是指具有有限个可能结果的 概率模型,几何概型是指具有无限多 个可能结果,且每个结果发生的可能 性相等的概率模型。
对模型进行检验和评估,确定 模型有效性
利用模型进行长期趋势预测并 输出结果
07
统计软件应用与实例 分析
常用统计软件介绍及功能比较
01
02
03
04
SPSS
适合社会科学领域的数据分析 ,提供丰富的统计方法和图形
统计(5大易错点分析+解题模板+举一反三+易错题通关)(新高考专用)(原卷版)
专题13统计易错点一:统计用表中概念不清、识图不准致误(频率分布直方图、总体取值规律)频率分布直方图作频率分布直方图的步骤①求极差:极差为一组数据中最大值与最小值的差.②决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.③将数据分组④列频率分布表各小组的频率=小组频数样本容量.⑤画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×频率组距=频率.频率分布直方图的性质①因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.②在频率分布直方图中,各小矩形的面积之和等于1.③频数相应的频率=样本容量.④频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.易错提醒:频率分布条形图和频率分布直方图是两个完全不同的概念,考生应注意两者之间的区别.虽然它们的横轴表示的内容是相同的,但是频率分布条形图的纵轴表示频率;频率分布直方图的纵轴表示频率与组距的比值,其各小组的频率等于该小组上的矩形的面积.例:如图所示是某公司(共有员工300人)2021年员工年薪情况的频率分布直方图,由此可知,员工中年薪在1.4万元~1.6万元之间的共有______人.易错分析:解本题容易出现的错误是审题不细,对所给图形观察不细心,认为员工中年薪在1.4万元~1.6万元之间的频率为()10.020.080.1020.60-++⨯=,从而得到员工中年薪在1.4万元~1.6万元之间的共有3000.60180⨯=(人)的错误结论.正解:由所给图形,可知员工中年薪在1.4万元~1.6万元之间的频率为()10.020.080.080.100.1020.24-++++⨯=,所以员工中年薪在1.4万元~1.6万元之间的共有3000.2472⨯=(人).故72.易错警示:考生误认为频率分布直方图中纵轴表示的是频率,这是错误的,而是“频率/组距”,所以频率对应的是各矩形的面积.变式1:某大学有男生2000名.为了解该校男生的身体体重情况,随机抽查了该校100名男生的体重,并将这100名男生的体重(单位:kg )分成以下六组:[)54,58、[)58,62、[)62,66、[)66,70、[)70,74、[]74,78,绘制成如下的频率分布直方图:70,78上的男生大约有人.该校体重(单位:kg)在区间[]变式2:现对某类文物进行某种物性指标检测,从1000件中随机抽取了200件,测量物性指标值,得到如下频率分布直方图,据此估计这1000件文物中物性指标值不小于95的件数为.变式3:如图是根据我国部分城市某年6月份的平均气温数据得到的样本频率分布直方图,其中平均气温的范围是[20,26],样本数据的分组为[20,21),[21,22),[22,23),[23,24),[24,25),[25,26].已知样本中平均气温低于22°C的城市个数为11,样本中平均气温不低于25°C的城市个数是.1.已知某班全体学生在某次数学考试中的成绩(单位:分)的频率分布直方图如图所示,则图中a所代表的数值是.2.某校共有400名学生参加了趣味知识竞赛(满分:这400名学生的竞赛成绩分组如下:分布直方图如图所示,则这400名学生中竞赛成绩不低于3.从某小学所有学生中随机抽取100名学生,将他们的身高(单位:图),其中样本数据分组[100,110),[110,120),[120,130),[130,140),[140,150)4.某工厂抽取100件产品测其重量(单位:[[[[,42],据此绘制出如图所示的频率分布直方图,则重量在40,40.5),40.5,41),41,41.5),41.5件数为.5.某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c ,将该指标大于c 的人判定为阳性,小于或等于定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为()p c ;误诊率是将未患病者判定为阳性的概率,记为()q c .假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.设函数()()()f c p c q c =+,则函数()f c 在区间[95,105]取得最小值时c =.6.某大学有男生10000名.为了解该校男生的身体体重情况,随机抽查了该校100100名男生的体重(单位:kg )分成以下六组:[)54,58、[)58,62、[)62,66、[66,70kg []7.某中学为了解高三男生的体能情况,通过随机抽样,获得了秒),将数据按照[)11.5,12,[)12,12.5,…8.某工厂对一批产品的长度(单位:mm)进行检验,将抽查的产品所得数据分为五组,整理后得到的频率分布直方图如图所示,若长度在20mm以下的产品有30个,9.某中学为了解学生的数学学习情况,在全体学生中随机抽取30,40成绩,将所得的数据分为7组:[)图,则在被抽取的学生中,该次数学考试成绩不低于10.某区为了解全区12000名高二学生的体能素质情况,测试,并将这1000名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,这平均成绩的估计值为.11.将一个容量为100的样本数据,按照从小到大的顺序分为组号123456频数10161815若第6组的频率是第3组频率的12.节约用水是中华民族的传统美德,某市政府希望在本市试行居民生活用水定额管理,即确定一个合理易错点二:统计中的数字特征的实际意义理解不清楚致误(频率分布直方图特征数考查)众数、中位数、平均数①众数:一组数据中出现次数最多的数.②中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.③平均数:如果n个数x1,x2,…,x n,那么()∑==+++=niinxnxxxnx12111叫做这n个数的平均数.总体集中趋势的估计①平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.②一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.频率分布直方图中平均数、中位数、众数的求法①样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.②在频率分布直方图中,中位数左边和右边的直方图的面积应相等.③将最高小矩形所在的区间中点作为众数的估计值.易错提醒:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例.某班50名学生期中考试数学成绩的频率分布直方图如图所示.根据频率分布直方图,估计该班本次测试众数为.变式1:为响应自己城市倡导的低碳出行,小李上班可以选择自行车,他记录了100次骑车所用时间(单位:分钟),得到频率分布直方图,则骑车时间的众数的估计值是分钟变式2:数学兴趣小组的四名同学各自抛掷骰子5次,分别记录每次骰子出现的点数,四名同学的部分统计结果如下:甲同学:中位数为3,方差为2.8;乙同学:平均数为3.4,方差为1.04;丙同学:中位数为3,众数为3;丁同学:平均数为3,中位数为2.根据统计结果,数据中肯定没有出现点数6的是同学.变式3:以下5个命题中真命题的序号有.①样本数据的数字特征中,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息;②若数据1x ,2x ,3x ,…,n x 的标准差为S ,则数据1ax b +,2ax b +,3ax b +,…,n ax b +的标准差为aS ;③将二进制数(2)11001000转化成十进制数是200;④x 是区间[0,5]内任意一个整数,则满足“3x <”的概率是35.1.2022年11月卡塔尔世界杯如期举行,这是世界足球的一场盛宴.为了了解全民对足球的热爱程度,组委会在某场比赛结束后,随机抽取了1000名观众进行对足球“喜爱度”的调查评分,将得到的分数分成6段:[)70,75,[)75,80,[)80,85,[)85,90,[)90,95,[]95,100,得到如图所示的频率分布直方图.图中部分数据丢失,若已知这1000名观众评分的中位数估计值为87.5,则m=.2.为了普及环保知识,增强环保意识,某中学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为e m ,众数为o m ,平均数为x ,则,,e o m m x 的大小关系是.3.《中国居民膳食指南(2022)》数据显示,学生的体重情况,某机构从该地中学生中随机抽取数据,按[)40,45,[)45,50,[50,55所示.根据调查的数据,估计该地中学生体重的中位数是4.为了解某校高三学生的数学成绩,随机地抽查了该校布直方图如图所示.请根据以上信息,估计该校高三学生数学成绩的中位数为两位)5.2021年某省高考体育百米测试中,成绩全部介于按如下方式分成六组:第一组[12,13该100名考生的成绩的中位数(保留一位小数)是6.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值分别为.7.某快递驿站统计了近期每天代收快件的数量,并制成如下图所示的频率分布直方图.则该快递驿站每天代收包裹数量的中位数为8.某质检部门对某新产品的质量指标随机抽取10.某大学天文台随机调查了该校100位天文爱好者的年龄,得到如下样本数据频率分布直方图,则估计该校100名天文爱好者的平均岁数为.11.众数、平均数和中位数都描述了数据的集中趋势,、、分别表示众数、平均数、形态中,m n p12.如图为某工厂工人生产能力频率分布直方图,则估计此工厂工人生产能力的平均值为易错点三:运用数字特征作评价时考虑不周(方差、标准差的求算)方差、标准差①假设一组数据为n x x x x ,,,321,则这组数据的平均数()∑==+++=ni i n x n x x x n x 12111 ,方差为()()()[]()⎪⎪⎭⎫ ⎝⎛-=-=-+-+-=∑∑=2221222212111n ii n i i n x n x n x x n x x x x x x ns ,标准差()211∑=-=ni i x x n s ②若假设一组数据为n x x x x ,,,321,它的平均数为x ,方差为2s ,则一组数据为b ax b ax b ax b ax n ++++ ,,,321,的平均数为b x a +,方差为22s a 。
统计基础知识讲义
统计基础知识讲义第一章总论第一节统计的涵义一、统计的概念、统计的三种涵义(一)统计的概念统计,是指对某一现象有关数据的搜集、整理、计算和分析等活动。
(二)统计的三种涵义统计工作、统计资料、统计学(三)统计工作、统计资料和统计学三者的关系第一、统计工作与统计资料是过程与成果的关系;第二、统计工作与统计学是实践与理论的关系;第三、统计工作与统计学是前与后的关系。
第二节统计学中的基本概念一、总体与总体单位(一)总体所谓总体,是指客观存在的,在同一性质基础上结合起来的许多个别事物的整体,称为统计总体,简称总体。
(二)总体单位构成总体的每个事物称为总体单位。
(三)总体与总体单位的关系总体由总体单位构成,它是全部和部分的关系。
总体和总体单位是相对而言的,总体和总体单位可以相互转化。
总体的基本特征:同质性,大量性,差异性。
二、指标与标志(一)指标有两种理解一是:指标是反映总体现象数量特征的概念。
二是:指标是反映总体现象数量特征的概念和具体数值。
如,2008年江苏省地区生产总值(GDP)达30312.61亿元。
(二)标志标志是说明总体单位特征的名称。
标志按性质不同,分为品质标志和数量标志。
标志按表现不同,分为不变标志和变异标志。
变异标志又分为品质变异标志和数量变异标志。
(三)指标与标志的区别1、指标说明总体特征,标志说明总体单位特征;2、标志分为有不能用数值表示的品质标志和能用数值表示的数量标志两种,但指标必须都能用数值表示。
(四)指标与标志的联系1、统计指标的数值直接汇总于总体单位的数量标志值;2、指标与数量标志之间存在着转化的关系。
三、变异与变量(一)变异标志在同一总体不同总体单位之间的差别,称为变异。
(二)变量数量变异标志就是变量数量变异标志的具体数值表现,称为变量值。
几个基本概念之间的联系第三节统计的任务与过程一、统计的任务《统计法》规定,统计的基本任务是:对国民经济和社会发展情况进行统计调配、统计分析,提供统计资料和统计咨询意见,实行统计监督。
2023学年苏教版数学五年级上学期章节考点精讲精练讲义第六单元《统计表和条形统计图(二)》(解析)
章节复习考点讲义(苏教版)苏教版数学五年级上册章节考点精讲精练 第六单元《统计表和条形统计图(二)》知识点一:认识复式统计表把几张简单的单式统计表合并成一张统计表,这张统计表叫做复式统计表。
复式统计表不仅反映了丰富的信息,同时也便于从整体上了解、对比、分析数据。
知识点二:认识复式条形统计图1.复式条形统计图:每组数据中有两个或两个以上的数据,用几种不同颜色的直线条表示数据的条形统计图,就是复式条形统计图。
2.读懂复式条形统计图:通过观察和比较,可以读懂复式条形统计图,从中获取生活信息,提出并解决问题。
知识导航知识互联网3.复式条形统计图的优点:复式条形统计图能够清楚地表示出各种数量的多少,可以更直观、形象地比较两种或多种数量之间的关系。
考点01:复式条形统计图的特点及绘制1.复式条形统计图和单式条形统计图提供的信息量相比()。
A.大一些B.相同C.小一些【答案】A【完整解答】复式条形统计图比单式条形统计图提供的信息量要大一些。
【思路引导】条形统计图分为复式条形统计图和单式条形统计图两种,复式条形统计图比单式条形统计图提供的信息量要多一些;掌握条形统计图的特点是关键。
2.下表画成()比较好西瓜香蕉桔子梨葡萄男13 5 1 2 5女8 3 2 4 8A.条形B.扇形C.折线【答案】A【完整解答】条形统计图可以直观看出每项数据的多少【思路引导】考查了复式条形统计图的解决能力3.这是一次期中考试后,四年级(1)班的成绩统计图这是()统计图A.条形B.折线C.扇形【答案】A【完整解答】可以看出这是条形统计图【思路引导】考查了复式条形统计图的解决能力4.甲和乙都是营养价值很高的食品.如图列出了100克甲食品和100克乙食品中所含的几种主要成分。
①两种食品相比,中的碳水化合物含量比较高。
③乙食品中的含量最高。
【答案】乙食品;蛋白质【完整解答】①两种食品相比,乙食品中的碳水化合物含量比较高;②乙食品中的蛋白质含量最高。
统计题目讲解教案模板范文
年级:六年级课时:1课时教学目标:1. 理解统计的基本概念,包括数据收集、整理和分析。
2. 能够运用统计方法解决实际问题,如计算平均数、中位数、众数等。
3. 培养学生的逻辑思维能力和解决问题的能力。
教学重点:1. 数据的收集和整理方法。
2. 统计数据的计算和分析。
教学难点:1. 复杂统计数据的处理。
2. 统计结论的合理性和可靠性。
教学准备:1. 多媒体课件。
2. 统计数据表格。
3. 统计图(条形图、折线图、饼图等)。
教学过程:一、导入新课1. 教师展示一组日常生活场景的图片,引导学生思考这些场景中可能涉及到的统计数据。
2. 学生分享自己的想法,教师总结并引出统计的概念。
二、新课讲解1. 数据收集- 教师讲解数据收集的方法,如问卷调查、实验数据收集等。
- 学生举例说明如何在实际生活中收集数据。
2. 数据整理- 教师展示数据整理的步骤,包括分类、排序、分组等。
- 学生练习对一组数据进行整理。
3. 数据分析- 教师讲解统计数据的分析方法,如计算平均数、中位数、众数等。
- 学生运用所学知识计算一组数据的统计量。
4. 统计图的应用- 教师讲解不同统计图的特点和适用场景。
- 学生练习制作条形图、折线图、饼图等统计图。
三、课堂练习1. 学生独立完成一组数据的收集、整理和分析。
2. 学生展示自己的成果,教师点评并给予指导。
四、课堂小结1. 教师总结本节课的重点内容,强调统计在解决实际问题中的重要性。
2. 学生分享自己的学习心得,教师鼓励学生将所学知识应用于实际生活。
五、课后作业1. 完成课后练习题,巩固所学知识。
2. 收集生活中的一组数据,运用所学方法进行分析,并制作统计图。
教学反思:本节课通过讲解统计的基本概念和方法,引导学生理解统计在解决实际问题中的重要性。
在教学过程中,注重培养学生的动手能力和实际操作能力。
在课堂练习环节,鼓励学生积极参与,展示自己的成果。
课后作业的设计旨在巩固所学知识,提高学生的实际应用能力。
人教版高中数学必修一精品讲义5.1 任意角和弧度制(精讲)(解析版)
5.1 任意角和弧度制考点一 基本概念的辨析【例1】(2020·河南宛城·南阳中学高一月考)下列说法正确的个数是( ) ①小于90︒的角是锐角; ②钝角一定大于第一象限角;③第二象限的角一定大于第一象限的角; ④始边与终边重合的角为0︒. A .0B .1C .2D .3【正确答案】A【详细解析】对①,小于90︒的角不是锐角,如10-︒不是锐角,故①错; 对②,390角是第一象限的角,大于任何钝角()90180αα<<,故②错; 对③,第二象限角中的210-角小于第一象限角中的30角,故③错; 对④,始边与终边重合的角的度数是()360k k Z ⋅∈,故④错.故选:A . 【一隅三反】1.(2020·全国高一课时练习)下列说法正确的是( ) A .终边相同的角一定相等 B .钝角一定是第二象限角 C .第四象限角一定是负角 D .小于90︒的角都是锐角【正确答案】B【详细解析】终边相同的角不一定相等,所以该选项错误; 钝角一定是第二象限角,所以该选项正确; 第四象限角不一定是负角,如116π是第四象限的角,但是不是负角,所以该选项错误; 小于90︒的角不都是锐角,如3π-.所以该选项错误.故选B 2.(2020·浙江高一课时练习)下列命题中正确的是( ). A .终边与始边重合的角是零角 B .90°~180°间的角不一定是钝角 C .终边和始边都相同的两个角相等 D .第二象限的角大于第一象限的角【正确答案】B【详细解析】终边与始边重合的角还有360°角,720°角等,故A 错误;90°~180°间的角包括90°角,故90°~180°间的角不一定是钝角,故B 正确; 终边和始边都相同的两个角相差360,k k Z ︒⋅∈,故C 错误;120°角是第二象限角,它小于第一象限的角400°角,故D 错误.故选:B 3.(2020·陕西大荔·高一期末)下列说法正确的是( ) A .第二象限角大于第一象限角B .不相等的角终边可以相同C .若α是第二象限角,2α一定是第四象限角D .终边在x 轴正半轴上的角是零角 【正确答案】B【详细解析】A 选项,第一象限角36030120︒+︒>︒,而120︒是第二象限角,∴该选项错误; B 选项,36030︒+︒与30终边相等,但它们不相等,∴该选项正确; C 选项,若α是第二象限角,则()222k k k Z ππαππ+<<+∈,∴()4242k k k Z ππαππ+<<+∈是第三象限角或第四象限角或终边在y 轴负半轴上的轴线角,∴该选项错误;D 选项,360︒角的终边在x 轴正半轴上,但不是零角,∴该选项错误.故选:B .考点二 角度与弧度的转换【例2】(2020·汪清县汪清第六中学高一期中(文))把下列各角的弧度数化为度数,度数化为弧度数. (1)712π; (2)136π- ; (3)1125° ;(4)-225°. 【正确答案】(1)105; (2)390-; (3)254π; (4)54π-. 【详细解析】根据弧度制与角度制的互化公式,1801,1180rad rad ππ==,可得:(1)771801051212πππ=⨯=; (2)131366180390πππ⨯==---; (3)25112511251804ππ=⨯=rad ;(4)52252251804ππ-=-⨯=-rad .【一隅三反】1.(2020·全国高一课时练习)把下列角度化成弧度:(1)36︒; (2)150︒-; (3)1095︒; (4)1440︒. 【正确答案】(1)5π(2)56π-(3)7312π(4)8π 【详细解析】(1)361805ππ︒⨯=;(2)51501806ππ-︒⨯=-;(3)73109518012ππ︒⨯=;(4)14408180ππ︒⨯=. 2.(2020·甘肃城关·兰州一中高一期中)315︒=___________弧度,7π12弧度=________. 【正确答案】7π4105︒ 【详细解析】180π︒=73153151804ππ︒=⨯=,77180π=1051212⨯︒=︒,故正确答案为:7π4;105︒3.(2020·土默特左旗金山学校高一月考(理))下列转化结果错误的是( ) A .30化成弧度是6πB .103π-化成度是600-︒ C .6730'︒化成弧度是27π D .85π化成度是288︒ 【正确答案】C【详细解析】30化成弧度是6π,A 正确103π-化成度是600-︒,B 正确; 6730'︒是367.567.51808ππ︒=⨯=,C 错误;85π化成度是288︒,D 正确.故选:C. 考点三 终边相同【例3】(2020·全国高一课时练习)(1)把-1480°写成()2k k Z απ+∈的形式,其中02απ≤≤; (2)在[]0,720︒︒内找出与25π角终边相同的角. 【正确答案】(1)()16259ππ+⨯-;(2)72°,432°. 【详细解析】(1)∵74148014801809ππ-︒=-⨯=-, 而74161099πππ-=-+,且02απ≤≤,∴169πα=. ∴()161480259ππ-︒=+⨯-.(2)∵221807255πππ⎛⎫=⨯︒=︒ ⎪⎝⎭,∴终边与25π角相同的角为()72360k k θ=︒+⋅︒∈Z , 当0k =时,72θ=︒;当1k =时,432θ=︒. ∴在[]0,720︒︒内与25π角终边相同的角为72°,432°. 【一隅三反】1.(2020·汪清县汪清第六中学高一期中(文))已知角2025α=︒.(1)将角α改写成2k βπ+( k Z ∈,02βπ≤<)的形式,并指出角α是第几象限的角; (2)在区间[)5,0π-上找出与角α终边相同的角. 【正确答案】(1)5104παπ=+,是第三象限角;(2)19113,,444πππ---. 【详细解析】(1)2025α=︒=45520251018044ππππ⨯==+,54π是第三象限角,∴α是第三象限角.(2)由55204k πππ-≤+<得25588k -<<-,因为k Z ∈,∴3,2,1k =---,对应角依次为19113,,444πππ---. 2.(2020·全国高一课时练习)把下列各角度化为弧度,并写成02π-的角加上2()k k π∈Z 的形式. ( 1)64︒-; ( 2)400︒; ( 3)72230︒'-【正确答案】( 1)74245ππ-;( 2)229ππ+;( 3)143672ππ-+. 【详细解析】( 1)16746424545πππ︒-=-=-; ( 2)202400299πππ︒==+; ( 3)144528914372230722.5621807272ππππ︒'︒-=-=-⨯=-=-+. 3.(2019·陕西榆阳·榆林十二中高一月考)用弧度制写出角的终边在下图中阴影区域内的角的集合.(1)(2)【正确答案】(1)55{|22,}66x k x k k Z ππππ-+≤≤+∈;(2){|,}42x k x k k Z ππππ+≤≤+∈ 【详细解析】(1)51506π-=-,51506π=,用弧度制表示终边在图中阴影区域内的角的集合为 55{|22,}66x k x k k Z ππππ-+≤≤+∈.(2)454π=,52254π=,用弧度制表示终边在图中阴影区域内的角的集合为{|22,}42x k x k k Z ππππ+≤≤+∈53{|22,}42x k x k k Z ππππ+≤≤+∈{|,}42x k x k k Z ππππ=+≤≤+∈.考点四 象限的判断【例4】(2020·全国高一课时练习)已知下列各角:①120- ②240- ③180 ④495,其中第二象限角的是( ) A .①② B .①③C .②③D .②④【正确答案】D【详细解析】①120-表示由x 轴非负半轴绕原点顺时针旋转120,落在第三象限; ②240-表示由x 轴非负半轴绕原点顺时针旋转240,落在第二象限; ③180表示由x 轴非负半轴绕原点逆时针旋转180,落在x 轴非正半轴;④495表示由x 轴非负半轴绕原点逆时针旋转495,且495360135=+,495的终边和135的终边相同,所以落在第二象限.故选:D【一隅三反】1.(2020·周口市中英文学校高一期中)角2912π的终边所在的象限是( ) A .第一象限 B .第二象限C .第三象限D .第四象限【正确答案】A 【详细解析】因为295=21212πππ+,角512π是第一象限角,所以角2912π的终边所在的象限是第一象限. 故选A.2.(2020·全国高二)若α是第二象限角,则180α-是( ) A .第一象限角 B .第二象限角C .第三象限角D .第四象限角【正确答案】A【详细解析】α为第二象限角,不妨取120α=,则180α-为第一象限角,故选A .3.(2020·全国高一课时练习)在0°~360°范围内,找出与下列各角终边相同的角,并判定它们是第几象限角. (1)-150°;(2)650°;(3)-950°15′.【正确答案】(1)210︒,第三象限的角;(2)290︒,第四象限的角;(3)12945︒',第二象限的角; 【详细解析】(1)150360210-︒=-︒+︒,210︒是第三象限的角,150∴-︒是第三象限的角; (2)650360290︒=︒+︒,290︒是第四象限的角,650∴︒是第四象限的角;(3)95015108012945-︒'=-︒+︒',12945︒'是第二象限的角,95015∴-︒'是第二象限的角.考点五 扇形【例5】(2020·浙江高一课时练习)已知一扇形的圆心角为(0)αα>,所在圆的半径为R . (1)若60α︒=,10R cm =,求扇形的弧长及该弧所在的弓形的面积;(2)若扇形的周长为20 cm ,当扇形的圆心角α等于多少弧度时,这个扇形的面积最大?【正确答案】(1)103cm π,()2503cm π⎛-⎝;(2)2rad α=. 【详细解析】(1)设扇形的弧长为l ,弓形面积为S ,则603πα︒==,10R =,101033l cm ππ=⨯=,()221105*********S cm ππ⎛=⨯⨯-=- ⎝.(2)设扇形弧长为l ,则220l R +=,即10202101l R R π⎛⎫=-<< ⎪+⎝⎭,∴扇形面积2211(202)10(5)2522S IR R R R R R ==-⋅=-+=--+, ∴当5R cm =时,S 有最大值225cm ,此时10l cm =,2rad lRα==.因此当2rad α=时,这个扇形面积最大.【一隅三反】1.(2020·赤峰二中)《九章算术》是我国古代的数学巨著,其中《方田》章给出了计算弧田面积所用的经验公式为:弧田面积12=⨯(弦×矢+矢2),弧田(如图阴影部分所示)是由圆弧和弦围成,公式中的“弦”指圆弧所对的弦长,“矢”等于半径长与圆心到弦的距离之差,现有圆心角为23π,矢为4的弧田,按照上述方法计算出其面积是( )A .4+B .8+C .8+D .8+【正确答案】D【详细解析】设半径为r ,圆心到弦的距离为d ,则121cos 232d r r π⎛⎫=⋅⨯=⎪⎝⎭, 11422r d r r r -=-==8,4r d ∴==∴所以弦长为==∴弧田面积为()214482⨯+=+故选:D.2.(2020·辽宁沈阳·高一期中)一个半径是R 的扇形,其周长为3R ,则该扇形圆心角的弧度数为( ) A .1B .3C .πD .3π 【正确答案】A【详细解析】设扇形的弧长为l ,则23R l R +=,得l R =,则扇形圆心角的弧度数为1lR=.故选:A. 3.(2020·上海高一课时练习)在扇形AOB 中,半径等于r . (1)若弦AB 的长等于半径,求扇形的弧长l ;(2)若弦AB ,求扇形的面积S【正确答案】(1)3r π; (2)213r π【详细解析】(1)如图所示:设AOB α∠=,若弦AB 的长等于半径,则3πα=所以扇形的弧长3παl r r(2)如图所示:若弦AB 倍,则32sin 2AC AOCOAr, 因为0απ<<,所以3AOC π∠=, 所以223παAOC, 所以扇形的面积为22111223απS lr r r .。
2019《统计》教学片段与评析.doc
《统计》教学片段与评析◆您现在正在阅读的《统计》教学片段与评析文章内容由收集 ! 本站将为您提供更多的精品教学资源! 《统计》教学片段与评析主持人简介:林至元中学高级教师,厦门教育学院初教室副主任。
福建省小学数学教育研究会副理事长、省小学数学骨干教师培训班导师、省课程改革学科组专家。
苏惠珍现任厦门实验小学副校长。
大专学历,中学高级教师,市小学数学学科带头人。
省、市小学数学教育研究会理事,省小学数学中青年教师教学研究会常务理事。
“新世纪”实验教材特邀研究员。
2019— 2019 年参加小学数学骨干教师国家级培训。
主持人:厦门市小学数学课程改革实验已历时三年了。
三年来,我们以课改新理念为指导,以课堂教学改革为切入口,开展了多种形式的教学研讨,就如何进行有效学习的一些热点、难点问题进行探索,并取得显著成效。
教育部基础教育课程教材发展中心主任助理刘兼在一次报告中指出:“在人的发展中,最核心的东西是人的情感、态度、价值观。
然后是能力,最后是知识。
”我市小学数学科在课改实践中,既关注知识、技能,更关注情感、态度、价值观,作了有益的探索。
请看下面教学案例分析。
《统计》教学片段与评析厦门教育学院叶金标人教版实验教材第一册第93—94 页《统计》课堂教学节录。
师:下面是四年级摘松果比赛的统计表。
(电脑展示比较统计表)班级一班二班三班四班数量30个39个35个生:小朋友认真观察,看谁能根据这个表格提出数学问题?生 1:哪个班级摘的松果最多?生 2:一班比二班少摘多少个松果?画外音:小朋友,这次摘松果比赛,我们四班得第二名,你能猜出我们摘多少个吗?全班沉默。
教师引导学生四人小组讨论,再汇报。
生 1:二班摘39 个是第一名,三班摘35 个是第三名,四班是第二名,应该是38 个。
生 2:还可以是 37 个、 36 个。
生 3:我觉得,四班如果摘 35 个,也是第二名。
生 4:反对!四班摘 35 个就和三班一样多,怎么会是第二名呢?师:四班摘 35 个松果,是不是第二名呢?小组讨论后再发表意见。
《统计》的教学设计及评析(通用15篇)
《统计》的教学设计及评析(通用15篇)《统计》的及评析篇1教学内容:人教版义务教育课程标准实验教科书《数学》二年级下册第八单元统计。
教学目的:1.使学生体验数据的收集、整理、描述和分析的过程,了解统计的意义,会用简单的方法收集和整理数据。
2.使学生初步认识统计图(一格代表五个单位)和简单的复式统计表,能根据统计图表中的数据提出并回答简单的问题,并能够进行简单的分析。
3.通过对周围现实生活中有关事例的调查,激发学生的学习兴趣,培养学生的合作意识和创新精神。
教学过程:课前谈话:同学们,我们在幼儿园的时候都唱过一首儿歌《小白兔》,今天咱们再唱一次怎么样?(师生拍手齐唱儿歌)今天,不但可爱的小白兔要来到我们的课堂上,可爱的小灰兔也要来呢!大家高兴吗?一、认识简单的复合统计表。
(一)创设情境,学生经历统计过程和复合统计表的形成过程。
1.师:这一天,小白兔们和小灰兔们要进行一场劳动大比武,比比看在相同的时间内哪一队拔的萝卜、采得蘑菇多。
他们正为找裁判发愁呢,我们给他们当一回裁判怎么样?要当好裁判必须注意力集中,把他们每一队拔了几个萝卜、采了几个蘑菇数准确,你能做到吗?2.播放动画。
(动画中,一只小白兔抱着一个大筐、一只小灰兔抱着一个大筐各自收集本队的劳动成果,一会儿一个萝卜“飞”到白兔队的筐里,一会儿一个萝卜一个蘑菇一块“飞”到灰兔队的筐里,接着又两个蘑菇一起“飞”到白兔队的筐里… … 真是令人眼花缭乱,想数出它们的个数根本不可能。
)3.师:哪位小裁判说说你数的结果?(此时的学生肯定是一肚子苦水)4.师:我们这个裁判怎么当?谁出个主意?5.学生自由发言。
6.再次播放动画,学生用自己的办法尝试统计。
7.学生交流哪种办法合适。
(一般统一在小组分工合作数上。
)8.再次播放动画,学生用可行办法进行统计。
9.交流统计结果,发放如下统计表,填写后各小组商议哪个队获胜。
小白兔队:菜名萝卜蘑菇数量小灰兔队:菜名萝卜蘑菇数量10.小组间交流比赛结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题5.1统计(精讲精析篇)提纲挈领点点突破热门考点01 随机抽样1.简单随机抽样的特点(1)抽取的个体数较少;(2)是逐个抽取;(3)是不放回抽取;(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.2.抽签法与随机数法的适用情况(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况. (2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法. 3.分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算. (3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量总体容量=各层样本数量各层个体数量”.提醒:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取n i =n ·N iN (i =1,2,…,k )个个体(其中i是层数,n 是抽取的样本容量,N i 是第i 层中个体的个数,N 是总体容量).【典例1】(2019·山东省泰安实验中学高一开学考试)总体由编号为01,02, ,29,30的30个个体组成,现从中9抽取一个容量为6的样本,请以随机数表第1行第3列开始,向右读取,则选出来的第6个个体的编号为()70 29 17 12 13 40 33 12 38 26 13 89 51 0356 62 18 37 35 96 83 50 87 75 97 12 55 93A.12 B.13 C.03 D.40【答案】C【解析】从随机数表第1行第3列开始由左到右依次选取两个数字中小于30的编号依次为29,17,12,13,26,03,则第6个个体的编号为26.故选C.【典例2】(2020·横峰中学高三其他(理))某中学高二年级共有学生2400人,为了解他们的身体状况,用分层抽样的方法从中抽取一个容量为80的样本,若样本中共有男生42人,则该校高二年级共有女生()A.1260 B.1230 C.1200 D.1140【答案】D【解析】设女生总人数为:x人,由分层抽样的方法可得:抽取女生人数为:804238-=人,所以80382400x=,解得:1140x=故选:D【典例3】下列抽取样本的方式属于简单随机抽样的个数为()①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0B.1 C.2 D.3【答案】A【解析】①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样.因为它是有放回抽样;③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样.因为不是等可能抽样.故选A.【总结提升】1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.分层抽样的前提和遵循的两条原则(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.(2)遵循的两条原则:①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.3. 两种抽样方法的特点、联系及适用范围热门考点02 茎叶图及其应用1.当数据个数较少时,用茎叶图可精确地记录每个数据.如果数据是两位数,那么茎表示十位数,叶表示个位数,如果数据是三位数,那么茎表示百位数和十位数,叶表示个位数.2.茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(3)数据分布一般是茎从上到下由小到大,叶从茎侧向外按从小到大排列.3.茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.【典例4】(2017·山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7【答案】A 【解析】由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y =5. 由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66, 从而有56+62+65+74+70+x 5=66,解得x =3.【典例5】(2019·济南模拟)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成就按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为( )A .2B .4C .5D .6【答案】A 【解析】由茎叶图可得,获“诗词达人”称号的有8人,据该次比赛的成就按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为108240⨯= (人). 【特别提醒】茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. ①“叶”位置只有一个数字,而“茎”位置的数字位数一般不需要统一; ②茎叶图上重复出现的数据要重复记录,不能遗漏.热门考点03 频率分布直方图1.频率、频数、样本容量的计算方法 (1)频率组距×组距=频率. (2)频数样本容量=频率,频数频率=样本容量, 样本容量×频率=频数. (3)各个小方形的面积总和等于1 . 2.频率分布表的画法第一步:求极差,决定组数和组距,组距=极差/组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.(4)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.【典例6】(2017北京,文17)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数学.科网不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(Ⅰ)0.4;(Ⅱ)5人;(Ⅲ)3 2 .【解析】(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为(0.020.04)100.6+⨯=,所以样本中分数小于70的频率为10.60.4-=.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(Ⅱ)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9+++⨯=,分数在区间[40,50)内的人数为1001000.955-⨯-=.学科%网所以总体中分数在区间[40,50)内的人数估计为5 40020100⨯=.【典例7】(2016高考四川文科)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……[4,4.5]分成9组,制成了如图所示的频率分布直方图.(I)求直方图中的a值;(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;(Ⅲ)估计居民月均用水量的中位数.a ;(Ⅱ)36000;(Ⅲ)2.04.【答案】(Ⅰ)0.30【解析】(Ⅰ)由频率分布直方图,可知:月用水量在[0,0.5]的频率为0.08×0.5=0.04.同理,在[0.5,1),(1.5,2],[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1–(0.04+0.08+0.21+.025+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(Ⅱ)由(Ⅰ),100位居民月均水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.13=36000. (Ⅲ)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5所以2≤x<2.5.由0.50×(x–2)=0.5–0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.【总结提升】1.两个主要考查角度:(1)利用频率分布直方图求频率、频数. (2)利用频率分布直方图估计总体2.熟记结论:(1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1;(2) 频率组距×组距=频率;(3)频数/样本容量=频率,此关系式的变形为频数/频率=样本容量,样本容量×频率=频数 3.易错防范:频率分布直方图的纵坐标是频率组距,而不是频率热门考点04 样本的数字特征众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平; 平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定. 标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.【典例8】(2020·全国高考真题(文))设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( ) A .0.01 B .0.1C .1D .10【答案】C 【解析】因为数据(1,2,,)i ax b i n +=,的方差是数据(1,2,,)i x i n =,的方差的2a 倍,所以所求数据方差为2100.01=1⨯ 故选:C【典例9】(2020·全国高考真题(理))在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( )A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====【答案】B对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65A s =-⨯+-⨯+-⨯+-⨯=;对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85B s =-⨯+-⨯+-⨯+-⨯=;对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05C s =-⨯+-⨯+-⨯+-⨯=;对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45D s =-⨯+-⨯+-⨯+-⨯=.因此,B 选项这一组的标准差最大. 故选:B.【典例10】(2019年高考全国Ⅱ卷文)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈.【答案】(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%;(2)这类企业产值增长率的平均数与标准差的估计值分别为30%,17%. 【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=. 产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比(2)1(0.1020.10240.30530.50140.707)0.30100y =-⨯+⨯+⨯+⨯+⨯=, ()52211100i ii s n y y ==-∑ 222221(0.40)2(0.20)240530.20140.407100⎡⎤=-⨯+-⨯+⨯+⨯+⨯⎣⎦ =0.0296,0.020.17s ==≈,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%. 【总结提升】1.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-n x 2]或写成s 2=1n (x 21+x 22+…+x 2n )-x 2,即方差等于原数据平方的平均数减去平均数的平方. 2.主要命题角度:(1)样本的数字特征与频率分布直方图交汇 (2)样本的数字特征与茎叶图交汇①在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.②茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等. (3)样本的数字特征与优化决策问题交汇:利用样本的数字特征解决优化决策问题的依据①平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定. ②用样本估计总体就是利用样本的数字特征来描述总体的数字特征.巩固提升1.(2020·四川省宜宾市第四中学校高三二模(文))某公司生产A ,B ,C 三种不同型号的轿车,产量之比依次为2:3:4,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n 的样本,若样本中A 种型号的轿车比B 种型号的轿车少8辆,则n =( ) A .96 B .72C .48D .36【答案】B 【解析】 由题意得23872.99n n n -=-∴=选B. 2.(2017课标1,文2)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B 【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B3.(河南省洛阳市2019届高三第三次统考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为A .100,10B .100,20C .200,10D .200,20【答案】D【解析】由题得样本容量为(350020004500)2%100002%200++⨯=⨯=, 抽取的高中生人数为20002%40⨯=人,则近视人数为400.520⨯=人,故选D .4.(2020·四川省棠湖中学高三一模(文))新冠肺炎期间某商场开通三种平台销售商品,收集一月内的数据如图1;为了解消费者对各平台销售方式的满意程度,该商场用分层抽样的方法抽取4%的顾客进行满意度调查,得到的数据如图2.下列说法错误的是( )A.样本容量为240B.若样本中对平台三满意的人数为40,则40%m= C.总体中对平台二满意的消费者人数约为300D.样本中对平台一满意的人数为24人【答案】B【解析】选项A,样本容量为60004%240⨯=,该选项正确;选项B,根据题意得平台三的满意率4040%25004%=⨯,40m=,不是40%m=,该选项错误;选项C,样本可以估计总体,但会有一定的误差,总体中对平台二满意人数约为150020%300⨯=,该选项正确;选项D,总体中对平台一满意人数约为20004%30%24⨯⨯=,该选项正确.故选:B.5.(2020·河南省高一期末)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差2s为()A.52B.3 C.72D.4【答案】C【解析】因为7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的平均数为x,方差为2s,由平均数和方差的计算公式可得75558x⨯+==,()227455782s⨯+-==.故选:C.6.(广东省汕头市2019届高三第二次模拟(B 卷))在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是A .成绩在[70,80]分的考生人数最多B .不及格的考生人数为1000人C .考生竞赛成绩的平均分约70.5分D .考生竞赛成绩的中位数为75分【答案】D【解析】由频率分布直方图可得,成绩在[70,80]的频率最高,因此考生人数最多,故A 正确;由频率分布直方图可得,成绩在[40,60)的频率为0.25,因此,不及格的人数为40000.251000⨯=,故B 正确;由频率分布直方图可得:平均分等于450.1550.15650.2750.3850.15⨯+⨯+⨯+⨯+⨯+950.170.5⨯=,故C 正确;因为成绩在[40,70)的频率为0.45,由[70,80]的频率为0.3,所以中位数为0.05701071.670.3+⨯≈,故D 错误.故选D . 7.(福建省泉州市2019届高三第二次(5月)质检)已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则 A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s ><【答案】A【解析】由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+, 22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选A .8.(2020·双峰县第一中学高一月考)甲、乙、丙、丁四名同学在某次军训射击测试中,各射击10次.四人测试成绩对应的条形图如下:以下关于四名同学射击成绩的数字特征判断不正确...的是( ) A .平均数相同 B .中位数相同 C .众数不完全相同 D .丁的方差最大【答案】D 【解析】由图的对称性可知,平均数都为5;由图易知,四组数据的众数不完全相同,中位数相同;记甲、乙、丙、丁图所对应的方差分别为22221234,,,s s s s ,则()()2221450.5650.51s =-⨯+-⨯=,()()()22222450.3550.4650.30.6s =-⨯+-⨯+-⨯=,()()()()()2222223350.3450.1550.2650.1750.3 2.6s =-⨯+-⨯+-⨯+-⨯+-⨯=,()()()()()2222224250.1450.3550.2650.3850.1 2.4s =-⨯+-⨯+-⨯+-⨯+-⨯=,所以丙的方差最大. 故选:D .9.(河南省郑州市2019届高三第三次质量检测)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .18【答案】A【解析】因为中位数为12,所以4x y +=,数据的平均数为1(223420191910x y ⨯+++++++++2021)11.4+=,要使该总体的标准差最小,即方差最小,所以22(1011.4)(1011.4)x y +-++-=2222.8( 1.4)( 1.4)2()0.722x y x y +--+-≥=,当且仅当1.4 1.4x y -=-,即2x y ==时取等号,此时总体标准差最小,4212x y +=,故选A .10.(2020·全国高三(理))某学校近几年来通过“书香校园”主题系列活动,倡导学生整本阅读纸质课外书籍.下面的统计图是该校2013年至2018年纸质书人均阅读量的情况,根据统计图提供的信息,下列推断不合理的是( )A .从2013年到2016年,该校纸质书人均阅读量逐年增长B .2013年至2018年,该校纸质书人均阅读量的中位数是46.7本C .2013年至2018年,该校纸质书人均阅读量的极差是45.3本D .2013年至2018年,该校后三年纸质书人均阅读量总和是前三年纸质书人均阅读量总和的2倍 【答案】D 【解析】对于A ,根据统计图分析可知,从2013年到2016年,该校纸质书人均阅读量分别是:15.5,38.5,43.3,58.4是逐年增长的,故A 是合理的;对于B ,2013年至2018年,该校纸质书人均阅读量按从小到大的顺序排列为:15.5,38.5,43.3,50.1,58.4,60.8,其中位数为43.350.146.72+=本,故B 是合理的;对于C ,因为最大阅读量为60.8本,最小阅读量为15.5本,所以极差为60.815.545.3-=本,故C 是合理的;对于D ,2013年至2018年,该校后三年纸质书人均阅读量总和为58.450.160.8169.3++=本,前三年纸质书人均阅读量总和为15.538.543.397.3++=本,169.397.32194.6≠⨯=, 故D 是不合理的. 故选:D.11.(2020·双峰县第一中学高一月考)某学校随机抽查了本校20个学生,调查他们平均每天进行体育锻炼的时间(单位:min ),根据所得数据的茎叶图,以5为组距将数据分为8组,分别是[0,5),[5,10),…,[35,40],作出频率分布直方图如图所示,则原始的茎叶图可能是( )A .B .C .D .【答案】B 【解析】从题设中提供的频率分布直方图可算得在区间[0,5),[5,10)内各有0.012051⨯⨯=个,答案A 被排除;在区间[10,15)内有0.042054⨯⨯=个;在区间[15,20)内有0.022052⨯⨯=个;在区间[20,25)内有0.042054⨯⨯=个;在区间[25,30),[30,35)内各有0.032053⨯⨯=个,答案C 被排除;在区间[35,40)内有0.022052⨯⨯=个,答案D 被排除;依据这些数据信息可推知,应选答案B .12. 已知一组正数x 1,x 2,x 3的方差s 2=13(x 21+x 22+x 23-12),则数据x 1+1,x 2+1,x 3+1的平均数为 .【答案】3【解析】由方差的计算公式可得s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]=1n [x 21+x 22+…+x 2n -2(x 1+x 2+…+x n )·x +n x 2] =1n (x 21+x 22+…+x 2n -2n x 2+n x 2) =1n (x 21+x 22+…+x 2n )-x 2, ∴由题意x 1,x 2,x 3的方差s 2=13(x 21+x 22+x 23-12),知x 2=4,又x 1,x 2,x 3均为正数,故x =2.所以数据x 1+1,x 2+1,x 3+1的平均数是2+1=3,故答案为3.13.(2020·广东省深圳外国语学校高三月考(文))已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______. 【答案】265【解析】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为:265. 14.(2020·重庆市凤鸣山中学高三月考(文))2018年俄罗斯世界杯将至,本地球迷协会统计了协会内180名男性球迷,60名女性球迷在观察场所(家里、酒吧、球迷广场)上的选择,制作了如图所示的条形图,用分层抽样的方法从中抽取48名球迷进行调查,则其中选择在酒吧观赛的女球迷人数为__________人.【答案】4 【解析】总球迷是180+60=240人家里的女性球迷是120×25%=30人 球迷广场女性:80×12.5%=10人 所以在酒吧观赛的女球迷是60-30-10=20人 抽样中,选择在酒吧观赛的女球迷人数为2048=4240⨯ 人 15.(2020·甘肃省会宁县第四中学高一期中)某网站举行“卫生防疫”的知识竞赛网上答题,共有120000人通过该网站参加了这次竞赛,为了解竞赛成绩情况,从中抽取了100人的成绩进行统计,其中成绩分组区间为[)50,60,[)60,70,[)70,80,[)80,90,[]90,100,其频率分布直方图如图所示,请你解答下列问题:(1)求m 的值;(2)成绩不低于90分的人就能获得积分奖励,求所有参赛者中获得奖励的人数;(3)根据频率分布直方图,估计这次知识竞赛成绩的平均分(用组中值代替各组数据的平均值). 【答案】(1)0.03m =(2)6000人(3)76分 【解析】(1)由频率分布直方图的性质,可得()100.0050.020.040.0051m ⨯++++=, 解得0.03m =.(2)由频率分布直方图,可得成绩在[]90,100之间的频率为100.0050.05⨯=, 所以可估计所有参赛者中获得奖励的人数约为1200000.056000⨯=人. (3)根据频率分布直方图的平均数的计算公式,可得平均分的估计值为550.05650.2750.4850.3950.0576⨯+⨯+⨯+⨯+⨯=分.16.(2020·上林县中学高一开学考试)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行调查,通过抽样,获得某年100为居民每人的月均用水量(单位:吨),将数据按照(0.0.5),(0.5,1),(4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图的a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; (3)估计居民月用水量的中位数.【答案】(1) 0.3a =; (2)36000;(3)2.04. 【解析】(Ⅰ)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1–(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a , 解得a=0.30.(Ⅱ)由(Ⅰ)100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36000. (Ⅲ)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5所以2≤x<2.5.由0.50×(x–2)=0.5–0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.。