2021届一轮复习人教A版 用样本估计总体 学案
2021版高考数学一轮复习第10章统计与统计案例第2节用样本估计总体课时跟踪检测理新人教A版
第二节 用样本估计总体A 级·基础过关|固根基|1.(2019年全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差解析:选A 记9个原始评分分别为a ,b ,c ,d ,e ,f ,g ,h ,i (按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A .2.(2019届济南模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( )A .x -=4,s 2<2B .x -=4,s 2>2C .x ->4,s 2<2D .x ->4,s 2>2 解析:选A 设原来的7个数分别为x 1,x 2,…,x 7,加入一个新数据4之后的平均数为7×4+48=4,则这8个数的方差s 2=(x 1-4)2+(x 2-4)2+…+(x 7-4)2+(4-4)28=7×2+(4-4)28<2,所以x -=4,s 2<2. 3.(2019届武汉调研)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式有:A .结伴步行,B .自行乘车,C .家人接送,D .其他方式.将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,知本次抽查的学生中结伴步行(A)上学的人数是( )A .30B .40C .42D .48解析:选A 由条形统计图知,B :自行乘车上学的有42人,C :家人接送上学的有30人,D :其他方式上学的有18人,采用B ,C ,D 三种方式上学的共90人,设A :结伴步行上学的有x 人,由扇形统计图知,A :结伴步行上学与B :自行乘车上学的学生占60%,所以x +42x +90=60100,解得x =30,故选A . 4.如图是某位同学近5次数学测试成绩(单位:分)的茎叶图,其中有一次测试成绩记录不清楚,其末位数记为x ,若该同学这5次数学测试成绩的中位数是122分,则该同学这5次数学测试成绩的平均数不可能是( )A .123.4分B .123.6分C .123.8分D .124分解析:选D 因为该同学这5次数学测试成绩的中位数是122分,所以x 的所有可能取值为0,1,2.当x =0时,平均数为123.4分;当x =1时,平均数为123.6分;当x =2时,平均数为123.8分.故选D .5.为了了解现在互联网行业的就业情况,某高校教授组织学生对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图(如图1)和90后从事互联网行业者岗位分布图(如图2),则下列结论中不一定正确的是(注:80后是指在1980~1989年(包含1980年与1989年)出生,90后是指在1990~1999年(包含1990年与1999年)出生,80前是指在1979年及以前出生)( )A .互联网行业从业人员中80后的人数不超过一半B .互联网行业中90后从事技术岗位的人数超过所有年龄从业者总人数的20%C .互联网行业中90后从事市场岗位的人数少于所有年龄从业者总人数的10%D .互联网行业中从事职能岗位的人数90后比80后多解析:选D 对于A 选项,由饼状图可知80后人数占了41%,故A 正确;对于B 选项,90后从事技术岗位的人数所占比例为39.6%,由饼状图知90后人数占了56%,所以56%×39.6%=22.176%>20%,故B 正确;对于C 选项,90后从事市场岗位的人数所占比例为13.2%,由饼状图知90后人数占了56%,所以56%×13.2%=7.392%<10%,故C 正确;对于D 选项,因为80后从事职能岗位的人数所占比例不清楚,所以无法判断,故D 错误.故选D .6.(2020届成都摸底)如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是( )A .甲所得分数的极差为22B .乙所得分数的中位数为18C .两人所得分数的众数相等D .甲所得分数的平均数低于乙所得分数的平均数解析:选D 由茎叶图知,甲所得分数的极差为33-11=22,故A 正确;乙所得分数的中位数为18,故B 正确;甲、乙两人所得分数的众数都是22,故C 正确;甲所得分数的平均数为11+15+17+20+22+22+24+32+339=1969,乙所得分数的平均数为8+11+12+16+18+20+22+22+319=1609,故D 错误.故选D . 7.(2019年全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.解析:经停该站高铁列车所有车次的平均正点率的估计值为10×0.97+20×0.98+10×0.9910+20+10=0.98. 答案:0.988.(2019年江苏卷)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.解析:数据6,7,8,8,9,10的平均数是6+7+8+8+9+106=8,所以方差是16×[(6-8)2+(7-8)2+2×(8-8)2+(9-8)2+(10-8)2]=53. 答案:539.如图是某篮球运动员在5场比赛中得分的茎叶图,则这5场比赛得分的方差为________.解析:这5场比赛的平均得分为(19+21+23+25+27)÷5=23,所以得分的方差为15×[(19-23)2+(21-23)2+(23-23)2+(25-23)2+(27-23)2]=8.答案:810.某工厂为了解某车间生产的每件产品的净重(单位:克)情况,从中随机抽测了200件产品的净重,所得数据均在区间[96,106]内,将所得数据按[96,98),[98,100),[100,102),[102,104),[104,106]分成五组,其频率分布直方图如图所示,且五个小矩形的高构成一个等差数列,则在抽测的200件产品中,净重在区间[98,102)内的产品件数是________.解析:由题意可知,0.050,a ,b ,c ,d 构成等差数列,设公差为t .由小矩形的面积之和为1可得(0.050+a +b +c +d )×2=1,即0.050+a +b +c +d =0.5,所以5×0.050+5×42×t =0.5,解得t =0.025.所以b =0.050+0.025×2=0.100,d =0.050+0.025×4=0.150.所以净重在区间[98,102)内的频率为(b +d )×2=(0.100+0.150)×2=0.5,则净重在区间[98,102)内的产品件数为200×0.5=100.答案:10011.(2019届石家庄高三一模)小明在石家庄市某物流公司找到了一份派送员的工作,该公司给出了甲、乙两种日薪薪酬方案,其中甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪140元,每日派送的前55单没有奖励,超过55单的部分每单奖励12元.(1)请分别求出甲、乙两种薪酬方案中日薪y (单位:元)与派送单数n 的函数关系式;(2)根据该公司100天所有派送员的派送记录,发现每名派送员的日平均派送单数与天数满足下表: 日平均派送单数 52 54 56 58 60天数20 30 20 20 10①设一名派送员的日薪为x (单位:元),根据以上数据,试分别求出甲、乙两种方案中日薪x 的平均数及方差;②结合①中的数据,根据统计的知识,帮助小明分析,他选择哪种薪酬方案比较合适,并说明你的理由.(参数数据:0.62=0.36,1.42=1.96,2.62=6.76,3.42=11.56,3.62=12.96,4.62=21.16,15.62=243.36,20.42=416.16,44.42=1 971.36)解:(1)由题意知,甲方案中派送员的日薪y (单位:元)与派送单数n 的函数关系式为y =100+n ,n ∈N ;乙方案中派送员的日薪y (单位:元)与派送单数n 的函数关系式为y =⎩⎪⎨⎪⎧140(n ≤55,n ∈N ),12n -520(n >55,n ∈N ). (2)①由(1)及表格可知,甲方案中,日薪为152元的有20天,日薪为154元的有30天,日薪为156元的有20天,日薪为158元的有20天,日薪为160元的有10天,则x -甲=1100×(152×20+154×30+156×20+158×20+160×10)=155.4,s 2甲=1100×[20×(152-155.4)2+30×(154-155.4)2+20×(156-155.4)2+20×(158-155.4)2+10×(160-155.4)2]=6.44,乙方案中,日薪为140元的有50天,日薪为152元的有20天,日薪为176元的有20天,日薪为200元的有10天,则x -乙=1100×(140×50+152×20+176×20+200×10)=155.6, s 2乙=1100×[50×(140-155.6)2+20×(152-155.6)2+20×(176-155.6)2+10×(200-155.6)2]=404.64.②由①可知,x -甲<x -乙,但两者相差不大,且s 2甲远小于s 2乙,即甲方案中日薪的波动相对较小,所以小明选择甲方案比较合适.B 级·素养提升|练能力|12.(2020届广州四校联考)如图是2019年第一季度A ,B ,C ,D ,E 五省GDP 情况图,则下列叙述中不正确的是( )A .2019年第一季度GDP 增速由高到低排位第5的是A 省B .与2018年同期相比,各省2019年第一季度的GDP 总量实现了增长C .2018年同期C 省的GDP 总量不超过4 000亿元D .2019年第一季度GDP 总量和增速由高到低排位均居同一位的省只有1个解析:选D 由折线图可知A 、B 正确;4 067.4÷(1+6.6%)≈3 816<4 000,故C 正确;2019年第一季度GDP 的总量和增速由高到低排位均居同一位的省有B 省均第一,C 省均第四,共有2个,故D错误.故选D.13.(2020届惠州调研)某高校调查了320名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20],(20,22.5],(22.5,25],(25,27.5],(27.5,30].根据频率分布直方图,在这320名学生中,每周的自习时间不超过22.5小时的人数是( )A.68 B.72C.76 D.80解析:选B 根据题图知,在这320名学生中,每周的自习时间不超过22.5小时的人数是(0.07+0.02)×2.5×320=72,故选B.14.第23届冬季奥林匹克运动会于2018年2月9日~25日在韩国平昌郡举行,简称“平昌冬奥会”.某媒体随机采访了某市20名关注“平昌冬奥会”的市民,其年龄数据绘制成如图所示的茎叶图,由于其中部分数据缺失,故打算根据频率分布直方图中的数据估计被采访的市民的平均年龄.(1)完成频率分布直方图;(2)根据(1)中的频率分布直方图估计被采访的市民的平均年龄x(同一组中的数据用该组区间的中点值作代表);(3)根据茎叶图计算出被采访的市民的平均年龄为y,并假设a∈{n∈Z|0≤n≤9},且a 取得每一个可能值的机会相等,在(2)的条件下.求P(y>x).解:(1)由题意知,频率分布直方图如图所示:(2)由题意知,x=25×0.1+35×0.15+45×0.3+55×0.25+65×0.2=48,即估计被采访的市民的平均年龄为48岁.(3)y =20×2+30×3+40×6+50×5+60×4+98+a 20=958+a 20, 故P (y >x )=P ⎝⎛⎭⎪⎫958+a 20>48=P (a >2)=0.7.。
高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案
第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
(人教A版)高考数学一轮复习精品学案:用样本估计总体及线性相关关系
2019年高考数学一轮复习精品学案(人教版A 版)用样本估计总体及线性相关关系一.【课标要求】1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差; ③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识. 2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 二.【命题走向】“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布.预测2019年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.【要点精讲】1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=n i i x x n S 叫做这n 个数据方差;同时=s )(11∑=-ni i x x n 叫做这n 个数据的标准差。
一轮复习必修三用样本估计总体导学案.docx
课题:用样本估计总体学习目标:1. 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2•理解样本数据标准差的意义和作用,会计算数据标准差.3•能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4•会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.考点说明:1 •本节是用样本估计总体,是统计学的基础.以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解.2.本节在高考题中主要是以选择题和填空题为主,属于中低档题目・知识要点:1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)・(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图公式:频率二------------- 频率二组距X小长方形再积巩固练习:某班有学生50人,最矮的155cm,最高的184cm,其中[1 55,1 60)8人,[1 6Q1 65)10 人,[165,170)8 人,[17Q175)10 人,[175,180)10人,[18Q185)4人,绘制频率分布直方图。
2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.巩固练习: (2) ________________________________________________ 总体密度曲线:随着 样本容量 的增加,作图时 _________________________________________ 所分的组增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度 曲线. 3. 样本的数字特征(1)众数: 样本数据中出现最多的数据(2)中位数:样本数据按大小排序之后位于中间的一个数或两个数和的一半即为中位数一 无[+X,+Xa+ ・・・+兀“(3) ------------------------------------------------------- 平均数:兀= —=—:(4) 标准差是样本数据到平均数的一种平均距离。
高考数学一轮复习第九章 第三讲用样本估计总体学案含解析新人教版
第三讲 用样本估计总体知识梳理·双基自测知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①__求极差__;②__决定组距与组数__;③__将数据分组__;④__列频率分布表__;⑤__画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中__各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指__中间__的一列数,叶是从茎的__旁边__生长出来的数.(2)茎叶图的优点是可以__保留__原始数据,而且可以__随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =__x 1+x 2+…+x n n __,反映了一组数据的平均水平.(4)标准差: s =__1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度. (5)方差:s 2=__1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.归纳拓展(1)若一组数据x i (i =1,2,…,n )的平均数为x -,方差为s 2,则数据组ax i +b (i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有__25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为(C)A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为(B)A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02=0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165)0.100笫2组[165,170)①第3组[170,175)20②第4组[175,180)200.200第5组[180,185)100.100合计100 1.00 (ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·湖北恩施州质检)为了解人们对环保知识的认知情况,某调查机构对A地区随机选取n个居民进行了环保知识问卷调查(满分为100分),并根据问卷成绩(不低于60分记为及格)绘制成如图所示的频率分布直方图(分为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组),若问卷成绩最后三组频数之和为360,则下列结论正确的是__②③④__.①n=480②问卷成绩在[70,80)内的频率为0.3③a=0.030④以样本估计总体,若对A 地区5 000人进行问卷调查,则约有1 250人不及格 [解析] (1)(ⅰ)第1组的频数为100×0.100=10, 所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)(理)记“第4组至少有一名选手被考官A 面试”为事件A ,则P (A )=C 12C 13+C 22C 25=710. ⎝⎛⎭⎫或P (A )=1-P (A -)=1-C 23C 25=710(文)设第3组的2位选手为A 1,A 2,第4组的2位选手为B 1,B 2,第5组的1位选手为C 1,则从这五位选手中抽取两位选手有(A 1,A 2),(A 1,B 1),(A 1,B 2),(A 1,C 1),(A 2,B 1),(A 2,B 2),(A 2,C 1),(B 1,B 2),(B 1,C 1),(B 2,C 1),共10种情况.其中第4组的2位选手B 1,B 2,中至少有一位入选的有(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(B 1,B 2),(B 1,C 1),(B 2,C 1),共有7种情况,所以第4组至少有一名选手被考官A 面试的概率为710.(2)由(0.010+0.015+0.015+a+0.025+0.005)×10=1,得a=0.030,n=360=600.故①不正确,③正确;成绩在[70,80)内的频率为10a=0.3,故②10(a+0.025+0.005)正确;若对A地区5 000人进行问卷调查,则约有5 000×(0.1+0.15)=1 250人不及格,故④正确.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为__220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是(C)A .12B .13C .14D .15[解析] (1)根据频率分布直方图知:(2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (2021·四川省乐山市调研)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法不正确...的是( C ) a b 6 4 4 23 8 64 143.1 3.2 3.3 3.42 3 7 1 1 1 1 2 5 7A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确;b品种的众数为3.31与3.41,故C错误;a品种的数据的中位数为:3.23+3.312=3.27,故D正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为(A)甲组乙组62 5x4567917y8A.3,5C.3,7 D.5,7[解析]甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.考点三,样本数字特征——多维探究角度1样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是(B)A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为__367__. [解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=(a 1-5)2+(a 2-5)2+…+(a 7-5)2+(5-5)28=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为__155__,平均数为__156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )7 8 9 8 4 6 7 7 91 4 8 8 9 9A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s ′2,则x -′,s ′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2 C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四,折线图——师生共研例4 (2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论正确的是( A )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选A .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x-乙,则下列结论正确的个数为( B )①每次考试甲的成绩都比乙的成绩高 ②甲的成绩比乙稳定 ③x -甲一定大于x -乙④甲的成绩的极差大于乙的成绩的极差 A .1 B .2 C .3D .4[解析] 第二次考试甲的成绩比乙低,①错;由图可知甲的成绩比乙的成绩波动小,②正确,④错;甲的平均成绩显然比乙的平均成绩高,③正确;故选B .名师讲坛·素养提升高考与频率分布直方图例5 (理)(2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频数6920105(2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.(文)(2021·河南新乡模拟)甲、乙两人想参加某项竞赛,根据以往20次的测试,将样本数据分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,并整理得到如下频率分布直方图:已知甲测试成绩的中位数是75.(1)求x ,y 的值,并分别求出甲、乙两人测试成绩的平均数(假设同一组中的每个数据可用该组区间中点值代替);(2)从甲、乙两人测试成绩不足60分的试卷中随机抽取3份,求恰有2份来自乙的概率. [解析] (理)(1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P (X =0)=C 33C 36=120,P (X =1)=C 13C 23C 36=920,P (X =2)=C 23C 13C 36=920,P (X =3)=C 33C 36=120,所以分布列为: X123P 120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.(文)(1)∵甲测试成绩的中位数为75,∴0.01×10+y×10+0.04×(75-70)=0.5,解得y=0.02,∴0.01×10+y×10+0.04×10+x×10+0.005×10=1,解得x=0.025.同学甲的平均分为55×0.01×10+65×0.02×10+75×0.04×10+85×0.025×10+95×0.005×10=74.5.同学乙的平均分为55×0.015×10+65×0.025×10+75×0.03×10+85×0.02×10+95×0.01×10=73.5.(2)甲测试成绩不足60分的试卷数为20×0.01×10=2,设为A,B.乙测试成绩不足60分的试卷数为20×0.015×10=3,设为a,b,c.从中抽3份的情况有(A,B,a),(A,B,b),(A,B,c),(A,a,b),(A,a,c),(A,b,c),(B,a,b),(B,a,c),(B,b,c),(a,b,c),共10种情况.满足条件的有(A,a,b),(A,a,c),(A,b,c),(B,a,b),(B,a,c),(B,b,c),共6种情况,故恰有2份来自乙的概率为610=35.名师点拨](1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)准确理解频率分布直方图的数据特点是解题关键.〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。
《9.2 用样本估计总体》教学导学案(统编人教A版)
9.2.1总体取值规律的估计知识点一频率分布表与频率分布直方图1.一般地,当总体很大或不便获取时,用□01样本的频率分布估计□02总体的频率分布.把反应总体频率分布的表格称为□03频率分布表.2.把表示□04样本数据分布规律的图形称为□05频率分布直方图.3.制作频率分布表与频率分布直方图的一般步骤:(1)求极差,即计算□06最大值与最小值的差.(2)决定□07组距与组数.(3)将数据□08分组.(4)列□09频率分布表.(5)画频率分布直方图.知识点二常用的统计图1.条形图条形图能清楚地表示出每个项目的□01具体数量.2.折线图折线图能够清晰地反映数据的□02变化趋势或情况.3.扇形图扇形图能直观、生动地反映各部分在总体中所占的□03比例情况.1.频率分布直方图能够直观、形象地反映样本的分布规律,可以大致估计出总体的分布,但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.在频率分布直方图中,由于长方形的面积S=组距×频率组距=频率,所以各个小长方形的面积表示相应各组的频率,这样频率分布直方图就以面积的形式反映了数据在各个小组的频率的大小,各个小长方形的面积总和等于1.2.一般地,样本量越大,这种估计就越精确.总体估计要掌握:(1)“表”(频率分布表);(2)“图”(频率分布直方图).提醒:直方图的纵轴(小长方形的高)一般是频率除以组距的商,横轴一般是数据的大小,小长方形的面积表示频率.1.判一判(正确的打“√”,错误的打“×”)(1)频率分布直方图的纵轴表示频率.()(2)数据落在各小组内的频率用各小组频数样本量来表示.()(3)频率分布直方图把样本数据落在各小组的比例大小直观化,更有利于我们从整体上把握数据分布的特点.()答案(1)×(2)√(3)√2.做一做(1)将容量为100的样本数据分为8个组,如下表:组号12345678频数1013x 141513129 则第A.0.03 B.0.07C.0.14 D.0.21(2)一个容量为n的样本,分成若干组,已知某组的频率和频数分别为0.125和40,则n的值为()A.640 B.320C.240 D.160(3)一个容量为20的样本,分组后,组距与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则样本在[10,50)上的频率为()A.120 B.14 C.12 D.710(4)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有______株树木的底部周长小于100 cm.答案(1)C(2)B(3)D(4)24题型一频率分布直方图的画法例1从某校高一年级1002名新生中随机抽取一个容量为100的身高样本,数据如下(单位:cm),试作出该样本的频率分布表和频率分布直方图.168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174168164174171165179163169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166[解](1)在全部数据中找出最大值180,最小值151,计算极差=180-151=29.(2)取组距为3,则组数为293≈10.(3)从第一组[150.5,153.5)开始,统计出各组的频数,再计算各组的频率,并将结果填入下表:频率分布直方图如图.绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,47,70.(1)将数据分为7组,列出频率分布表,并画出相应的频率分布直方图;(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.解(1)以4为组距,列频率分布表如下:分组频数频率[42,46)20.0444[46,50)70.1555[50,54)80.1778[54,58)160.3556[58,62)50.1111[62,66)40.0889[66,70]30.0667合计45 1.0000画出相应的频率分布直方图,如图所示.(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁及45岁以下和65岁以上就任的总统所占的比例相对较小.题型二频率分布直方图的应用例2为了迎接某市作为全国文明城市的复查,爱卫会随机抽取了60位路人进行问卷调查,调查项目是自己对该市各方面卫生情况的满意度(假设被问卷的路人回答是客观的),以分数表示问卷结果,并统计他们的问卷分数,把其中不低于50分的分成五段:[50,60),[60,70),…,[90,100]后画出如图所示的部分频率分布直方图,观察图形信息,回答下列问题:(1)求出问卷调查分数低于50分的被问卷人数;(2)估计全市市民满意度在60分及以上的百分比.[解](1)因为各组的频率之和等于1,故低于50分的频率为f=1-(0.015×2+0.030+0.025+0.005)×10=0.1,故低于50分的人数为60×0.1=6.(2)依题意,60分及以上的频率和为(0.015+0.030+0.025+0.005)×10=0.75,所以抽样满意度在60分及以上的百分比为75%.于是,可以估计全市市民满意度在60分及以上的百分比为75%.频率分布直方图的应用频率分布指的是一个样本数据在各个小范围内所占比例的大小,一般用频率分布直方图反映样本的频率分布,其中:(1)频率分布直方图中纵轴表示频率组距;(2)频率分布直方图中,各个小长方形的面积等于频率,各个小长方形的面积之和为1;(3)长方形的高的比也就是频率之比.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.答案0.030 3解析因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为1860×10=3.题型三统计图表的应用例3某省有关部门要求各中小学要把“每天锻炼一小时”写入课程表,为了响应这一号召,某校围绕着“你最喜欢的体育活动项目是什么?(只写一项)”的问题,对在校学生进行了随机抽样调查,从而得到一组数据.图1是根据这组数据绘制的柱形图.请结合柱形图回答下列问题:(1)该校对多少名学生进行了抽样调查?(2)本次抽样调查中,最喜欢篮球活动的有多少人?占被调查人数的百分比是多少?(3)若该校九年级共有200名学生,图2是根据各年级学生人数占全校学生总人数的百分比绘制的扇形图,请你估计全校学生中最喜欢跳绳活动的人数约为多少?[解](1)由图1知4+8+10+18+10=50(名),所以该校对50名学生进行了抽样调查.(2)本次调查中,最喜欢篮球活动的有18人,占被调查人数的1850×100%=36%.(3)1-(30%+26%+24%)=20%,200÷20%=1000(人),850×100%×1000=160(人),所以估计全校学生中最喜欢跳绳活动的人数约为160.(1)柱形图是用一个单位长度表示一定的数量,根据数量的多少画成高度不同的小矩形,然后把这些小矩形按照一定的顺序排列起来.其特点是便于看出和比较各种数量的多少,即柱形图能清楚地表示出每个项目的具体数目.(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各部分所占总数的百分数.总之,用图表来表示数量关系更生动形象、具体,使人一目了然.下表给出了2018年A,B两地的降水量(单位:mm):(1)根据统计表绘制折线图;(2)根据折线图比较A,B两地的降水量,分析哪个地方的降水量较大?解(1)建立直角坐标系,用横坐标上的点表示月份,用纵坐标上的点表示降水量,描出每个月份对应的点,然后用直线段顺次连接相邻的点,得到折线统计图如图表示.(2)观察折线图,从整体上看,B地降水量较大.1.反映某种股票的涨跌情况,应选择()A.条形图B.折线图C.扇形图D.三种图均可答案 B解析条形图主要用于直观描述不同类别或分组数据的频数,折线图主要用于描述数据随时间变化的趋势,扇形图主要用于直观描述各类数据占总数的比例.故选B.2.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8C.12 D.18答案 C解析志愿者的总人数为20(0.24+0.16)×1=50,所以第三组的人数为50×0.36×1=18,所以有疗效的人数为18-6=12.3.一个频率分布表(样本量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为()A.14 B.15C.16 D.17答案 B解析∵样本中数据在[20,60)内的频率为0.8,∴样本数据在[20,60)内的频数为30×0.8=24,∴样本在[40,50),[50,60)内的数据个数共为24-4-5=15.4.某电子商务公司对10000名网络购物者2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3.0(2)6000解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2.0×0.1+2.5×0.1+a×0.1=1,解得a=3.0,消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2.0×0.1+3.0×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10000=6000.5.从高三参加数学竞赛的学生中抽取50名学生的成绩,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例;(4)估计成绩在80分以下的学生比例.解(1)频率分布表如下:成绩分组频数频率[40,50)20.04[50,60)30.06[60,70)100.2[70,80)150.3[80,90)120.24[90,100]80.16合计50 1(2)频率分布直方图如图所示.(3)样本中成绩在[60,90)分的学生比例为0.20+0.30+0.24=0.74=74%.由样本估计总体,成绩在[60,90)分的学生约占74%.(4)样本中成绩在80分以下学生比例为1-(0.24+0.16)=1-0.4=0.6=60%.由样本估计总体,成绩在80分以下的学生约占60%.。
2021年高考数学一轮复习 9.2 用样本估计总体课时作业 理(含解析)新人教A版
2021年高考数学一轮复习 9.2 用样本估计总体课时作业理(含解析)新人教A版一、选择题1.(xx·厦门市高三质检)某雷达测速区规定:凡车速大于或等于80 km/h 的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有( )A.20辆 B.40辆 C.60辆 D.80辆解析:由图知车速大于或等于80 km/h的频率为0.1,被罚车辆大约为200×0.1=20辆,选A.答案:A2.(xx·武汉调研测试)某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:频率分布直方图中、各个矩形的面积和为1,所以20a +0.2+0.3+0.4=1,∴a =0.005.答案:B3.(xx·安徽亳州高三摸底联考)样本中共有五个个体,其值分别为a,2,3,4,5,若该样本的平均值为3,则样本方差为( )A.65 B.65C. 2 D .2 解析:由a +2+3+4+55=3得a =1∴方差S 2=15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.∴故答案为D. 答案:D4.(xx·石家庄第二次模拟)给定一组数据x 1,x 2,…,x 20,若这组数据的方差为3,则数据2x 1+3,2x 2+3,…,2x 20+3的方差为( )A .6B .9C .12D .15解析:由D (aξ+b )=a 2D (ξ),可知2x 1+3,2x 2+3,…,2x 20+3的方差为12.故选C. 答案:C5.(xx·陕西卷)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则( )A.x甲<x乙,m甲>m乙B.x甲<x乙,m甲<m乙C.x甲>x乙,m甲>m乙D.x甲>x乙,m甲<m乙解析:由题图可得x甲=34516=21.562 5,m甲=20,x乙=45716=28.562 5,m乙=29,所以x甲<x乙,m甲<m乙.故选B.答案:B6.(xx·安徽卷)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差解析:由图可得,x甲=4+5+6+7+85=6,x乙=3×5+6+95=6,故A错;而甲的成绩的中位数为6,乙的成绩的中位数为5,故B 错;s 2甲=4-62+5-62+6-62+7-62+8-625=2,s 2乙=3×5-62+6-62+9-625=2.4,故C 正确;甲的成绩的极差为4,乙的成绩的极差也为4,故D 错.答案:C 二、填空题7.(xx·贵州省六校第一次联考)某同学学业水平考试的9科成绩如茎叶图所示,则根据茎叶图可知该同学的平均分为________.解析:由茎叶图可知该同学的分数由个位及十位数组成,个位数的平均数与十位数的平均数之和为该同学的平均数,所以平均分为:x =1×60+4×70+3×80+1×909+3×8+2×9+2×2+1+39=670+509=80.答案:808.(xx·马鞍山第一次质检)已知总体的各个个体的值由小到大依次为3,7,a ,b,12,20,且总体的中位数为12,若要使该总体的标准差最小,则a =________.解析:总体的中位数为a +b2=12,即a +b =24,数据是从小到大排列的7≤a ≤b ≤12,∴a =b =12.答案:129.(xx·保定市高三第一次模拟)一个频率分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.解析:由已知样本数据在[20,60)上的频率为0.6,故在[20,60)上的数据为30,则在[40,50),[50,60)内的数据个数之和为21.答案:21三、解答题10.为征求个人所得税法修改建议,某机构对当地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,4 000)的频率;(2)根据频率分布直方图估算样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?解:(1)居民月收入在[3 000,4 000)的频率为(0.000 3+0.000 1)×500=0.2.(2)第一组和第二组的频率之和为(0.000 2+0.000 4)×500=0.3,第三组的频率为0.000 5×500=0.25,因此,可以估算样本数据的中位数为2 000+0.5-0.30.25×500=2 400(元).(3)第四组的人数为0.000 5×500×10 000=2 500,因此月收入在[2 500,3 000)的这段应抽2 500×10010 000=25(人).11.某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组[100,200],第二组(200,300],第三组(300,400],第四组(400,500],第五组(500,600],第六组(600,700],由于工作中不慎将部分数据丢失,现有以下部分图表:分组 [100,200](200,300] (300,400](400,500](500,600] (600,700]频数 B 30EF20H 频率CD 0.20.4GI(2)求图2中阴影部分的面积;(3)若电子元件的使用时间超过300h 为合格产品,求这批电子元件合格的概率. 解:(1)由题意可知0.1=A ·100,∴A =0.001, ∵0.1=B200,∴B =20,又C =0.1,D =30200=0.15,E =0.2×200=40,F =0.4×200=80,G =20200=0.1, ∴H =10,I =10200=0.05. (2)阴影部分的面积为0.4+0.1=0.5.(3)电子元件的使用时间超过300 h 的共有40+80+20+10=150个,故这批电子元件合格的概率P =150200=34.[热点预测]12.(1)(xx·莆田质检)一组数据如茎叶图所示.若从中剔除2个数据,使得新数据组的平均数不变且方差最小,则剔除的2个数据的积等于________.(2)(xx·江门佛山两市质检)为了解一片速生林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出样本的频率分布直方图(如下图),那么在这100株树木中,底部周长小于110cm的株数是( )A.30 B.60 C.70 D.80解析:(1)这组数据的平均数x=3+8+12+11+13+16+217=12,若剔除两个数据后平均数不变,则这两个数之和为24.若使方差最小,则这两个数应与12的差较大,所以剔除3和21,其乘积为3×21=63.(2)100×(0.1+0.2+0.4)=70.答案:(1)63 (2)C22856 5948 奈=21432 53B8 厸121070 524E 剎V27321 6AB9 檹?40185 9CF9 鳹n38761 9769 革23834 5D1A 崚n21879 5577 啷。
2021版高考文科数学人教A版一轮复习 六十二 用样本估计总体
温馨提示:此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。
关闭Word文档返回原板块。
核心素养测评六十二用样本估计总体(30分钟60分)一、选择题(每小题5分,共25分)1.某学生在一门功课的22次考试中,所得分数的茎叶图如图所示,则此学生该门功课考试成绩的极差与中位数之和为( )A.117B.118C.118.5D.119.5【解析】选B.22次考试成绩最高为98分,最低为56分,所以极差为98-56=42,从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试成绩的极差与中位数之和为42+76=118.2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56B.60C.120D.140【解析】选D.由频率分布直方图可知,每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.3.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差【解析】选A.9个数据去掉最高分与最低分2个,最中间的数据没变,所以不变的数字特征是中位数.4.(2020·芜湖模拟)由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为( )A. B.C. D.【解析】选C.因为x1<x2<x3<x4<x5<-1,所以x1<x3<x5<1<-x4<-x2,则该组样本的中位数为中间两数的平均数,即.5.(2020·潍坊模拟)如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,三星销量约占30%,苹果销量约占20%),根据该图,以下结论中一定正确的是 ( )A.四个季度中,每季度三星和苹果总销量之和均不低于华为的销量B.苹果第二季度的销量小于第三季度的销量C.第一季度销量最大的为三星,销量最小的为苹果D.华为的全年销量最大【解析】选D.对于A,第四季度中,华为销量大于50%,三星和苹果总销量之和低于华为的销量,故A错误;对于B,每个季度的销量不确定,根据每个季度的百分比无法比较苹果在第二、三季度销量的多少;对于C,第一季度销量最大的是华为,故C错误;对于D,由图知,四个季度华为的销量占比都最大,所以华为的全年销量最大,D正确.二、填空题(每小题5分,共15分)6.(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.【解析】由题意,该组数据的平均数为=8,所以该组数据的方差是[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=.答案:7.(2020·阳泉模拟)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是________. 世纪金榜导学号①众数是9;②平均数是10;③中位数是9;④标准差是3.4.【解析】由题意可知,该组数据分别为:7,8,9,9,9,10,11,12,12,13, 该组数据的众数为9,平均数为=10,中位数为=9.5,标准差为=,因此,①②正确.答案:①②8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)频率分布直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250)内的户数为________.世纪金榜导学号【解析】(1)由频率分布直方图中各小矩形的总面积为1,得(0.0012+0.002 4×2+0.003 6+x+0.006 0)×50=1,解得x=0.004 4.(2)用电量在[100,250)内的频率为(0.003 6+0.004 4+0.006 0)×50=0.7,故用电量落在区间[100,250)内的户数为100×0.7=70.答案:(1)0.004 4 (2)70三、解答题(每小题10分,共20分)9.为庆祝国庆节,某中学团委组织了“歌颂祖国,爱我中华”知识竞赛,从参加考试的学生中抽出60名,将其成绩(成绩均为整数)分成[40,50),[50,60),…, [90,100]六组,并画出如图所示的部分频率分布直方图,观察图形,回答下列问题:(1)求第四组的频率,并补全这个频率分布直方图.(2)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】(1)因为各组的频率和等于1,所以第四组的频率为1-(0.025+0.015×2+0.010+0.005)×10=0.3.补全的频率分布直方图如图所示.(2)依题意可得第三、四、五、六组的频率之和为(0.015+0.030+0.025+0.005)×10=0.75,则可估计这次考试的及格率是75%.因为抽取学生的平均分约为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分),所以可估计这次考试的平均分为71分. 10.为了比较两种治疗失眠症的药(分别称为A药, B药)的疗效,随机选取18位患者服用A药,18位患者服用B药,这36位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下: 服用A药的18位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.22.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3服用B药的18位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.31.6 0.5 1.8 0.62.1 1.1 2.5 1.2 2.7(1)分别计算两组数据的平均数(小数点后保留两位小数),从计算结果看哪种药疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?并说明理由.世纪金榜导学号【解析】(1)服用A药的18位患者日平均增加的睡眠时间的平均数为=(0.6+1.2+2.7+…+3.0+3.1+2.3)≈2.23(h)服用B药的18位患者日平均增加的睡眠时间的平均数为=(3.2+1.7+1.9+…+2.5+1.2+2.7)≈1.67(h),因为2.23>1.67,所以A种药的疗效更好.(2)由观测结果可绘制如图茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.(15分钟35分)1.(5分)(2020·福州模拟)某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数与平均数分别为 ( )A.20,22.5B.22.5,25C.22.5,22.75D.22.75,22.75【解析】选C.根据频率分布直方图,得平均数为5×(12.5×0.02+17.5×0.04+22.5×0.08+27.5×0.03+32.5×0.03)=22.75,因为0.02×5+0.04×5=0.3<0.5,0.3+0.08×5=0.7>0.5,所以中位数应在20~25内,设中位数为x,则0.3+(x-20)×0.08=0.5,解得x=22.5,所以这批产品的中位数是22.5.2.(5分)(2020·郑州模拟)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则4x+2y的值是( )A.12B.14C.16D.18【解析】选A.因为中位数为12,所以x+y=4,数据的平均数为×(2+2+3+4+ x+y+20+19+19+20+21)=11.4,要使该总体的标准差最小,即方差最小,所以(10+x-11.4)2+(10+y-11.4)2=(x-1.4)2+(y-1.4)2≥2=0.72,当且仅当x-1.4=y-1.4,即x=y=2时取等号,此时总体标准差最小,4x+2y=12.3.(5分)(2020·阳泉模拟)气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8. 则肯定进入夏季的地区有________.(填序号)【解析】①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22,22,24,25,26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19,20,27,27,27时,可知其连续5天的日平均温度有低于22 ℃的,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22.则肯定进入夏季的地区有甲、丙两地.答案:①③4.(10分)(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例.(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 世纪金榜导学号附:≈8.602.【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=n i=[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,所以s==0.02×≈0.17,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.5.(10分)(2020·昆明模拟)栀子原产于中国,喜温暖湿润、阳光充足的环境,较耐寒.叶,四季常绿;花,芳香素雅.绿叶白花,格外清丽.某地区引种了一批栀子作为绿化景观植物,一段时间后,从该批栀子中随机抽取100棵测量植株高度,并以此测量数据作为样本,得到该样本的频率分布直方图,其中不高于1.50 m的植株高度茎叶图如图所示. 世纪金榜导学号(1)求植株高度频率分布直方图中a,b,c的值.(2)在植株高度频率分布直方图中,同一组中的数据用该区间的中点值代表,植株高度落入该区间的频率作为植株高度取该区间中点值的频率,估计这批栀子植株高度的平均值.【解析】(1)由茎叶图知,a==0.5,b==1.由频率分布直方图知(0.5+1+c+3+4)×0.1=1,所以c=1.5.(2)这批栀子植株高度的平均值的估计值为(1.35×0.5+1.45×1+1.55×3+1.65×4+1.75×1.5)×0.1=1.60(m). 【拓广探索练】(2020·佛山模拟)某高中非毕业班学生人数分布情况如表,为了了解这2 000个学生的体重情况,从中随机抽取160个学生并测量其体重数据,根据测量数据制作了如图所示的频率分布直方图. 世纪金榜导学号性别男生女生合计年级高一年级550 650 1 200高二年级425 375 800合计975 1 025 2 000(1)为了使抽取的160个样品更具代表性,宜采取分层抽样,请你给出一个你认为合适的分层抽样方案,并确定每层应抽取的样品个数.(2)根据频率分布直方图,求x的值,并估计全体非毕业班学生中体重在[45,75)内的人数.(3)已知高一全体学生的平均体重为58.50 kg,高二全体学生的平均体重为61.25 kg,试估计全体非毕业班学生的平均体重.【解析】(1)方案一:考虑到体重应与年级及性别均有关,最合理的分层应分为以下四层:高一男生、高一女生、高二男生、高二女生高一男生:×160=44(人),高一女生:×160=52(人),高二男生:×160=34(人),高二女生:×160=30(人),方案二:按性别分为两层,男生与女生:男生人数:×160=78(人),女生人数:×160=82(人).方案三:按年级分为两层,高一学生与高二学生:高一人数:×160=96(人),高二人数:×160=64(人).(2)体重在[70,80)内的学生人数的频率:1-(0.075+0.2+0.275+0.225+0.05+0.025)=0.15,x==0.015,体重在[45,75)内人数的频率为:0.1+0.275+0.225+0.075=0.675,所以估计全体非毕业班学生体重在[45,75)内的人数为:2 000×0.675= 1 350(人).(3)设高一全体学生的平均体重为=58.5 kg,频率为P1=×100%=60%.高二全体学生的平均体重为=61.25 kg,频率为P2=×100%=40%, 则估计全体非毕业班学生的平均体重为·P1+·P2=58.50×60%+61.25×40%=59.6 (kg).答:估计全校非毕业班学生的平均体重为59.6 kg.关闭Word文档返回原板块快乐分享,知识无界!感谢您的下载!由Ruize收集整理!。
2021版高考文科数学(人教A版)一轮复习高效演练分层突破:第十一章 第2讲 用样本估计总体
[基础题组练]1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( )A .0.05B .0.25C .0.5D .0.7解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.2.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差解析:选A.记9个原始评分分别为a ,b ,c ,d ,e ,f ,g ,h ,i (按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.3.(2020·陕西咸阳模拟检测(二))PM2.5是衡量空气质量的重要指标,我国采用世界卫生组织的最宽值限定值,即PM2.5日均值在35 μg/m 3以下空气质量为一级,在35~75μg/m 3空气质量为二级,超过75 μg/m 3为超标.如图是某地12月1日至10日的PM2.5(单位:μg/m 3)的日均值,则下列说法不正确的是( )A .这10天中有3天空气质量为一级B .从6日到9日PM2.5日均值逐渐降低C .这10天中PM2.5日均值的中位数是55D .这10天中PM2.5日均值最高的是12月6日解析:选C.这10天中第一天,第三天和第四天,共3天空气质量为一级,所以A 正确;从题图可知从6日到9日PM2.5日均值逐渐降低,所以B 正确;从题图可知,这10天中PM2.5日均值最高的是12月6日,所以D 正确; 由题图可知,这10天中PM2.5日均值的中位数是41+452=43,所以C 不正确.故选C.4.甲、乙两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数中相同的是( )A .极差B .方差C .平均数D .中位数解析:选C.由题中茎叶图中数据的分布,可知方差不同,极差不同, 甲的中位数为16+212=18.5,乙的中位数为14+182=16,x -甲=5+16+12+25+21+376=583,x -乙=1+6+14+18+38+396=583,所以甲、乙的平均数相同.故选C.5.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:甲 乙 丙 丁 平均环数x -8.3 8.8 8.8 8.7 方差s 23.53.62.25.4从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是 .解析:由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好. 答案:丙6.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为 ;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为 .解析:设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h +0.07+0.06+0.02)=1,解得h =0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.答案:(1)0.04 (2)4407.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:成绩分组 频数 频率 平均分 [0,20) 3 0.015 16 [20,40) a b 32.1 [40,60) 25 0.125 55 [60,80) c 0.5 74 [80,100]620.3188(1)求a 、b 、c 的值;(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100. (2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=0.81.(3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73,所以这次数学测验的年级平均分大约为73分.8.为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制图如下:每名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超出35件的部分每件7元.(1)根据图中数据写出甲公司员工A 在这10天投递的快递件数的平均数和众数; (2)根据图中数据估算两公司的每位员工在该月所得的劳务费.解:(1)甲公司员工A 在这10天投递的快递件数的平均数为36,众数为33.(2)根据题图中数据,可估算甲公司的每位员工该月所得劳务费为4.5×36×30=4 860(元),易知乙公司员工B 每天所得劳务费X 的可能取值为136,147,154,189,203,所以乙公司的每位员工该月所得劳务费约为110×(136×1+147×3+154×2+189×3+203×1)×30=165.5×30=4 965(元).[综合题组练]1.(2020·安徽五校联盟第二次质检)数据a 1,a 2,a 3,…,a n 的方差为σ2,则数据2a 1,2a 2,2a 3,…,2a n 的方差为( )A.σ22 B .σ2 C .2σ2D .4σ2解析:选D.设a 1,a 2,a 3,…,a n 的平均数为a ,则2a 1,2a 2,2a 3,…,2a n 的平均数为2a ,σ2=(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n.则2a 1,2a 2,2a 3,…,2a n 的方差为(2a 1-2a )2+(2a 2-2a )2+(2a 3-2a )2+…+(2a n -2a )2n=4×(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n=4σ2.故选D.2.(2020·郑州市第二次质量预测)将甲、乙两个篮球队各5场比赛的得分数据整理成如图所示的茎叶图,由图可知以下结论正确的是( )A .甲队平均得分高于乙队的平均得分B .甲队得分的中位数大于乙队得分的中位数C .甲队得分的方差大于乙队得分的方差D .甲、乙两队得分的极差相等解析:选C.由题中茎叶图得,甲队的平均得分x -甲=26+28+29+31+315=29,乙队的平均得分x -乙=28+29+30+31+325=30,x -甲<x -乙,选项A 不正确;甲队得分的中位数为29,乙队得分的中位数为30,甲队得分的中位数小于乙队得分的中位数,选项B 不正确;甲队得分的方差s 2甲=15×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=185,乙队得分的方差s 2乙=15×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2,s 2甲>s 2乙,选项C 正确;甲队得分的极差为31-26=5,乙队得分的极差为32-28=4,两者不相等,选项D 不正确.故选C.3.(2020·沈阳市质量监测(一))某篮球运动员的投篮命中率为50%,他想提高自己的投篮水平,制定了一个夏季训练计划,为了了解训练效果,执行训练前,他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为46.3.执行训练后也统计了10场比赛的得分,茎叶图如图所示:(1)请计算该篮球运动员执行训练后统计的10场比赛得分的中位数、平均得分与方差;(2)如果仅从执行训练前后统计的各10场比赛得分数据分析,你认为训练计划对该运动员的投篮水平的提高是否有帮助?为什么?解:(1)训练后得分的中位数为14+152=14.5;平均得分为8+9+12+14+14+15+16+18+21+2310=15;方差为110[(8-15)2+(9-15)2+(12-15)2+(14-15)2+(14-15)2+(15-15)2+(16-15)2+(18-15)2+(21-15)2+(23-15)2]=20.6.(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练后方差20.6小于训练前方差46.3,说明训练后得分稳定性提高了(阐述观点合理即可),这是投篮水平提高的表现.故此训练计划对该篮球运动员的投篮水平的提高有帮助.4.(2020·广州市调研测试)某蔬果经销商销售某种蔬果,售价为每千克25元,成本为每千克15元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价以每千克10元处理完.根据以往的销售情况,按[0,100),[100,200),[200,300),[300,400),[400,500]进行分组,得到如图所示的频率分布直方图.(1)根据频率分布直方图计算该种蔬果日需求量的平均数x -(同一组中的数据用该组区间中点值代表); (2)该经销商某天购进了250千克该种蔬果,假设当天的需求量为x 千克(0≤x ≤500),利润为y 元.求y 关于x 的函数关系式,并结合频率分布直方图估计利润y 不小于1 750元的概率.解:(1)x -=50×0.001 0×100+150×0.002 0×100+250×0.003 0×100+350×0.002 5×100+450×0.001 5×100=265.故该种蔬果日需求量的平均数为265千克.(2)当日需求量不低于250千克时,利润y =(25-15)×250=2 500(元),当日需求量低于250千克时,利润y =(25-15)x -(250-x )×5=15x -1 250(元),所以y =⎩⎨⎧15x -1 250,0≤x <2502 500,250≤x ≤500,由y≥1 750,得200≤x≤500,所以P(y≥1 750)=P(200≤x≤500)=0.003 0×100+0.002 5×100+0.001 5×100=0.7.故估计利润y不小于1 750元的概率为0.7.。
2021年高考数学大一轮总复习 第9篇 第2节 用样本估计总体课时训练 理 新人教A版
2021年高考数学大一轮总复习 第9篇 第2节 用样本估计总体课时训练理 新人教A 版一、选择题1.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n 的值为( )A .90B .100C .900D .1000解析:支出在[50,60)元的频率为1-0.36-0.24-0.1=0.3, 因此30n=0.3,故n =100.故选B.答案:B2.(xx 年高考湖北卷)容量为20的样本数据,分组后的频数如表:分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70)频数234542A .0.35B .0.45C .0.55D .0.65解析:由表知[10,40)的频数为2+3+4=9, 所以样本数据落在区间[10,40)的频率为920=0.45.故选B. 答案:B3.(xx 年高考山东卷)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解析:由题原来众数88变为90,中位数由86变为88,平均数增加2.所以每个数与平均数的差不变,即标准差不变.故选D.答案:D4.(xx 合肥一中质量检测)某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,所得数据如表:则y 对x A.y ^=2.3x -0.7 B.y ^=2.3x +0.7 C.y ^=0.7x -2.3 D.y ^=0.7x +2.3解析:由题中表格,x =9,y =4,∑i =14x i y i =158,∑i =14x 2i =344,∴b ^=158-4×9×4344-4×92=0.7,a ^=4-0.7×9=-2.3,∴回归直线方程为y ^=0.7x -2.3.故选C. 答案:C5.(xx 西安模拟)某校甲、乙两个班级各有编号为1,2,3,4,5的五名学生进行投篮练习,每人投10次,投中的次数如表:A .25B .425C .35D .4解析:甲班的平均数为x 甲=6+7+7+8+75=7,甲班的方差为s2甲=6-72+7-72+7-72+8-72+7-725=25;乙班的平均数为x乙=6+7+6+7+95=7,乙班的方差为s2乙=6-72+7-72+6-72+7-72+9-725=65.∵65>25,∴s2=25.故选A.答案:A6.(xx年高考重庆卷)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )A.2,5 B.5,5C.5,8 D.8,8解析:因为甲组数据的中位数为15,由茎叶图可得x=5,因乙组数据的平均数为16.8,则9+15+10+y+18+245=16.8,解得y=8.故选C.答案:C二、填空题7.(xx青岛模拟)如图所示是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人比赛得分的中位数之和是________.解析:甲比赛得分的中位数为28,乙比赛得分的中位数为36,所以甲、乙两人比赛得分的中位数之和为28+36=64.答案:648.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a,b的取值分别是________,________.解析:∵中位数为10.5,∴a+b2=10.5,即a+b=21.∵x=2+3+3+7+a+b+12+13.7+18.3+2010=10,∴s2=110[(2-10)2+(3-10)2×2+(7-10)2+(a-10)2+(b-10)2+(12-10)2+(13.7-10)2+(18.3-10)2+(20-10)2].令y=(a-10)2+(b-10)2=2a2-42a+221=2a-2122+12,当a=10.5时,y取最小值,方差s2也取最小值.∴a=10.5,b=10.5.答案:10.5 10.59.(xx威海模拟)某商场调查旅游鞋的销售情况,随机抽取了部分顾客的购鞋尺寸,整理得如下频率分布直方图,其中直方图从左至右的前3个小矩形的面积之比为1∶2∶3,则购鞋尺寸在[39.5,43.5)内的顾客所占百分比为________.解析:后两个小组的频率为(0.0375+0.0875)×2=0.25,所以前3个小组的频率为1-0.25=0.75,又前3个小组的面积比为1∶2∶3,即前3个小组的面积比即频率比为1∶2∶3.所以第三小组的频率为31+2+3×0.75=0.375,第四小组的频率为0.0875×2=0.175,所以购鞋尺寸在[39.5,43.5)的频率为0.375+0.175=0.55=55%.答案:55%10.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则a1与a2的大小关系是________.解析:去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.答案:a2>a1三、解答题11.(xx 年高考安徽卷)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值.解:(1)设甲校高三年级学生总人数为n , 则30n =0.05⇒n =300.05=600, 甲校样本数据人数为30,及格人数为25, 所以估计甲校这次联考数学成绩及格率P =2530=56.(2)x 1=208430, x 2=206930, x 1-x 2=208430-206930=1530=0.5. 故x 1-x 2的估计值为0.5分.12.(xx 年高考新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y , 由观测结果可得x =120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3.y =120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x >y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制茎叶图从以上茎叶图可以看出,A 药疗效的试验结果有一半的叶集中在茎2.上,而B 药疗效的试验结果有1920的叶集中在茎0.,1.,2.上,较为分散,由此可看出A 药的疗效更好.. 28535 6F77潷 <32554 7F2A 缪39975 9C27 鰧,31938 7CC2 糂37381 9205 鈅 28813 708D 炍30152 75C8 痈t36403 8E33 踳。
2021年高考数学一轮复习 9.3 用样本估计总体备选练习 文 新人教A版
2021年高考数学一轮复习 9.3 用样本估计总体备选练习 文 新人教A 版1.已知一组数据:a 1,a 2,a 3,a 4,a 5,a 6,a 7构成公差为d 的等差数列,且这组数据的方差等于1,则公差d 等于( )A .±14B .±12C .±128D .无法求解解析:这组数据的平均数为a 1+a 2+a 3+a 4+a 5+a 6+a 77=7a 47=a 4,又因为这组数据的方差等于1,所以17[(a 1-a 4)2+(a 2-a 4)2+(a 3-a 4)2+(a 4-a 4)2+(a 5-a 4)2+(a 6-a 4)2+(a 7-a 4)2]=3d2+2d2+d2+0+d 2+2d2+3d27=1,即4d 2=1,解得d =±12.答案:B2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,测试成绩(单位:分)如图所示,假设得分值的中位数为m e ,众数为m o ,平均值为x ,则( )A .m e =m o =xB .m e =m o <xC .m e <m o <xD .m o <m e <x解析:由图可知,30名学生的得分情况依次为得3分的有2人,得4分的有3人,得5分的有10人,得6分的有6人,得7分的有3人,得8分的有2人,得9分的有2人,得10分的有2人.中位数为第15、16个数(分别为5、6)的平均数,即m e =5.5,5出现的次数最多,故m o =5,x =2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m o <m e <x .故选D.答案:D3.(xx年宜春模拟)某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如下图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试的平均分为________.解析:由频率分布直方图中,所有小长方形的面积和为1,设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,解得x=0.3,即数学成绩落在[70,80)的频率为0.3,所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.答案:71 # 927984 6D50 浐40040 9C68 鱨l-g24774 60C6 惆36299 8DCB 跋!28793 7079 灹(。
2021人教A版 必修三 统计 用样本估计总体学案
用样本估计总体一、目标与策略明确学习目标及主要的学习方法是提高学习效率的首要条件,要做到心中有数!学习目标:● 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.● 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.● 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.● 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.● 会用样本的基本数字特征估计总体的基本数字特征.重点难点:● 重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.用样本平均数和标准差估计总体的平均数与标准差.● 难点:能通过样本的频率分布估计总体的分布.能应用相关知识解决简单的实际问题. 学习策略:● 本课题主要包括两大内容:用样本频率分布估计总体分布、用样本数字特征估计总体数字特征.通过对实际数据的分析,评估现实中的实际问题是数学学科的灵魂,而频率分布直方图、总体密度曲线、茎叶图正是有着这方面的作用,所以在学习过程中要注意理论和实际的结合。
二、学习与应用(一)简单随机抽样的概念:“凡事预则立,不预则废”。
科学地预习才能使我们上课听讲更有目的性和针对性。
我们要在预习的基础上,认真听讲,做到眼睛看、耳朵听、心里想、手上记。
知识回顾——复习学习新知识之前,看看你的知识贮备过关了吗?一般地,从元素个数为N 的总体中地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体被抽到的是的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本.(二)系统抽样的概念:当总体中的个体比较多时,将总体分成的若干部分,然后按照预先制定的规则,从每一部分中抽取一个,得到所需要的样本,这样的抽样方法称为系统抽样,也称作抽样.(三)分层抽样的概念: 当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个的几部分,每一部分叫做,在各层中按层在总体中所占进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.知识点一:频率分布的概念频率分布是指一个样本数据在各个小范围内所占的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:(1)计算一组数据中最值与最值的差,即求(2)决定与(3)将数据分组(4)列分布表(5)画频率分布直方图 要点诠释: 频率分布直方图的特征: (1)从频率分布直方图可以清楚的看出数据分布知识要点——预习和课堂学习认真阅读、理解教材,尝试把下列知识要点内容补充完整,带着自己预习的疑惑认真听课学习。
2021届高考数学一轮复习方案 第51讲 用样本估计总体课时作业 新
2021届高考数学一轮复习方案第51讲用样本估计总体课时作业新----a9f41d26-6ea1-11ec-b0f0-7cb59b590d7d2021届高考数学一轮复习方案第51讲用样本估计总体课时作业新课堂作业(51)[第51课用样本估计人口](时间:45分钟分值:100分)基本热身一.一个容量为n的样本,分成若干组,已知某组频数和频率分别为36和0.25,则n=()a、 9b.36c.72d.1442.[2021祁阳四中第三次月考]如图k51-1是某中学高三(1)班的一次数学考图k51-1试成绩的频数分布直方图,根据该图可估计,这次数学考试中平均成绩为()a.36b.46c.56d.603.【2022宁德联检】一组数据的平均值为2.8,方差为3.6。
如果将该组中的每个数据加上60以获得一组新数据,则新数据的平均值和方差分别为()a.57.2,3.6b.57.2,56.4c.62.8,63.6d.62.8,3.6图k51-24.如图k51-2是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是()a、 161中巴。
162cmc。
163cmd。
164cm容量提升5.一个容量为20的样本数据,分组后,组别与频数如下:一组别频数(10,20]2(20,30]3(30,40]4(40,50]5(50,60]4(60,70]2则样本在(20,50]上的频率为()a.12%b.40%c.60%d.70%6.【2022乌鲁木齐中学月考】如果200辆车通过一个雷达区,且速度频率分布直方图如图k51-3所示,则速度超过60km/h的车辆数量为()图k51-3a、 65辆b.76辆c.88辆d.95辆7.[2021唐山一中月考]设矩形的长为a,宽为b,其比满足b∶a=5-1≈0.618,2这种长方形给人一种美感,被称为黄金长方形。
2021届高考数学一轮必备 10.2《用样本估量整体》考情分析学案(1)
用样本估量整体考情分析统计的大体思想方式确实是用样本估量整体,而用样本估量整体是高考考查的重点,频率散布直方图,频率散布表,茎叶图在高考中都有考查,专门是频率散布直方图、方差(标准差)是高考的热点。
基础知识1. 作频率散布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差) (2)决定组距与组数; (3)将数据分组 (4)列频率散布表 (5)画频率散布直方图. 2. 频率散布折线图和整体密度曲线(1)频率散布折线图:连接频率散布直方图中各小长方形上端的中点,就取得频率散布折线图;(2)整体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会愈来愈接近于一条滑腻曲线,即整体密度曲线. 3. 众数、中位数、平均数(1)在一组数据中,显现次数最多的数据叫做这组数据的众数.(2)将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.(3)若是有n 个数12,,n x x x ,那么12nx x x n+++叫做这n 个数的平均数.(4)利用频率散布直方图估量样本的数字特点(1)中位数:在频率散布直方图中,中位数左侧和右边的直方图的面积相等,由此能够估量中位数的值.(2)平均数:平均数的估量值等于频率散布直方图中每一个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)众数:在频率散布直方图中,众数是最高的矩形的中点的横坐标. 4、茎叶图的优势用茎叶图表示数据有两个突出的优势:一是在统计图上没有原始信息的损失,所有的数据信息都能够从茎叶图中取得; 二是茎叶图能够在竞赛时随时记录,方便记录与表示. 五、标准差设样本的元素为1x ,2x ,…,n x ,样本的平均数为 ,(1)样本方差222212()()()n x x x x x x s n-+-++-=(2)标准差22212()()()n x x x x x x s n-+-++-=注意事项1.(1)众数、中位数与平均数的异同①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. ②由于平均数与每一个样本数据有关,因此,任何一个样本数据的改变都会引发平均数的改变,这是中位数、众数都不具有的性质.③众数考查各数据显现的频率,其大小只与这组数据中的部份数据有关.当一组数据中有很多数据多次重复显现时,其众数往往更能反映问题.④某些数据的变更对中位数可能没有阻碍.中位数可能出此刻所给数据中,也可能不在所给数据中.当一组数据中的个别数据变更较大时,可用中位数描述其集中趋势. (2)标准差与方差的异同标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度那么越小,因为方差与原始数据的单位不同,且平方后可能夸大了误差的程度,因此尽管方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一样多采纳标准差.2.利用频率散布直方图估量样本的数字特点:(1)中位数:在频率散布直方图中,中位数左侧和右边的直方图的面积相等,由此能够估量中位数值.(2)平均数:平均数的估量值等于每一个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.题型一频率散布直方图的绘制与应用【例1】某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受处惩罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率散布直方图,那么从图中能够看出被惩罚的汽车大约有( ) A.30辆C.60辆D.80辆答案:B解析:由题图可知,车速大于或等于70 km/h的汽车的频率为×10=,那么将被惩罚的汽车大约有200×=40(辆).【训练1】有一个容量为200的样本,其频率散布直方图如下图.依照样本的频率散布直方图估量,样本数据落在区间[10,12)内的频数为( ).A.18 B.36C.54 D.72解析样本数据落在区间[10,12)内的频率1-+++×2=,因此数据落在此区间的频数为200×=36.答案B题型二茎叶图的应用【例2】对某商店一个月内天天的顾客人数进行了统计,取得样本的茎叶图(如下图),那么该样本中的中位数、众数、极不同离是( )A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53答案:A解析:此题要紧考查茎叶图数据的读取和数据特点的简单计算,由所给的茎叶图可知所给出的数据共有30个,其中45显现3次为众数,处于中间位置的两数为45和47,那么中位数为46;极差为68-12=56.应选A.【变式2】在一项大西瓜品种的实验中,共收成甲种大西瓜13个、乙种大西瓜11个,并把这些大西瓜的重量(单位:斤,1斤=500克)制成了茎叶图,如下图,据此茎叶图写出对甲乙两种大西瓜重量的两条统计结论是:(1)__________________________________________;(2)__________________________________________.解析从那个茎叶图能够看出,甲种大西瓜的重量大致对称,平均重量、众数及中位数都是30多斤;乙种大西瓜的重量除一个51斤外,也大致对称,平均重量、众数及中位数都是20多斤,但甲种大西瓜的产量比乙种稳固,整体情形比乙好.答案(1)甲种大西瓜的平均重量大于乙种大西瓜(2)甲种大西瓜的产量比乙种大西瓜稳固题型三用样本的数字特点估量整体的数字特点【例3】甲、乙两名射击运动员参加某大型运动会的预选赛,他们别离射击了5次,成绩如下表(单位:环):甲108999乙1010799若是甲、乙两人中只有1人入选,那么入选的最正确人选应是________.答案:甲解析:x甲=x乙=9环,s 2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25, s 2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳固,故填甲.【变式3】 甲、乙两名射击运动员参加某大型运动会的预选赛,他们别离射击了5次,成绩如下表(单位:环):甲 10 8 9 9 9 乙1010799若是甲、乙两人中只有1人入选,那么入选的最正确人选应是________. 解析x 甲=x 乙=9环,s 2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳固,故填甲. 答案 甲 重难点冲破【例4】以下茎叶图记录了甲、乙两组各四名同窗的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)若是X =8,求乙组同窗植树棵数的平均数和方差;(2)若是X =9,别离从甲、乙两组中随机选取一名同窗,求这两名同窗的植树总棵数为19的概率. (注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)[解析] (1)当X =8时,由茎叶图可知,乙组同窗的植树棵数是:8,8,9,10,因此平均数为 x =8+8+9+104=354.方差为s 2=14⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫9-3542+⎝ ⎛⎭⎪⎫10-3542 =1116.(2)记甲组四名同窗为A 1,A 2,A 3,A 4,他们植树的棵数依次为9,9,11,11;乙组四名同窗为B 1,B 2,B 3,B 4,他们植树的棵数依次为9,8,9,10.别离从甲、乙两组中随机选取一名同窗,所有可能的结果有16个,它们是:(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,B 4),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,B 4),(A 3,B 1),(A 3,B 2),(A 3,B 3),(A 3,B 4),(A 4,B 1),(A 4,B 2),(A 4,B 3),(A 4,B 4),用C 表示:“选出的两名同窗的植树总棵数为19”这一事件,那么C 中的结果有4个,它们是:(A 1,B 4),(A 2,B 4),(A 3,B 2),(A 4,B 2).故所求概率为P (C )=416=14.巩固提高1.样本中共有五个个体,其值别离为a,0,1,2,3.假设该样本的平均值为1,那么样本方差为( )A. 65B. 65 C.2D. 2答案:D 解析:∵a +0+1+2+35=1,得a =-1,∴s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.应选D.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图,假设得分值的中位数为m e ,众数为m 0,平均值为x ,那么( )A. m e =m 0=xB. m e =m 0<xC. m e <m 0<xD. m 0<m e <x答案:D解析:由图可知,30名学生的得分情形依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(别离为5,6)的平均数,即m e=,5显现次数最多,故m0=5,x=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10≈.于是得m300<m e <x .3.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,假设求得新数据的平均数是,方差是,那么原先数据的平均数和方不同离是 ( )A. ,B. ,C. ,D. ,答案:A解析:记原数据依次为x 1,x 2,x 3,…,x n ,那么新数据依次为2x 1-80,2x 2-80,2x 3-80,…,2x n -80,且2x 1+x 2+…+x n -80n n =,因此有x 1+x 2+…+x nn=错误!=,结合各选项知正确选项为A.4.在某次测量中取得的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.假设B 样本数据恰好是A 样本数据每一个都加2后所得数据,那么A ,B 两样本的以下数字特点对应相同的是( )A .众数B .平均数C .中位数D .标准差答案:D解析:此题考查众数、平均数、中位数及标准差的概念,考查推理论证能力,容易题. 当每一个样本数据加上2后,众数、平均数、中位数都会发生转变,不变的是数据的波动情形,即标准差不变.5.某中学组织了“迎新杯”知识竞赛,从参加考试的学生中抽出假设干名学生,并将其成绩绘制成频率散布直方图(如图),其中成绩的范围是[50,100],样本数据分组为[50,60),[60,70),[70,80), [80,90),[90,100],已知样本中成绩小于70分的个数是36,那么样本中成绩在[60,90)内的学生人数为________.答案:90人解析:依照给定的频率直方图可得,小于70分的人数占有的频率为+×10=,因此样本整体为错误!=120人,那么成绩在[60, 90)内的学生人数为120×++=90.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2021届一轮复习人教A 版 用样本估计总体 学案1.用样本的频率分布估计总体分布 (1)作频率分布直方图的步骤。
①求极差(即一组数据中最大值与最小值的差)。
②决定组距与组数。
③将数据分组。
④列频率分布表。
⑤画频率分布直方图。
(2)频率分布折线图和总体密度曲线。
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图。
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线。
(3)茎叶图。
茎是指中间的一列数,叶是从茎的旁边生长出来的数。
2.用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数。
(2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。
(3)平均数:x -=x 1+x 2+…+x nn,反映了一组数据的平均水平。
(4)标准差:是样本数据到平均数的一种平均距离,s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]。
(5)方差:s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数)。
1.频率分布直方图中各小矩形的面积之和为1。
2.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数。
(2)中位数左边和右边的小长方形的面积和是相等的。
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。
3.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a 。
(2)数据x 1,x 2,…,x n 的方差为s 2。
①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2。
一、走进教材1.(必修3P 65例题改编)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人。
解析 由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为:0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25。
答案 252.(必修3P 82A 组T 6改编)甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:甲 0 1 0 2 2 0 3 1 2 4 乙 2 3 1 1 0 2 1 1 0 1 则机床性能较好的为________。
解析 因为x 甲=1.5,x 乙=1.2,s 2甲=1.65,s 2乙=0.76,所以s 2乙<s 2甲,所以乙机床性能较好。
答案 乙 二、走近高考3.(2018·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________。
解析 由茎叶图可得分数的平均数为 89+89+90+91+915=90。
答案 904.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)。
若这两组数据的中位数相等,且平均值也相等,则x 与y 的值分别为( )A .3,5B .5,5C .3,7D .5,7解析 由两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3。
答案 A 三、走出误区微提醒:①平均数与方差的性质理解出错;②中位数、众数、平均数的求法不清导致出错。
5.若数据x 1,x 2,x 3,…,x n 的平均数x -=5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为( )A .5,2B .16,2C .16,18D .16,9解析 因为x 1,x 2,x 3,…,x n 的平均数为5,所以x 1+x 2+x 3+…+x nn=5,所以3x 1+3x 2+3x 3+…+3x nn+1=3×5+1=16,因为x 1,x 2,x 3,…,x n 的方差为2,所以3x 1+1,3x 2+1,3x 3+1,…,3x n +1的方差是32×2=18。
故选C 。
答案 C6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m ,众数为n ,平均数为x -,则m ,n ,x -的大小关系为________。
(用“<”连接)解析 由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m =5.5;又5出现次数最多,故n =5;x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97。
故n <m <x -。
答案 n <m <x -考点一频率分布直方图【例1】 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90]。
并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等。
试估计总体中男生和女生人数的比例。
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4。
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4。
(2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5。
所以总体中分数在区间[40,50)内的人数估计为400×5100=20。
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60。
所以样本中分数不小于70的男生人数为60×12=30。
所以样本中的男生人数为30×2=60, 女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2。
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2。
1.绘制频率分布直方图时需注意的两点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确; (2)频率分布直方图的纵坐标是频率组距,而不是频率。
2.与频率分布直方图计算有关的两个关系式 (1)频率组距×组距=频率; (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数。
【变式训练】 (2019·贵阳监测考试)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )A .15B .18C .20D .25解析 根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是400.4=100,又成绩在80~100分的频率是(0.010+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15。
故选A 。
答案 A 考点二茎叶图【例2】 (2019·郑州质量预测)我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为( )A .49B .2C .94D .9解析 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x =1。
由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y -6)+5+7+10=0,解得y =4。
由x ,G ,y 成等比数列,可得G 2=xy =4,由正实数a ,b 满足a ,G ,b 成等差数列,可得G =2,a +b =2G =4,所以1a +4b =⎝ ⎛⎭⎪⎫1a +4b ×⎝ ⎛⎭⎪⎫a 4+b 4=14⎝ ⎛⎭⎪⎫1+b a +4a b +4≥14×(5+4)=94(当且仅当b =2a 时取等号)。
故1a +4b 的最小值为94。
故选C 。
答案 C1.由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断。
2.茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图中的数据求出样本数据的数字特征,进一步估计总体情况。
【变式训练】 (1)(2019·长春质量监测)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )A.95,94 B.92,86C.99,86 D.95,91(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示。
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,假设抽到的第一个数据是133,则这7人的平均成绩为________。
解析(1)由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86。
故选B。
(2)依题意,应将35名运动员的成绩由好到差排序后分为7组,每组5人。