高三数学大一轮复习 11.2用样本估计总体教案 理 新人教A版
人教版高中数学高考一轮复习--用样本估计总体(课件)
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2
人教版高三数学一轮复习精品课件5:11.2 用样本估计总体
1.了解分布的意义与作用,会列频率分布表、会画频率分布直 方图、频率折线图、茎叶图,理解它们各自的特点. 2.理解样本数据标准差的意义和作用,会计算数据标准差. 3.能从样本数据中提取基本的数字特征(如平均数、标准差),并 作出合理的解释.
高三一轮总复习 ·新课标 ·数学
限时规范特训
路漫漫其修远兮,吾将上下而求索!
第十一章 第2讲
第3页
1 条重要规律——方差和标准差刻画样本数据的分散程度 标准差、方差描述了一组数据围绕平均数波动的大小.标准差、 方差越大,数据的离散程度越大,标准差、方差越小,数据的离 散程度越小. 2 个必会比较——频率分布直方图与茎叶图的优点和缺点 (1) 频率分布直方图: 优点:频率分布直方图能够很容易地表示大量数据,非常直观地 表明分布的规律.
考点 2 样本的数字特征
[判一判] 判断下列说法是否正确(在括号内填“√”或“× ”). (1)平均数、众数与中位数从不同的角度描述了一组数据的集 中趋势.(√) (2)一组数据的平均数一定大于这组数据中的每个数据.(×) (3)一组数据的方差越大,说明这组数据的波动越大.(√) (4)一组数据的众数可以是一个或几个,那么中位数也具有相 同的结论.(×)
抓住2个必备考点 突破3个热点考向 破译5类高考密码 迎战2年高考模拟
君不见,黄河之水天上来,奔流到海不复回。 君不见,高堂明镜悲白发,朝如青丝暮成雪。 人生得意须尽欢,莫使金樽空对月。 天生我材必有用,千金散尽还复来。 烹羊宰牛且为乐,会须一饮三百杯。 岑夫子,丹丘生,将进酒,杯莫停。 与君歌一曲,请君为我倾耳听。 钟鼓馔玉不足贵,但愿长醉不复醒。 古来圣贤皆寂寞,惟有饮者留其名。 陈王昔时宴平乐,斗酒十千恣欢谑。 主人何为言少钱,径须沽取对君酌。 五花马,千金裘,呼儿将出换美酒,与尔同销万古愁
高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案
第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
高三数学大一轮复习讲义 用样本估计总体
11.2 用样本估计总体一、选择题1.对某校400 名学生的体重(单位:kg )进行统计,得到如图所示的频率分布直方图,则学生体重在60kg 以上的人数为( ) A .300 B .100 C .60 D .20 解析 60kg 以频率为0.04050.01050.25⨯+⨯=,故人数为4000.25100⨯=(人). 答案 B2.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( ). A. 65 B.65C. 2 D .2解析 由题可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2. 答案 D3.为了了解某地区10 000名高三男生的身体发育情况,抽查了该地区100名年龄为17~18岁的高三男生体重(kg),得到频率分布直方图如图.根据图示,请你估计该地区高三男生中体重在[56.5,64.5]的学生人数是( )A .40B .400C .4 000D .4 400解析 依题意得,该地区高三男生中体重在[56.5,64.5]的学生人数是10 000×(0.03+2×0.05+0.07)×2=4 000. 答案 C4.如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( ).A .161 cmB .162 cmC .163 cmD .164 cm解析 由给定的茎叶图可知,这10位同学身高的中位数为161+1632=162(cm).答案 B5.从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图.根据茎叶图,下列描述正确的是( )A .甲种树苗的平均高度大于乙种树苗的平均高度,且甲种树苗比乙种树苗长得整齐B .甲种树苗的平均高度大于乙种树苗的平均高度,但乙种树苗比甲种树苗长得整齐C .乙种树苗的平均高度大于甲种树苗的平均高度,且乙种树苗比甲种树苗长得整齐D .乙种树苗的平均高度大于甲种树苗的平均高度,但甲种树苗比乙种树苗长得整齐 解析 根据茎叶图计算得甲种树苗的平均高度为27,而乙种树苗的平均高度为30,但乙种树苗的高度分布不如甲种树苗的高度分布集中. 答案 D6.对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h 的电子元件的数量与使用寿命在300~600 h 的电子元件的数量的比是( ).A.12B.13C.14D.16 解析 寿命在100~300 h 的电子元件的频率为⎝ ⎛⎭⎪⎫12 000+32 000×100=420=15; 寿命在300~600 h 的电子元件的频率为⎝ ⎛⎭⎪⎫1400+1250+32 000×100=45. ∴它们的电子元件数量之比为15∶45=14.答案 C7.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ).A .57.2,3.6B .57.2,56.4C .62.8,63.6D .62.8,3.6 解析 平均数增加,方差不变. 答案 D 二、填空题8.甲、乙两名同学学业水平考试的9科成绩如茎叶图所示,请你根据茎叶图判断谁的平均分高________.(填“甲”或“乙”)解析 由茎叶图可以看出,x 甲=19(92+81+89×2+72+73+78×2+68)=80,x 乙=19(91+83+86+88+89+72+75+78+69)≈81.2, x 乙>x 甲,故乙的平均数大于甲的平均数. 答案 乙9. 如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为_________.0891035(注:方差2222121()()()n s x x x x x x n⎡⎤=-+-++-⎣⎦L ,其中x 为x 1,x 2,…,x n 的平均数)答案 6.810.世界卫生组织(WHO)证实,英国葛兰素史克(GSK)药厂生产的甲型流感疫苗在加拿大种植后造成多人出现过敏症状的情况,下面是加拿大五个地区有过敏症状人数(单位:个)的茎叶统计图,则该组数据的标准差为 8 9 7 9 0 1 3 解析 由茎叶图,得该组数据的平均数为x =90,则该组数据的标准差为 s =15[(89-90)2+(87-90)2+(90-90)2+(91-90)2+(93-90)2=2. 答案 211.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.解析 根据样本的频率分布直方图,成绩小于60分的学生的频率为(0.002+0.006+0.012)×10=0.20,所以可推测3 000名学生中成绩小于60分的人数为600名. 答案 60012.某校开展“爱我青岛,爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x 应该是________.解析 当x≥4时,89+89+92+93+92+91+947=6407≠91,∴x <4,则89+89+92+93+92+91+x +907=91,∴x=1.答案 1 三、解答题13.某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A 配方和B 配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A 配方的频数分布表(2)已知用B 配方生产的一件产品的利润y(单位:元)与其质量指标值t 的关系式为y =⎩⎪⎨⎪⎧-2,t <94,2,94≤t<102,4,t≥102.估计用B 配方生产的一件产品的利润大于0的概率,并求用B 配方生产的上述100件产品平均一件的利润.解析 (1)由试验结果知,用A 配方生产的产品中优质品的频率为22+8100=0.3,所以用A 配方生产的产品的优质品率的估计值为0.3.由试验结果知,用B 配方生产的产品中优质品的频率为32+10100=0.42,所以用B 配方生产的产品的优质品率的估计值为0.42.(2)由条件知,用B 配方生产的一件产品的利润大于0当且仅当其质量指标值t≥94,由试验结果知,质量指标值t≥94的频率为0.96.所以用B 配方生产的一件产品的利润大于0的概率估计值为0.96.用B 配方生产的产品平均一件的利润为 1100×[4×(-2)+54×2+42×4]=2.68(元). 14.某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六组[90,100),[100,110),…,[140,150)后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在[120,130)内的频率;(2)若在同一组数据中,将该组区间的中点值(如:组区间[100,110)的中点值为100+1102=105.)作为这组数据的平均分,据此,估计本次考试的平均分;(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率. 解析 (1)分数在[120,130)内的频率为1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3. (2)估计平均分为x =95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121.(3)由题意,[110,120)分数段的人数为60×0.15=9(人).[120,130)分数段的人数为60×0.3=18(人).∵用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本, ∴需在[110,120)分数段内抽取2人,并分别记为m ,n ;在[120,130)分数段内抽取4人,并分别记为a ,b ,c ,d ;设“从样本中任取 2人,至多有1人在分数段[120,130)内”为事件A ,则基本事件共有(m ,n ), (m ,a ),…,(m ,d ),(n ,a ),…,(n ,d ),(a ,b ),…,(c ,d )共15种.则事件A 包含的基本事件有(m ,n ),(m ,a ),(m ,b ),(m ,c ),(m ,d ),(n ,a ),(n ,b ),(n ,c ),(n ,d )共9种. ∴P (A )=915=35.15.某制造商3月生产了一批乒乓球,随机抽取100个进行检查,测得每个球的直径(单位:mm ),将数据进行分组,得到如下频率分布表:分组 频数 频率 [39.95,39.97) 10 [39.97,39.99) 20 [39.99,40.01)50[40.01,40.03] 20合计100(1)补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图;(2)若以上述频率作为概率,已知标准乒乓球的直径为40.00 mm,试求这批乒乓球的直径误差不超过0.03 mm的概率;(3)统计方法中,同一组数据常用该组区间的中点值(例如区间[39.99,40.01)的中点值是40.00)作为代表.据此估计这批乒乓球直径的平均值(结果保留两位小数).解析(1)频率分布表如下:分组频数频率[39.95,39.97) 10 0.10[39.97,39.99) 20 0.20[39.99,40.01) 50 0.50[40.01,40.03] 20 0.20合计100 1频率颁布直方图如图:(2)误差不超过0.03 mm,即直径落在[39.97,40.03]内,其概率为0.2+0.5+0.2=0.9.(3)整体数据的平均值为39.96×0.10+39.98×0.20+40.00×0.50+40.02×0.20=40.00(mm).16.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.样本频率分布表:(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解析(1)频率分布表:[101,111]2230(2)频率分布直方图:(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115.有26天处于良的水平,占当月天数的1315.处于优或良的天数共有28天,占当有月数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.。
高中数学《用样本估计总体》教案1 新人教A版必修3
2.2.2用样本的数字特征估计总体的数字特征(2课时)教学目标:知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
重点与难点重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
教学设想【创设情境】在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总体的数字特征(板出课题)。
【探究新知】<一>、众数、中位数、平均数〖探究〗:P62(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。
例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
(人教A版)高考数学一轮复习精品学案:用样本估计总体及线性相关关系
2019年高考数学一轮复习精品学案(人教版A 版)用样本估计总体及线性相关关系一.【课标要求】1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差; ③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识. 2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 二.【命题走向】“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布.预测2019年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.【要点精讲】1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=n i i x x n S 叫做这n 个数据方差;同时=s )(11∑=-ni i x x n 叫做这n 个数据的标准差。
2022届高三数学大一轮复习11.2用样本估计总体教案理新人教A版
§用样本预计整体2022 高考会这样考 1 考察样本的频次散布散布表、直方图、茎叶图中的相关计算,样本特征数众数、中位数、均匀数、标准差的计算.主要以选择题、填空题为主; 2 考察以样本的散布预计整体的散布以样本的频次预计整体的频次、以样本的特色数预计整体的特色数.复习备考要这样做 1 理解统计中的常用术语:整体、个体、样本、均匀数、方差、中位数、众数; 2 会利用频次散布直方图、茎叶图对整体进行预计,特别是频次散布直方图的应用更是高考考察的热门.1.频次散布直方图1往常我们对整体作出的预计一般分红两种,一种是用样本的频次散布预计整体的频次散布,另一种是用样本的数字特色预计整体的数字特色.2在频次散布直方图中,纵轴表示错误 ! ,数据落在各小组内的频次用各小长方形的面积表示,各小长方形的面积总和等于13连结频次散布直方图中各小长方形上端的中点,就获取频次散布折线图.跟着样本容量的增添,作图时所分的组数增添,组距减小,相应的频次散布折线图就会愈来愈靠近于一条圆滑的曲线,统计中称之为整体密度曲线,它能够更为精美的反应出整体在各个范围内取值的百分比.4当样本数据较少时,用茎叶图表示数据的成效较好,它不只能够保存全部信息,并且能够随时记录,给数据的记录和表示都带来方便.2.用样本的数字特色预计整体的数字特色1众数、中位数、均匀数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小挨次摆列,把处在最中间地点的一个数据或最中间两个数据的均匀数叫做这组数据的中位数.均匀数:样本数据的算术均匀数,即\to =错误 ! 1+2++n.在频次散布直方图中,中位数左侧和右侧的直方图的面积应当相等.2样本方差、标准差标准差=错误 ! ,此中 n 是样本数据的第n 项, n 是样本容量,\to是均匀数.标准差是反应整体颠簸大小的特色数,样本方差是标准差的平方.往常用样本方差预计整体方差,当样本容量靠近整体容量时,样本方差很靠近整体方差.[ 难点正本疑点清源]1.作频次散布直方图的步骤1 求极差;2 确立组距和组数;3 将数据分组;4 列频次散布表;5 画频次散布直方图.频次散布直方图能很简单地表示大批数据,特别直观地表示散布的形状.2.众数、中位数与均匀数的异同1众数、中位数及均匀数都是描绘一组数据集中趋向的量,均匀数是最重要的量.2因为均匀数与每一个样本数据相关,所以,任何一个样本数据的改变都会惹起均匀数的改变,这是中位数、众数都不拥有的性质.3众数考察各数据出现的频次,其大小只与这组数据中的部分数据相关.当一组数据中有许多量据多次重复出现时,其众数常常更能反应问题.4某些数据的改动对中位数可能没有影响.中位数可能出此刻所给数据中,也可能不在所给数据中.当一组数据中的个别数据改动较大时,可用中位数描绘其集中趋向.3.利用频次散布直方图预计样本的数字特色1中位数:在频次散布直方图中,中位数左侧和右侧的直方图的面积相等,由此能够预计中位数值.2均匀数:均匀数的预计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.3众数:最高的矩形的中点的横坐标.1. 2022·江苏某老师从礼拜一到礼拜五收到的信函数分别为10,6,8,5,6,则该组数据的方差2= ________答案分析\to=错误! =7,222222∴=错误 ! [10-7 +6-7 +8-7 +5-7+6- 7]=错误!=2. 2022·浙江某中学为认识学生数学课程的学习状况,在 3 000 名学生中随机抽取200 名,并统计这 200 名学生的某次数学考试成绩,获取了样本的频次散布直方图如图.依据频率散布直方图推断,这 3 000名学生在该次数学考试中成绩小于60 分的学生数是________ .答案600分析由直方图易得数学考试中成绩小于60 分的频次为++× 10=,所以所求分数小于60 分的学生数为 3 000 ×= 6003. 2022·湖南以下图是某学校一名篮球运动员在五场竞赛中所得分数的茎叶图,则该运动员在这五场竞赛中得分的方差为________.注:方差2=错误 ! [ 1-错误 !2+2-错误!2++ n-错误!2],此中错误!为 1, 2,, n 的均匀数答案分析依题意知,运动员在 5次竞赛中的分数挨次为8,9,10,13,15 ,其均匀数为错误 ! =11由方差公式得2=错误 ! [8 - 112+ 9- 112+ 10- 112+ 13- 112+ 15- 112] =错误 ! 9+ 4+ 1+4+ 16=4.一个容量为20 的样本,数据的分组及各组的频数以下:[10,20 ,2; [20,30 ,3;[30,40 ,;[40,50 ,5;[50,60 , 4;[60,70 ,2;则= ________;依据样本的频次散布预计,数据落在[10,50的概率约为________.答案4分析= 20- 2+ 3+5+ 4+ 2=4,P=错误!=或P=1-错误!=5.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受各处分,如图是某路段的一个检测点对200 辆汽车的车速进行检测所得结果的频次散布直方图,则从图中能够看出被处分的汽车大概有A.30 辆B. 40 辆C.60 辆D.80 辆答案B分析由题图可知,车速大于或等于70 km/h的汽车的频次为×10=,则将被处分的汽车大概有200×= 40 辆题型一频次散布直方图的绘制与应用例 1某校从参加高一年级期中考试的学生中随机抽出60 名学生,将其物理成绩均为整数分红六段[40,50 , [50,60 ,,[90,100]后获取以下图的频次散布直方图,察看图形的信息,回答以下问题:1 求分数在 [70,80内的频次,并补全这个频次散布直方图;2统计方法中,同一组数据常用该组区间的中点值作为代表,据此预计本次考试中的均匀分.思想启示:利用各小长方形的面积和等于1 求分数在 [70,80 内的频次,再补齐频次散布直方图.解 1 设分数在 [70,80 内的频次为,依据频次散布直方图,有+× 2++× 10+= 1,可得=,所以频次散布直方图以下图.2 均匀分为= 45×+ 55×+ 65×+ 75×+ 85×+ 95×=71 分.研究提高频次散布直方图直观形象地表示了样本的频次散布,从这个直方图上能够求出样本数据在各个组的频次散布.依据频次散布直方图预计样本或许整体的均匀值时,一般是采纳组中值乘以各组的频次的方法.某种袋装产品的标准质量为每袋100 克,但工人在包装过程中一般有偏差,规定偏差在 2 克之内的产品均合格.因为操作娴熟,某工人在包装过程中不称重直接包装,现对其包装的产品进行随机抽查,抽查30 袋产品获取的数据以下:质量单位:克数目单位:袋[90,942[94,986[98,10212[102,1068[106,110]21依据表格中的数据绘制产质量量的频次散布直方图;2预计该工人包装的产品的均匀质量的预计值是多少.解 1 频次散布直方图以下:2错误 ! ×92+错误 ! ×96+错误 ! ×100+错误 ! ×104+错误 ! ×108≈克.题型二茎叶图的应用例 2进行比较试验.两种小麦各样植了25 亩,所得亩产数据单位:千克以下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407, 410,412,415,416,422,4301作出数据的茎叶图;2用茎叶图办理现有的数据,有什么长处3经过察看茎叶图,对品种A与B 的亩产量及其稳固性进行比较,写出统计结论.思想启示:作茎叶图时,将高位十位与百位作为茎,低位个位作为叶,逐一统计;依据茎叶图剖析两组数据的特色,能够得出结论.解 1以以下图2 因为每个品种的数据都只有25 个,样本不大,画茎叶图很方便;此时茎叶图不单清楚了然地展现了数据的散布状况,便于比较,没有任何信息损失,并且还能够随时记录新的数据.3 经过察看茎叶图能够看出:①品种 A 的亩产均匀数或均值比品种 B 高;②品种 A 的亩产标准差或方差比品种 B 大,故品种A的亩产稳固性较差.研究提高 1 茎叶图的长处是保存了原始数据,便于记录及表示,能反应数据在各段上的散布状况.2茎叶图不可以直接反应整体的散布状况,这就需要经过茎叶图给出的数据求出数据的数字特色,进一步预计整体状况.1如图是某赛季甲、乙两名篮球运动员每场竞赛得分的茎叶图,则甲、乙两人竞赛得分的中位数之和是 ________.2 甲、乙两个体能痊愈训练小组各有10 名组员,经过一段时间训练后,某项体能测试结果的茎叶图以下图,则这两个小组中体能测试均匀成绩较高的是________组.答案164 2甲分析1∵甲的中位数为28,乙的中位数为36,∴甲、乙得分中位数之和为28+ 36= 642∵\to甲=错误 !=,\to 乙=错误!=,∴\to 甲>\to 乙.题型三用样本的数字特色预计整体的数字特色例 3甲、乙两名战士在同样条件下各射靶10 次,每次命中的环数分别是甲: 8,6,7,8,6,5,9,10,4,7;乙: 6,7,7,8,6,7,8,7,9,51分别计算两组数据的均匀数;2分别计算两组数据的方差;3依据计算结果,预计一下两名战士的射击水平谁更好一些.思想启示:依据公式计算均匀数和方差,而后利用均匀数和方差的意义进行预计.解 1\to 甲=错误 ! 8+ 6+7+ 8+ 6+ 5+ 9+ 10+ 4+ 7= 7 环,\to 乙=错误 ! 6+ 7+ 7+ 8+ 6+ 7+ 8+ 7+9+ 5= 7 环.2 由方差公式22222=错误![ -错误!+-错误 ! ++-错误 !]可求得错误!=环,错误!12n=环2.3 由 \to 甲=\to 乙,说明甲、乙两战士的均匀水平相当;又∵ 错误 ! >错误 ! ,说明甲战士射击状况颠簸大,所以乙战士比甲战士射击状况稳固.研究提高均匀数与方差都是重要的数字特色,是对整体的一种简洁的描绘,它们所反应的状况有侧重要的实质意义,均匀数、中位数、众数描绘其集中趋向,方差和标准差描绘其颠簸大小.1 如右图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的均匀数和方差分别为A. 84,B. 84,C. 85,4D. 85,22022·山东在某次丈量中获取的 A 样本数据以下:82,84,84,86,86,86,88,88,88,样本数据每个都加 2 后所得数据,则,B 两样本的以下数字特色对应同样的是AA.众数B.均匀数C.中位数D.标准差答案1D2D分析1由茎叶图可知评委打出的最低分为79,最高分为93,其他得分为84,84,86,84,87,故均匀分为错误 ! = 85,方差为错误 ! [3 ×84- 852+ 86-852+ 87- 852] =2 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、均匀数都发生改变.统计图表识图禁止致误典例: 4 分从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频次散布直方图以下图:若某高校A专业对视力的要求在以上,则该班学生中能报 A 专业的人数为________.易错剖析解题中易出现审题不认真,又对所给图形没有真实理解清楚,将矩形的高误以为频次或许对“以上”的含义理解有误.分析该班学生视力在以上的频次为++×=,故能报答案20A 专业的人数为×50=20温馨提示频次散布条形图的纵轴矩形的高表示频次;频次散布直方图的纵轴矩形的高表示频次与组距的比值,其各小组的频次等于该小组上的矩形的面积.方法与技巧1.用样本频次散布来预计整体散布的要点是频次散布表和频次散布直方图的绘制及用样本频次散布预计整体散布;难点是频次散布表和频次散布直方图的理解及应用.在计数和计算时必定要正确,在绘制小矩形时,宽窄要一致.经过频次散布表和频次散布直方图能够对整体作出预计.2.茎叶图、频次散布表和频次散布直方图都是用来描绘样本数据的散布状况的.茎叶图由全部样本数据构成,没有损失任何样本信息,能够随时记录;而频次散布表和频次散布直方图则损失了样本的一些信息,一定在达成抽样后才能制作.3.若取值1,2,,n的频次分别为1,2,, n,则其均匀值为11+ 22++ nn;若 1,2,,n 的均匀数为\to,方差为2,则a 1+, 2+,, n+b的均匀数为a\to +,方差为b a b a ba22失误与防备频次散布直方图的纵坐标为频次 / 组距,每一个小矩形的面积表示样本个体落在该区间内的频次;条形图的纵坐标为频数或频次,把直方图视为条形图是常有的错误.A 组专项基础训练时间: 35 分钟,满分:57 分一、选择题每题5分,共 20 分1. 2022·四川有一个容量为66 的样本,数据的分组及各组的频数以下:[,2[,4[,9[,18[,11[,12[,7[,3依据样本的频次散布预计,数据落在[, 的概率约是答案B分析由条件可知,落在[, 的数占有12+ 7+ 3= 22 个,故所求概率约为错误!=错误! 2.为了认识高三学生的数学成绩,抽取了某班60 名学生,将所得数据整理后,画出其频次散布直方图如图,已知从左到右各长方形高的比为2∶3∶5∶6∶3∶1,则该班学生数学成绩在 80,100 之间的学生人数是A. 32B. 27C. 24D. 33答案D分析80~100 之间两个长方形高占整体的比率为错误 ! =错误 ! ,即为频数之比,∴错误 !=错误 !,∴= 333.在某项体育竞赛中,七位裁判为一选手打出的分数以下:90899095939493去掉一个最高分和一个最低分后,所剩数据的均匀值和方差分别为A. 92,2 B . 92,2.8 C. 93,2 D. 93,答案B分析去掉最高分 95和最低分 89后,节余数据的均匀数为\to =错误 ! = 92,方差为2=错误 ! [90 - 922+ 90-922+ 93- 922+ 94- 922+93- 922] =错误 ! 4+ 4+1+ 4+ 1=4.如图,样本 A 和 B 分别取自两个不一样的整体,它们的样本均匀数分别为\to A和\to B,样本标准差分别为A和B,则A>\to B , A >BAB\toB, ABA>二、填空题每题5分,共 15 分5. 2022·广东由正整数构成的一组数据1,2, 3, 4,其均匀数和中位数都是2,且标准差等于 1,则这组数据为 ________________ .从小到大摆列答案1,1,3,3分析假定这组数据按从小到大的次序摆列为1, 2,3 ,4,则错误 !∴错误 !又=错误!=错误!错误!=错误 ! 错误 ! =1,∴ 1- 22+ 2- 22=2同理可求得 3- 22+ 4- 22=2由 , , , 均为正整数,且, , ,22= 2 上的点,剖析知, , ,11均为圆- 2 +- 21423423423应为 1,1,3,36. 2022·山东如图是依据部分城市某年6 月份的均匀气温单位:℃数据获取的样本频次分布直方图, 此中均匀气温的范围是 [,] ,样本数据的分组为 [, ,[ ,,[, ,[, ,[, ,[ ,] .已知样本中均匀气温低于 22.5 ℃的城市个数为 11,则样本中均匀气温不低于25.5 ℃的城市个数为 ________.答案9分析最左侧两个矩形面积之和为× 1+× 1=, 总城市数为 11÷= 50,最右边矩形面积为× 1=, 50×= 97. 将容量为 n 的样本中的数据分红6 组,绘制频次散布直方图,若第一组至第六组数据的频次之比为 2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于 27,则 n = ________答案60分析∵第一组至第六组数据的频次之比为2∶3∶4∶6∶4∶1,∴前三组频数和为 错误 ! · n = 27,故 n =60三、解答题共22 分8. 10 分甲乙二人参加某体育项目训练,近期的五次测试成绩得分状况如图.1分别求出两人得分的均匀数与方差;2依据图和上边算得的结果,对两人的训练成绩作出评论.解 1 由图象可得甲、乙两人五次测试的成绩分别为甲: 10 分, 13 分, 12 分, 14 分, 16 分;乙: 13 分, 14 分, 12 分, 12 分, 14 分.\to 甲=错误 ! = 13,\to 乙=错误 ! = 13,错误 ! =错误 ! [10 - 132+ 13- 132+ 12- 132+ 14-132+ 16- 132] = 4,错误 ! =错误 ! [13 - 132+ 14- 132+ 12- 132+ 12-132+ 14- 132] =2 由错误 ! >错误 ! 可知乙的成绩较稳固.从折线图看,甲的成绩基本奉上涨状态,而乙的成绩上下颠簸,可知甲的成绩在不停提高,而乙的成绩则无显然提高.9.12分 2022·广东某校100 名学生期中考试语文成绩的频次散布直方图以下图,此中成绩分组区间是[50,60, [60,70, [70,80, [80,90, [90,100].1 求图中a的值;2 依据频次散布直方图,预计这100 名学生语文成绩的均匀分;3 若这 100 名学生语文成绩某些分数段的人数与数学成绩相应分数段的人数之比方下表所示,求数学成绩在[50,90以外的人数分数段[50,60[60,70[70,80[80,90∶1∶12∶13∶44∶5解 1 由频次散布直方图知2a+++× 10= 1,解得a=2 由频次散布直方图知这100 名学生语文成绩的均匀分为55×× 10+65×× 10+75×× 10+85×× 10+95×× 10=73 分.3 由频次散布直方图知语文成绩在[50,60 , [60,70 , [70,80 , [80,90各分数段的人数依次为× 10×100=5, ×10×100=40, ×10×100=30, ×10×100=20由题中给出的比率关系知数学成绩在上述各分数段的人数挨次为5,40×错误!=20,30 ×错误 ! =40,20 ×错误 ! = 25故数学成绩在[50,90以外的人数为 100- 5+ 20+ 40+ 25= 10B 组专项能力提高时间: 25 分钟,满分: 43 分一、选择题每题 5 分,共 15分1.2 022·重庆从一堆苹果中任取10 只,称得它们的质量以下单位:克:125 120122 105 13011411695120134则样本数据落在[,]内的频次为A.B.C.D.答案C分析落在 [,]内的样本数据为120,122,116,120,共4个,故所求频次为错误!=2.为了认识某校高三学生的视力状况,随机地抽查了该校100 名高三学生的视力状况,得到频次散布直方图,以下图.因为不慎将部分数据丢掉,但知道前 4 组的频数成等比数列,后 6 组的频数成等差数列,设最大频次为a,视力在到之间的学生数为b,则a,b的值分别为A. ,78B. ,83C. ,78D. ,83答案A分析由题意,到之间的频次为, 到之间的频次为,后6 组的频数成等差数列,设公差为d,则有6×+ 15d=1---,解得 d 而后可求得各组频次也可用清除法.3.一个样本a, 3,5,7的均匀数是b,且a、 b是方程2-5+4=0的两根,则这个样本的方差是A. 3B. 4C. 5D. 6答案C分析2-5+4=0的两根是1,4当 a=1时, a, 3,5,7的均匀数是4,当 a=4时, a, 3,5,7的均匀数不是1∴ a=1, b=2=错误!×[1-42+3-42+5-42+7-42]=5,应选C二、填空题每题5分,共 15 分4.从某小学随机抽取100 名学生,将他们的身高单位:厘米数据绘制成频次散布直方图如图.由图中数据可知a=120,130,[130,140,[140,150]三组内的学生中,用分层抽样的方法选用 18人参加一项活动,则从身高在[140,150]内的学生中选用的人数应为________ .答案3分析∵小矩形的面积等于频次,∴除 [120,130 外的频次和为,∴a=错误 ! =由题意知,身高在 [120,130,[130,140,[140,150]的学生疏别为 30 人, 20 人, 10 人,∴由分层抽样可知抽样比为错误 !=错误 !,∴在 [140,150]中选用的学生应为 3 人.5.某人 5 次上班途中所花的时间单位:分钟分别为, , 10,11,9已知这组数据的均匀数为10,方差为 2,则 | - | 的值为 ________.答案4分析由题意可得:+= 20,- 102+- 102= 8,设= 10+t,= 10-t, | - | =2| t | = 4 6.已知整体的各个体的值由小到大挨次为2,3,3,7 ,a,b, 12,,,20 ,且整体的中位数为,若要使该整体的方差最小,则、b 的取值分别是 ________、 ________a答案分析∵中位数为,∴错误!=,+= 21,a b∵\to =错误 ! = 10,∴2=错误 ! [2 - 102+ 3- 102+ 3- 102+ 7- 102+a- 102+b- 102+ 12- 102+- 102+- 102+20- 102] .令= 10-a2+ 10-b2= 2a2- 42a+ 221=2错误 ! 2+错误 ! ,当 a=时,取最小值,方差2也取最小值.∴ a=, b=三、解答题7. 13 分某地域100 位居民的人均月用水量单位:t 的分组及各组的频数以下:[0, , 4; [,1, 8; [1, , 15;[,2 , 22; [2, , 25; [,3 , 14; [3, ,6; [,4 , 4; [4,,2 1列出样本的频次散布表;2画出频次散布直方图,并依据直方图预计这组数据的均匀数、中位数、众数;3 当地政府拟订了人均月用水量为3t 的标准,若高出标准加倍收费,当地政府说,85%以上的居民不超出这个标准,这个解说对吗为何解 1 频次散布表分组频数频次[0,4[,18[1,15[,222[2,25[,314[3,6[,44[4,2共计10012频次散布直方图如图:众数:,中位数:,均匀数:3 人均月用水量在3t以上的居民所占的比率为6%+4%+ 2%=12%,即大概有12%的居民月用水量在3t以上, 88%的居民月用水量在3t以下,所以政府的解说是正确的.。
人教版高三数学一轮复习精品课件2:11.2 用样本估计总体
(4)这组数据为 87,87,94,90,91,90,90+x,99,91,最高分为 99, 最低分为 87,剩余数据为 87,94,90,91,90,90+x,91.
17(87+94+90+91+90+90+x+91)=91,所以 x=4. 方差为17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90 -91)2+(94-91)2+(91-91)2] =376.故选 B. [答案] (1)A (2)C (3)D (4)B
• 【失误与防范】
频率分布直方图的纵坐标为频率/组距,每一个小矩形的 面积表示样本个体落在该区间内的频率;条形图的纵坐标为频 数或频率,把直方图视为条形图是常见的错误.
A.甲网店的极差大于乙网店的极差 B.甲网店的中位数是46 C.乙网店的众数是42 D.甲网店的销售业绩好 (4)(2013·山东高考)将某选手的9个得分去掉1个最高分,去掉1 个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎 叶图后来有一个数据模糊,无法辨认,在图中以x表示:
则 7 个剩余分数的方差为( )
第十一章 统计、统计案例
11.2 用样本估计总体
考纲要求
1.了解分布的意义与作用,能根据频率分布表画频率分布直方 图、频率折线图、茎叶图,体会它们各自的特点. 2.理解样本数据标准差的意义和作用,会计算数据标准差. 3.能从样本数据中提取基本的数字特征(如平均数、标准差), 并做出合理的解释. 4.会用样本的频率分布估计总体分布,会用样本的基本数字特 征估计总体的基本数字特征,理解用样本估计总体的思想. 5.会用随机抽样的基本方法和样本估计总体的思想解决一些简 单的实际问题.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样 本数据的分布情况的.茎叶图由所有样本数据构成,没有损失 任何样本信息,可以随时记录;而频率分布表和频率分布直方 图则损失了样本的一些信息,必须在完成抽样后才能制作.
高考(新课标)数学(理)一轮复习教师用书§11.2 用样本估计总体 Word版含解析
§用样本估计总体.用样本的频率分布估计总体分布()通常我们对总体作出的估计一般分成两种:一种是用样本的估计总体的;另一种是用样本的估计总体的.()在频率分布直方图中,纵轴表示,数据落在各小组内的频率用表示.各小长方形的面积总和等于.()连接频率分布直方图中各小长方形上端的中点,就得到频率分布.随着样本容量的增加,作图时所分的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为,它能够更加精细地反映出.()当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以,而且可以,给数据的记录和表示都带来方便..用样本的数字特征估计总体的数字特征()众数,中位数,平均数众数:在一组数据中,出现次数的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的)叫做这组数据的中位数.平均数:样本数据的算术平均数,即=.在频率分布直方图中,中位数左边和右边的直方图的面积应该.()样本方差,样本标准差标准差=,其中是,是,是.标准差是反映总体的特征数,样本方差是样本标准差的.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.自查自纠.()频率分布分布数字特征数字特征()各小长方形的面积()折线图组数总体密度曲线总体在各个范围内取值的百分比()保留所有信息随时记录.()最多平均数(++…+) 相等()样本数据的第项样本容量平均数波动大小平方在频率分布直方图中,各个长方形的面积表示( ).落在相应各组的数据的频数.相应各组数据的频率.该样本所分成的组数.该样本的样本容量解:在频率分布直方图中,小长方形面积=组距×=频率,所以每个小长方形的面积是相应各组数据的频率.故选.()某中学初中部共有名教师,高中部共有名教师,其性别比例如图所示,则该校女教师的人数为()....解:由扇形统计图可得,该校女教师人数为×+×(-)=.故选.有一个容量为的样本,数据的分组及各组的频数如下:[,) [,) [,)[,) [,)[,)[,) [,)根据样本的频率分布估计,数据落在[,)的概率约是( )解:落在[,)的频数为,所以概率约为.故选.()某学校高一年级男生人数占该年级学生人数的.在一次考试中,男、女生平均分数分别为,,则这次考试该年级学生平均分数为.解:该年级学生平均分数为=×+×=.故填.()在一次马拉松比赛中,名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为~号,再用系统抽样方法从中抽取人,则其中成绩在区间[,]上的运动员人数是.解:由题意可知,这名运动员的分组情况为,第一组(,,,,),第二组(,,,,),第三组(,,,,),第四组(,,,,),第五组(,,,,),第六组(,,,,),第七组(,,,,),故成绩在区间[,]上的运动员恰有组,故所求人数为.故填.类型一数字特征及其应用()某工厂名工人的年龄数据如下表:。
用样本估计总体教案
用样本估计总体教案教案标题:用样本估计总体教学目标:1. 理解样本和总体的概念,并能够解释样本估计总体的原理。
2. 掌握样本估计总体的方法和计算步骤。
3. 能够应用样本估计总体解决实际问题。
教学资源:1. 教材:包含有关样本估计总体的理论知识和实例的教材。
2. 计算器或电脑:用于进行样本估计总体的计算。
教学步骤:引入(5分钟):1. 向学生介绍样本和总体的概念,并解释它们在统计学中的重要性。
2. 引出样本估计总体的概念,解释为什么我们需要使用样本来估计总体参数。
讲解理论(15分钟):1. 解释样本估计总体的原理:样本是从总体中抽取出来的一部分数据,通过对样本数据进行分析和计算,可以推断出总体的特征。
2. 介绍样本估计总体的方法:a. 点估计:使用样本数据计算出一个具体的数值作为总体参数的估计值。
b. 区间估计:使用样本数据计算出一个区间,该区间内的数值作为总体参数的估计范围。
3. 解释如何选择合适的样本大小和抽样方法,以确保样本能够代表总体。
示例演练(20分钟):1. 给出一个实际问题,例如:某市场调查公司想要估计某产品在全国范围内的平均销售额。
请设计一个样本估计总体的方案,并计算出估计值和置信区间。
2. 引导学生根据问题的要求,选择合适的样本大小和抽样方法。
3. 指导学生使用样本数据计算出估计值和置信区间,并解释结果的意义。
讨论和总结(10分钟):1. 学生讨论他们设计的样本估计总体方案和计算结果。
2. 引导学生思考样本估计总体的优缺点,以及在实际应用中可能遇到的问题。
3. 总结样本估计总体的关键概念和方法。
作业(5分钟):布置作业,要求学生根据给定的问题,设计样本估计总体的方案,并计算出估计值和置信区间。
要求学生在作业中解释他们的思路和计算过程。
扩展活动:1. 提供更多的实际问题,让学生继续练习样本估计总体的设计和计算。
2. 鼓励学生使用统计软件或编程语言进行样本估计总体的计算,以提高计算效率和准确性。
备战2024年高考数学大一轮老教材人教A版理第十一章用样本估计总体
第
二 部 分
探究核心题型
题型一 样本的数字特征
例1 (1)某工厂10名工人某天生产同一类型零件,生产的件数分别是
10,12,14,14,15,15,16,17,17,17.记这组数据的中位数为a,平均数为b,众数
为c,则
A.a>b>c
√C.c>a>b
B.b>c>a D.c>b>a
这10个数据已经从小到大进行了排序, ∴中位数 a=15+2 15=15,众数 c=17, 平均数 b=10+12+14+14+151+015+16+17+17+17=14.7, ∴c>a>b.
为众数的估计值.( √ )
教材改编题
1.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为
A.2
B.4
C.6
√D.8
根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据 2x1,2x2,…,2x9的方差为22s2=8.
教材改编题
2.已知一组数据a,0,1,2,3,若该组数据的平均数为1,则a等于
平均数、中位数、众数与方差、标准差都是重要的数字特征, 是对总体的一种简明的描述,它们所反映的情况有着重要的 实际意义,平均数、中位数、众数描述其集中趋势,方差和 标准差描述其离散程度.
跟踪训练1 (1)已知甲、乙、丙、丁、戊五位同学高一入学时年龄的平 均数、中位数、众数均为16,方差为0.8,则三年后,下列判断错误的是 A.这五位同学年龄的平均数变为19
(2)已知某 7 个数的平均数为 4,方差为 2,现加入一个新数据 4,此时这
8=4,s2<2
B. x =4,s2=2
高考大一轮复习备考资料之数学人教A版全国用课件:11.2 用样本估计总体
第十一章 统计与统计案例§11.2 用样本估计总体内容索引基础知识 自主学习题型分类 深度剖析课时作业基础知识 自主学习1.作频率分布直方图的步骤(1)求极差(即一组数据中 与 的差).(2)决定 与 .(3)将数据.(4)列 .(5)画 .知识梳理最大值最小值组距组数分组频率分布表频率分布直方图2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的增加, 减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.中点组数组距3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.4.标准差和方差平均距离.(1)标准差是样本数据到平均数的一种(2)标准差:s=____________________________________.(3)方差:s2=__________________________________(x n是样本数据,n是样本容量, 是样本平均数).【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示 ,频率=组距× .(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为 ,那么mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m +a.(2)数据x1,x2,…,x n的方差为s2.①数据x1+a,x2+a,…,x n+a的方差也为s2;②数据ax1,ax2,…,ax n的方差为a2s2.题组一 思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )基础自测123456√×√(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( )(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( )×√×题组二 教材改编2.[P100A组T2(1)]一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为√A.4B.8C.12D.16解析 设频数为n,3.[P81A组T1]若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是√A.91.5和91.5B.91.5和92C.91和91.5D.92和924.[P71T1]如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有______人.25解析 0.5×0.5×100=25.题组三 易错自纠5.若数据x1,x2,x3,…,x n的平均数 =5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为A.5,2B.16,2√C.16,18D.16,96.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为 ,则m,n, 的大小关系为________.(用“<”连接)题型分类 深度剖析题型一 茎叶图的应用自主演练1.(2017·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为√A.3,5B.5,5C.3,7D.5,72.(2017·长沙一模)空气质量指数(Air Q uality Index,简单AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如下.根据该统计数据146,估计此地该年AQI大于100的天数约为________.(该年有365天)思维升华茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.题型二 频率分布直方图的绘制与应用多维探究命题点1 用频率分布直方图求频率、频数典例从全校参加数学竞赛的学生的试卷中抽取一个样本,考察竞赛的成绩分布,将样本分成5组,绘成频率分布直方图,图中从左到右各小组的小长方形的高之比为1∶3∶6∶4∶2,最右边一组的频数是6,请结合频率分布直方图提供的信息,解答下列问题:(1)求样本的容量;(2)列出频率分布表;(3)成绩落在哪个范围内的人数最多,并求出该小组的频数、频率;(4)估计这次竞赛中,成绩高于60分的学生占总人数的百分比.命题点2 用频率分布直方图估计总体典例 (2016·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.思维升华(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.(2)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.跟踪训练(2017·北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.典例 (1)(2017·长春模拟)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:题型三 用样本的数字特征估计总体的数字特征师生共研运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.2(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:①分别求出两人得分的平均数与方差;②根据图和上面算得的结果,对两人的训练成绩作出评价.思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.高考中频率分布直方图的应用高频小考点频率分布直方图是高考考查的热点,考查频率很高,题型有选择题,填空题,也有解答题,难度为中低档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常考点分析典例 (12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;解 由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.0025)×20=1,得x=0.007 5,所以直方图中x的值是0.007 5.(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?课时作业基础保分练1.(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是√A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳A.5 8B.4 9C.6 7D.3 102.(2018届广东肇庆检测)下面茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为√3.(2016·全国Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同√D.平均最高气温高于20℃的月份有5个。
《用样本估计总体》教案2(新课标人教A版必修3).doc
总体分布的估计(2)用样本的频率分布估计总体分布教学目标:知识与技能(1)通过实例体会分布的意义和作用。
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需耍,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
重点与难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
难点:能通过样本的频率分布估计总体的分布。
教学设想〈一〉频率分布的概念:频率分布:是指一个样本数据在各个小范围内所占比例的大小。
可以用样本的频率分布估计总体的频率分布。
频率分布表:我们把反映总体频率分布的表格称为频率分布表。
编制频率分布表的步骤如下:(1)找到最大最小值,求全距;决定组数,算得组距;(2)分组通常对组内数值所在区间取左闭又开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表。
【注意】:在决定组数以后有可能要适当的调整全距,既如果全距不利于分组(如不能被组数整除),可适当增加全距,(只能加不能减)如在左右两端各增加适当的范围(尽量使两端增加量相同)。
彳列1・从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高的样本,数据如下(单位:cm)。
试作出该样本的频率分布表。
解:最大值=180,最小值=151,他们相差29,决定分为10组,则需将全距调整为30,组距为3,既每个小区间的长度为3,组距二全距/组数可取区间[150. 5, 180. 5]练习:P53, T 1, 3第二课时频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。
高考数学一轮复习 第11章 统计与统计案例 2 第2讲 用样本估计总体教案 理-人教版高三全册数学教
第2讲 用样本估计总体1.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; ③将数据分组; ④列频率分布表; ⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. (3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧. 2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (3)平均数:把a 1+a 2+…+a nn称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,那么这组数据的标准差和方差分别是s =1n[〔x 1-x -〕2+〔x 2-x -〕2+…+〔x n -x -〕2] s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]3.与平均数和方差有关的结论(1)假设x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ;(2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)假设x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑i =1n (x i -x -)2=1n ∑i =1nx 2i -x -2,即各数平方的平均数减去平均数的平方.判断正误(正确的打“√〞,错误的打“×〞)(1)一组数据的方差越大,说明这组数据的波动越大.( )(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.( )(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( )(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.( )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.( ) 答案:(1)√ (2)√ (3)× (4)√ (5)√(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,以下结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月份D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳解析:选A.根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A错误.重庆市某年各月的平均气温(℃)数据的茎叶图如图,那么这组数据的中位数是( )A.19 B.20C.21.5 D.23解析:选B.由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.(2018·郑州第一次质量预测)我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],假设低于60分的人数是15,那么该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:50甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,那么这10天甲、乙两人日加工零件的平均数分别为________和________.解析:由茎叶图可知甲的平均数为19+18+20+21+23+22+20+31+31+3510=24.乙的平均数为19+17+11+21+24+22+24+30+32+3010=23.答案:24 23茎叶图[典例引领](2017·高考山东卷)如下图的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).假设这两组数据的中位数相等,且平均值也相等,那么x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7【解析】 根据两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等, 所以56+62+65+74+〔70+x 〕5=59+61+67+〔60+y 〕+785,解得x =3.应选A .【答案】 A茎叶图中的三个关注点(1)“叶〞的位置只有一个数字,而“茎〞的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心〞下移者平均数较大,数据集中者方差较小.[通关练习]1.(2018·贵州遵义航天高中模拟)某学生在一门功课的22次考试中,所得分数茎叶图如下图,那么此学生该门功课考试分数的极差与中位数之和为( )A.117 B.118C.118.5 D.119.5解析:选B.22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.2.为了了解某校教师使用多媒体进行教学的情况,现采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如下图.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为( )A.100 B.160C.200 D.280解析:选B.由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×820=160.频率分布直方图(高频考点)频率分布直方图是高考的热点,选择题、填空题、解答题都有可能出现.难度一般较小.高考对频率分布直方图的考查主要有以下三个命题角度:(1)求样本的频率、频数;(2)求样本的数字特征;(3)与概率结合的问题.[典例引领]角度一求样本的频率、频数(2016·高考山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140【解析】 由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.应选D. 【答案】 D角度二 求样本的数字特征(2018·云南省11校跨区调研)为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如下图.(1)求图中a 的值;(2)估计这种植物果实重量的平均数x -和方差s 2(同一组中的数据用该组区间的中点值作代表).【解】 (1)组距d =5,由5×(0.02+0.04+0.075+a +0.015)=1得a =0.05. (2)各组中点值和相应的频率依次为中点值3035404550频率0.1 0.2 0.375 0.25 0.075x-=30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40,s2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75.角度三与概率结合的问题(2018·东北四市高考模拟)某手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,对手机进行打分,打分的频数分布表如下:女性用户分值区间[50,60) [60,70) [70,80) [80,90) 频数20 40 80 50男性用户分值区间[50,60) [60,70) [70,80) [80,90) 频数45 75 90 60(1)完成以下频率分布直方图,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);(2)根据评分的不同,运用分层抽样的方法从男性用户中抽取20名用户,再从这20名用户中满足评分不低于80分的用户中任意抽取3名用户,求3名用户中评分小于90分的人数X 的分布列和数学期望.【解】(1)女性用户和男性用户的频率分布直方图如图.由图可知女性用户评分的波动小,男性用户评分的波动大.(2)运用分层抽样的方法从男性用户中抽取20名用户,评分不低于80分的用户有6人,其中评分小于90分的有4人,从6人中任取3人,那么X的可能取值为1,2,3,P (X =1)=C 14C 22C 36=420=15,P (X =2)=C 24C 12C 36=1220=35,P (X =3)=C 34C 36=420=15.所以X 的分布列为X 1 2 3 P153515E (X )=15+65+35=2.频率、频数、样本容量的计算方法(1)频率组距×组距=频率. (2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数. [提醒] 制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.[通关练习]1.在样本频率分布直方图中,共有9个小长方形,假设中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,那么中间一组的频数为( )A .28B .40C .56D .60解析:选B .设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x =140,解得x =40.2.(2018·武汉市武昌区调研考试)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x (吨),月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如下图的频率分布直方图.(1)求频率分布直方图中a的值;(2)该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)假设该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解:(1)由频率分布直方图,可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800 000×0.12=96 000.(3)因为前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.样本数字特征的求解与应用[典例引领](1)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人〞.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是( )A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3(2)(2018·南昌模拟)假设1,2,3,4,m这五个数的平均数为3,那么这五个数的方差为________.(3)(2018·石家庄市教学质量检测(二))设样本数据x1,x2,…,x2 017的方差是4,假设y i =2x i-1(i=1,2,…,2 017),那么y1,y2,…,y2 017的方差为________.【解析】 (1)根据标志,要求数据中每个个体不超过7.中位数与众数不能表达个体数据,无法确定.方差表达数据中个体的波动程度,假设大于0,那么无法确定.假设均值为2,方差为3,假设∃x i ≥8,那么s 2≥〔x i -x -〕210=6210>3,故假设不成立.(2)由1+2+3+4+m 5=3得m =5,所以这五个数的方差为15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.(3)设样本数据的平均数为x -,那么y i =2x i -1的平均数为2x --1,那么y 1,y 2,…,y 2 017的方差为12 017[(2x 1-1-2x -+1)2+(2x 2-1-2x -+1)2+…+(2x 2 017-1-2x -+1)2]=4×12 017[(x 1-x -)2+(x 2-x -)2+…+(x 2 017-x -)2]=4×4=16. 【答案】 (1)D (2)2 (3)16(1)众数、中位数、平均数及方差的意义①平均数与方差都是重要的数字特征,是对总体的一种简明地描述. ②平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)在计算平均数、方差时可利用平均数、方差的有关结论.[通关练习]1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如下图,那么( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 解析:选C. x -甲=15(4+5+6+7+8)=6,x -乙=15(5×3+6+9)=6,甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.2.(2018·合肥市第二次教学质量检测)某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,那么这组数据的方差是________.解析:因为对一组数据同时加上或减去同一个常数,方差不变,所以此题中可以先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s 2=〔0-8〕2+〔4-8〕2+〔11-8〕2+〔9-8〕2+〔16-8〕25=30.8.答案:30.83.(2018·贵阳市监测考试)在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图(如图).假设从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.解:学生甲的平均成绩x -甲=68+76+79+86+88+956=82,学生乙的平均成绩x -乙=71+75+82+84+86+946=82,又s 2甲=16×[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77,s 2乙=16×[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2]=1673,那么x -甲=x -乙,s 2甲>s 2乙,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.众数、中位数和平均数的异同众 数中位数平均数相同点都是描述一组数据集中趋势的量不同点与这组数据中的部分数据有关,出现在这些数据中不一定在这些数据中出现.奇数个时,在这组数据中出现;偶数个时,为中间两数的平均值不一定在这些数据中出现标准差和方差的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小.不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差那么不然. 易错防范(1)易忽视频率分布直方图中纵轴表示的应为频率组距.(2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,那么在区间[10,50)上的数据的频率是( )A .0.05B .0.25C .0.5D .0.7解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.2.(2018·广西三市第一次联考)在如下图一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,那么被污染的数字为( )C .3D .4解析:选B.由题图可知该组数据的极差为48-20=28,那么该组数据的中位数为61-28=33,易得被污染的数字为2.3.(2018·岳阳模拟)某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如下图,9时至10时的销售额为2.5万元,那么11时到12时的销售额为( )A .6万元B .8万元C .10万元D .12万元解析:选C.设11时到12时的销售额为x 万元,依题意有2.5x =0.100.40,解得x =10.4.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如下图,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )解析:选A.由分组可知C ,D 一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相等,可排除B.5.某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.这组数据的平均数为10,方差为2,那么|x -y |的值为( )C.3 D.4解析:选D.由题意这组数据的平均数为10,方差为2,可得:x+y=20,(x-10)2+(y-10)2=8,设x=10+t,y=10-t,由(x-10)2+(y-10)2=8,得t2=4,所以|x-y|=2|t|=4. 6.(2018·湖南省五市十校联考)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如下图,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,那么n-m的值是________.解析:由甲组学生成绩的平均数是88,可得70+80×3+90×3+〔8+4+6+8+2+m+5〕7=88,解得m=3.由乙组学生成绩的中位数是89,可得n=9,所以n-m=6.答案:67.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如下图.现在要从第1,3,4组中用分层抽样的方法抽取16人,那么在第4组中抽取的人数为________.解析:根据频率分布直方图得,第1,3,4组的频率之比为1∶4∶3,所以用分层抽样的方法抽取16人时,在第4组中应抽取的人数为16×31+4+3=6.答案:68.(2018·成都市第二次诊断性检测)在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1 ,那么这组数据的方差s 2可能的最大值是________.解析:由题意可设两个被污损的数据分别为10+a ,b ,(a ,b ∈Z ,0≤a ≤9),那么10+a +b +9+10+11=50,即a +b =10,b =10-a ,所以s 2=15[(9-10)2+(10-10)2+(11-10)2+(10+a -10)2+(b -10)2]=15[2+a 2+(b -10)2]=25(1+a 2)≤25×(1+92)=32.8.答案:32.89.某校1 200名高三年级学生参加了一次数学测验(总分值为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决以下问题:(1)求a 、b 、c (2)如果从这 1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.(2)根据,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=81100=0.81.(3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73,所以这次数学测验的年级平均分大约为73分.10.(2017·高考北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.1.(2018·长春模拟)某销售公司为了解员工的月工资水平,从 1 000位员工中随机抽取100位员工进行调查,得到如下的频率分布直方图:(1)试由此图估计该公司员工的月平均工资;(2)该公司的工资发放是以员工的营销水平为重要依据来确定的,一般认为,工资低于 4 500元的员工属于学徒阶段,没有营销经验,假设进行营销将会失败;高于4 500元的员工属于成熟员工,进行营销将会成功.现将该样本按照“学徒阶段工资〞“成熟员工工资〞分成两层,进行分层抽样,从中抽出5人,在这5人中任选2人进行营销活动.活动中,每位员工假设营销成功,将为公司赚得3万元,否那么公司将损失1万元.试问在此次比赛中公司收入多少万元的可能性最大?解:(1)估计该公司员工的月平均工资为0.000 1×1 000×2 000+0.000 1×1 000×3 000+0.000 2×1 000×4 000+0.000 3×1 000×5 000+0.000 2×1 000×6 000+0.000 1×1 000×7 000=4 700(元). (2)抽取比为5100=120,从工资在[1 500,4 500)内的员工中抽出100×(0.1+0.1+0.2)×120=2人,设这两位员工分别为1,2;从工资在[4 500,7 500]内的员工中抽出100×(0.3+0.2+0.1)×120=3人,设这三位员工分别为A ,B ,C .从中任选2人,共有以下10种不同的等可能结果:(1,2),(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),(A ,B ),(A ,C ),(B ,C ).两人营销都成功,公司收入6万元,有以下3种不同的等可能结果:(A ,B ),(A ,C ),(B ,C ),概率为310;其中一人营销成功,一人营销失败,公司收入2万元,有以下6种不同的等可能结果:(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),概率为610=35;两人营销都失败,公司收入-2万元,即损失2万元,有1种结果:(1,2),概率为110.因为110<310<35,所以公司收入2万元的可能性最大.2.(2018·河北三市第二次联考)某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X 的分布列和均值.解:(1) x -甲 =18(7+9+11+13+13+16+23+28)=15,x -乙=18(7+8+10+15+17+19+21+23)=15,s 2甲=18[(-8)2+(-6)2+(-4)2+(-2)2+(-2)2+12+82+132]=44.75,s 2乙=18[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.甲、乙两名同学解答题失分的平均数相等;甲同学解答题失分的方差比乙同学解答题失分的方差大.所以乙同学做解答题相对稳定些.(2)根据统计结果,在一次周练中,甲和乙失分超过15分的概率分别为P 1=38,P 2=12,两人失分均超过15分的概率为P 1P 2=316,X 的所有可能取值为0,1,2.依题意,X ~B (2,316),P (X =k )=C k 2(316)k (1316)2-k,k =0,1,2, 那么X 的分布列为X 0 1 2 P169256391289256X 的均值E (X )=2×16=8.。
高考数学总复习 102 用样本估计总体课件 理 新人教A版
则n,m的大小关系为
()
A.n<m
B.n>m
C.n=m
D.不能确定
第三十五页,共47页。
解析:由已知,得x1+x2+…+xn=n x ,y1+y2+…+ym
=m y ,
z
=
x1+x2+…+xn+y1+y2+…+ym m+n
从这个茎叶图中得到,其二是在比赛时随时记录,方便记录
与表示.
(3)在样本数据较少时,用茎叶图表示数据的效果较好,
但当样本数据较多时,茎叶图就显得不太方便了.
第七页,共47页。
4.样本的数字特征
数字特征
定义
众数
在一组数据中,出现次数 最多的数据叫做这组 数据的众数.
中位 数
平均 数
方差
将一组数据按大小依次排列,把处在 最中间位(置zhōngjiān) 的一个数据(或最中间两个数据的平均数)叫做这
如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81
,83,82,82,64,79,86,85,75,71,49,45. 分组 频数 频率
[41,51)
2
2 30
[51,61)
1
1 30
第十五页,共47页。
第十三页,共47页。
2.频率分布直方图中各小长方形的面积之和为1,因此 在频率分布直方图中组距是一个固定值,所以各小长方形高 的比也就是频率比.
3.频率分布表和频率分布直方图是一组数据频率分布的 两种形式,前者准确,后者直观.
第十四页,共47页。
某市2012年4月1日~4月30日对空气污染指数的监测数据
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§11.2 用样本估计总体2014高考会这样考 1.考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要以选择题、填空题为主;2.考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数).复习备考要这样做 1.理解统计中的常用术语:总体、个体、样本、平均数、方差、中位数、众数;2.会利用频率分布直方图、茎叶图对总体进行估计,尤其是频率分布直方图的应用更是高考考查的热点.1. 频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.(2)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便. 2. 用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ).在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差标准差s =1nx 1-x2+x 2-x2+…+x n -x2],其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. [难点正本 疑点清源] 1. 作频率分布直方图的步骤(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状. 2. 众数、中位数与平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. (2)由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.(3)众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.(4)某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势. 3. 利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和. (3)众数:最高的矩形的中点的横坐标.1. (2011·江苏)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________. 答案 3.2解析 x =10+6+8+5+65=7,∴s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165=3.2.2. (2011·浙江)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.答案 600解析 由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3 000×0.2=600.3. (2012·湖南)如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数) 答案 6.8解析 依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为8+9+10+13+155=11.由方差公式得s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=15(9+4+1+4+16)=6.8.4. 一个容量为20的样本,数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),x ;[40,50),5;[50,60),4;[60,70),2;则x =________;根据样本的频率分布估计,数据落在[10,50)的概率约为________. 答案 4 0.7解析 x =20-(2+3+5+4+2)=4,P =2+3+4+520=0.7或P =1-4+220=0.7.5. 某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有( )A.30辆B.40辆C.60辆D.80辆答案 B解析由题图可知,车速大于或等于70 km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆).题型一频率分布直方图的绘制与应用生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.思维启迪:利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率分布直方图.解(1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.(2)平均分为x=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).探究提高频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.某种袋装产品的标准质量为每袋100克,但工人在包装过程中一般有误差,规定误差在2克以内的产品均合格.由于操作熟练,某工人在包装过程中不称重直接包装,现对其包装的产品进行随机抽查,抽查30袋产品获得的数据如下:(1)(2)估计该工人包装的产品的平均质量的估计值是多少. 解 (1)频率分布直方图如下:(2)115×92+15×96+25×100+415×104+115×108≈100.27(克). 题型二 茎叶图的应用例2 某良种培育基地正在培育一种小麦新品种A .将其与原有的一个优良品种B 进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下: 品种A :357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454 品种B :363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430 (1)作出数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A 与B 的亩产量及其稳定性进行比较,写出统计结论. 思维启迪:作茎叶图时,将高位(十位与百位)作为茎,低位(个位)作为叶,逐个统计;根据茎叶图分析两组数据的特点,可以得出结论.解 (1)如下图(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A 的亩产平均数(或均值)比品种B 高;②品种A 的亩产标准差(或方差)比品种B 大,故品种A 的亩产稳定性较差.探究提高 (1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.(1) 如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人比赛得分的中位数之和是________.(2)甲、乙两个体能康复训练小组各有10名组员,经过一段时间训练后,某项体能测试结果的茎叶图如图所示,则这两个小组中体能测试平均成绩较高的是________组.答案 (1)64 (2)甲解析 (1)∵甲的中位数为28,乙的中位数为36, ∴甲、乙得分中位数之和为28+36=64.(2)∵x 甲=63+65+66+71+77+77+79+81+84+9210=75.5,x 乙=58+68+69+74+75+78+79+80+82+9110=75.4,∴x 甲>x 乙.题型三 用样本的数字特征估计总体的数字特征例3 甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5. (1)分别计算两组数据的平均数; (2)分别计算两组数据的方差;(3)根据计算结果,估计一下两名战士的射击水平谁更好一些.思维启迪:根据公式计算平均数和方差,然后利用平均数和方差的意义进行估计. 解 (1)x 甲=110(8+6+7+8+6+5+9+10+4+7)=7(环), x 乙=110(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]可求得s 2甲=3.0(环2),s 2乙=1.2(环2).(3)由x 甲=x 乙,说明甲、乙两战士的平均水平相当;又∵s 2甲>s 2乙,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定. 探究提高 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(1)如右图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,4D .85,1.6(2)(2012·山东)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( ) A .众数 B .平均数 C .中位数D .标准差答案 (1)D (2)D解析 (1)由茎叶图可知评委打出的最低分为79,最高分为93,其余得分为84,84,86,84,87,故平均分为84×3+86+875=85,方差为15[3×(84-85)2+(86-85)2+(87-85)2]=1.6.(2)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.统计图表识图不准致误典例:(4分)从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为________. 易错分析 解题中易出现审题不仔细,又对所给图形没有真正理解清楚,将矩形的高误认为频率或者对“0.9以上”的含义理解有误.解析 该班学生视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4,故能报A 专业的人数为0.4×50=20. 答案 20温馨提醒 频率分布条形图的纵轴(矩形的高)表示频率;频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其各小组的频率等于该小组上的矩形的面积.方法与技巧1. 用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2. 茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3. 若取值x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,则其平均值为x 1p 1+x 2p 2+…+x n p n ;若x 1,x 2,…,x n 的平均数为x ,方差为s 2,则ax 1+b ,ax 2+b ,…,ax n +b 的平均数为a x +b ,方差为a 2s 2. 失误与防范频率分布直方图的纵坐标为频率/组距,每一个小矩形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.A 组 专项基础训练 (时间:35分钟,满分:57分)一、选择题(每小题5分,共20分)1. (2011·四川)有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是( ) A.16B.13C.12D.23答案 B解析 由条件可知,落在[31.5,43.5)的数据有12+7+3=22(个),故所求概率约为2266=13. 2. 为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图),已知从左到右各长方形高的比为2∶3∶5∶6∶3∶1,则该班学生数学成绩在(80,100)之间的学生人数是( )A .32B .27C .24D .33答案 D解析 80~100之间两个长方形高占总体的比例为5+62+3+5+6+3+1=1120,即为频数之比,∴x 60=1120,∴x =33. 3. 在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )A .92,2B .92,2.8C .93,2D .93,2.8 答案 B解析 去掉最高分95和最低分89后,剩余数据的平均数为x =90+90+93+94+935=92,方差为s 2=15[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=15(4+4+1+4+1)=2.8.4. 如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和x B ,样本标准差分别为s A 和s B ,则( )A.x A >x B ,s A >s BB.x A <x B ,s A >s BC.x A >x B ,s A <s BD.x A <x B ,s A <s B答案 B解析 A 中的数据都不大于B 中的数据,所以x A <x B ,但A 中的数据比B 中的数据波动幅度大,所以s A >s B .二、填空题(每小题5分,共15分)5. (2012·广东)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________________.(从小到大排列) 答案 1,1,3,3解析 假设这组数据按从小到大的顺序排列为x 1,x 2,x 3,x 4,则⎩⎪⎨⎪⎧x 1+x 2+x 3+x 44=2,x 2+x 32=2,∴⎩⎪⎨⎪⎧x 1+x 4=4,x 2+x 3=4.又s =14x 1-2+x 2-2+x 3-2+x 4-2]=12x 1-2+x 2-2+-x 2-2+-x 1-22=12x 1-2+x 2-2]=1,∴(x 1-2)2+(x 2-2)2=2. 同理可求得(x 3-2)2+(x 4-2)2=2.由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2+(y -2)2=2上的点,分析知x 1,x 2,x 3,x 4应为1,1,3,3.6. (2012·山东)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.7. 将容量为n 的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n =________. 答案 60解析 ∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1, ∴前三组频数和为2+3+420·n =27,故n =60.三、解答题(共22分)8. (10分)甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.9. (12分)(2012·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.解 (2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.B 组 专项能力提升 (时间:25分钟,满分:43分)一、选择题(每小题5分,共15分)1. (2011·重庆)从一堆苹果中任取10只,称得它们的质量如下(单位:克):125 120 122105 130 114 116 95 120 134 则样本数据落在[114.5,124.5]内的频率为( )A .0.2B .0.3C .0.4D .0.5答案 C解析 落在[114.5,124.5]内的样本数据为120,122,116,120,共4个,故所求频率为410=0.4.2. 为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,78D .2.7,83答案 A解析 由题意,4.5到4.6之间的频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d ,则有6×0.27+15d =1-0.01-0.03-0.09,解得d 然后可求得各组频率(也可用排除法).3. 一个样本a,3,5,7的平均数是b ,且a 、b 是方程x 2-5x +4=0的两根,则这个样本的方差是 ( )A .3B .4C .5D .6答案 C解析 x 2-5x +4=0的两根是1,4. 当a =1时,a,3,5,7的平均数是4, 当a =4时,a,3,5,7的平均数不是1.∴a =1,b =4.则方差s 2=14×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5,故选C.二、填空题(每小题5分,共15分)4. 从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.答案 0.030 3解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =1-0.70010=0.030.由题意知,身高在[120,130),[130,140),[140,150]的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=310,∴在[140,150]中选取的学生应为3人.5. 某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________. 答案 4解析 由题意可得:x +y =20,(x -10)2+(y -10)2=8,设x =10+t ,y =10-t ,|x -y |=2|t |=4.6. 已知总体的各个体的值由小到大依次为2,3,3,7,a ,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a 、b 的取值分别是________、________. 答案 10.5 10.5 解析 ∵中位数为10.5, ∴a +b2=10.5,a +b =21,∵x =2+3+3+7+a +b +12+13.7+18.3+2010=10,∴s 2=110[(2-10)2+(3-10)2+(3-10)2+(7-10)2+(a -10)2+(b -10)2+(12-10)2+(13.7-10)2+(18.3-10)2+(20-10)2]. 令y =(10-a )2+(10-b )2=2a 2-42a +221=2⎝⎛⎭⎪⎫a -2122+12,当a =10.5时,y 取最小值,方差s 2也取最小值. ∴a =10.5,b =10.5. 三、解答题7. (13分)某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2. (1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数; (3)当地政府制定了人均月用水量为3t 的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?解(1)频率分布表(2)众数:2.25,中位数:2.02,平均数:2.02.(3)人均月用水量在3t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3t以上,88%的居民月用水量在3t以下,因此政府的解释是正确的.。