数学:新人教A版必修三 2.2用样本估计总体(同步练习)

合集下载

人教A版必修3《2.2.2用样本的数字特征估计总体的数字特征》优化训练ppt课件

人教A版必修3《2.2.2用样本的数字特征估计总体的数字特征》优化训练ppt课件
最中间位置 的一个数据(或中间两个数据的平均数)称为这 在____________
组数据的中位数.
注意:在频率分布直方图中,中位数左边和右边的直方图 相等 ,由此可以估计中位数的值. 的面积________
x1+x2+„+xn x= n (3)如果有n个数x1,x2,„,xn,那么_________________
如下(单位:mL):
342,348,346,340,344,341,343,350,340,342
343.6 则样本的平均数是________.
解析:由于数据较大,又都在常数 342 附近波动,把各数
据都减去 342,得 0,6,4,-2,2,-1,1,8,-2,0,
1 则 x ′=10×(0+6+4-2+2-1+1+8-2+0)=1.6, 即 x = x ′+342=343.6.
人员
平均环数- x 方差s2
甲 8.6 3.5
乙 8.9 3.5
丙 8.9 2.1
丁 8.2 5.6
从这四个人中选择一人参加奥运会射击项目比赛,最佳人 选是( C )
A.甲
C.丙
B.乙
D.丁
【问题探究】
如何通过频率分布直方图估计众数、中位数和平均数? 答案:(1)众数是最高矩形底边的中点;(2)中位数左边和右
边的直方图的面积应相等,由此可以估计中位数的值;(3)平均
数是频率分布直方图的“重心”,它等于每个小矩形的面积乘
以小矩形底边中点的横坐标之和.
题型 1 众数、中位数、平均数的求法
【例 1】 在一次中学生田径运动会上,参加男子跳高的 17 名运动员的成绩如下表: 成绩/米 1.50 1.60 1.65 1.70 人数/名
1 这组数据的平均数是 x =17×(1.50×2+1.60×3+1.65×

山东省高中数学新课标人教A版必修三222用样本的

山东省高中数学新课标人教A版必修三222用样本的
s=____n1_[_x_1_-__x__2_+__x_2_-__x__2_+__…__+__x_n_-__x__2_] .
显然,标准差越大,数据的离散程度越大;标准差越小,
数据的离散程度越小.
(2)方差:标准差 s 的平方 s2,即
_s_2=___n1_[(_x_1_-__x__)2_+__(_x_2-___x_)_2_+__…__+__(_x_n-___x_)_2_] 叫做这组数据的方差,同标准差一样,方差也是用来测量 样本数据的分散程度的特征数.
课前探究学习
课堂讲练互动
活页规范训练
规律方法 1.几个性质:(1)若 x1,x2,…,xn 的平均数是 x , 那么 mx1+a,mx2+a,…,mxn+a 的平均数是 m x +a. (2)数据 x1,x2,…,xn 与数据 x1+a,x2+a,…,xn+a 的方 差相等. (3)若 x1,x2,…,xn 的方差为 s2,那么 ax1,ax2,…,axn 的 方差为 a2s2. 2.(1)方差的基本公式:s2=n1[(x1- x )2+(x2- x )2+…+(xn- x )2].
课前探究学习
课堂讲练互动
活页规范训练
解 (1) x 甲=16(99+100+98+100+100+103)=100, x 乙=16(99+100+102+99+100+100)=100. s 甲 2=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2 +(100-100)2+(103-100)2]=73, s 乙 2=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2 +(100-100)2+(100-100)2]=1. (2)两台机床所加工零件的直径的平均值相同, 又 s 甲 2>s 乙 2, 所以乙机床加工零件的质量更稳定.

高中数学必修第二册用样本估计总体练习题(平均数、方差、众数、百分位数等)

高中数学必修第二册用样本估计总体练习题(平均数、方差、众数、百分位数等)

用样本估计总体(平均数、众数、方差、百分位数等)一、单选题1.甲、乙、丙三人投掷飞镖,他们的成绩(环数)如下面的频数条形统计图所示.则甲、乙、丙三人训练成绩方差S甲2,S乙2,S丙2的大小关系是()A. S丙2<S乙2<S甲2B. S丙2<S甲2<S乙2C. S乙2<S丙2<S甲2D. S乙2<S甲2<S丙22.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花的纤维长度(棉花的纤维长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示.估计棉花的纤维长度的样本数据的80%分位数是()A. 28mmB. 28.5mmC. 29mmD. 29.5mm3.某校为了解高三年级学生在线学习情况,统计了2020年4月18日∼27日(共10天)学生在线学习人数及其增长比例数据,并制成如图所示的条形图与折线图的组合图.根据组合图判断,下列结论正确的是()A. 这10天学生在线学习人数的增长比例在逐日减小B. 前5天在线学习人数的方差大于后5天在线学习人数的方差C. 这10天学生在线学习人数在逐日增加D. 前5天在线学习人数增长比例的极差大于后5天在线学习人数增长比例的极差4.下列说法中,正确的是()A. 数据5,4,4,3,5,2的众数是4B. 一组数据的标准差的平方是这组数据的方差C. 数据2,3,4,5的方差是数据4,6,8,10的方差的一半D. 频率分布直方图中各小矩形的面积等于相应各组的频数5.为促进精准扶贫,某县计划引进一批果树树苗免费提供给贫困户种植.为了解果树树苗的生长情况,现从甲、乙两个品种中各随机抽取了100株,进行高度测量,并将高度数据制作成了如图所示的频率分布直方图.由频率分布直方图求得甲、乙两个品种高度的平均值都是66.5,用样本估计总体,则下列描述正确的是()A. 甲品种的平均高度高于乙品种,且乙品种比甲品种长的整齐B. 乙品种的平均高度高于甲品种,且甲品种比乙品种长的整齐C. 甲、乙品种的平均高度差不多,且甲品种比乙品种长的整齐D. 甲、乙品种的平均高度差不多,且乙品种比甲品种长的整齐6.从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为()A. 92,85B. 92,88C. 95,88D. 96,857.已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是13,那么另一组数3x1−2,3x2−2,3x3−2,3x4−2,3x5−2的平均数,方差分别是()A. 2,13B. 2,1 C. 4,3 D. 4,238.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数x8.68.98.98.2方差s2 3.5 3.5 2.1 5.6从这四人中选择一人参加奥运会射击项目比赛,最佳人选是()A. 甲B. 乙C. 丙D. 丁9.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则()A. x A>x B,s A>s BB. x A<x B,s A<s BC. x A>x B,s A<s BD. x A<x B,s A>s B10.某工厂的机器上有一种易损元件,这种元件发生损坏时,需要及时维修.现有甲、乙两名工人同时从事这项工作,下表记录了某月1日到10日甲、乙两名工人分别维修这种元件的件数.日期1日2日3日4日5日6日7日8日9日10日甲3546463784乙4745545547由于甲、乙的任务量大,拟增加工人,为使增加工人后平均每人每天维修的元件不超过3件,请利用上表数据估计最少需要增加工人的人数为()A. 2B. 3C. 4D. 5二、多选题(本大题共2小题,共10.0分)11.某赛季甲乙两名篮球运动员各6场比赛得分情况如表:场次123456甲得分31162434189乙得分232132113510则下列说法正确的是()A. 甲运动员得分的极差小于乙运动员得分的极差B. 甲运动员得分的中位数小于乙运动员得分的中位数C. 甲运动员得分的平均值大于乙运动员得分的平均值D. 甲运动员的成绩比乙运动员的成绩稳定12.一组样本数据的频率分布直方图如图所示,每组数据取中间值为代表,则下列说法正确的是()A. 此样本数据的中位数估计值为12B. 此样本数据的众数估计值为12C. 此样本数据的均值估计值为11.52D. 若将样本数据中每个数扩大1倍,则数据的方差也扩大1倍第II卷(非选择题)三、单空题13.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值分别为.14.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第百分位数.15.为了解中学生课外阅读情况,现从某中学随机抽取200名学生,收集了他们一年内的课外阅读量(单位:本)等数据,图是根据数据绘制的统计图表的一部分.下面有四个推断:①这200名学生阅读量的平均数可能是26本;②这200名学生阅读量的75%分位数在区间[30,40)内;③这200名学生中的初中生阅读量的中位数一定在区间[20,30)内;④这200名学生中的初中生阅读量的25%分位数可能在区间[20,30)内.所有合理推断的序号是.四、多空题16.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)年龄组[25,30)对应小长方形的高度为;(2)由频率分布直方图估计这800名志愿者年龄的85%分位数为岁.(精确到0.01)五、解答题17.某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.(1)求x;(2)求抽取的x人的年龄的50%分位数(结果保留整数);(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路”的认知程度,并谈谈你的感想.18.某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式.(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值.(3)根据(2)中求得的数据计算用电量的75%分位数.19.某校研究性学习课题小组为了了解某市工薪阶层的工资水平,从该市工薪阶层中随机调查了50位市民,调查结果如下表.(1)完成下图的月收入频率分布直方图(注意填写纵坐标);(2)估计该市市民月收入的第25和70百分位数.20.起源于汉代的“踢键子”运动,虽有两千多年历史,但由于简便易行,至今仍很流行.某校为丰富课外活动、增强学生体质,在高一年级进行了“踢键子”比赛,以学生每分钟踢毯子的个数记录分值,一个记一分.参赛学生踢键子的分值均在40∼100分之间,从中随机抽取了100个样本学生踢键子的成绩进行统计分析,绘制了如图所示的频率分布直方图,并称得分在80∼90之间为“踢毽健将”,90分以上为“踢建达人”.(1)求样本的平均值x(同一组数据用该区间的中点值代替);(2)求下列数据的四分位数.13,15,12,27,22,24,28,30,31,18,19,20.(3)求上述数据的40百分位数。

人教版高中数学必修3课后解答答案

人教版高中数学必修3课后解答答案

第一章 算法初步 1.1算法与程序框图练习(P5) 1、算法步骤:第一步,给定一个正实数r .第二步,计算以r 为半径的圆的面积2S r π=.第三步,得到圆的面积S .2、算法步骤:第一步,给定一个大于1的正整数n .第二步,令1i =.第三步,用i 除n ,等到余数r .第四步,判断“0r =”是否成立. 若是,则i 是n 的因数;否则,i 不是n 的因数. 第五步,使i 的值增加1,仍用i 表示.第六步,判断“i n >”是否成立. 若是,则结束算法;否则,返回第三步.练习(P19)算法步骤:第一步,给定精确度d ,令1i =.第二步,i 位的不足近似值,赋给a ;第i 位的过剩近似值,赋给b . 第三步,计算55b a m =-.第四步,若m d <,则得到5a ;否则,将i 的值增加1,仍用i 表示.返回第二步. 第五步,输出5a .程序框图:习题1.1 A 组(P20)1、下面是关于城市居民生活用水收费的问题.为了加强居民的节水意识,某市制订了以下生活用水收费标准:每户每月用水未超过7 m 3时,每立方米收费1.0元,并加收0.2元的城市污水处理费;超过7m 3的部分,每立方收费1.5元,并加收0.4元的城市污水处理费.设某户每月用水量为x m 3,应交纳水费y 元,那么y 与x 之间的函数关系为 1.2,071.9 4.9,7x x y x x ≤≤⎧=⎨->⎩我们设计一个算法来求上述分段函数的值.算法步骤:第一步:输入用户每月用水量x .第二步:判断输入的x 是否不超过7. 若是,则计算 1.2y x =;若不是,则计算 1.9 4.9y x =-.第三步:输出用户应交纳的水费y . 程序框图:2、算法步骤:第一步,令i =1,S=0.第二步:若i ≤100成立,则执行第三步;否则输出S. 第三步:计算S=S+i 2.第四步:i = i +1,返回第二步.程序框图:3、算法步骤:第一步,输入人数x ,设收取的卫生费为m 元.若x ≤3,则费用为5m =.第三步:输出m .程序框图:B 组 1、算法步骤:第一步,输入111222,,,,,a b c a b c ..第二步:计算21121221b c b c x a b a b -=-.第三步:计算12211221a c a c y ab a b -=-.第四步:输出,x y .程序框图:2、算法步骤:第一步,令n =1第二步:输入一个成绩r ,判断r 与6.8的大小. 若r ≥6.8,则执行下一步;第三步:使n 的值增加1,仍用n 表示.第四步:判断n 与成绩个数9的大小. 若n ≤9,则返回第二步;若n >9,则结束算法.程序框图:说明:本题在循环结构的循环体中包含了一个条件结构.1.2基本算法语句 练习(P24) 12、程序:3练习(P29) 12、本程序的运行过程为:输入整数x . 若x 是满足9<x <100的两位整数,则先取出x 的十位,记作a ,再取出x 的个位,记作b ,把a ,b 调换位置,分别作两位数的个位数与十位数,然后输出新4、34练习(P32) 1 2习题1.2 A 组(P33)1、1(0)0(0)1(0)x x y x x x -+<⎧⎪==⎨⎪+>⎩1、程序:23 41.3算法案例 练习(P45) 1、(1)45; (2)98; (3)24; (4)17. 2、2881.75.3、2200811111011000=() ,820083730=() 习题1.3 A 组(P48) 1、(1)57; (2)55. 2、21324.3、(1)104; (2)7212() (3)1278; (4)6315().4、习题1.3 B 组(P48)1、算法步骤:第一步,令45n =,1i =,0a =,0b =,0c =.第二步,输入()a i .第三步,判断是否0()60a i ≤<. 若是,则1a a =+,并执行第六步. 第四步,判断是否60()80a i ≤<. 若是,则1b b =+,并执行第六步. 第五步,判断是否80()100a i ≤≤. 若是,则1c c =+,并执行第六步. 第六步,1i i =+. 判断是否45i ≤. 若是,则返回第二步.第七步,输出成绩分别在区间[0,60),[60,80),[80,100]的人数,,a b c .2、如“出入相补”——计算面积的方法,“垛积术”——高阶等差数列的求和方法,等等.第一章 复习参考题A 组(P50)1、(1)程序框图: 程序:1、(2)程序框图: 程序:2、见习题1.2 B 组第1题解答.34、程序框图:程序:INPUT “n=”;ni=1S=0WHILE i<=nS=S+1/ii=i+1WENDPRINT “S=”;SEND5(1)向下的运动共经过约199.805 m (2)第10次着地后反弹约0.098 m (3)全程共经过约299.609 m B 组(P35)1 2、3、算法步骤:第一步,输入一个正整数x 和它的位数n . 第二步,判断n 是不是偶数,如果n 是偶数,令2n m =;如果n 是奇数,令12n m -=. 第三步,令1i =第四步,判断x 的第i 位与第(1)n i +-位上的数字是否相等. 若是,则使i 的值增加1,”是否成立. 若是,则n是回文数,结束算法;否则,返回第四步.第五步,判断“i m第二章统计2.1随机抽样练习(P57)1、.况之间有误差. 如抽取的部分个体不能很好地代表总体,那么我们分析出的结果就会有偏差.2、(1)抽签法:对高一年级全体学生450人进行编号,将学生的名字和对应的编号分别写在卡片上,并把450张卡片放入一个容器中,搅拌均匀后,每次不放回地从中抽取一张卡片,连续抽取50次,就得到参加这项活动的50名学生的编号.(2)随机数表法:第一步,先将450名学生编号,可以编为000,001, (449)第二步,在随机数表中任选一个数. 例如选出第7行第5列的数1(为了便于说明,下面摘取了附表的第6~10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28第三步,从选定的数1开始向右读,得到一个三位数175,由于175<450,说明号码175在总体内,将它取出;继续向右读,得到331,由于331<450,说明号码331在总体内,将它取出;继续向右读,得到572,由于572>450,将它去掉. 按照这种方法继续向右读,依次下去,直到样本的50个号码全部取出,这样我们就得到了参加这项活动的50名学生.3、用抽签法抽取样本的例子:为检查某班同学的学习情况,可用抽签法取出容量为5的样本. 用随机数表法抽取样本的例子:部分学生的心理调查等.抽签法能够保证总体中任何个体都以相同的机会被选到样本之中,因此保证了样本的代表性.4、与抽签法相比,随机数表法抽取样本的主要优点是节省人力、物力、财力和时间,缺点是所产生的样本不是真正的简单样本.练习(P59)1、系统抽样的优点是:(1)简便易行;(2)当对总体结构有一定了解时,充分利用已有信息对总体中的个体进行排队后再抽样,可提高抽样调查;(3)当总体中的个体存在一种自然编号(如生产线上产品的质量控制)时,便于施行系统抽样法.系统抽样的缺点是:在不了解样本总体的情况下,所抽出的样本可能有一定的偏差.2、(1)对这118名教师进行编号;(2)计算间隔1187.37516k==,由于k不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样. 例如我们随机剔除了3,46,59,57,112,93这6名教师,然后再对剩余的112位教师进行编号,计算间隔7k=;(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.3、由于身份证(18位)的倒数第二位表示性别,后三位是632的观众全部都是男性,所以这样获得的调查结果不能代表女性观众的意见,因此缺乏代表性.练习(P62) 1、略2、这种说法有道理,因为一个好的抽样方法应该能够保证随着样本容量的增加,抽样调查结果会接近于普查的结果. 因此只要根据误差的要求取相应容量的样本进行调查,就可以节省人力、物力和财力.3、可以用分层抽样的方法进行抽样. 将麦田按照气候、土质、田间管理水平的不同而分成不同的层,然后按照各层麦田的面积比例及样本容量确定各层抽取的面积,再在各层中抽取个体(这里的个体是单位面积的一块地). 习题2.1 A 组(P63)1、产生随机样本的困难:(1)很难确定总体中所有个体的数目,例如调查对象是生产线上生产的产品.(2)成本高,要产生真正的简单随机样本,需要利用类似于抽签法中的抽签试验来产生非负整值随机数. (3)耗时多,产生非负整数值随机数和从总体中挑选出随机数所对的个体都需要时间. 2、调查的总体是所有可能看电视的人群. 学生A 的设计方案考虑的人数是:上网而且登录某网址的人群,那些不能上网的人群,或者不登录某网址的人群就被排除在外了. 因此A 方案抽取的样本的代表性差.学生B 的设计方案考虑的人群是小区内的居民,有一定的片面性. 因此B 方案抽取的样本的代表性差.学生C 的设计方案考虑的人群是那些有电话的人群,也有一定的片面性. 因此C 方案抽取的样本的代表性.所以,这三种调查方案都有一定的片面性,不能得到比较准确的收视率. 3、(1)因为各个年级学习任务和学生年龄等因素的不同,影响各年级学生对学生活动的看法,所以按年级分层进行抽样调查,可以得到更有代表性的样本. (2)在抽样的过程中可能遇到的问题如敏感性问题:有些学生担心提出意见对自己不利;又如不响应问题:由于种种原因,有些学生不能发表意见;等等. (3)前面列举的两个问题都可能导致样本的统计推断结果的误差. (4)为解决敏感性问题,可以采用阅读与思考栏目“如何得到敏感性问题的诚实反应”中的方法设计调查问卷;为解决不响应问题,可以事先向全体学生宣传调查的意义,并安排专人负责发放和催收调查问卷,最大程度地回收有效调查问卷.4、将每一天看作一个个体,则总体由365天组成. 假设要抽取50个样本,将一年中的各天按先后次序编号为0~364天用简单随机抽样设计方案:制作365个号签,依次标上0~364. 将号签放到容器内充分搅拌均匀,从容器中任意不放回取出50个号签. 以签上的号码所对应的那些天构成样本,检测样本中所有个体的空气质量. 用系统抽样设计抽样方案:先通过简单随机抽样方法从365天中随机抽出15天,再把剩下的350天重新按先后次序编号为0~349. 制作7个分别标有0~7的号签,放在容器中充分搅拌均匀. 从容器中任意取出一个号签,设取出的号签的编号为a ,则编号为7(050)a k k +≤<所对应的那些天构成样本,检测样本中所有个体的空气质量.显然,系统抽样方案抽出的样本中个体在一年中排列的次序更规律,因此更好实施,更受方案的实施者欢迎.5、田径队运动员的总人数是564298+=(人),要得到28人的样本,占总体的比例为27.于是,应该在男运动员中随机抽取256167⨯=(人),在女运动员中随机抽取281612-=(人).这样我们就可以得到一个容量为28的样本.6、以10为分段间隔,首先在1~10的编号中,随机地选取一个编号,如6,那么这个获奖者奖品的编号是:6,16,26,36,46.7、说明:可以按年级分层抽样的方法设计方案. 习题2.1 B 组(P64)1、说明:可以按年级分层抽样的方法设计方案,调查问卷由学生所关心的问题组成. 例如:(1)你最喜欢哪一门课程? (2)你每月的零花钱平均是多少? (3)你最喜欢看《新闻联播》吗? (4)你每天早上几点起床? (5)你每天晚上几点睡觉?要根据统计的结果和具体的情况解释结论,主要从引起结论的可能原因及结论本身含义来解释.2、说明:这是一个开放性的题目,没有一个标准的答案. 2.2用样本估计总体 练习(P71) 1、说明:由于样本的极差为364.41362.51 1.90-=,取组距为0.19,将样本分为10组. 可以按照书上的方法制作频率分布表、频率分布直观图和频率折线图. 2、说明:此题目属于应用题,没有标准的答案.3、茎叶图为:由该图可以看出30名工人的日加工零件个数稳定在120件左右. 练习(P74)这里应该采用平均数来表示每一个国家项目的平均金额,因为它能反应所有项目的信息. 但平均数会受到极端数据2000万元的影响,所以大多数项目投资金额都和平均数相差比较大.练习(P79)1、甲乙两种水稻6年平均产量的平均数都是900,但甲的标准差约等于23.8,乙的标准差约等于41.6,所以甲的产量比较稳定.2、(1)平均重量496.86x ≈,标准差 6.55s ≈.(2)重量位于(,)x s x s -+之间有14袋白糖,所占的百分比约为66.67%.3、(1)略. (2)平均分19.25x ≈,中位数为15.2,标准差12.50s ≈.这些数据表明这些国家男性患该病的平均死亡率约为19.25,有一半国家的死亡率不超过15.2,15.2x >说明存在大的异常数据,值得关注. 这些异常数据使标准差增大. 习题2.2 A 组(P81) 1、(1)茎叶图为:(2)汞含量分布偏向于大于1.00 ppm 的方向,即多数鱼的汞含量分布在大于1.00 ppm 的区域.比较短,所以在这批棉花中混进了一些次品.3、说明:应该查阅一下这所大学的其他招生信息,例如平均数信息、最低录取分数线信息等. 尽管该校友的分数位于中位数之下,而中位数本身并不能提供更多录取分数分布的信息.在已知最低录取分数线的情况下,很容易做出判断;在已知平均数小于中位数很多,则说明最低录取分数线较低,可以推荐该校友报考这所大学,否则还要获取其他的信息(如标准差的信息)来做出判断. 4、说明:(1)对,从平均数的角度考虑; (2)对,从标准差的角度考虑;(3)对,从标准差的角度考虑; (4)对,从平均数和标准差的角度考虑; 5、(1)不能. 因为平均收入和最高收入相差太多,说明高收入的职工只占极少数. 现在已知知道至少有一个人的收入为50100x =万元,那么其他员工的收入之和为4913.55010075ii x==⨯-=∑(万元)每人平均只有1.53. 如果再有几个收入特别高者,那么初进公司的员工的收入将会很低. (2)不能,要看中位数是多少.(3)能,可以确定有75%的员工工资在1万元以上,其中25%的员工工资在3万元以上.(4)收入的中位数大约是2万. 因为有年收入100万这个极端值的影响,使得年平均收入比中位数高许多.6、甲机床的平均数=1.5x 甲,标准差=1.2845s 甲;乙机床的平均数 1.2z y =,标准差0.8718z s =. 比较发现乙机床的平均数小而且标准差也比较小,说明乙机床生产出的次品比甲机床少,而且更为稳定,所以乙机床的性能较好. 7、(1)总体平均数为199.75,总体标准差为95.26. (2)可以使用抓阄法进行抽样. 样本平均数和标准差的计算结果和抽取到的样本有关.(3) (4)略 习题2.2 B 组(P82)1、(1)由于测试1T 的标准差小,所以测试1T 结果更稳定,所以该测试做得更好一些. (2)由于2T 测出的值偏高,有利于增强队员的信心,所以应该选择测试2T .G E .2、说明:此题需要在本节开始的时候就布置,先让学生分头收集数据,汇总所收集的数据才能完成题目.2.3变量间的相关关系 练习(P85)1、从已经掌握的知识来看,吸烟会损害身体的健康. 但除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果. 我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题. 但吸烟引起健康问题的可能性大,因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.2、从现在我们掌握的知识来看,没有发现根据说明“天鹅能够带来孩子”,完全可能存在既能吸引天鹅和又使婴儿出生率高的第3个因素(例如独特的环境因素),即天鹅与婴儿出生率之间没有直接的关系,因此“天鹅能够带来孩子”的结论不可靠.而要证实此结论是否可靠,可以通过试验来进行. 相同的环境下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的出生率是否相同. 练习(P92)1、当0x =时,147.767y =,这个值与实际卖出的热饮杯数150不符,原因是:线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差;即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x ,预报值y 能够等于实际值y . 事实上:y bx a e =++. (这里e 是随机变量,是引起预报值y 与真实值y 之间的误差的原因之一,其大小取决于e 的方差.)(1)散点图如下: 2、数据的散点图为:从这个散点图中可以看出,鸟的种类数与海拔高度应该为正相关(事实上相关系数为0.793). 但是从散点图的分布特点来看,它们之间的线性相关性不强. 习题2.3 A 组(P94)1、教师的水平与学生的学习成绩呈正相关关系. 又如,“水涨船高”“登高望远”等.2、(3)基本成正相关关系,即食品所含热量越高,口味越好.(4)因为当回归直线上方的食品与下方的食品所含热量相同时,其口味更好. 3、(1)散点图如下:(2)回归方程为:0.66954.933y x =+.(3)加工零件的个数与所花费的时间呈正线性相关关系.(2)回归直线如下图所示:4、(1)散点图为:(2)回归方程为:0.546876.425y x =+.(3)由回归方程知,城镇居民的消费水平和工资收入之间呈正线性相关关系,即工资收入水平越高,城镇居民的消费水平越高. 习题2.3 B 组(P95) 1、(1)散点图如下:(2)回归方程为: 1.44715.843y x =-.(3)如果这座城市居民的年收入达到40亿元,估计这种商品的销售额为42.037y ≈(万元). 2、说明:本题是一个讨论题,按照教科书中的方法逐步展开即可.第二章 复习参考题A 组(P100)1、A .2、(1)该组的数据个数,该组的频数除以全体数据总数; (2)nmN. 3、(1)这个结果只能说明A 城市中光顾这家服务连锁店的人比其他人较少倾向于选择咖啡色,因为光顾连锁店的人使一种方便样本,不能代表A 城市其他人群的想法. (2)这两种调查的差异是由样本的代表性所引起的. 因为A 城市的调查结果来自于该市光顾这家服装连锁店的人群,这个样本不能很好地代表全国民众的观点.反应”来设计提问方法.5、表略. 可以估计出句子中所含单词的分布,以及与该分布有关的数字特征,如平均数、标准差等.6、(1)可以用样本标准差来度量每一组成员的相似性,样本标准差越小,相似程度越高. (2)A 组的样本标准差为 3.730A S ≈,B 组的样本标准差为11.789B S ≈. 由于专业裁判给分更符合专业规则,相似程度应该高,因此A 组更像是由专业人士组成的.7、(1)中位数为182.5,平均数为217.1875.(2)这两种数字特征不同的主要原因是,430比其他的数据大得多,应该查找430是否由某种错误而产生的. 如果这个大数据的采集正确,用平均数更合适,因为它利用了所有数据的信息;如果这个大数据的采集不正确,用中位数更合适,因为它不受极端值的影响,稳定性好. 8、(1)略.(2)系数0.42是回归直线的斜率,意味着:对于农村考生,每年的入学率平均增长0.42%.(3)城市的大学入学率年增长最快. 说明:(4)可以模仿(1)(2)(3)的方法分析数据.第二章 复习参考题B 组(P101)1、从表中看出当把 指标定为17.46千元 时,月65%的推销员 经过努力才能完成销 售指标. 2、(1)数据的散点图如下:(2)用y 表示身高,x 表示年龄,则数据的回归方程为 6.31771.984y x =+. (3)在该例中,斜率6.317表示孩子在一年中增加的高度.(4)每年身高的增长数略. 3~16岁的身高年均增长约为6.323 cm. (5)斜率与每年平均增长的身高之间之间近似相等.第三章概率3.1随机事件的概率练习(P113)1、(1)试验可能出现的结果有3个,两个均为正面、一个正面一个反面、两个均为反面.(2)通过与其他同学的结果汇总,可以发现出现一个正面一个反面的次数最多,大约在50次左右,两个均为正面的次数和两个均为反面的次数在25次左右. 由此可以估计出现一个正面一个反面的概率为0.50,出现两个均为正面的概率和两个均为反面的概率均为0.25.2、略3、(1)例如:北京四月飞雪;某人花两元钱买福利彩票,中了特等奖;同时抛10枚硬币,10枚都正面朝上.(2)例如:在王府井大街问路时,碰到会说中文的人;去烤鸭店吃饭的顾客点烤鸭;在1~1000的自然数任选一个数,选到的数大于1.练习(P118)1、说明:例如,计算机键盘上各键盘的安排,公交线路及其各站点的安排,抽奖活动中各奖项的安排等,其中都用到了概率. 学生可能举出各种各样的例子,关键是引导他们正确分析例子中蕴涵的概率思想.2、通过掷硬币或抽签的方法,决定谁先发球,这两种方法都是公平的. 而猜拳的方法不太公平,因为出拳有时间差,个人反应也不一样.3、这种说法是错误的. 因为掷骰子一次得到2是一个随机事件,在一次试验中它可能发生也可能不发生. 掷6次骰子就是做6次试验,每次试验的结果都是随机的,可能出现2也可能不出现2,所以6次试验中有可能一次2都不出现,也可能出现1次,2次,…,6次. 练习(P121)1、0.72、0.6153、0.44、D5、B习题3.1 A组(P123)1、D.2、(1)0;(2)0.2;(3)1.3、(1)430.067645≈;(2)900.140645≈;(3)7010.891645-≈.4、略5、0.136、说明:本题是想通过试验的方法,得到这种摸球游戏对先摸者和后摸者是公平的结论. 最好把全班同学的结果汇总,根据两个事件出现的频率比较近,猜测在第一种情况下摸到红球的概率为110,在第二种下也为110. 第4次摸到红球的频率与第1次摸到红球的频率应该相差不远,因为不论哪种情况,第4次和第1次摸到红球的概率都是1 10.习题3.1 B组(P124)1、D.2、略. 说明:本题是为了学生根据实际数据作出一些推断. 一般我们假定每个人的生日在12个月中哪一个月是等可能的,这个假定是否成立,引导学生通过收集的数据作出初步的推断.3.2古典概率练习(P130)1、110. 2、17. 3、16.练习(P133)1、38,38.2、(1)113;(2)1213;(3)14;(4)313;(5)0;(6)213;(7)12;(8)1.说明:模拟的方法有两种.(1)把1~52个自然数分别与每张牌对应,再用计算机做模拟试验.(2)让计算机分两次产生两个随机数,第一次产生1~4的随机数,代表4个花色;第二次产生1~13的随机数,代表牌号.3、(1)不可能事件,概率为0;(2)随机事件,概率为49;(3)必然事件,概率为1;(4)让计算机产生1~9的随机数,1~4代表白球,5~9代表黑球.4、(1)16;(2)略;(3)应该相差不大,但会有差异. 存在差异的主要原因是随机事件在每次试验中是否发生是随机的,但在200次试验中,该事件发生的次数又是有规律的,所以一般情况下所得的频率与概率相差不大.习题3.2 A组(P133)1、游戏1:取红球与取白球的概率都为12,因此规则是公平的.游戏2:取两球同色的概率为13,异色的概率为23,因此规则是不公平的.游戏3:取两球同色的概率为12,异色的概率为12,因此规则是公平的.2、第一位可以是1~9这9个数字中的一个,第二位可以是0~9这10个数字中的一个,所以(1)190;(2)18919090-=;(3)9919010-=3、(1)0.52;(2)0.18.4、(1)12;(2)16;(3)56;(4)16.5、(1)25;(2)825.6、(1)920;(2)920;(3)12.习题3.2 B组(P134)1、(1)13;(2)14.2、(1)35;(2)310;(3)910.说明:(3)先计算该事件的对立事件发生的概率会比较简单.3、具体步骤如下:①建立概率模型. 首先要模拟每个人的出生月份,可用1,2,…,11,12表示月份,用产生取整数值的随机数的办法,随机产生1~12之间的随机数. 由于模拟的对象是一个有10个人的集体,故把连续产生的10个随机数作为一组模拟结果,可模拟产生100组这样的结果.②进行模拟试验. 可用计算器或计算机进行模拟试验.如使用Excel软件,可参看教科书125页的步骤,下图是模拟的结果:其中,A,B,C,D,E,F,G,H,I,J的每一行表示对一个10人集体的模拟结果. 这样的试验一共做了100次,所以共有100行,表示随机抽取了100个集体.③统计试验的结果. K,L,M,N列表示统计结果. 例如,第一行前十列中至少有两个数相同,表示这个集体中至少有两个人的生日在同一月. 本题的难点是统计每一行前十列中至少有两个数相同的个数. 由于需要判断的条件态度,所以用K,L,M三列分三次完成统计.其中K列的公式为“=IF(OR(A1=B1,A1=C1,A1=D1,A1=E1,A1=F1,A1=G1,A1=H1,A1=I1,A1=J1,B1=C1,B1=D1,B1=E1,B1=F1,B1=G1,B1=H1,B1=I1,B1=J1,C1=D1,C1=E1,C1=F1,C1=G1,C1=H1,C1=I1,C1=J1,D1=E1,D1=F1,D1=G1,D1=H1,D1=I1,D1=J1),1,0)”,L列的公式为“=IF(OR(E1=F1,E1=G1,E1=H1,E1=I1,E1=J1,F1=G1,F1=H1,F1=I1,F1=J1,G1=H1,G1=I1,G1=J1,H1=I1,H1=J1,I1=J1),1,0)”,M列的公式为“=IF(OR(K1=1,L1=1),1,0)”,M列的值为1表示该行所代表的10人集体中至少有两个人的生日在同一个月. N1表示100个10人集体中至少有两个人的生日在同一个月的个数,其公式为“=SUM(M$1:M$100)”. N1除以100所得的结果0.98,就是用模拟方法计算10人集体中至少有两个人的生日在同一个月的概率的估计值. 可以看出,这个估计值很接近1.3.3几何概率练习(P140)1、(1)1;(2)38.2、如果射到靶子上任何一点是等可能的,那么大约有100个镖落在红色区域.说明:在实际投镖中,命中率可能不同,这里既有技术方面的因素,又是随机因素的影响,所以在投掷飞镖、射击或射箭比赛中不会以一枪或一箭定输赢,而是取多次成绩的总和,这就是为了减少随机因素的影响.习题3.3 A组(P142)1、(1)49;(2)13;(3)29;(4)23;(5)59.2、(1)126;(2)12;(3)326;(4)326;(5)12;(6)313.习题3.3 B 组(P142) 1、设甲到达的时间为x ,乙到达的时间为y ,则0,24x y <<. 若至少一般船在停靠泊位时必须等待,则06y x <-<或06x y <-<,必须等待的概率为:22189711241616-=-=.2、D .第三章 复习参考题A 组(P145)1、56,16,23. 2、(1)0.548; (2)0.186; (3)0.266.3、(1)38; (2)14.4、(1)813; (2)726; (3)665. 5、分别计算两球均为白球的概率、均为红球的概率、均为黑球的概率,然后相加,得1223311166666636⨯⨯⨯++=⨯⨯⨯. 6、56. 说明:利用对立事件计算会比较简单. 第三章 复习参考题B 组(P146)1、第一步,先计算出现正面次数与反面次数相等的概率46328=. 第二步,利用对称性,即出现正面的次数多于反面次数的概率与出现反面的次数多于正面次数的概率是相等的,所以出现正面的次数多于反面次数的概率为35(1)2816-÷=. 2、(1)是; (2)否; (3)否; (4)是.3、(1)45; (2)15; (3)25; (4)25. 说明:此题属于古典概型的一类“配对问题”,由于这里的数比较小,可以用列举法.4、参考教科书140页例4.。

高一数学必修3同步练习:2-2-2用样本的数字特征估计总体的数字特

高一数学必修3同步练习:2-2-2用样本的数字特征估计总体的数字特

2-2-2用样本的数字特征估计总体的数字特一、选择题1.甲、乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是()A.因为他们平均分相等,所以学习水平一样B.成绩平均分虽然一样,方差较大的,说明潜力大,学习态度端正C.表面上看这两个学生平均成绩一样,但方差小的成绩稳定D.平均分相等,方差不等,说明学习不一样,方差较小的同学,学习成绩不稳定,忽高忽低[答案] C2.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3[答案] D3.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>aC.c>a>b D.c>b>a[答案] D4.甲、乙两台机床同时生产一种零件,现要检验它们的运行情况,统计10天中两台机床每天出次品数分别为甲:0,1,0,2,2,0,3,1,2,4;乙:2,3,1,1,0,2,1,1,0,1.则从平均数考试,甲、乙两台机器出次品数较少的为( )A .甲B .乙C .相同D .不能比较[答案] B[解析] x 甲=110(0+1+0+2+…+4)=1.5,x 乙=110(2+3+…+1)=1.2.x 乙<x 甲.5.已知一个样本中含有5个数据3,5,7,4,6,则样本方差为( ) A .1 B .2 C .3 D .4 [答案] B[解析] x =3+5+7+4+655,则方差s 2=15[(3-5)2+(5-5)2+(7-5)2+(4-5)2+(6-5)2]=2.6.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是( )A.63 B.64C.65 D.66[答案] A[解析]甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.7.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:s 123差,则有( )A .s 3>s 1>s 2B .s 2>s 1>s 3C .s 1>s 2>s 3D .s 2>s 3>s 1[答案] B8.某市在非典期间一手抓防治非典,一手抓经济发展,下表是利群超市5月份一周的利润情况记录:A .6.51万元B .6.4万元C .1.47万元D .5.88万元[答案] A[解析] 从表中一周的利润可得一天的平均利润为 x =0.20+0.17+0.23+0.21+0.23+0.18+0.257=0.21.又五月份共有31天,∴五月份的总利润约是0.21×31=6.51(万元).9.(2011~2012·江西南昌一模)甲、乙两个数学兴趣小组各有5名同学,在一次数学测试中,成绩统计用茎叶图表示,如图所示.若甲、乙小组的平均成绩分别是x 甲、x 乙,则下列结论正确的是( )A.x甲>x乙,甲比乙成绩稳定B.x甲>x乙,乙比甲成绩稳定C.x甲<x乙,甲比乙成绩稳定D.x甲<x乙,乙比甲成绩稳定[答案] A[解析]根据茎叶图可知,甲组5名同学的成绩分别是88,89,90,91,92,乙组5名同学的成绩分别是83,84,88,89,91,可得x甲=90,x乙=87,故有x甲>x乙;s2甲=2,s2乙=9.2,故有s2甲>s2乙,所以甲比乙的成绩稳定,所以选A.10.如图是一次考试结果的频数分布直方图,根据该图可估计,这次考试的平均分数为()A.46 B.36C.56 D.60[答案] A[解析] 根据频数分布直方图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考虑总成绩为40+240+500+420+180=1 380,平均数=1 38030=46.二、填空题11.已知样本101,100,99,a ,b 的平均数为100,方差为2,这个样本中的数据a 与b 的取值为________.[答案] 102,98或98,102[解析] 由题设知⎩⎪⎨⎪⎧a +b =2002+(a -100)2+(b -100)2=10, ∴⎩⎪⎨⎪⎧ a =102b =98或⎩⎪⎨⎪⎧a =98b =102. 12.(2012·广东高考卷)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[答案] 1,1,3,3[解析] 不妨设x 1≤x 2≤x 3≤x 4,得:x 2+x 3=4,x 1+x 2+x 3+x 4=8⇒x 1+x 4=4 s 2=1⇔(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2=4⇒①如果有一个数为0或4;则其余数为2,不合题意; ②只能取|x 1-2|=1;得:这组数据为1,1,3,3.13.某班50名学生右眼视力的检查结果如下表所示:[答案] 1.2 0.814.(2011~2012·江苏南京高三一模)为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图所示,则该组数据的方差为________.[答案] 5[解析] 由茎叶图可知,该篮球运动员6场比赛的得分分别是14,17,18,18,20,21,得分的平均数x =14+17+18+18+20+216=18,根据方差公式得s 2=16[(14-18)2+(17-18)2+(18-18)2+(18-18)2+(20-18)2+(21-18)2]=5.三、解答题15.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:(1)(2)谁的各门功课发展较平衡?[解析] (1)x 甲=15(60+80+70+90+70)=74,x 乙=15(80+60+70+80+75)=73,故甲的平均成绩较好.(2)s 2甲=15[(60-74)2+(80-74)2+(70-74)2+(90-74)2+(70-74)2]=104,s 2乙=15[(80-73)2+(60-73)2+(70-73)2+(80-73)2+(75-73)2]=56,由s 2甲>s 2乙,知乙的各门功课发展较平衡.16.某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B 进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)完成所附的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A 与B 的亩产量及其稳定性进行比较,写出统计结论.[解析] (1)(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了的展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A 的亩产稳定性较差.17.某学校高一(1)班和高一(2)班各有49名学生,两班在一次数学测验中的成绩统计如下:(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分为79分,得70分的人最多,我得了85分,在班里算上上游了!”(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.[分析](1)根据平均数、中位数、众数所反映的情况来分析;(2)结合方差的意义来提出建议.[解析](1)由于(1)班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,所以从位次上看,不能说85分是上游,成绩应该属于中游.但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.(2)①班成绩的中位数是87分,说明高于87分(含87)的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.②班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.18.从某校参加数学竞赛的试卷中抽取一个样本,考查竞赛的成绩分布,将样本分成6组,得到频率分布直方图如图,从左到右各小组的小长方形的高的比为1:1:3:6:4:2,最右边的一组的频数是8.请结合直方图的信息,解答下列问题:(1)样本容量是多少?(2)成绩落在哪个范围的人数最多?并求出该小组的频数和频率.(3)估计这次数学竞赛成绩的众数、中位数和平均数.[解析] (1)从左到右各小组的频率分别为117,117,317,617,417,217样本容量为8217=68. (2)成绩落在70~80之间的人数最多;频率为617;频数为68×617=24.(3)众数的估计值是75,中位数的估计值是70+12-117-117-317617×10 =4556≈75.83. 平均数的估计值是117×45+117×55+317×65+617×75+417×85+217×95=75.。

高中数学第二章统计221用样本的频率分布估计总体分布练习含解析新人教A版必修

高中数学第二章统计221用样本的频率分布估计总体分布练习含解析新人教A版必修

2.2.1 用样本的频率分布估计总体分布A级基础巩固一、选择题1.没有信息的损失,所有的原始数据都可以从图中得到的统计图是( )A.总体密度曲线B.茎叶图C.频率分布折线图D.频率分布直方图答案:B2.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )B.C.D.解析:数据总个数n=10,又落在区间[22,30)内的数据个数为4,故所求的频率为410=0.4.答案:B3.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.下图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为( )A.30辆B.40辆C.60辆D.80辆解析:车速大于或等于70 km/h的汽车数为×10×300=60(辆).答案:C4.一个社会调查机构就某地区居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图),为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(单位:元)月收入段应抽出的人数为( )A.5 B.25 C.50 D.2 500解析:组距=500,在[2 500,3 000)的频率=0.000 5×500=,样本数为100,则在[2 500,3 000)内应抽100×=25(人).答案:B5.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,仅知道后5组的频数和为62.设视力在到之间的学生数为a,最大频率为,则a的值为( )A.27 B.48 C.54 D.64解析:由已知,视力在到之间的学生数为100×=32,又视力在到之间的频率为1-+0.5)×-62100=,所以视力在到之间的学生数为100×=22,所以视力在到之间的学生数a =32+22=54.答案:C二、填空题6.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:分组/分频数频率[80,90)①②[90,100)[100,110)[110,120)36[120,130)[130,140)12③[140,150]合计④根据上面的频率分布表,可以①处的数值为________,②处的数值为________. 解析:由位于[110,120)的频数为36,频率=36n=,得样本容量n =120,所以[130,140)的频率=12120=,②处的数值=1------=; ①处的数值为×120=3. 答案:37.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[140,150]内的学生中抽取的人数应为________.解析:所有小矩形的面积和等于10×++0.020+a +0.035)=1,解得a =;100名同学中,身高在[120,130)内的学生数是10××100=30,身高在[130,140)内的学生数是10××100=20,身高在[140,150]内的学生数是10××100=10,则三组内的总学生数是30+20+10=60,抽样比是1860=310,所以身高在[140,150]内的学生中选取的人数应为10×310=3.答案: 38.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如下:据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.答案:60三、解答题9.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00-10:00间各自的点击量,得到如图所示的茎叶图.(1)甲网站点击量在[10,40]间的频率是多少? (2)甲、乙两个网站哪个更受欢迎?请说明理由.解:(1)甲网站点击量在[10,40]内的有17,20,38,32,共有4天,则频率为414=27. (2)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由题意估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.B 级 能力提升1.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图所示是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18解析:志愿者的总人数为20(+)×1=50,所以第三组的人数为50×=18,有疗效的人数为18-6=12.答案:C2.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,则运动员人数为4.答案:43.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分): [40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)分的学生所占总体的百分比.解:(1)频率分布表如下:成绩分组频数频率[40,50)2[50,60)3[60,70)10[70,80)15[80,90)12[90,100]8合计50(2)由题意知组距为10,取小矩形的高根据表格画出如下的频率分布直方图:(3)由频率分布直方图,可估计成绩在[70,80)分的学生所占总体的百分比是×10==30%.。

新课标人教A版数学必修3全部课件:2.2.2用样本的数字特征估计总体的数字特征习题

新课标人教A版数学必修3全部课件:2.2.2用样本的数字特征估计总体的数字特征习题
用样本的数字特征估计总体的数字特征
用样本的数字特征估计总体的数字特征
怎样将各个样本数据 汇总为一个数值,并使 它成为样本数据的中 心点? 能否用一个数值来描 写样本数据的离散程 度?
例题:
某班12名学生体育考试跳高成绩如 下(单位:米): 1.58 1.59 1.57 1.61 1.58 1.65
直方图,说明它们的异同点
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6; (3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.
±½ ¼ Ö ·Í 1
频1.0 率0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0
x 5 s 1 . 49
3
4
5
6
7
8
±½ ¼ Ö ·Í 4
频 1.0 率 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0
x 5 s 2 . 83
1
2
3
4
5
6
7
8
例2
甲乙两人同时生产内径为25.40mm的一种零件。 为了对两人的生产质量进行评比,从他们生产的零件 中各抽出20件,量得其内径尺寸如下(单位:mm)


25.46 25.34 25.39 25.40 25.40 25.47 25.33 25.31
25.32 25.42 25.43 25.42 25.43 25.49 25.43 25.32
25.45 25.45 25.39 25.35 25.44 25.49 25.43 25.32
25.39 25.38 25.40 25.41 25.48 25.36 25.32 25.32

人教A版高中数学必修3《二章统计2.2用样本估计总体阅读与思考生产过程中的质量控制图》优质课教案_4

人教A版高中数学必修3《二章统计2.2用样本估计总体阅读与思考生产过程中的质量控制图》优质课教案_4

阅读与思考:生产过程中的质量控制图》教学设计阅读与思考:生产过程中的质量控制图——正态分布[ 教材分析]本节课选自人教A 版必修3第二章“统计”第2.2节“用样本估计总体”课后的“阅读与思考”部分。

在第2.1节通过抽样收集数据之后,第2.2节给出了两种用样本估计总体的方式,一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征(如平均数、标准差等)估计总体的数字特征。

本节课是在这基础上,结合前面所学的总体密度曲线、平均数和标准差的概念,通过生产过程中的产品质量控制图引出正态分布,利用具体的生活应用介绍正态分布密度曲线的特点以及期望、标准差对整个正态分布的影响。

正态分布无论是在理论上还是应用上都是极其重要的一个分布,将正态分布的这些特点应用到质量控制中,可使学生进一步加强对标准差的认识。

由于正态分布的随机变量是连续型随机变量,这也让学生对随机变量由离散型到连续型有一个初步的认识。

从教材编排上来看,“阅读与思考”内容是对频率分布直方图、标准差认识的深化,是统计知识体系的一种承接和完善,也是后续选修2-3 中第2.4“正态分布”一课的铺垫。

[学情分析]学生在之前章节的学习中,已经掌握如何通过抽样来收集数据,能够画出所收集数据的频率分布直方图、折线图,会根据图表初步分析数据的分布规律,会计算平均数与标准差,这为本节课的探究学习打下了坚实的基础。

但学生仍存在一些知识短板和理解缺口。

其一,本节课学习的正态分布的随机变量是连续型随机变量的分布问题,学生一直以来接触的都是离散型随机变量,这在概念接受与理解上会有一定困难,可以通过信息技术辅助理解;其二,由于学生在此之前还未学习过定积分、随机事件的概率以及二项分布,只在初中接触过简单的概率定义,因而对本节课正态分布的本质理解会显得生涩;其三,正态分布的密度曲线函数较为复杂,学生对抽象且陌生的公式会存在惧怕心理,需要通过一些函数模型及实际应用帮助学生体会其参数的作用。

高中数学人教A版必修三课时习题:第2章 统计 2.2.2.2含答案

高中数学人教A版必修三课时习题:第2章 统计 2.2.2.2含答案

2.2.2 用样本的数字特征估计总体的数字特征第2课时方差、标准差课时目标1.理解方差、标准差的意义,会计算一组数据的方差和标准差,掌握用样本方差或标准差去估计总体方差或总体标准差的方法.2.会用平均数和方差对数据进行处理与比较.识记强化标准差及方差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示.标准差的平方s2叫做方差,也为测量样本数据分散程度的工具.若样本数据是x1,x2,…,x n,x表示这组数据的平均数,则s=1n[x1-x2+x2-x2+…+x n-x2];s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].课时作业一、选择题1.下列说法正确的是( )A.在两组数据中,平均值较大的一组方差较大C .2x -+3和s 2D .2x -+3和4s 2+12s +9 答案:B解析:由平均数、方差的求法可得.6.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是( )A .甲B .乙C .甲、乙相同D .不能确定 答案:B解析:方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B.二、填空题7.已知样本9、10、11、x 、y 的平均数是10,方差是2,则xy =________. 答案:96解析:由平均数得9+10+11+x +y =50,∴x +y =20,又由(9-10)2+(10-10)2+(11-10)2+(x -10)2+(y -10)2=(2)2×5=10,得x 2+y 2-20(x +y )=-192,(x +y )2-2xy -20(x +y )=-192,xy =96.8.如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.答案:6.8解析:x =15(8+9+10+13+15)=11,s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.9.若k 1,k 2,…,k 8的方差为3,则2(k 1-3),2(k 2-3),…,2(k 8-3)的方差为________. 答案:12解析:设k 1,k 2,…,k 8的平均数为k ,则18[(k 1-k )2+(k 2-k )2+…+(k 8-k )2]=3,而2(k 1-3),2(k 2-3),…,2(k 8-3)的平均数为2(k -3),解析:x 9=x 8+19(x 9-x 8)=5+19×(4-5)=449,s 29=89[s 28+19(x 9-x 8)2]=89[22+19(4-5)2]=29681. 13.下图为我国10座名山的“身高”统计图,请根据图中信息回答下列问题。

(人教a版)必修三同步课件:2.2.1用样本的频率分布估计总体分布

(人教a版)必修三同步课件:2.2.1用样本的频率分布估计总体分布

(-∞,- 为____________ . 1)
8,10,则其中位数位 __. 7
(-1,+∞)
6
2.已知一组数分别为:2,3,5,7,8,10,11,则其中位数为__;数据2,3,5,7,
[预习导引]
1.用样本估计总体的两种情况
频率分布 (1)用样本的_________ 估计总体分布.
数字特征 (2)用样本的_________ 估计总体数字特征.
0.045 5
0.159 1 0.181 8 0.363 6 0.113 6 0.090 9 0.045 5 1.00
合计
(2)从频率分布表中可以看出60%左右的美国总统就任时的年 龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所 占的比例相对较小.
要点二
例2
茎叶图及其应用
某中学甲、乙两名同学最近几次的数学考试成绩情况如下: 甲的得分:95,81,75,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
组距
4.茎叶图
中间 (1)定义:顾名思义,茎是指_____的一列数,叶就是从茎的 _____生长出来的数,中间
旁边 的数字表示十位数,旁边的数字表示个位数.
(2)茎叶图的优点与不足
①优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;二
是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. ②不足:当样本数据较多时,茎叶图就显得不太方便.
2.作频率分布直方图的步骤
最大值 (1)求极差:即一组数据中_______和_______ 的差;

山东省高中数学《2.2.2 用样本的数字特征估计总体的数字特征》教案2 新人教A版必修3

山东省高中数学《2.2.2 用样本的数字特征估计总体的数字特征》教案2 新人教A版必修3

第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.甲110 121312512125135125135125乙115 112513115125125145125145哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range ).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论. (3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s 表示. 所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i=1,2,…,n).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是S=nx x x x x x n ||||||21-++-+- .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=])()()[(122221x x x x x x nn -++-+- .意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709; x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具: s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2].显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s 甲=2.用类似的方法,可得s 乙≈1.095.由s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定. 应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8. 分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83. 它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm): 甲25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值. 解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40,(12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据这组数据估计哪一种水稻品种的产量比较稳定.品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8解:甲品种的样本平均数为10,样本方差为 [(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02. 乙品种的样本平均数也为10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24. 因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.天数151—180 181—210 211—240 241—270 271—300 301—330 331—360 361—390灯泡数1111820251672分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命. 解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天). 这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2). 故所求的标准差约6.2128≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天. 知能训练 (1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________.(2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差是____________. (3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲 27 38 30 37 35 31 乙 33 29 38 34 28 36试判断选谁参加某项重大比赛更合适? 答案:(1)9.5,0.016 (2)a 2s 2(3)甲x =33,乙x =33,33734722=>=乙甲s s ,乙的成绩比甲稳定,应选乙参加比赛更合适. 拓展提升某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x 条),作上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a 条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则鱼塘中鱼的总条数鱼的条数鱼塘中所有带有标记的条鱼中带有标记的条数)(x aa =这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而估计全部鱼的重量,最后估计出收入. 课堂小结1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度. 2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确. 作业习题2.2A 组4、5、6、7,B 组1、2.设计感想统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.。

用样本的数字特征估计总体的数字特征(第一课时)教案新人教A版必修3

用样本的数字特征估计总体的数字特征(第一课时)教案新人教A版必修3

2.2.2用样本的数字特征估计总体的数字特征(第一课时)和县第一中学田文武一.教学任务分析:(1)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征,并做出合理的解释.(2)会用样本的基本数字特征估计总体的基本数字特征.形成对数据处理过程进行初步评价的意识.(3) 在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解统计的作用.二.教学目标:(1)知识与技能: (1) 能利用频率颁布直方图估计总体的众数、中位数、平均数.(2) 能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数。

并结合实际,对问题作出合理判断,制定解决问题的有效方法.(3)初步体会、领悟“用数据说话”的统计思想方法.(2)过程与方法:在有关数据的搜集、整理、分析的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。

(3)情感态度与价值观:通过对有关数据的搜集、整理、分析、判断、,培养学生“实事求是”的科学态度和严谨的工作作风.教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征.教学难点:用样本的数字特征估计总体的数字特征,统计思维的建立.四.1.创设情景,揭示课题:上一节我们学习了用图、表组织样本数据,并且学习了如何通过图、表提供的信息,用样本的频率分布估计总体的分布. 在日常生活中,我们往往并不需要了解总体的分布形态,而是关心总体的某一数字特征,例如:居民月均用水量问题,我们关心的是数字,而不是总体的分布形态.因此我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征(板书课题).2.探究:(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”? 我们初中时曾学过众数、中位数、平均数等各种数字特征.我们共同回忆一下?什么是众数、中位数、平均数?(教师提出问题,学生思考讨论并回答,教师可提示引导)众 数—一 在一组数据中,出现次数最多的数称为众数. 中位数——将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数——一般是一组数据和的算术平均数.这些数字都能够为我们提供关于样本数据的特征信息.例如,在上一节抽样调查的100位居民的月均用水量的数据中,我们如何得知这一组样本数据的众数、中位数和平均数 ? 众 数=2.3(t )、中位数=2.0(t )、平均数=1.973(t ) 那么如何从频率分布直方图中估计众数、中位数、平均数? 3. 如何从频率直方图中估计众数、中位数、平均数呢? 1)如何从频率分布直方图中估计众数?学生交流讨论,回答:从频率分布直方图可以看出:月均用水量的众数是 2.25t (最高的矩形的中点),它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少. 思考1:请大家看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?表2-1 100为居民的月均用水量(单位:t)0.10.20.30.4月均用水量/t请学生思考交流,回答:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.显然通过频率分布直方图的估计精度较低,其估计结果与数据分组有关,在不能得到样本数据,只能得到频率分布直方图的情况下,也可以估计总体的特征. 归纳总结:因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内. 众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标. 2) 如何从频率分布直方图估计中位数?学生交流讨论,回答:分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.,由此可以估计中位数的值.设中位数为x ,则5.05.0)2(22.015.008.004.0=⨯-++++x求出02.2=x2.20.61.81.21.01.52.02.22.52.82.4 0.8 1.7 1.0 1.0 1.6 2.1 2.3 2.6 2.5 2.4 0.5 1.5 1.2 1.4 1.7 2.1 2.4 2.7 2.6 2.3 0.9 1.6 1.3 1.3 1.8 2.3 2.3 2.8 2.5 2.0 0.7 1.8 1.4 1.3 1.9 2.4 2.4 2.93.04.3 0.8 1.9 3.5 1.4 1.8 2.3 2.4 2.9 3.2 4.1 0.6 1.7 3.6 1.3 1.7 2.2 2.3 2.8 3.3 3.8 0.5 1.5 3.7 1.2 1.6 2.1 2.3 2.7 3.2 0.4 0.3 0.4 0.2 1.2 1.5 2.2 2.2 2.6 3.4 1.6 1.9 1.8 1.6 1.0 1.5 2.0 2.0 2.5 3.1 观察频率分布直方图估计中位数频率 00.10.20.30.40.50.6月均用水量/t在上图中,虚线代表居民月平均用水量的中位数的估计值.其左边的直方图的面积代表着50个单位.右边的直方图的面积也是50个单位.由此可以估计出中位数的值为2.02.思考2:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗? (样本数据的频率分布直方图把原始的一些数据给遗失了) 3) 如何从频率分布直方图中估计平均数? 学生交流讨论,回答:平均数等于是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.以上图为例来讲解求解过程:02.202.025.404.075.306.025.314.075.225.025.222.075.115.025.108.075.004.025.0=⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯平均数为2.02由此居民的月用水量的平均数是2.02t.大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考3:样本中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗? 让学生讨论,并举例:优点:对极端数据不敏感的方法能够有效地预防错误数据的影响.对极端值不敏感有利的例子:如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,如:考察表中2-1中的数据如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据. 缺点:(1)出现错误的数据也不知道.(2)对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作.这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.4)对众数、中位数、平均数估计总体数字特征的几点认识(1)样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表示样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.(2) 中位数不受少数几个极端值的影响, 容易计算,它仅利用了数据排在中间的数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据 的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.(4)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.(5)使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.探究:“用数据说话”这是我们经常可以听到的一句话.但是数据有时也会被利用,从而产生误导.例如一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多,尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?以员工平均工资收入水平去描述他们单位的收入情况.这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,平均数受数据中的极端值的影响大,所以平均数不能反映该单位员工的收入水平.这个老板的话有误导与蒙骗行为.五、例题讲解(众数、中位数、平均数的简单应用)例1 某工厂人员及工资构成如下:(1)指出这个问题中周工资的众数、中位数、平均数.(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?解析:(1)众数为200,中位数为220,平均数为300。

高中数学必修三同步练习题库:用样本估计总体(填空题:较易)

高中数学必修三同步练习题库:用样本估计总体(填空题:较易)

用样本估计总体(填空题:较易)1、在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1,那么这组数据的方差可能的最大值是__________.2、从某高校的高一学生中采用系统抽样法选出30人测量其身高,数据的茎叶图如图所示(单位:cm),若高一年级共有600人,估算身高在1.70m以上的有_______人.3、如图是甲,乙两名同学次综合测评成绩的茎叶图,则乙的成绩的中位数是,甲乙两人中成绩较为稳定的是 .4、为了普及环保知识,增强环保意识,某高中随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为,众数为,平均值为,则这三个数的大小关系为_______________.5、甲,乙两人在相同条件下练习射击,每人打发子弹,命中环数如下则两人射击成绩的稳定程度是6、下图是甲、乙两市领导干部年龄的茎叶图,对于这两市领导干部的平均年龄给出的以下说法正确的是________.①甲市领导干部的年龄的分布主要集中在40~60之间;②乙市领导干部的年龄分布大致对称;③甲市领导干部的平均年龄比乙市领导干部的平均年龄大;④平均年龄都是50.7、从某高校的高一学生中采用系统抽样法选出30人测量其身高,数据的茎叶图如图所示(单位:cm),若高一年级共有600人,估算身高在1.70m以上的有_______人.8、某市为了了解居民家庭网购消费情况,调查了10000户家庭的月消费金额(单位:元),所有数据均有区间上,其频率分布直方图如图所示,则被调查的10000户家庭中,月消费金额在1000元以下的有__________户.9、一所中学共有4 000名学生,为了引导学生树立正确的消费观,需抽样调查学生每天使用零花钱的数量(取整数元)情况,分层抽取容量为300的样本,作出频率分布直方图如图所示,请估计在全校所有学生中,一天使用零花钱在6元~14元的学生大约有________人.10、某人连续五周内收到的包裹数分别为3,2,5,1,4,则这5个数据的标准差为________.11、下列四个命题①样本方差反映的是所有样本数据与样本平均值的偏离程度;②从含有2008个个体的总体中抽取一个容量为100的样本,现采用系统抽样方法应先剔除8人,则每个个体被抽到的概率均为;③从总体中抽取的样本数据共有m个a,n个b,p个c,则总体的平均数的估计值为;④某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查,现将800名学生从001到800进行编号,已知从497--512这16个数中取得的学生编号是503,则初始在第1小组00l~016中随机抽到的学生编号是007.其中真命题的个数是_____个12、某校在市统测后,从高三年级的1000名学生中随机抽出100名学生的数学成绩作为样本进行分析,得到样本频率分布直方图,如图所示,则估计该校高三学生中数学成绩在之间的人数为__________.13、某植树小组测量了一批新采购的树苗的高度,所得数据如茎叶图所示(单位:),则这批树苗高度的中位数为__________.14、某人5次上班途中所花的时间(单位:分钟)分别为.已知这组数据的平均数为10,方差为2,则的值为___.15、若1,2,3,4,这五个数的平均数为3,则这五个数的方差为__________.16、某学院的三个专业共有1200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的专业有380名学生,专业有420名学生,则在该学院的专业应抽取____________名学生.17、在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示,则该35名运动员成绩的中位数为__________.18、为了解学生答卷情况,某市教育部门在高三某次测试后抽取了名同学的试卷进行调查,并根据所得数据画出了样本的频率分布直方图(如图),该样本的中位数是__________.19、已知一组数据,,,,,则该组数据的方差是____.20、气象意义上从春季进入夏季的标志为:“连续5天的日平均温度均不低于22℃.”现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:℃):①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.2.则肯定进入夏季的地区有____个.21、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为,其中甲社区有驾驶员人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为,,,,则这四个社区驾驶员的总人数为.22、已知一组数据的方差是S,那么另一组数据的方差是。

(新新练案系列)高中数学 2.2+用样本估计总体+练案 新人教A版必修3

(新新练案系列)高中数学 2.2+用样本估计总体+练案 新人教A版必修3

据分成1组!绘 制 频 率 分 布 直 方 图!若 第 一 组
至第六 组 数 据 的 频 率 之 比 为 'N)N+N1N
+N$!且 前 三 组 数 据 的 频 数 之 和 等 于 '4!则4
等于!
')!"'#$#-江苏 高 考#某 棉 纺 厂 为 了 解 一 批 棉 花
的质量!从中随机抽测了$##根 棉 花 纤 维 的 长
中 !下 列 说 法 中 正 确 的 是 " #
新新练案
高中数学必修人教实验 版
%!总 体 容 量 越 大 !估 计 越 精 确 &!总 体 容 量 越 小 !估 计 越 精 确 (!样 本 容 量 越 大 !估 计 越 精 确 *!样 本 容 量 越 小 !估 计 越 精 确 $$对于样本频率分 布 直 方 图 与 总 体 密 度 曲 线 的 关 系 !下 列 说 法 正 确 的 是 " # %!频 率 分 布 直 方 图 与 总 体 密 度 曲 线 无 关 &!频 率 分 布 直 方 图 就 是 总 体 密 度 曲 线 (!样本容量很大的频率 分 布 直 方 图 就 是 总 体
第+小 组 与 第 " 小 组 的 频 率 分 别 为#$4"和
##4"!第二小 组 的 频 数 为 $#!则 抽 取 的 顾 客
人数是
能力练三综合拓展练
$5在 学 校 开 展 的 综 合 实 践
活动中!某 班 进 行 了 小 制
作!作品 上 交 时 间 为 " 月
$日至)#日!评 委 会 把 同
O 5 10 15 20 25 30 35 40 长度(mm)

高中数学人教版A版必修三课时作业习题及答案:第二章2-2 用样本估计总体

高中数学人教版A版必修三课时作业习题及答案:第二章2-2 用样本估计总体

第二章统计2.2 用样本估计总体2.2.1用样本的频率分布估计总体分布课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图,频率分布折线图,茎叶图.3.能够利用图形解决实际问题.1,用样本估计总体的两种情况(1)用样本的____________估计总体的分布.(2)用样本的____________估计总体的数字特征.2,数据分析的基本方法(1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.(2)借助于表格分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.3,频率分布直方图在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.4,频率分布折线图和总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.(2)总体密度曲线随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.5,茎叶图(1)适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.(2)优点:它不但可以____________,而且可以__________,给数据的记录和表示都带来方便.(3)缺点:当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.一、选择题1,下列说法不正确的是()A,频率分布直方图中每个小矩形的高就是该组的频率B,频率分布直方图中各个小矩形的面积之和等于1C,频率分布直方图中各个小矩形的宽一样大D,频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的2,一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数12 13 24 15 16 13 7 则样本数据落在(10,40]上的频率为()A,0.13 B.0.39 C.0.52 D.0.643,100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有()A.30辆B.40辆C,60辆D.80辆4,如图是总体密度曲线,下列说法正确的是()A,组距越大,频率分布折线图越接近于它B,样本容量越小,频率分布折线图越接近于它C,阴影部分的面积代表总体在(a,b)内取值的百分比D,阴影部分的平均高度代表总体在(a,b)内取值的百分比5,一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A,20% B.69%C,31% D.27%6,某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A,90 B.75 C.60 D.45题号 1 2 3 4 5 6答案二、填空题7,将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 8,在如图所示的茎叶图中,甲,乙两组数据的中位数分别是________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10,抽查100袋洗衣粉,测得它们的重量如下(单位:g):494498493505496492485483508 511495494483485511493505488 501491493509509512484509510 495497498504498483510503497 502511497500493509510493491 497515503515518510514509499 493499509492505489494501509 498502500508491509509499495 493509496509505499486491492 496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升11,在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?12,某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.答案: 2.2.1 用样本的频率分布估计总体分布 知识梳理1,(1)频率分布 (2)数字特征 2.(1)提取信息 传递 (2)表格 构成形式 3.频率/组距 小长方形的面积 1 4.(1)上端的中点 (2)组数 光滑曲线5,(2)保留所有信息 随时记录 (3)较多作业设计1,A 2,C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.] 3,B [时速在[60,70)的汽车的频率为:0,04×(70-60)=0.4,又因汽车的总辆数为100, 所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4,C5,C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.]6,A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36, ∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 7,60解析 ∵n·2+3+42+3+4+6+4+1=27, ∴n =60.8,45,46解析 由茎叶图及中位数的概念可知x 甲中=45,x 乙中=46. 9.m h解析频率组距=h ,故|a -b|=组距=频率h =m h . 10,解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计 频数 频率 累积频率 [482.5,486.5) 正 8 0.08 0.08 [486.5,490.5) 3 0.03 0.11[490.5,494.5) 正正正 17 0.17 0.28 [494.5,498.5) 正正正正- 21 0.21 0.49 [498.5,502.5) 正正 14 0.14 0.63 [502.5,506.5) 正 9 0.09 0.72[506.5,510.5) 正正正 19 0.19 0.91 [510.5,514.5) 正- 6 0.06 0.97[514.5,518.5] 3 0.03 1.00合计 100 1.00(2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44.设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55. 11,解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.12,解 (1)(2)(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.2.2.2用样本的数字特征估计总体的数字特征课时目标 1.会求样本的众数,中位数,平均数,标准差,方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.1,众数,中位数,平均数(1)众数的定义:一组数据中重复出现次数________的数称为这组数的众数.(2)中位数的定义及求法把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.②当数据个数为偶数时,中位数为排列的最中间的两个数的________.(3)平均数①平均数的定义:如果有n个数x1,x2,…,x n,那么x=____________,叫做这n个数的平均数.②平均数的分类:总体平均数:________所有个体的平均数叫总体平均数.样本平均数:________所有个体的平均数叫样本平均数.2,标准差,方差(1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=________________________________________________________________________.(2)方差的求法:标准差的平方s2叫做方差.s2=________________________________________________________________________.一、选择题1,下列说法正确的是()A,在两组数据中,平均值较大的一组方差较大B,平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C,方差的求法是求出各个数据与平均值的差的平方后再求和D,在记录两个人射击环数的两组数据中,方差大的表示射击水平高2,已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有()A,a>b>c B.a>c>bC,c>a>b D.c>b>a3,甲,乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲,乙两同学在这次篮球比赛活动中,发挥得更稳定的是()A,甲B.乙C,甲,乙相同D.不能确定4,一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是()A.13s2B.s2C,3s2D.9s25,如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为()A,84,4.84 B.84,1.6C,85,1.6 D.85,0.46,如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B则()A.x A>x B,s A>s BB.x A<x B,s A>s BC.x A>x B,s A<s BD.x A<x B,s A<s B题号 1 2 3 4 5 6答案二、填空题7,已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.8,甲,乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲10 8 9 9 9乙10 10 7 9 9如果甲,乙两人只能有1人入选,则入选的应为________.9,若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,x这21个数据的方差为________.三、解答题10,甲,乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:(1)请填写表:平均数方差中位数命中9环及9环以上的次数甲乙(2)请从下列四个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和中位数相结合看(分析谁的成绩好些);③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);④从折线图上两人射击命中环数的走势看(分析谁更有潜力).能力提升11,下面是一家快餐店所有工作人员(共7人)一周的工资表:总经理大厨二厨采购员杂工服务员会计3 000元450元350元400元320元320元410元(1)计算所有人员一周的平均工资;(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?12,1,平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.2,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3,极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.答案:2,2.2用样本的数字特征估计总体的数字特征知识梳理1,(1)最多 (2)中间 ①中间位置的 ②平均数 (3)①x 1+x 2+…+x n n ②总体中 样本中2,(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2] 作业设计1,B [A 中平均值和方差是数据的两个特征,不存在这种关系;C 中求和后还需取平均数;D 中方差越大,射击越不平稳,水平越低.]2,D [由题意a =110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,即b =16,c =18,∴c>b>a.]3,B [方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B .]4,D [s 20=1n [9x 21+9x 22+…+9x 2n -n(3x )2]=9·1n(x 21+x 22+…+x 2n -n x 2)=9·s 2(s 20为新数据的方差).]5,C [由题意x =15(84+84+86+84+87)=85.s 2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=15(1+1+1+1+4)=85=1.6.]6,B [样本A 数据均小于或等于10,样本B 数据均大于或等于10,故x A <x B , 又样本B 波动范围较小,故s A >s B .] 7,91解析 由题意得8,甲解析 x 甲=9,2S 甲=0.4,x 乙=9,2S 乙=1.2,故甲的成绩较稳定,选甲.9,0.19 解析 这21个数的平均数仍为20,从而方差为121×[20×0.2+(20-20)2]≈0.19. 10,解 由折线图,知甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为: 2,4,6,8,7,7,8,9,9,10.也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.(1)x 甲=110×(5+6×2+7×4+8×2+9)=7010=7(环), x 乙=110×(2+4+6+7×2+8×2+9×2+10)=7010=7(环),s 2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s 2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2] =110×(25+9+1+0+2+8+9)=5.4. 根据以上的分析与计算填表如下:平均数 方差 中位数 命中9环及9环以上的次数甲 7 1.2 7 1乙 7 5.4 7.5 3 (2)①∵平均数相同,2S 甲<2S 乙,∴甲成绩比乙稳定. ②∵平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好些.③∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.11,解 (1)平均工资即为该组数据的平均数 x =17×(3 000+450+350+400+320+320+410)=17×5 250=750(元).(2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.(3)除去总经理的工资后,其他工作人员的平均工资为:x ′=16×(450+350+400+320+320+410)=16×2 250=375(元).这个平均工资能代表一般工作人员一周的收入水平.12,解 设第一组20名学生的成绩为x i (i =1,2,…,20),第二组20名学生的成绩为y i (i =1,2,…,20), 依题意有:x =120(x 1+x 2+…+x 20)=90,y =120(y 1+y 2+…+y 20)=80,故全班平均成绩为:140(x 1+x 2+…+x 20+y 1+y 2+…+y 20)=140(90×20+80×20)=85;又设第一组学生成绩的标准差为s 1,第二组学生成绩的标准差为s 2,则s 21=120(x 21+x 22+…+x 220-20x 2),s 22=120(y 21+y 22+…+y 220-20y 2) (此处,x =90,y =80),又设全班40名学生的标准差为s ,平均成绩为z (z =85),故有s 2=140(x 21+x 22+…+x 220+y 21+y 22+…+y 220-40z 2) =140(20s 21+20x 2+20s 22+20y 2-40z 2) =12(62+42+902+802-2×852)=51. s =51.所以全班同学的平均成绩为85分,标准差为51.。

人教新课标A版高中数学必修3第二章统计2.2用样本估计总体2.2.2用样本的数字特征估计总体同步测试

人教新课标A版高中数学必修3第二章统计2.2用样本估计总体2.2.2用样本的数字特征估计总体同步测试

人教新课标A版高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体同步测试C卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93。

下列说法一定正确的是()A . 这种抽样方法是一种分层抽样。

B . 这种抽样方法是一种系统抽样。

C . 这五名男生成绩的方差大于这五名女生成绩的方差。

D . 该班级男生成绩的平均数小于该班女生成绩的平均数。

2. (2分)样本4,2,1,0,-2的标准差是:()A . 1B . 2C . 4D .5. (2分)对一个样本容量为100的数据分组,各组的频数如表:区间[17,19)[19,21)[21,23)[23,25)[25,27)[27,29)[29,31)[31,33]频数113318162830估计小于29的数据大约占总体的()A . 42%B . 58%C . 40%D . 16%6. (2分)(2020·漳州模拟) 某学校运动会的立定跳远和秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为名学生的预赛成绩,其中有三个数据模糊.学生序号立定跳远(单位:米)30秒跳绳(单位:次)在这名学生中,进入立定跳远决赛的有人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则()A . 号学生进入秒跳绳决赛B . 号学生进入秒跳绳决赛C . 号学生进入秒跳绳决赛D . 号学生进入秒跳绳决赛8. (2分)甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数8.48.78.78.3方差s2 3.6 3.6 2.2 5.4从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是()A . 甲B . 乙C . 丙D . 丁9. (2分) 2012年上海市居民的支出构成情况如下表所示:食品衣着家庭设备用品及服务医疗保健交通和通讯教育文化娱乐服务居住杂项商品和服务39.4% 5.9% 6.2%7.0%10.7%15.9%11.4% 3.5%用下列哪种统计图表示上面的数据最合适()A . 条形统计图B . 茎叶图C . 扇形统计图D . 折线统计图11. (2分)已知样本数据x1 , x2 ,…,x10 ,其中x1 , x2 , x3的平均数为a;x4 , x5 ,…,x10的平均数为b,则样本数据的平均数为()A .B .C .D .12. (2分)在黄冈市青年歌手大赛中,七位评委为某选手打出的分数如下:91,89,91,96,94,95,94,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A . 93,2.8B . 93,2C . 94,2.8D . 94,215. (2分) (2016高一下·双峰期中) 10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A . a>b>cB . b>c>aC . c>a>bD . c>b>a二、填空题 (共5题;共6分)16. (1分)(2018·如皋模拟) 甲、乙两个城市2017年夏季连续5天中,每天的最高气温()数据如下:每天的最高气温城市第1天第2天第3天第4天第5天甲2831273331乙2526293436则这5 天中,每天最高气温较为稳定(方差较小)的城市为________. (填甲或乙).19. (1分)统计的基本思想是:________ .三、解答题 (共5题;共25分)21. (5分)一台机器由于使用时间较长,生产的零件有一些缺损,按不同转速生产出来的零件有缺损的统计数据如下表所示.转速x(转/秒)1614128每小时生产有缺损零件数y(个)11985(1)作出散点图;(2)如果y与x线性相关,求出回归直线方程;(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么机器的运转速度应控制在什么范围内?22. (5分)某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:[107,109)3株;[109,111)9株;[111,113)13株;[113,115)16株;[115,117)26 株;[117,119)20株;[119,121)7株;[121,123)4株;[123,125]2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据落在[109,121)范围内的可能性是百分之几?24. (5分) (2018高二下·辽源月考) 从两块玉米地里各抽取10株玉米苗,分别测得它们的株高如下(单位:cm ):甲:25 41 40 37 22 14 19 39 21 42 乙:27 16 44 27 44 16 40 40 16 40根据以上数据回答下面的问题:(1)哪种玉米苗长得高?(2)哪种玉米苗长得齐?参考答案一、单选题 (共15题;共30分)1-1、2-1、5-1、6-1、8-1、9-1、11-1、12-1、15-1、二、填空题 (共5题;共6分)16-1、19-1、三、解答题 (共5题;共25分)21-1、21-2、21-3、22-1、24-1、24-2、。

河南省镇平县第一高级中学高中数学人教A版必修三同步

河南省镇平县第一高级中学高中数学人教A版必修三同步

高一数学《用样本估计总体》练习题1.如右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )A .161 cmB .162 cmC .163 cmD .164 cm2.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .603.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A .40.6,1.1B .48.8,4.4C .81.2,44.4D .78.8,75.6 4.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差5.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则( )A .m e =m 0=x -B .m e =m 0<x -C .m e <m 0<x -D .m 0<m e <x -6.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为( )A.65B.65C. 2 D.27.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的概率分布直方图是( )8.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画出了如图所示的频率分布直方图,现要从这10 000人中再用分层抽样的方法抽出100人作进一步调查,则月收入在[2 500,3 000)(元)内应抽出________人.9.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.10. 为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:(1)表中m,n,M,(2)画出频率分布直方图.(3)全体女生中身高在哪组范围内的人数最多?11.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图.(2)这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?12、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)(2)(3)13、为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。

人教A版高中数学必修三用样本估计总体同步练习新(1)

人教A版高中数学必修三用样本估计总体同步练习新(1)

2.2 用样本估计总体一、选择题1、为了解一批数据在各个范围内所占比例的大小,将这批数据分组,落在各个小组的个数叫做( )A 、频数B 、样本容量C 、频率D 、累计频数2、在频率分布直方图中各校长方形的面积表示( )A 、落在相应各组内的数据的频数B 、相应各组的频率C 、该样本所分成的组数D 、该样本的容量3、为考察某种皮鞋的各种尺码的销售情况,以某天销售40双皮鞋为一个样本,按尺码分为5组,第三组的频率为0.25,第1,2,4组的频数为6,7,9,若第5组表示的是40~42的皮鞋,则售出的200双皮鞋中含40~42的皮鞋为( )双A 、50B 、40C 、20D 、304、从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,前三组是不超过80的其频数之和为20 ,其频率之和为0.4,则抽取的样本的容量为( )A 、100B 、80C 、40D 、505、在频率分布直方图中,小长方形的面积是 ( )A 、频率/样本容量B 、组距×频率C 、频率D 、样本数据6、在10人中,有4人是学生,2人是干部,3人是工人,1人是农民,分数2/5是学生占总体的( )A 、频数B 、概率C 、频率D 、累积频率7、一个容量为20 的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],4;(60,70],2。

则样本在区间(- ,50]上的频率是( )A 、5%B 、25%C 、50%D 、70%8、在抽查某产品尺寸的过程中,将其尺寸分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率为m ,该组上的直方图的高是h ,则,[a-b]等于( )A 、hmB 、h m C 、 mh D 、 与m ,h 无关二、填空题9、在已分组的数据中,每组的频数是指 ,每组的频率是指 。

10、某人掷一个均匀的正方体玩具(它的每个面上分别标以数字1,2,3,4,5,6),一共抛了7768次,从而统计它落地时向上的数出现的频率。

新课标高中数学人教A版必修三2.2用样本估计总体(三)

新课标高中数学人教A版必修三2.2用样本估计总体(三)
平均数代表了数据更多的信息,但受样本中 每个数据的影响,越极端的数据对平均数的影响 也越大.
当样本数据质量比较差时,使用众数、中位 数或平均数描述数据的中心位置,可能与实际情 况产生较大的误差,难以反映样本数据的实际状 况,因此,我们需要一个统计数字刻画样本数据 的离散程度. 最新高中数学精品课件试卷
频率分布直方图损失了一些样本数据,得到 的是一个估计值,且所得估值与数据分组有关.
注: 在只有样本频率分布直方图的情况下,我 们可以按上述方法估计众数、中位数和平均数, 并由此估计总体特征.
最新高中数学精品课件试卷
知 识 探 究 ( 一 ): 众 数 、 中 位 数 和 平 均 数 思考 8 (1)一组数据的中位数一般不受少数 几个极端值的影响,这在某些情况下是一个优 点,但它对极端值的不敏感有时也会成为缺 点,你能举例说明吗?
平均数大于(或小于)中位数,说明样 本数据中存在许多较大(或较小)的极端值.
最新高中数学精品课件试卷
知 识 探 究 ( 一 ): 众 数 、 中 位 数 和 平 均 数 思考 8 (2)样本数据的平均数大于(或小于) 中位数说明什么问题?
平均数大于(或小于)中位数,说明样 本数据中存在许多较大(或较小)的极端值.
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 最新高中数学精品课件试卷 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
知 识 探 究 ( 一 ): 众 数 、 中 位 数 和 平 均 数
思考 2:在城市居民月均用水量样本数据的频 率分布直方图中,你认为众数应在哪个小矩形 内?由此估计总体的众数是什么?
知 识 探 究 ( 二 ): 标 准 差 思考 3:对于样本数据 x1,x2,…,xn,设想通过 各数据到其平均数的平均距离来反映样本数据的 分散程度,那么这个平均距离如何计算?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2. 2 用样本估计总体
一、选择题
1、为了解一批数据在各个范围内所占的比例大小,将这批数据分组,落在各个小组里的数据个数叫做()
A、频数
B、样本容量
C、频率
D、频数累计
2、在频率分布直方图中,各个小长方形的面积表示()
A、落在相应各组的数据的频数
B、相应各组的频率
C、该样本所分成的组数
D、该样本的容量
3、为考察某种皮鞋的各种尺码的销售情况,以某天销售40双皮鞋为一个样本,把它按尺码分成5组,第3组的频率为0、25,第1,2,4组的频率分别为6,7,9,若第5组表示的是40—42码的皮鞋,则售出的200双皮鞋中含40—42码的皮鞋为()
A、50
B、40
C、20
D、30
4、从一群学生中收取一个一定容量的样本对他们的学习成绩进行分析,前三组是不超过80分的人,其频数之和为20人,其频率之和(又称累积频率)为0、4,则所抽取的样本的容量是()
1
1 A 、100 B 、80 C 、40 D 、50
5、一个容量为20的数据样本,分组后,组距与频数如下:(10,20]2个,(20,30]3个,(30,40]4个,(40,50]5个,(50,60]4个,(60,70 ]2个,则样本在区间(-∞,50]上的频率是 ( )
A 、5%
B 、25%
C 、50%
D 、70%
6、在10人中,有4个学生,2个干部,3个工人,1个农民,数52
是学生占总体的(
) A 、频数 B 、概率 C 、频率 D 、累积频率
7、列样本频率分布表时,决定组数的正确方法是 ( )
A 、任意确定
B 、一般分为5—12组
C 、由组距和组数决定
D 、根据经验法则,灵活掌握
8、下列叙述中正确的是 ( )
A 、从频率分布表可以看出样本数据对于平均数的波动大小
B 、频数是指落在各个小组内的数据
C 、每小组的频数与样本容量之比是这个小组的频率
D 、组数是样本平均数除以组距
9、频率分布直方图中,小长方形的面积等于()
A、组距
B、频率
C、组数
D、频数
10、一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0、125,则n 的值为()
A、640
B、320
C、240
D、160
11、有一个数据为50的样本数据分组,以及各组的频数如下,根据累积频率分布,估计小于30的数据大约占多少()
[12、5,15、5),3;[15、5,18、5),8;[18、5,21、5),9;[21、5,24、5),11;[24、5,27、5),10;[30、5,33、5),4
A、10%
B、92%
C、5%
D、30%
二、填空题
12、将一批数据分成5组列出频率分布表,其中第1组的频率是0、1,第4组与第5组的频率之和是0、3,那么第2组与第3组的频率之和是。

13、在求频率分布时,把数据分为5组,若已知其中的前四组频率分别为0、1,0、3,0、3,0、1,则第五组的频率是,这五组的频数之比为。

三、解答题
1。

相关文档
最新文档