2.2.1用样本的频率分布估计总体分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§2.2.1用样本的频率分布估计总体分布
一、学习目标
1. 会用频率分布表作频率直方图和频率折线图
2. 能够用频率直方图对总体分布规律进行估计。

3. 知道茎叶图的意义及画法,并能在实际问题中用茎叶图进行数据统计 二、预习课本,自主掌握
1.通常我们对总体做出的估计一般分成两种。

一种是用_样本的频率分布估计总体的分布,另一种是用_样本的数字特征估计总体的数字特征
2.分析数据的一种基本方法是用图将他们画出来,或者用紧凑的表格改变数据的排列方式。

作图可以达到两个目的,一是从数据中提取信息,二是_利用图形传递信息_.表格则是通过改变数据的构成形式,为我们提供_解释数据__的新方式。

3.在频率分布直方图中,纵轴表示__
组距
频率
_____,数据落在各小组内的频率用各小长方形的面积_表示,各小长方形的面积总和等于1_.
4.作频率分布直方图的步骤为(1)求极差,即_一组数据中的最大值与最小值的差;(2)决定组距与组数;(3)将数据分组(4)列频率分布表(5)绘制频率分布直方图
5.连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

随着样本容量的增加,作图时所分的组数增加,相应的频率折线图会越来越接近一条光滑曲线,它能够更加精细的反映出总体在各个范围内取值的百分比。

6.茎是指中间的一列数,叶就是从茎的旁边生长出来的数.茎叶图可用来分析单组数据,也可以对两组数据进行比较.茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况.
7.在样本数据较少时,用茎叶图表示数据效果的好坏,它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便。

三、基础自测
1.2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在)60,50[的汽车大约有 ( )
A .30辆
B .60辆
C .300辆
D .600辆 2.下列关于茎叶图的叙述正确的是
( )
(A )将数据的数按位数进行比较,将数大小基本不变或变化不大的作为一个主杆(茎),将变化大的位数作为分枝(叶),列在主杆的后面
(B )茎叶图只可以分析单组数据,不能对两组数据进行比较 (C )茎叶图更不能表示三位数以上的数据
(D )画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可以随意同行列出
3.容量为100的样本数据,按从小到大的顺序分为8组,如下表:第三组的频数和频率分别是 ( )
A .14和0.14
B .0.14和14
C . 14
1和0.14 D . 31和141
4.下图是样本容量为200的频率分布直方图。

根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为 ,数据落在(2,10)内的概率约为 。

5.(1)甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示(单位:分),则甲班、乙班的最高成绩分别是________,从图中看,________班的平均成绩较高.
(4题图) 四、合作、探究、展示:
探究一、列频率分布表、画频率分布直方图
[例1] 考察某校高二年级男生的身高,随机抽取40名高二男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 160 168 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161 (1)作出频率分布表;
(2)画出频率分布直方图和频率分布折线图.
组号 1 2 3 4 5 6 7 8 频数 10
13
x
14
15
13
12
9
探究二、频率分布直方图的应用
例2.为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:
组别频数频率
145.5~149.5 1 0.02
149.5~153.5 4 0.08
153.5~157.5 20 0.40
157.5~161.5 15 0.30
161.5~165.5 8 0.16
165.5~169.5 m n
合计M N
m n M N所表示的数分别是多少?
(1)求出表中,,,
(2)画出频率分布直方图.
(3)全体女生中身高在哪组范围内的人数最多?
探究三、茎叶图
例3、某中学高一(2)班甲、乙两名同学自入高中以来每场数学考试成绩情况如下:甲同学得分:95,81,75,91,86,89,71,65,76,88,94,110;
乙同学得分:83,86,93,99,88,103,98,114,98,79,101,107.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
五、课堂检测:
1.一个容量为100的样本,其数据的分组与各组的频数如下: 组别 (0,10]
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
频数
12 13 24 15 16 13 7
则样本数据落在(10,40]上的频率为( )
A .0.13
B .0.39
C .0.52
D .0.64
2.对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( )
A .频率分布直方图与总体密度曲线无关
B .频率分布直方图就是总体密度曲线
C .样本容量很大的频率分布直方图就是总体密度曲线
D .如果样本容量无限增大,分组的组距无限减小,那么相应的频率分布折线图会越来越接近一条光滑曲线,则这条光滑曲线为总体密度曲线
3.容量为100的样本数据,按从小到大的顺序分为8组,但是记录时不小心把第3组数据和第8组数据的部分信息丢失,记录如下:
组号 1 2 3
4 5 6 7 8
频数 10
13
14
15
13
12
频率
0.10 0.13
0.14 0.15 0.13 0.12 0.09
则根据上表可知,第3组的频率是______,第8组的频数是______.
4.有100个数据,最大的是101,最小的是79,那么要绘制频率分布直方图,首先要求出极差(最大值与最小值的差)为______.如果选择组距为3,那么合适的分组数是____________.
5.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如
图.据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为( )
A .100
B .160
C .200
D .280
答案:1.C 样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52
100
=0.52.
2.D
3.0.14 9 根据第8组的频率为0.09可计算出第8组的频数是9,根据总的频率之和为1,可以得出第3组的频率是1-0.10-0.13-0.14-0.15-0.13-0.12-0.09=0.14,频数为14.
4.22 8 极差为101-79=22,由于22÷3=71
3
,所以合适的分组数应该是8组.
解析:选B 由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学次数在[16,30)内的人数为400
20
×8=160.
6.(2009安徽皖南八校二模,2)从某校高三年级随机抽取一个班,对该班50名学生的
高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图所示:
若某高校A专业对视力的要求在0.9以上,则该班学生中能报A专业的人数为() A.10 B.20 C.8 D.16
7.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为()
A.100 B.1000 C.90 D.900
8.“毒奶粉”事件引起了社会对食品安全的高度重视,各级政府加强了对食品安全的检查力度.某市工商质检局抽派甲、乙两个食品质量检查组到管辖区域内的商店进行食品质量检查.下图表示甲、乙两个检查组每天检查到的食品品种数的茎叶图,则甲、乙两个检查组每天检查到的食品种数的中位数的和是()
A.56 B.57 C.58 D.59
9.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95),由此得到频率分布直方图(如图所示),则这20名工人中一天生产该产品数量在[55,75)的人数是__________.
10如图是2012年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有()
A .a 1>a 2
B .a 2>a 1
C .a 1=a 2
D .a 1,a 2的大小与m 的值有关
11.对某400件元件进行寿命追踪调查,频率分布如下:
寿命(h) 频数 频率 500~600 0.10 600~700 0.15 700~800 800~900 80 900~1000 60 合计
400
1
(1)完成上述频率分布表;
(2)估计元件寿命在500~800 h 以内的频率.
答案:6.B 视力在0.9以上的频率为(1+0.75+0.25)×0.2=0.4,故能报A 专业的人数为0.4×50=20.
7.A 支出在[50,60)元的同学的概率为0.03×10=0.3,因此n =30
0.3=100.
8.B 根据中位数的定义知,甲的中位数为32,乙的中位数为25,故中位数的和是32+25=57.
9.13 20×(0.065×10)=13(人).
10.解析:选B 根据茎叶图可知,去掉一个最高分和一个最低分后,甲的平均分为a 1=80+5+4+5+5+15=84,乙的平均分为a 2=80+4+4+6+4+75=85,故a 2>a 1.
11.解:(1)
寿命(h) 频数 频率 500~600 40 0.10 600~700 60 0.15 700~800 160 0.4 800~900 80 0.2 900~1000 60
0.15
合计
400 1
(2)解法一:估计元件寿命在500~800 h 以内的频率为0.1+0.15+0.4=0.65. 解法二:1-(0.2+0.15)=0.65.
点评:频数分布图(表)能使我们清楚地知道数据分布在各个小组的个数;而频率分布图(表)则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布.
在上述图表中,各组频数之和等于样本容量,各组频率之和等于1.
12.甲、乙两人在10天中每天加工零件的个数用茎叶图表示下图,中间一列的数字表示零件个数,两边的数字表示零件个数的位数。

则这10天甲、乙两人日加工零件的平均数分别为 24 和 23 。

13.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm )
(1)列出频率分布表; (2)画出频率分布直方图;
(3)估计数据落在[150,170]范围内的概率。

14.为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了14天,记录了下午00:2~
00:5间各自的点击数:
甲 73
24
58
72
64
38
66
70
20
41
55 67 8 25 乙
12 37 21 5 54 42 61 45 19 6
19
36
42
14
请你用茎叶图表示上面的数据,并据此说明哪个网站更受欢迎。

分组 [140,145) [145,150) [150,155) [155,160) [160,165) [165,170) [170,175) [175,180) 合计 人数
1
2
5
9
13
6
3
1
40。

相关文档
最新文档