2.2.1 用样本的频率估计总体的频率doc

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.2.1 用样本的频率估计总体的频率
目标:掌握频率分布表、频率分布直方图、频率分布折线和茎叶图
一. 频率分布表
实例1.从某校高一年级的1002名新生中,用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm ).试作出该样本的频率分布表.
分析:这组数据中最小值为151,最大值为180,相差29,它们分布在一个长度为29的区间上[151,180],为了统计上的方便,我们把这个区间对称地略为放大为[150.5,180.5](这时区间的长度为30,便于分组),并将这个区间平均分成10个小区间,每个小区间的长度为3,然后统计出每个区间内的频数,并计算出相应的频率。

统计学上,我们将整个取值区间的长度称为全距(这里为30),平均分成的小区间的长度称为组距(这里组距为3).
问题的解决:
①.在全部数据中找到最大值为180,最小值为151,两者之差为29,故确定全距为30(注:这时的分布区间为]5.180,5.150[),决定以组距3将区间]5.180,5.150[分成10个组;
②从第一组)5.153,5.150[开始,分别统计各组中的频数,再计算各组的频率,立表如下:
上面的频率分布表给出了“身高样本”处于各区间内的人数和频率,可以用它来估计高一学生身高的分布状况. 一般地,当总体很大或很难取得的时候,可以用样本的频率分布来估计总体的频率分布。

应用中,我们把反映总体频率分布的表格称为频率分布表.
编制频率分布表的具体步骤如下:
①.求全距(也称为极差=最大值与最小值的差),决定组数和组距,组距=全距/组数;(如果实际的全距不利于分组,比如不能整除,则可以适当对称地增大全距).
②.分组,通常每个小组所对应的小区间都取为左闭右开的区间,只有最后一个小区间是全闭区间;(避免数据的重复统计和遗漏)
③.登记频数,计算频率,列出频率分布表.
二.频率分布直方图与折线图
样本的频率分布表可以用来反映总体的频率分布情况,除此之外,更为直观的频率分布直方图和频率折线图也可以用来反映总体的频率分布.
实例2.从某校高一年级的1002名新生中,用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm).
①.试作出该样本的频率分布直方图;
由实例1可知,经过如下步骤:①求全距,决定组数和组距;②.分组;
③.登记频数,计算频率;我们可以得到样本的频率分布表如下:
(问题①的解答):①在编制了频率分布表后,我们以横坐标表示身高,纵坐标表示“频率/组距”,建立直角坐标系;②在横坐标上标出150.5,153.5,156.5,┅,180.5,相当于把全距和组距都搬运到横坐标轴上来了,③在横坐标轴上的每一个小区间上,以样本在这个区间上的“频率/组距”为高画矩形,全部小矩形合起来就是这个样本的频率分布直方图.
一般地,把横轴分成若干段,每一段对应一个组的组距,然后以此线段为底作一矩形,使其高为“频率/组距”,这样得到一系列的矩形,每个矩形的面积恰好是该组上的频率,所有这些矩形合起来,就是频率分布直方图.
频率分布直方图比频率分布表更形象、更直观地反映了样本的分布规律。

每个小矩形的面积等于总体在相应区间上的频率分布,全部小矩形面积的和一定等于1(100%).
(问题②的解答):如果将频率分布直方图中各相邻矩形上底边的中点顺次连结起来,就得到一条折线,这就是所谓的频率折线图.
频率折线图的优点是它反映了数据的变化趋势,如果将样本的容量取得足够大,分组的组距取得足够小,这条折线将趋于一条光滑曲线,我们称这条曲线为总体的密度曲线.
总体的密度曲线反映了总体在各个范围内取值的频率(百分比),它能给我们提供更加精确的信息,图中阴影部分的面积就是总体在区间),(b a 内取值的频率(百分比).密度曲线总是在横坐标轴的上方,与横坐标轴所围面积等于1.
三.茎叶图
除了频率分布表、频率分布直方图、频率折现图、密度曲线之外,统计中还有一种被用来表示数据的图,称为茎叶图.
实例3:某篮球运动员在某赛季中各场比赛的得分情况如下:
12,15,24,25,31,31,36,36,37,39,44,49,50(共13场比赛),如何分析运动员的整体水平及发挥的稳定程度?
在这个问题中:我们将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序自上而下一一列出,共茎的叶一般按从小到大(或从大到小)的顺序同行列出,这样就得到了
身高/cm b
a
图中第一行分界线左侧的“1”表示十位数字,右侧的“2”和“5”表示个位数字,这一行说明在这个赛季中该运动员有两场比赛的得分分别为12分和15分;同理,第二行说明在这个赛季中该运动员有两场比赛的得分分别为24分和25分;第三行说明在这个赛季中该运动员有六场比赛的得分分别为31、31分、36分、36分、37分和39分;依次类推.
实例4.甲、乙两篮球运动员在上个赛季中每场比赛的得分如下: 甲:12,15,24,25,31,31,36,36,37,39,44,49,50. 乙:8,13,14,16,23,26,28,33,38,39,51. 试画出两人得分的茎叶图。

解:为了便于比较分析,画图时,可将茎放在中间共用,叶分居左右两侧.
从这张茎叶图中我们可以看到,甲运动员的得分大致对称,平均得分及中位数、众数都是30多分;乙运动员的得分除了一个51分外,也大致对称,平均得分及中位数、众数都是20多分;因此甲运动员发挥比较稳定,总体得分情况比乙要好。

从这个实例中我们看到,茎叶图既可用于单组数据的统计和分析,也可用于两组数据的比较.
茎叶图刻画数据有两个优点:一是所有的信息都可以从这一张茎叶图中得到,二是茎叶图便于记录和表示,但当样本的数据很多的时候,用茎叶图分析数据就不是太好!
四.课外练习《优化设计》3834 P
五.补充练习
1.频率分布直方图中,各小矩形面积的和等于 ( ) A.0 B.2
1
C.1
D.不确定
2.在画频率分布直方图时,某组的频数为10,样本的容量为50,总体的容量为600,则该组的频率是 ( ) A.51 B.61 C.
10
1 D.不确定
3.没有信息的损失,所有的原始数据都可以从图中得到的统计图是 ( ) A.总体密度曲线 B.茎叶图 C.频率分布折线图 D.频率分布直方图
4.为了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据 画出样本的频率分 布直方图如图所示, 根据该图,估计该 校2000名高中男生 中体重不小于70.5
千克的人数为 ( ) A.300 B.360 C.420 D.450
5.统计某校1000名学生的数学测 试成绩,得到样本频率分布直方 图如图所示,若满分为100分, 规定不低于60分为及格,则及
格率是 ( ) A.20% B.25% C.6% D.80%
6.某校进行演讲比赛,9位评委给选手A 打出的分数的茎叶图如图所示,统计员在去掉一个最高分和一个最低分之后,算得平均分为91分,复核员在复核时,发现一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是 ( )
A.5
B.4
C.3
D.2
7.将一个容量为n 的样本分成若干组,已知某组的频数和频率分别为30和0.25,求n 的值.
8.有一个容量为50的样本,数据的分组及各组的频数如下:
3,)5.15,5.12[;8,)5.18,5.15[;9,)5.21,5.18[;11,)5.24,5.21[; 10,)5.27,5.24[;5,)5.30,5.27[;4,)5.33,5.30[. ①.列出样本的频率分布表;
②.画出频率分布直方图和频率折线图; ③.根据频率分布直方图估计,数据落在)5.24,5.15[内的百分比(频率).
2 x
3
4 2 1 9 8 7
9 8。

相关文档
最新文档