用样本的频率分布估计总体分布(一) 课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

反思:用茎叶图表示数据的特点如下: ① 用茎叶图表示数据有两个突出的优点,一是统计图上没有原始信息的损
失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录, 用 3| 3 8 9 就表示了 33,38,39 这 3 个数据,方便记录与表示.但茎叶图只便于表示 两位有效数字的数据,虽然可以表示两个人以上的比赛结果(或两个以上的记 录),但没有表示两个记录那么直观、清晰.
cm,组数为 12. (3)将数据分组. 使分点比数据多一位小数,并且把第 1 小组的起点稍微减小一点.那么所分
的 12 个小组可以是 3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.
(4)列频率分布表.
对各个小组作频数累计,然后数频数,算频率,列频率分布表,如下表所示:
茎叶图
个茎叶图中得到;二是茎叶 样本数据较多或数据位数较 图便于记录和表示,能够展 多时,不方便表示数据
示 数 据的分布情况
【例题 1】 一个农技站为了考察某种麦穗长的分布情况,在一块试验地里抽取 了 100 个麦穗,量得长度如下(单位:cm): 6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3 根据上面的数据列出频率分布表、绘出频率分布直方图,并估计长度在 5.75~6.05 cm 之间的麦穗在这批麦穗中所占的百分比.
分组
频 数 累计
频数
频率
3.95~4.25
1
0.01
4.25~4.55
1
0.01
4.55~4.85
2
0.02
4.85~5.15
5
0.05
5.15~5.45
11
0.11
5.45~5.75
15
0.15
5.75~6.05
28
0.28Hale Waihona Puke 6.05~6.3513
0.13
6.35~6.65
11
0.11
6.65~6.95
组距
组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的 频率大小.
②在频率分布直方图中,各个小矩形的面积之和等于 1. ③ 频数 =样本容量.
相 应 的频率
【例题 4】 某校举行演讲比赛,9 位评委给选手 A 打出的分数的茎叶图如图所 示,统计员在去掉一个最高分和一个最低分后,算得平均分为 91,复核员在复核 时,发现有一个数字(茎叶图中的 x)无法看清,若统计员计算无误,则数字 x 应该 是( )
【做一做 3】 对于频率分布折线图与总体密度曲线的关系,下列说法中正 确的是( )
A.频率分布折线图与总体密度曲线无关 B.频率分布折线图就是总体密度曲线 C.样本容量很大的频率分布折线图就是总体密度曲线 D.如果样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会 无限接近于一条光滑曲线,即为总体密度曲线 答案:D
分析:用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示 两人每场数学考试成绩的个位数.
解:甲、乙两人数学成绩的茎叶图如图所示. 从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是 98;
甲同学的得分情况除一个特殊得分外,也大致对称,中位数是 88.因此乙同学发 挥比较稳定,总体得分情况比甲同学好.
A.总体密度曲线 B.茎叶图 C.频率分布折线图 D.频率分布直方图 解析:所有的统计图中,仅有茎叶统计图完好无损地保存着所有原始数据的 信息. 答案:B
1.估计总体分布 剖析:总体分布是指总体取值的分布规律,即某小组数据在总体数据中所占
的比例大小.这种分布我们一般是不知道的.用样本估计总体是统计的基本思想, 对于不易知道的总体分布,常常用样本的频率分布对其进行估计.样本的容量越 大,这种估计就越精确.用样本估计总体的思想就是用部分考察全体、用有限考 察无限,也就是用观察测量值来探究客观规律的一种重要的基本思想.通常用统 计图(表)来直观地展现样本数据的分布状况,常用的统计图表有频率分布表、频 率分布直方图、频率分布折线图、茎叶图、总体密度曲线等.我们不但要能认 识各种统计图,从中提取各种信息,而且还要能制作各种统计图,表达问题的数 据信息.
A.15
B.16
C.110
D.不确定
解析:该组的频率是10
50
=
15.
答案:A
3.频率分布折线图和总体密度曲线 (1)类似于频数分布折线图,连接频率分布直方图中各个小长方形上端的中 点,就得到频率分布折线图. 一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.例如,如果 要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一 个城市的时候大.可以想像,随着样本容量的增加,作图时所分的组数增加,组距 减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线 为总体密度曲线.
分析:依据步骤画出频率分布直方图;用样本中的百分比(即频率)来估计长度在 5.75~6.05 cm 之间的麦穗在这批麦穗中所占的百分比. 解:步骤是:
(1)计算极差,7.4-4.0=3.4(cm). (2)决定组距与组数.
若取组距为 0.3 cm,由于30..43=1113,需分成 12 组,组数合适.于是取定组距为 0.3
【例题 2】 某中学高一(2)班甲、乙两名同学自高中以来每次数学考试成绩情 况如下: 甲的得分:95,75,86,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101. 画出两人的数学成绩茎叶图.请根据茎叶图对两人的数学成绩进行比较.
② 茎叶图在样本数据较少,较为集中且位数不多时比较适用.由于它较好地 保留了原始数据,所以可以帮助分析样本数据的大致频率分布,还可以用来分析 样本数据的一些数字特征,如众数、中位数、平均数等.
【例题 3】 (2011·山东寿光高三抽测,理 14)为了解某小区老年人在一天中锻
炼身体的时间,随机调查了 50 人,根据调查数据,画出了锻炼时间在 0~2 小时的
茎叶图的特征:统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶 图中得到;茎叶图中的数据可以随时记录,随时添加,方便记录与表示.但是茎叶 图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两位以
上的数据虽然能够记录,但是没有表示两位数记录那么直观、清晰.
【做一做 4】 没有信息的损失,所有的原始数据都可以从图中得到的统计 图是( )
(2)意义:频率分布直方图中,每个小矩形的面积表示相应组的频率,所有小 矩形的面积的总和等于 1.
(3)频率分布的估计:频率分布是指各个小组数据在容量中所占比例的大小, 可以用样本的频率分布估计总体的频率分布,频率分布表是反映样本的频率分 布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.
频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围 内取值的百分比,它能给我们提供更加精细的信息.
(2)估计方法:实际上,尽管有些总体密度曲线是客观存在的,但是在实际应 用中我们并不知道它的具体表达形式,需要用样本来估计.由于样本是随机的, 不同的样本得到的频率分布折线图不同;即使对于同一个样本,不同的分组情况 得到的频率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变 化而变化的,因此不能用样本的频率分布折线图得到准确的总体密度曲线.
估计总体分布的步骤是: (1)选择适当的抽样方法从总体中抽取样本,即收集数据. (2)利用样本数据画出统计图或计算数字特征. (3)结合统计图分析样本取值的分布规律. (4)用样本取值的分布规律估计总体分布,由于是用科学抽样抽取的样本, 那么样本与总体取值的分布规律近似,有时也可看成相同. (5)利用总体分布解决有关问题.
2.频率分布表、频率分布直方图、频率分布折线图和茎叶图的优缺点比较
剖析:如下表:
优点
缺点
频率分 布表
表 示 数量较确切
分析数据分布的总体态势不 方便
频率分 布 直 方图
原有的具体数据信息被抹掉 表示数据分布情况非常直观 了
频 率 分布 折线图
能 反 映数据的变化趋势
不 能 显示原有数据信息
一是所有的信息都可以从这
样本频率分布直方图(如图).则 50 人中锻炼身体的时间在区间[0.5,1.5)小时的人
数是
.
解析:根据频率分布直方图,锻炼身体的时间在区间[0.5,1.5)小时的频率为 (0.8+0.6)×0.5=0.7,则人数为 0.7×50=35. 答案:35
反思:频率分布直方图的性质: ① 因为小矩形的面积=组距×频 率=频率,所以各个小矩形的面积表示相应各
10
0.10
6.95~7.25
2
0.02
7.25~7.55 合计
1
0.01
100
1.00
(5)画频率分布直方图,如图所示.
从表中看到,样本数据落在 5.75~6.05 之间的频率是 0.28,于是可以估计,在 这块地里,长度在 5.75~6.05 cm 之间的麦穗约占 28%.
反思:本题画频率分布直方图时,小长方形的高易错用该组的频率的大小来表示. 其原因是不清楚频率分布直方图纵轴的意义.由于画频率分布直方图的步骤比 较烦琐,因此在实际操作的过程中要有足够的耐心.
用样本的频率分布估计总体分布
1.分析数据的方法 (1)借助于图形. 用图将各个数据画出来,作图可以达到两个目的,一是从数据中提取信息; 二是利用图形传递信息. (2)借助于表格. 用紧凑的表格改变数据的构成方式,为我们提供解释数据的新方式.
【做一做 1】在 2010 年第十六届亚运会中,各个国家和地区代表队金牌获 得情况的条形统计图,如图所示.
第十六届亚运会各个国家和地区代表队金牌获得情况统计图
从图中可以看出中国是亚洲第一体育强国,中国队所获得金牌数占全部金 牌数的比例约是( )
A.41.7%
B.59.8%
C.67.3% D.94.8%
解析:金牌总数为
477,我国获得
199
块金牌,所占比例为199
477
≈41.7%
.
答案:A
2.频率分布直方图 (1)绘制步骤: ① 求极差,即一组数据中的最大值与最小值的差. ② 决定组距与组数.组距与组数的确定没有具体的标准,一般来说,数据分 组的组数与样本容量有关,样本容量越大,所分组数越多.当样本容量不超过 100 时,按照数据的多少,常分为 5~12 组. ③ 将数据分组. ④ 列出频率分布表. ⑤ 画出频率分布直方图.其中横轴表示数据,纵轴表示频率与组距的比.
4.茎叶图 (1)制作方法:将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者 共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或 从小到大)的顺序同行列出(也可以没有大小顺序). (2)优缺点:在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以 保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是 当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一 个空间,如果数据很多,枝叶就会很长.
频率分布直方图的特征:直观、形象地反映了样本的分布规律;可以大致估计出 总体的分布.但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频
率分布直方图后,原有的具体数据信息就被抹掉了.
【做一做 2-1】 频率分布直方图中,各小矩形面积的和等于( )
A.0
B.12
C.1
D.不确定
答案:C
【做一做 2-2】 在画频率分布直方图时,某组的频数为 10,样本容量为 50, 总体容量为 600,则该组的频率是( )
相关文档
最新文档