2.2用样本估计总体(一)精编版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

①采用抽样调查的方 式获得样本数据
②分你析认为样,本为数了据较来为估 计全合市理地居确民定用出水这量个的 分布标情准,况需要做哪些
工作?
下表给出100位居民的月均用水量表
根据这些数据 你能得出用水 量其他信息吗?
讨论:如何分 析数据?
分析数据的一种基本方法是用图将它们画出来,或者 用紧凑的表格改变数据的排列方式,作图可以达到两 个目为的此,我们一要是对从这数些据数中据提进行取整信理息与,分二析是利用图形传递 信息。表格则是通过改变数据的构成形式,为我们提 供解释数据的新方式
分布直方图,如右,由于不慎将部分数据丢失,
但知道前 4 组的频数成等比数列,后 6 组的频数
频率
组成距 等差数列,设最大频率为 a,视力在 4.6 到 5.0
之间的学生数为 b,则 a,b 的值分别为( A )
A. 0.27,78
频率/组距
ຫໍສະໝຸດ Baidu
B. 0.27,83
C. 2.7,78
0.3
D. 2.7,83
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率分布直方图的特征: 1.频率分布直方图频率分布表更直观 地反映了样本的分布规律. 2.从频率分布直方图得不出原始的数 据内容,把数据表示成直方图后, 原有的具体数据信息就被抹掉了。
如果当地政府希望使85%以上的居民每 月的用水量不超出标准,根据频率分布表2-2 和频率分布直方图2.2-1, 你能对制定月用水量标准提出建议吗 ?
一、用样本的频率分布估计总体的分布 频率分布表、频率分布直方图、 频率折线图、茎叶图
二、用样本的数字特征估计总体的特征 平均数、中位数、众数、 极差、方差、标准差
探究:
我国是世界上严重缺水 的国家之一,城市缺水 问题较为突出,某市政 府为了节约生活用水, 计划在本市试行居民生 活用水定额管理,即确 定一个居民月用水量标 准a,用水量不超过a的 部分按平价收费,超出 a的部分按议价收费。 如果希望大部分居民的 日常生活不受影响,那 么标准a定为多少比较 合理呢 ?
88%的居民月用水量在3t以下, 可建议取a=3.
小结:
画频率分布直方图的步骤: 第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (强调取整)
组距:指每个小组的两个端点的距离 组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
第三步: 将数据分组 ( 给出组的界限) 第四步: 列频率分布表. (包括分组、频数、频率、频 率/组距) 第五步: 画频率分布直方图(在频率分布表的基础上 绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.)
复习回顾
1.抽样方法有哪些?
抽样方法系简单统随抽机样抽样随抽机签数(抓法阄) 分层抽样
2.三种抽样方式比较
类别 简单随机 抽样
系统 抽样
分层抽样
共同点
1.不放 回抽样
2.抽样过 程中,每 个个体 被抽取 的机会 均等
各自特点 相互联系
从总体中 逐个抽取
将总体均分为 几部分,按简单 随机抽样抽取 第一个样本, 然后按相同的 间隔抽取其他 样本
初中我们曾经学过频数分布图和频数分 布表,这使我们能够清楚地知道数据分 布在各个小组的个数。下面将要学习的 频率分布图和频率分布表,则是从各个 小组数据在样本容量中所占比例大小的 角度,来表示数据分布的规律。它可以 使我们看到整个样本数据的频率分布情 况。
一、频率分布直方图
〈一〉频率分布的概念: 频率分布是指一个样本数据在各个小范围 内所占比例的大小。一般用频率分布直方 图反映样本的频率分布
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
简单随机抽样
2、从2004名同学中,抽取一个容量为20的样本
系统抽样
3、某中学有180名教工,其中业务人员136名, 管理人员20名,后勤人员24名,从中抽取一个 容量为15的样本。
分层抽样
抽样是统计的第一步, 接下来就要对样本进行分析。
如何从样本数据中提取基本信 息来估计总体的情况呢?
2.2 用样本估计总体
注意
(1)第几组频率
第几组频数 样本容量
(2)纵坐标为:
频率 组距
练习:
例 某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比例 约是多少.
月均用 水量/t
ab
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1
第二步: 决定组距与组数: (注意取整) 当样本容量不超过100时, 按照数据的多少, 常
分成5~12组.
为方便组距的选择应力求“取整”.
本题如果组距为0.5(t).

组数=
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
(1)极差为67-28=39,取组距为5,分为8组.
样本频率分布表:
分组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67)
合计
频数 3 3 9 16 7 5 4 3 50
频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
则在[2500,3000](元)月收入段应抽出___2__5__人.
0.0005 0.0004 0.0003 0.0002 0.0001
频率/组距
月收入(元)
1000 1500 2000 2500 3000 3500 4000
课堂练习
3.为了解某校高三学生的视力情况,随机地抽
查了该校 100 名高三学生的视力情况,得到频率
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
0.1
4.3 4.5 4.7 4.9 5.1
视力
频率分布直方图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
频率分布折线图
由于样本是随机的,不同的样本的 得到的频率分布折线图不同,即使对于 同一样本,不同的分组情况得到的频率 分布折线图也不同,频率分布折线图是 随着样本的容量和分组情况的变化而变 化的。
抽取第一 个样本时 采用简单 随机抽样
适用范围
总体中的个 体数较少
总体中的个体 数较多 (间隔相同的 时间或距离)
将总体分成 几层,分层 进行抽取
各层抽样时,
采用简单随 总体由差异
机抽样或系 明显的几部
统抽样
分组成
练习:在下列问题中,各采用什么抽样 方法抽取样本较合适?
1、从20台电脑中抽取4台进行质量检测;
极差 组距
4.1 0.5
8.2
所以将数据分成9组较合适.
第三步: 将数据分组:( 给出组的界限)
[0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5) 共9组.
第四步: 列频率分布表.
分组
频数
频率
[0-0.5)
4
0.04
[0.5-1)
8
0.08
[1-1.5)
15
0.15
[1.5-2)
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67 年龄
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
课堂练习
2.(2006年全国卷II)一个社会调查机构就某地居民 的月收入调查了10 000人,并根据所得数据画了样 本的频率分布直方图(如下图).为了分析居民的收入 与年龄、学历、职业等方面的关系,要从这10 000 人中再用分层抽样方法抽出100人作进一步调查,
22
0.22
[2-2.5)
25
0.25
[2.5-3)
15
0.15
[3-3.5)
5
0.05
[3.5-4)
4
0.04
[4-4.5)
2
0.02
合计
100
1
组距=0.5
频率/组距
0.08 0.16
0.3 0.44 0.5 0.3 0.1 0.08 0.04 2.00
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
利用样本频分布对总体分布进行相应估计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢?
(2)样本容量越大,这种估计越精确。
(3)当样本容量无限增大,组距无限缩小, 那么频率折线图就会无限接近于一条光滑曲
线——总体密度曲线。
总体密度曲线
频率 组距
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
第五步: 画出频率分布直方图.
频率/组距 (组距=0.5)
0.6
0.5请大家阅读第
0.5
0.46哪8页些,优直点方和图缺有 0.44
0.3
点? 0.3
0.3
小月长均方用形水的量面居 民积人积总数=和最?=多? 的 在哪个区间?
0.2
0.16
0.1 0.08
0.1 0.08 0.04
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同.不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断.分 别以1和0.1为组距重新作图,然后谈谈你对图的印象.
并非所有的总体都存在密度曲线,如一些离散型总体 不能由样本折线图得到准确的总体密度曲线
相关文档
最新文档