用样本估计总体ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.
知识探究(一):频率分布表
【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的 月均用水量如下表(单位:t):
.
1.5.1 用样本估计总体
.
1、知识与技能: (1) 通过实例体会分布的意义和作用.(2)在表示样本数据 的过程中,学会列频率分布表,画频率分布直方图、频率折 线图和茎叶图.(3)通过实例体会频率分布直方图、频率折线 图、茎叶图的各自特征,从而恰当地选择上述方法分析样本 的分布,准确地做出总体估计. 2、过程与方法: 通过对现实生活的探究,感知应用数学知识解决问题的方法, 理解数形结合的数学思想和逻辑推理的数学方法. 3、情感态度与价值观: 通过对样本分析和总体估计的过程,感受数学对实际生活的 需要,认识到数学知识源于生活并指导生活的事实,体会数 学知识与现实世界的联系.
.
思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么?
0.2~4.3
思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
(4.3-0.2)÷0.5=8.2 .
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?
问题提出
1.随机抽样有哪几种基本的抽样方法?
简单随机抽样、系统抽样、分层抽样.
2.从前面的分析可以知道,当研究一个对象时,如果 能得到他们的全部数据(可以看作是总体),我们就 可以直接从中分析总体的各种信息.如人口普查得到 的数据较为全面,从中可以很好地反映对象的重要信 息.但是,在实际问题中,总体的信息往往不能全部 得到,因此我们需要进行抽样调查,从总体中抽取一 部分作为样本,并用样本的各种信息来估计总体的情 况,包括它的分布和基本数字特征.
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格. (频数=样本数据落在各小组内的个数, 频率=频数÷样本容量. )
知识探究(二):频率分布直方图
思考1:为了直观反映样本数据在各组中 的分布情况,我们将上述频率分布表中 的有关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
用样本的频率分布估计总体分布.
.
思考6:如果市政府希望85%左右的居民每月 的用水量不超过标准,根据上述频率分布表, 你对制定居民月用水量标准(即a的取值) 有何建议?
88%的居民月用水量在3t以下,可建议取a=3.
思考7:在实际中,取a=3t一定能保证85%以 上的居民用水不超标吗?哪些环节可能会导 致结论出现偏差?
合计
频数累计
பைடு நூலகம்
频数
4
正
8
正正正
15
正 正 正 正 22
正 正 正 正 正 25
正正
14
正一
6
4
2
100
.
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00
思考5:上表称为样本数据的频率分布表, 由此可以推测该市全体居民月均用水量 分布的大致情况,给市政府确定居民月 用水量标准提供参考依据,这里体现了 一种什么统计思想?
.
思考2:频率分布直方图中各小长方形的 面积表示什么?各小长方形的面积之和 为多少?
[0,0.5),[0.5,1),[1,1.5), …,[4,4.5].
思考4:如何统计上述100个数据在各组 中的频数?如何计算样本数据在各组中 的频率?你能将这些数据用表格反映出 来吗?
.
分组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5]
.
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
分组时,组距的大小可能会导致结论出现偏 差,实践中,对统计结论是需要进行评价的.
.
思考8:对样本数据进行分组,其组数 是由哪些因素确定的?
了解:对样本数据进行分组,组距的确定没 有固定的标准,组数太多或太少,都会影响 我们了解数据的分布情况.数据分组的组数与 样本容量有关,一般样本容量越大,所分组 数越多.按统计原理,若样本的容量为n,分
组数一般在(1+3.3lgn)附近选取.当样本容
量不超过100时,按照数据的多少,常分成 5~12组.若以0.1或1.5为组距对上述100个样 本数据分组合适吗? .
思考10:一般地,列出一组样本数据的频率 分布表可以分哪几个步骤进行? 第一步,求极差. (极差=样本数据中最大值与最小值的差)
第二步,决定组距与组数. (设k=极差÷组距,若k为整数,则组 数=k,否则,组数=k+1)
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
.
月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
上图称为频率分布直方图,其中横轴表 示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高度 在数量上有何特点?
知识探究(一):频率分布表
【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的 月均用水量如下表(单位:t):
.
1.5.1 用样本估计总体
.
1、知识与技能: (1) 通过实例体会分布的意义和作用.(2)在表示样本数据 的过程中,学会列频率分布表,画频率分布直方图、频率折 线图和茎叶图.(3)通过实例体会频率分布直方图、频率折线 图、茎叶图的各自特征,从而恰当地选择上述方法分析样本 的分布,准确地做出总体估计. 2、过程与方法: 通过对现实生活的探究,感知应用数学知识解决问题的方法, 理解数形结合的数学思想和逻辑推理的数学方法. 3、情感态度与价值观: 通过对样本分析和总体估计的过程,感受数学对实际生活的 需要,认识到数学知识源于生活并指导生活的事实,体会数 学知识与现实世界的联系.
.
思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么?
0.2~4.3
思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
(4.3-0.2)÷0.5=8.2 .
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?
问题提出
1.随机抽样有哪几种基本的抽样方法?
简单随机抽样、系统抽样、分层抽样.
2.从前面的分析可以知道,当研究一个对象时,如果 能得到他们的全部数据(可以看作是总体),我们就 可以直接从中分析总体的各种信息.如人口普查得到 的数据较为全面,从中可以很好地反映对象的重要信 息.但是,在实际问题中,总体的信息往往不能全部 得到,因此我们需要进行抽样调查,从总体中抽取一 部分作为样本,并用样本的各种信息来估计总体的情 况,包括它的分布和基本数字特征.
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格. (频数=样本数据落在各小组内的个数, 频率=频数÷样本容量. )
知识探究(二):频率分布直方图
思考1:为了直观反映样本数据在各组中 的分布情况,我们将上述频率分布表中 的有关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
用样本的频率分布估计总体分布.
.
思考6:如果市政府希望85%左右的居民每月 的用水量不超过标准,根据上述频率分布表, 你对制定居民月用水量标准(即a的取值) 有何建议?
88%的居民月用水量在3t以下,可建议取a=3.
思考7:在实际中,取a=3t一定能保证85%以 上的居民用水不超标吗?哪些环节可能会导 致结论出现偏差?
合计
频数累计
பைடு நூலகம்
频数
4
正
8
正正正
15
正 正 正 正 22
正 正 正 正 正 25
正正
14
正一
6
4
2
100
.
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00
思考5:上表称为样本数据的频率分布表, 由此可以推测该市全体居民月均用水量 分布的大致情况,给市政府确定居民月 用水量标准提供参考依据,这里体现了 一种什么统计思想?
.
思考2:频率分布直方图中各小长方形的 面积表示什么?各小长方形的面积之和 为多少?
[0,0.5),[0.5,1),[1,1.5), …,[4,4.5].
思考4:如何统计上述100个数据在各组 中的频数?如何计算样本数据在各组中 的频率?你能将这些数据用表格反映出 来吗?
.
分组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5]
.
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
分组时,组距的大小可能会导致结论出现偏 差,实践中,对统计结论是需要进行评价的.
.
思考8:对样本数据进行分组,其组数 是由哪些因素确定的?
了解:对样本数据进行分组,组距的确定没 有固定的标准,组数太多或太少,都会影响 我们了解数据的分布情况.数据分组的组数与 样本容量有关,一般样本容量越大,所分组 数越多.按统计原理,若样本的容量为n,分
组数一般在(1+3.3lgn)附近选取.当样本容
量不超过100时,按照数据的多少,常分成 5~12组.若以0.1或1.5为组距对上述100个样 本数据分组合适吗? .
思考10:一般地,列出一组样本数据的频率 分布表可以分哪几个步骤进行? 第一步,求极差. (极差=样本数据中最大值与最小值的差)
第二步,决定组距与组数. (设k=极差÷组距,若k为整数,则组 数=k,否则,组数=k+1)
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
.
月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
上图称为频率分布直方图,其中横轴表 示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高度 在数量上有何特点?