总体分布的估计ppt
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
下表是随机抽取的近年来北京地区7月25日至 8月24日的日最高气温,得到如下样本(单位:ºC)
7月25日 至8月10 日
41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8
8月8日至 28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 8月24日 32.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3
怎样通过上表中的数据,分析比较两时间段的高温(≥33℃)状 况呢?
知识新授:
1.频数与频率
频数是指一组数据中,某范围内的数据出现 的次数;把频数除以数据的总个数,就得到频率.
2.频率分布表
当总体很大或不便于获得时,可以用样本的 频率分布估计总体的频率分布.我们把反映总体 频率分布的表格称为频率分布表.
说明:样本频率分布与总体频率分布 有什么关系?
通过样本的频数分布、频率分布可以 估计总体的频率分布.
7月25日 至8月10 日
41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8
8月8日至 28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 8月24日 32.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3
这个例子与前面问题是不同的,这里的总体可以在一个实 数区间取值,称为连续型总体.样本的频率分布表示形式有:
频率分布表和频率分布直方图
1.频率分布表
算法:
S1 计算数据中最大值与最小值的差(极差),确定全距. S2 根据全距,决定组数和组距. S3 分组:通常对组内数据所在区间取左闭右开区间,最后一组 取闭区间,且使分点比数据多一位小数. S4 登记频数,计算频率,列出频率分布表.
源自文库
168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166 S1 计算数据中最大值与最小值的差(极差),确定全距. 极差=180-151=29;取值区间[150.5,180.5]; 全距=30;
S2 根据全距,决定组数和组距.
组距和组数与数据的数量有关.一般数据较多,分的组数 也多;数据较少,分的组数也少.当数据个数在50以内,分5~8 组;当数据个数在50~100之间,分8~12组.应当注意的是如果 组内没有数据出现,就应当放宽组距,保证每个组内都有数据, 且每个数据只属于确定的一组.在决定组数时,往往不是一次 就能成功的,要有一个观察、尝试的过程,一般分点比已知数 据多一位小数,并且第一组的起点要稍稍减小.只有合理地确 定组距与组数,才能使数据分布的规律性比较明显地呈现出来;
整体介绍:
用样本的有关情况去估计总体的相应情况, 这种估计大体分为两类,一类是用样本频率分 布估计总体分布,一类是用样本的某种数字特 征(例如平均数、方差等)去估计总体的相应 数字特征。
问题引入:
国际奥委会2003年6月29日决定,2008年北京 奥运会举办的日期比原定日期推迟两周,改在8月 8日至8月24日举行.原因是7月末8月初北京地区 得气温高于8月中下旬.
频率分布表:
时间
总天数
高温天数
频率
7月25日至8月10日
17
8月8日至8月24日
17
11
0.647
2
0.118
时间 7月25日至8月10日 8月8日至8月24日
总天数
17 17
3.频率分布条形图
高温天数
11 2
频率
0.647 0.118
0.7 频率
0.6 0.5 0.4 0.3 0.2 0.1
时间
① 各长方形长条的宽度要相同. ②相邻长条的间距要适当. ③长方形长条的高度表示取各 值的频率.
一幅图胜 过一千字
7/25-8/10 8/8-8/24
引例 从某校高一年级的1002名新生中用系统抽样的方法抽取一 个容量为100的身高样本,数据如下(单位:cm).试作出该样 本的频率分布表.
168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166
总体分布的估计(1)
统计的基本思想方法:
用样本估计总体,即通常不直接去研究总体, 而是通过从总体中抽取一个样本,根据样本的 情况去估计总体的相应情况.
统计的核心问题:
如何根据样本的情况对总体的情况作出一种 推断. 这里包括两类问题:
一类是如何从总体中抽取样本?
另一类是如何根据对样本的整理、计算、分 析, 对总体的情况作出推断.
7月25日 至8月10 日
41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8
8月8日至 28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 8月24日 32.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3
怎样通过上表中的数据,分析比较两时间段的高温(≥33℃)状 况呢?
知识新授:
1.频数与频率
频数是指一组数据中,某范围内的数据出现 的次数;把频数除以数据的总个数,就得到频率.
2.频率分布表
当总体很大或不便于获得时,可以用样本的 频率分布估计总体的频率分布.我们把反映总体 频率分布的表格称为频率分布表.
说明:样本频率分布与总体频率分布 有什么关系?
通过样本的频数分布、频率分布可以 估计总体的频率分布.
7月25日 至8月10 日
41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8
8月8日至 28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 8月24日 32.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3
这个例子与前面问题是不同的,这里的总体可以在一个实 数区间取值,称为连续型总体.样本的频率分布表示形式有:
频率分布表和频率分布直方图
1.频率分布表
算法:
S1 计算数据中最大值与最小值的差(极差),确定全距. S2 根据全距,决定组数和组距. S3 分组:通常对组内数据所在区间取左闭右开区间,最后一组 取闭区间,且使分点比数据多一位小数. S4 登记频数,计算频率,列出频率分布表.
源自文库
168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166 S1 计算数据中最大值与最小值的差(极差),确定全距. 极差=180-151=29;取值区间[150.5,180.5]; 全距=30;
S2 根据全距,决定组数和组距.
组距和组数与数据的数量有关.一般数据较多,分的组数 也多;数据较少,分的组数也少.当数据个数在50以内,分5~8 组;当数据个数在50~100之间,分8~12组.应当注意的是如果 组内没有数据出现,就应当放宽组距,保证每个组内都有数据, 且每个数据只属于确定的一组.在决定组数时,往往不是一次 就能成功的,要有一个观察、尝试的过程,一般分点比已知数 据多一位小数,并且第一组的起点要稍稍减小.只有合理地确 定组距与组数,才能使数据分布的规律性比较明显地呈现出来;
整体介绍:
用样本的有关情况去估计总体的相应情况, 这种估计大体分为两类,一类是用样本频率分 布估计总体分布,一类是用样本的某种数字特 征(例如平均数、方差等)去估计总体的相应 数字特征。
问题引入:
国际奥委会2003年6月29日决定,2008年北京 奥运会举办的日期比原定日期推迟两周,改在8月 8日至8月24日举行.原因是7月末8月初北京地区 得气温高于8月中下旬.
频率分布表:
时间
总天数
高温天数
频率
7月25日至8月10日
17
8月8日至8月24日
17
11
0.647
2
0.118
时间 7月25日至8月10日 8月8日至8月24日
总天数
17 17
3.频率分布条形图
高温天数
11 2
频率
0.647 0.118
0.7 频率
0.6 0.5 0.4 0.3 0.2 0.1
时间
① 各长方形长条的宽度要相同. ②相邻长条的间距要适当. ③长方形长条的高度表示取各 值的频率.
一幅图胜 过一千字
7/25-8/10 8/8-8/24
引例 从某校高一年级的1002名新生中用系统抽样的方法抽取一 个容量为100的身高样本,数据如下(单位:cm).试作出该样 本的频率分布表.
168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166
总体分布的估计(1)
统计的基本思想方法:
用样本估计总体,即通常不直接去研究总体, 而是通过从总体中抽取一个样本,根据样本的 情况去估计总体的相应情况.
统计的核心问题:
如何根据样本的情况对总体的情况作出一种 推断. 这里包括两类问题:
一类是如何从总体中抽取样本?
另一类是如何根据对样本的整理、计算、分 析, 对总体的情况作出推断.