高中数学 2.2.1《用样本的频率分布估计整体分布》》课件1 新人教A版必修3
合集下载
高中数学(人教版A版必修三)配套课件:2.2.1用样本的频率分布估计总体分布(一)
小长方形的面积 来表示,各小长方形的面积的总和等于 1 .
答案
返回
题型探究
重点难点 个个击破
类型一 利用原始数据绘制频率分布表
例1 从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为 100的身高样本,如下(单位:cm).作出该样本的频率分布表,并估计身高 不小于170(cm)的同学所占的百分率.
40,0.125,则n的值为( B )
A.640
B.320
C.240
D.160
解析 依题意得4n0=0.1125,∴n=0.41025=320.
解析答案
1 2345
3.在第十六届亚运会中,各个国家和地区金牌获得情况统计如图:
从图中可以看出中国所获得金牌数占全部金牌数的比例约是( A )
A.41.7%
百分比为4415×100%≈91%.
解析答案
规律与方法
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布 是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布 直方图去估计总体的分布. 2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用 紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通 过作图既可以从数据中提取信息,又可以利用图形传递信息. 3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容 量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整 个样本数据的频率分布情况,并由此估计总体的分布情况.
新知探究 点点落实
答案
知识点二 数据分析的基本方法 思考 通过抽样获得的原始数据有什么缺点? 答案 因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们 的含义,并提取信息,也不便于我们用它来传递信息. (1)借助于图形 分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的, 一是从数据中提取信息,二是利用图形传递 信息. (2)借助于表格 分析数据的另一种方法是用紧凑的表格 改变数据的排列方式,此方法是通 过改变数据的构成形式 ,为我们提供解释数据的新方式.
【课件】新课标人教A版数学必修3:2.2.1用样本的频率分布估计总体分布课件
频率分布
样本中所有数据(或数据组)的频数和样 本容量的比,叫做该数据的频率.
所有数据(或数据组)的频数的分布变化 规律叫做样本的频率分布.
频率分布的表示形式有: ①样本频率分布表 ②样本频率分布条形图 ③样本频率分布直方图
2.2.1用样本的频率分布 估计总体分布(1)
我国的缺水情况
• 我国是世界上严重缺水的国家之一。
茎叶图
甲
乙
8 463 368 389
1
0 1 25 2 54 3 1 61679 4 49 50
注:中间的数字表示得分的十位数字。
旁边的数字分别表示两个人得分的 个位数。
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上 没有原始数据信息的损失;二是茎叶图中的数据可 以随时记录,随时添加,方便记录与表示;
极差 组距
4.1 0.5
8.2
3.将数据分组(8.2取整,分为9组)
4.列出频率分布表.
5.画出频率分布直方图
画频率分布直方图
步骤:
1.求极差: 4.3 - 0.2 = 4.1
2.决定组距与组数:组数=
极差 组距
=
4.1 0.5
= 8.2
3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
组距0.5
0.6 0.5 0.4 0.3 0.2 0.1
0 123456789
组距0.5
0.6 0.5 0.4 组距0.5 0.3 0.2 0.1
0 123456789
组距0.5
所得到的结论的统计意义
• 3t这个标准一定能保证85%以上的居民用水 不超标吗?
• 不一定! • 原因1、样本只是总体的代表,并且具有随
高中数学 2.2.1-1用样本的频率分布估计整体分布 新人教A版必修3
ppt课件
ppt课件
知识探究(一):频率分布表
【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的 月均用水量如下表(单位:t):
ppt课件
思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么?
0.2~4.3
思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
(4.3-0.2)÷0.5=8.2 ppt课件
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?
组数一般在(1+3.3lgn)附近选取.当样本容
量不超过100时,按照数据的多少,常分成 5~12组.若以0.1或1.5为组距对上述100个样 本数据分组合适吗? ppt课件
思考10:一般地,列出一组样本数据的频率 分布表可以分哪几个步骤进行?
第一步,求极差. (极差=样本数据中最大值与最小值的差)
用样本的频率分布估计总体分布.
ppt课件
思考6:如果市政府希望85%左右的居民每月 的用水量不超过标准,根据上述频率分布表, 你对制定居民月用水量标准(即a的取值) 有何建议?
88%的居民月用水量在3t以下,可建议取a=3.
思考7:在实际中,取a=3t一定能保证85%以 上的居民用水不超标吗?哪些环节可能会导 致结论出现偏差?
合计
频数累计
频数
4
正
ppt课件
知识探究(一):频率分布表
【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的 月均用水量如下表(单位:t):
ppt课件
思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么?
0.2~4.3
思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
(4.3-0.2)÷0.5=8.2 ppt课件
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?
组数一般在(1+3.3lgn)附近选取.当样本容
量不超过100时,按照数据的多少,常分成 5~12组.若以0.1或1.5为组距对上述100个样 本数据分组合适吗? ppt课件
思考10:一般地,列出一组样本数据的频率 分布表可以分哪几个步骤进行?
第一步,求极差. (极差=样本数据中最大值与最小值的差)
用样本的频率分布估计总体分布.
ppt课件
思考6:如果市政府希望85%左右的居民每月 的用水量不超过标准,根据上述频率分布表, 你对制定居民月用水量标准(即a的取值) 有何建议?
88%的居民月用水量在3t以下,可建议取a=3.
思考7:在实际中,取a=3t一定能保证85%以 上的居民用水不超标吗?哪些环节可能会导 致结论出现偏差?
合计
频数累计
频数
4
正
高中数学第二章统计2.2.1用样本的频率分布估计总体分布A版一等奖公开课ppt课件
0.22
25
0.25
14
0.14
6
0.06
4
0.04
2
0.02
100
1.00
二、频率分布直方图 【问题思考】 1.数据分析的基本方法有哪两种? 提示(1)借助于表格:分析数据的一种方法是用紧凑的表格改变 数据的排列方式,此法是通过改变数据的呈现形式,为我们提供解 释数据的依据. (2)借助于图形:分析数据的另一种基本方法是用图将它们画出 来,此法可以达到两个目的,一是从数据中提取信息,二是利用图形 传递信息.
2.为了直观反映样本数据在各组中的分布情况,你能根据上述所 列频率分布表画出频率分布直方图吗?
提示频率分布直方图为:
3.样本数据的频率分布直方图是根据频率分布表画出来的,频率 分布直方图的作图步骤如何?
提示第一步,作出平面直角坐标系. 第二步,在横轴上均匀地标出各组分点,在纵轴上标出单位长度. 第三步,以组距为宽,各组的频率与组距的比值为高,分别画出各 组对应的小长方形.
提示 2.你认为频率分布折线图能大致反映样本数据的频率分布吗? 提示因为折线图是取了长方形上端的中点,即每一组数据平均值 对应的频率,所以能大致反映样本数据的频率分布.
3.当总体中的个体数很多时(如抽样调查全国城市居民月均用水 量),随着样本容量增加,作图时所分的组数增多,组距减少,你能想象 出相应的频率分布折线图会发生什么变化吗?
2.由于城市住户较多,为了了解全市居民日常用水量的整体分布 情况,应采用怎样的方法?
提示采用抽样调查的方式,通过分析样本数据来估计全市居民用 水量的分布情况.
3.假如通过抽样调查,我们获得100位居民某年的月均用水量如 下(单位:t):
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 上述100个数据中的最大值和最小值分别是什么?由此说明样本 数据的变化范围是什么? 提示最大值是4.3 t,最小值是0.2 t,数据的变化范围为4.1 t.
人教A版高中数学必修用样本的频率分布估计总体分布PPT课件
抽样特征
从总体中 逐个不放 回抽取
将总体分 成均衡几 部分,按 规则关联 抽取
相互联系 适应范围
总体中 的个体 数较少
人教A版高中数学必修3第二章 2.2.1 用样本的频率分布估计总体分布( 共65张 PPT)
方法 类别
共同 特点
简单随 机抽样
系统 抽样
分层 抽样
抽样过 程中每 个个体 被抽取 的概率 相等
抽样特征
从总体中 逐个不放 回抽取
相互联系 适应范围
方法
共同
类别
特点
简单随 机抽样
系统 抽样
分层 抽样
抽样过 程中每 个个体 被抽取 的概率 相等
抽样特征
从总体中 逐个不放 回抽取
相互联系 适应范围
总体中 的个体 数较少
方法
共同
类别
特点
简单随 机抽样
系统 抽样
分层 抽样
抽样过 程中每 个个体 被抽取 的概率 相等
总体中 的个体 数较少
总体中 的个体 数较多
将总体分 成几层, 按比例分 层抽取
人教A版高中数学必修3第二章 2.2.1 用样本的频率分布估计总体分布( 共65张 PPT)
人教A版高中数学必修3第二章 2.2.1 用样本的频率分布估计总体分布( 共65张 PPT)
方法 类别
共同 特点
简单随 机抽样
方法
共同
类别
特点
简单随 机抽样
抽样特征 相互联系 适应范围
系统 抽样
分层 抽样
方法
共同
类别
特点
简单随 机抽样
系统 抽样
分层 抽样
抽样过 程中每 个个体 被抽取 的概率 相等
高中数学 用样本频率分布估计总体分布(1)课件 新人教A版必修3
0.5 1 1.5 2 2.5 3 3.5 4 0.14 4.5 0.06 月平均用水量/t
正 6
正正
14
[3.5,
4) [4, 4.5] 合计 丅
4
0.04 0.02
2
100
1
4.列频率分布表
分 组 [0, 0.5) [0. 正 8 频数累计(划 记) 4 0.04 0.08 0.15 0.22 [1, 1.5) [1. 正正正正丅 22 正正正 15 0.25 0.14 频数 频率 频率/组 距 0.08 0.16 0.3 0.44 0.5 0.28 0.12 0.08 0.04
频数
[0,
4
[0.5,
正
8
[1,
正正正
15
[1.5, 2) [2, 2.5) [2.5, 3) [3, 3.5) [3.5, 4) [4, 4.5] 合计
正正正正丅
22
正正正正正
25
正正
14
正
6
4
丅
2
100
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
分组
频数累计(划记)
3 .1 3 .4 3 .2 3 .3 3 .8 2 .7 2 .6 2 .5 2 2 2 .0 2 .2 2 .3 2 .3 2 .2 2 .1 2 .7 1 .2 2 .6 1 .3 1 .0 2 .5 1 .2 1 .6 3 2 .5 1 .2 1 .7 3 .7 1 1 .0 1 .2 3 .5 1 .6 0 1 .6 0 .4 1 .5 0 .1 4 1 .8 0 .3 0 .8 4 1 .9 0 .4 3 1 .6 0 1
2.2.1用样本的频率分布 估计总体分布
高中数学 2.2.1 用样本的频率分布估计总体分布课件1 新人教A版必修3
(1)列出学生参加运动队的频率分布表.
(2)画出频率分布条形图. 解 (1)参加足球队记为 1,参加篮球队记为 2,参加排球队记为 3,参加乒乓球队记为 4,
得频率分布表如下:
试验结果
频数 频率
参加足球队(记为 1) 30
0.30
参加篮球队(记为 2) 27
0.27
参加排球队(记为 3) 23
0.23
[157.5,161.5) 6 0.15
[161.5,165.5) 9 0.225
[165.5,169.5) 14 0.35
[169.5,173.5) 3 0.075
[173.5,177.5) 3 0.075
[177.5,181.5] 1 0.025
合计
40
1
第十八页,共37页。
探要点 (yàodiǎn)、究
第七页,共37页。
探要点 (yàodiǎn)、究
探所究然 点一:频率分布
表
思考 2 为了了解全市居民日常用水量的整体分布情况,用怎样的方法了解? 答 采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.
第八页,共37页。
探要点
探表(究y究à所o然点diǎ一n:)、频率分布
例 1 从某校高一年级的 1 002 名新生中用系统抽样的方法抽取一个容量为 100 的身高样 本,如下(单位:cm).作出该样本的频率分布表,并估计身高不小于 170(cm)的同学所 占的百分率. 168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 170 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162
高中数学 2.2.1 用样本的频率分布估计总体分布课堂教学课件1 新人教A版必修3
4、画频率分布表
第五页,共26页。
一、频率(pínlǜ)分布
表 4、画频率(pínlǜ)分布
表 55名12岁男生身高的频率(pínlǜ)分布
表
分组
频数
频率
[125.45 ,130.45)
6
[130.45, 135.45)
7
[135.45, 140.45)
14
[140.45, 145.45)
17
[145.45, 150.45)
第十一页,共26页。
四、总体密度(mìdù ) 反映了总体曲分线布,即反映了总体在各个范围内取值的
百分比
频率 组距
身高
ab
(shē
(图中阴影部分的面积(miàn jī),表示总nɡ体āo)
在区间 (a, b) 内取值的百分比)。
第十二页,共26页。
说明:总体密度(mìdù)曲线是客观存在的,但在实际中, 我们只能用样本来估计。由于样本是随机的,不同的样 本得到的频率分布折线图不同;即使是同一样本,不同 的分组得到的频率分布折线图也不同。
第八页,共26页。
二、频率分布直方图 画频率分布直方图的一般(yībān)步骤: 1、求极差(最大值与最小值的差) 2、决定(jué dìng)组距与组数(将数据 分组)
组数=极差/组距
当样本容量不超过(chāoguò)100时,组数一般为 5~12组
3、将数据分组 4、画频率分布表 5、画频率分布直方图
第九页,共26页。
三、频率(pínlǜ)分布折 线图
频率
组距
0.02 0.01
125.45 130.45
第十页,共26页。
身高
160.45
四、总体密度 (mìdù )曲线 随着样本容量的增加,作图时所分的组数 增加,组距减小,相应的频率(pínlǜ)折线 图会越来越接近于一条光滑曲线,统计中 称这条光滑曲线为总体密度曲线。
第五页,共26页。
一、频率(pínlǜ)分布
表 4、画频率(pínlǜ)分布
表 55名12岁男生身高的频率(pínlǜ)分布
表
分组
频数
频率
[125.45 ,130.45)
6
[130.45, 135.45)
7
[135.45, 140.45)
14
[140.45, 145.45)
17
[145.45, 150.45)
第十一页,共26页。
四、总体密度(mìdù ) 反映了总体曲分线布,即反映了总体在各个范围内取值的
百分比
频率 组距
身高
ab
(shē
(图中阴影部分的面积(miàn jī),表示总nɡ体āo)
在区间 (a, b) 内取值的百分比)。
第十二页,共26页。
说明:总体密度(mìdù)曲线是客观存在的,但在实际中, 我们只能用样本来估计。由于样本是随机的,不同的样 本得到的频率分布折线图不同;即使是同一样本,不同 的分组得到的频率分布折线图也不同。
第八页,共26页。
二、频率分布直方图 画频率分布直方图的一般(yībān)步骤: 1、求极差(最大值与最小值的差) 2、决定(jué dìng)组距与组数(将数据 分组)
组数=极差/组距
当样本容量不超过(chāoguò)100时,组数一般为 5~12组
3、将数据分组 4、画频率分布表 5、画频率分布直方图
第九页,共26页。
三、频率(pínlǜ)分布折 线图
频率
组距
0.02 0.01
125.45 130.45
第十页,共26页。
身高
160.45
四、总体密度 (mìdù )曲线 随着样本容量的增加,作图时所分的组数 增加,组距减小,相应的频率(pínlǜ)折线 图会越来越接近于一条光滑曲线,统计中 称这条光滑曲线为总体密度曲线。
高一数学 2.2.1 用样本的频率分布估计总体分布课件 新人教A版必修2
解:(1)频率分布表如下:
区间人数 [122,126) [126,130) [130,134) [134,138) [138,142)
人数 5 8 10 22 33
频率
1 24
1 15
1 12
11 60 11 40
续表
[142,146)
20
1
6
[146,150)
11
11
120
[150,154)
6
解:(1)
题型四 频率直方图的应用 例4:为了解电视对生活的影响,一个社会调查机构就平均每天 看电视的时间对某地居民调查了10000人,并根据所得数据画 出样本的频率分布直方图(如图),为了分析该地居民平均每天 看电视的时间与年龄、学历、职业等方面的关系,要从10000人 中再用分层抽样方法抽出100人做进一步调查,则在[2.5,3](小 时)时间段内应抽出的人数是( )
2.下列叙述中正确的是( ) A.从频率分布表可以看出样本数据对于平均数的波动大小 B.频数是指落在各个小组内的数据 C.每小组的频数与样本容量之比是这个小组的频率 D.组数是样本平均数除以组距 解析:由频率的意义知,选项C正确. 答案:C
3.频率分布直方图中,小长方形的面积等于( )
A.相应各组的频数
寿命(h) 100~200 200~300 300~400 400~500 500~600
合计
频数 20
30 80 40 30 200
频率 0.10
0.15 0.40 0.20 0.15
1
(2)频率分布直方图如下图:
3电子元件寿命在400 h以上的百分比为 40 30 35%.
200
题型三 茎叶图 例3:某赛季甲、乙两名篮球运动员每场比赛的得分情况如下: 甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50; 乙的得分:8,13,14,16,23,26,28,33,38,39,51. (1)画出甲、乙两名运动员得分数据的茎叶图; (2)根据茎叶图分析甲、乙两运动员的水平. 分析:按照作茎叶图的方法首先画出茎叶图,然后分析.
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
2
3
4
5 月均用水量/t
思考1:在频率分布直方图中,依次连接 各小长方形上端的中点,就得到一条折 线,这条折线称为频率分布折线图. 你 认为频率分布折线图能大致反映样本数 据的频率分布吗?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
思考5:上表称为样本数据的频率分布表, 由此可以推测该市全体居民月均用水量 分布的大致情况,给市政府确定居民月 用水量标准提供参考依据,这里体现了 一种什么统计思想?
用样本的频率分布估计总体分布.
思考6:如果市政府希望85%左右的居民每 月的用水量不超过标准,根据上述频率分 布表,你对制定居民月用水量标准(即a的 取值)有何建议? 88%的居民月用水量在3t以下,可建议取a=3. 思考7:在实际中,取a=3t一定能保证85%以 上的居民用水不超标吗?哪些环节可能会导 致结论出现偏差? 分组时,组距的大小可能会导致结论出现偏 差,实践中,对统计结论是需要进行评价的.
(4.3-0.2)÷0.5=8.2
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?
[0,0.5),[0.5,1),[1,1.5), „,[4,4.5].
思考4:如何统计上述100个数据在各组 中的频数?如何计算样本数据在各组中 的频率?你能将这些数据用表格反映出 来吗?
理论迁移
例1 某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比例 约是多少.
3.1 3.4 3.2 3.3 3.2 3.0 2.5 2.6 2.5 2.8
2.5 2.6 2.7 2.8 2.9 2.9 2.8 2.7 2.6 2.5
2.0 2.2 2.3 2.3 2.4 2.4 2.3 2.4 2.3 2.2
2.0 2.2 2.1 2.2 2.3 2.4 2.3 2.1 2.1 2.0
4 3 3
6 6 8
1
6
7
9
思考1:你能理解这个图是如何记录这些数 据的吗?你能通过该图说明哪个运动员的发 挥更稳定吗?
甲
乙 8 3 8 9 1 0 1 2 3 4 5 2 5 1 4 0 5 4 6 9
4 3 3
6 6 8
1
6
7
9
思考2:在统计中,上图叫做茎叶图,它 也是表示样本数据分布情况的一种方法, 其中“茎”指的是哪些数,“叶”指的 是哪些数?
第三步,将各个数据的叶按大小次序写 在茎右(左)侧.
思考5:用茎叶图表示数据的分布情况是一种 好方法,你认为茎叶图有哪些优点?
(1)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改.
思考7:对任意一组样本数据,是否都适合用 茎叶图表示?为什么?
不适合样本容量很大或茎、叶不分明的样本 数据.
思考9一般地,列出一组样本数据的频率分布 表可以分哪几个步骤进行? 第一步,求极差. (极差=样本数据中最大值与最小值的差) 第二步,决定组距与组数. (设k=极差÷组距,若k为整数,则组 数=k,否则,组数=k+1)
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格. (频数=样本数据落在各小组内的个数, 频率=频数÷样本容量)
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少; (3)居民月均用水量的分布有一定的对称性等.
思考4:样本数据的频率分布直方图是 根据频率分布表画出来的,一般地,频 率分布直方图的作图步骤如何? 第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点, 在纵轴上标出单位长度.
思考2:当总体中的个体数很多时(如抽 样调查全国城市居民月均用水量),随 着样本容量的增加,作图时所分的组数 增多,组距减少,你能想象出相应的频 率分布折线图会发生什么变化吗?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
频率 组距
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
各小长方形的面积=频率 各小长方形的面积之和=1
思考3:频率分布直方图非常直观地表明 了样本数据的分布情况,使我们能够看 到频率分布表中看不太清楚的数据模式, 但原始数据不能在图中表示出来.你能根 据上述频率分布直方图指出居民月均用 水量的一些数据特点吗?
思考8:对样本数据进行分组,组距的确定没 有固定的标准,组数太多或太少,都会影响 我们了解数据的分布情况.数据分组的组数与 样本容量有关,一般样本容量越大,所分组 数越多.按统计原理,若样本的容量为n,分 组数一般在(1+3.3lgn)附近选取.当样本容 量不超过100时,按照数据的多少,常分成 5~12组.若以0.1或1.5为组距对上述100个样 本数据分组合适吗?
2.2
用样本估计总体
2.2.1用样本的频率分布估计总体分布
问题提出
1.随机抽样有哪几种基本的抽样方法?
简单随机抽样、系统抽样、分层抽样. 2.随机抽样是收集数据的方法,如何通 过样本数据所包含的信息,估计总体的 基本特征,即用样本估计总体,是我们 需要进一步学习的内容.
3.高一某班有50名学生,在数学必 修②结业考试后随机抽取10名,其考试 成绩如下: 82, 75, 61, 93, 62, 55, 70, 68, 85, 78. 如果要求我们根据上述抽样数据, 估计该班对数学模块②的总体学习水平, 就需要有相应的数学方法作为理论指导, 本节课我们将学习用样本的频率分布估 计总体分布.
不存在,因为组距不能任意缩小.
探究(三):茎叶图
频率分布表、频率分布直方图和折 线图的主要作用是表示样本数据的分布 情况,此外,我们还可以用茎叶图来表 示样本数据的分布情况.
【问题】 某赛季甲、乙两名篮球运动员每场比赛 的得分情况如下: 甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44, 36,15,37,25,36,39. 助教在比赛中将这些数据记录为如下形式:
思考3:对于样本数据:3.1,2.5,2.0, 0.8,1.5,1.0,4.3,2.7,3.1,3.5, 用茎叶图如何表示? 茎 0 1 2 3 4 叶 8 0 5 0 5 7 1 1 5 3
思考4:一般地,画出一组样本数据的茎 叶图的步骤如何?
第一步,将每个数据分为“茎”(高位) 和“叶”(低位)两部分; 第二步,将最小的茎和最大的茎之间的 数按大小次序排成一列
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67 年龄
(3)因为0.06+0.16+0.32+0.16=0.68, 故年龄在32~52岁的知识分子约占68%.
例2 在某小学500名学生中随机抽样得到 100人的身高如下表(单位cm) :
(1)极差为67-28=39,取组距为5,分为8组.
样本频率分布表: 分 组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67] 合 计 频数 3 2 8 16 8 5 4 4 50 频率 0.06 0.04 0.16 0.32 0.16 0.10 0.08 0.08 1.00
O
宽度:组距
高度:
频率 组距
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的宽和 高度在数量上有何特点?
思考2:频率分布直方图中各小长方形的 面积表示什么?各小长方形的面积之和 为多少?
1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6
1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2
思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么? 0.2~4.3
思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
第三步,以组距为宽,各组的频率与 组距的商为高,分别画出各组对应的 小长方形.
思考5:对一组给定的样本数据,频率分 布直方图的外观形状与哪些因素有关? 在居民月均用水量样本中,你能以1为组 距画频率分布直方图吗?
与分组数(或组距)及坐标系的单位长 度有关. 频率
0.4 0.3 0.2分布表
【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的 月均用水量如下表(单位:t):
身高区间
人 数
[122,126) [126,130) [130,134) [134,138)