用样本的频率分布估计总体分布(一) 课件
合集下载
用样本的频率分布估计总体的分布课件
在实际生活中,频率分布的应用非常广泛,如市场调查、数据分析等领域都需要用到。
02 样本与总体
样本与总体的定义
总体
研究对象的全体,表示研究对象 的全体数据。
样本
从总体中随机抽取的一部分数据, 用于推断总体的特征和规律。
样本与总体的关系
样本的代表性
样本的代表性越高,推断出的总体特 征和规律越准确。
06 课程总结
本课程的主要内容回顾
样本和总体之间的关系
频率分布表的制作
阐述了样本和总体之间的基本概念,以及 如何通过样本的频率分布来估计总体的分布。
介绍了如何制作频率分布表,包括对数据 进行分组、统计各组的频数和频率等步骤。
估计总体分布的方法
实例分析
讲解了如何利用样本的频率分布来估计总 体的分布,包括计算估计量、绘制估计分 布曲线等。
用样本的频率分布估 计总体的分布课件
目录
CONTENTS
• 样本与总体 • 频率分布 • 用样本的频率分布估计总体分布的方法 • 实例分析 • 课程总结
01 引言
课程目标
掌握用样本的频率分 布估计总体分布的方 法。
能够运用所学知识解 决实际问题。
理解频率分布与概率 分布的关系。
课程重要性
在统计学中,用样本的频率分布估计总体的分布是一个基础而重要的概念。 通过本课程的学习,学生能够更好地理解数据分布的特点,为后续学习奠定基础。
人口普查数据量大且复杂,通过观察人口普查数据的频率 分布,可以大致估计总体人口数据的分布况。
人口普查是国家为了掌握全国人口数量、结构、分布等数 据而进行的大型调查。由于调查范围广、数据量大,通常 采用抽样调查的方式进行。通过对抽样数据的频率分布进 行分析,可以大致估计总体人口数据的分布情况,为国家 制定相关政策提供依据。
02 样本与总体
样本与总体的定义
总体
研究对象的全体,表示研究对象 的全体数据。
样本
从总体中随机抽取的一部分数据, 用于推断总体的特征和规律。
样本与总体的关系
样本的代表性
样本的代表性越高,推断出的总体特 征和规律越准确。
06 课程总结
本课程的主要内容回顾
样本和总体之间的关系
频率分布表的制作
阐述了样本和总体之间的基本概念,以及 如何通过样本的频率分布来估计总体的分布。
介绍了如何制作频率分布表,包括对数据 进行分组、统计各组的频数和频率等步骤。
估计总体分布的方法
实例分析
讲解了如何利用样本的频率分布来估计总 体的分布,包括计算估计量、绘制估计分 布曲线等。
用样本的频率分布估 计总体的分布课件
目录
CONTENTS
• 样本与总体 • 频率分布 • 用样本的频率分布估计总体分布的方法 • 实例分析 • 课程总结
01 引言
课程目标
掌握用样本的频率分 布估计总体分布的方 法。
能够运用所学知识解 决实际问题。
理解频率分布与概率 分布的关系。
课程重要性
在统计学中,用样本的频率分布估计总体的分布是一个基础而重要的概念。 通过本课程的学习,学生能够更好地理解数据分布的特点,为后续学习奠定基础。
人口普查数据量大且复杂,通过观察人口普查数据的频率 分布,可以大致估计总体人口数据的分布况。
人口普查是国家为了掌握全国人口数量、结构、分布等数 据而进行的大型调查。由于调查范围广、数据量大,通常 采用抽样调查的方式进行。通过对抽样数据的频率分布进 行分析,可以大致估计总体人口数据的分布情况,为国家 制定相关政策提供依据。
221用样本的频率分布估计总体分布(1)PPT课件
5
三、分组,通常对组内数值所在区间, 取左闭右开区间 , 最后一组取闭区间
四、登记频数,计算频率,列出频率分布表 (频数=样本数据落在各小组内的个数,
频率=频数÷样本容量) 五、画出频率分布直方图(1)纵轴表示频率/组距 (2)各组概率用这个区间的面积表示。(3)所有小 长方形的面积之和等于1
6
探究:
It'S An Honor To Walk With You All The Way
演讲人:XXXXXX
时 间:XX年XX月XX日
13
填写下面的频率分布表,绘出频率分布直方图。
组别 频数累计 频数 频率
20.5~ 22.5
22.5~ 24.5
24.5~ 26.5
26.5~
28.5
10
练习 1.在100名学生中,每人参加一个运动队,其中参 加田径 队的有13人,参加体操队的有10 人, 参加足球队的有24人,参加篮球队的有27人,参加 排球队的有15人,参加乒乓球队的有11人. (1)列出学生参加各运动队的频率分布表; (2)画出表示频率分布的条形图.
11
写在最后
经常不断地学习,你就什么都知道。你知道得越多,你就越有力量 Study Constantly, And You Will Know Everything. The More
You Know, The More Powerful You Will Be
12
谢谢大家
荣幸这一路,与你同行
排除了抽样造成的误差,精确地反映了总体取 值的概率分布规律.这种总体取值的概率分布规律 称为总体分布 .
4
画一组数据的频率分布直方图,可以按以下的 步骤进行:
一、求极差. (极差=样本数据中最大值与最小值的差) 二、决定组距与组数 : (设k=极差÷组距,若k为整数,则组数=k,否则, 组数=k+1)
三、分组,通常对组内数值所在区间, 取左闭右开区间 , 最后一组取闭区间
四、登记频数,计算频率,列出频率分布表 (频数=样本数据落在各小组内的个数,
频率=频数÷样本容量) 五、画出频率分布直方图(1)纵轴表示频率/组距 (2)各组概率用这个区间的面积表示。(3)所有小 长方形的面积之和等于1
6
探究:
It'S An Honor To Walk With You All The Way
演讲人:XXXXXX
时 间:XX年XX月XX日
13
填写下面的频率分布表,绘出频率分布直方图。
组别 频数累计 频数 频率
20.5~ 22.5
22.5~ 24.5
24.5~ 26.5
26.5~
28.5
10
练习 1.在100名学生中,每人参加一个运动队,其中参 加田径 队的有13人,参加体操队的有10 人, 参加足球队的有24人,参加篮球队的有27人,参加 排球队的有15人,参加乒乓球队的有11人. (1)列出学生参加各运动队的频率分布表; (2)画出表示频率分布的条形图.
11
写在最后
经常不断地学习,你就什么都知道。你知道得越多,你就越有力量 Study Constantly, And You Will Know Everything. The More
You Know, The More Powerful You Will Be
12
谢谢大家
荣幸这一路,与你同行
排除了抽样造成的误差,精确地反映了总体取 值的概率分布规律.这种总体取值的概率分布规律 称为总体分布 .
4
画一组数据的频率分布直方图,可以按以下的 步骤进行:
一、求极差. (极差=样本数据中最大值与最小值的差) 二、决定组距与组数 : (设k=极差÷组距,若k为整数,则组数=k,否则, 组数=k+1)
用样本的频率分布估计总体分布1ppt1ppt课件
(1) 列出样本的频率分布表; (2)根据上述结果,估计此种产品为二级品或三级品的概率 约是多少.
解:
产品 频数 频率
(1)样本的频率分布表为:
一级品 5
0.17
二级品 8
0.27
三级品 13 0.43
次品
4
0.13
(2)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.
频数/组距
0.06 0.05 0.04 0.03 0.02 0.01
分组
B. 7.5~9.5
D. 11.5~13.5
频数
频率
频数累计
5.5~7.5
2
0.1
2
7.5~9.5
6
0.3
8
9.5~11.5
8
0.4
16
11.5~13.5
4
0.2
20
合计
20
1.0
4.一个容量为100的样本,数据的分组和各组的相 关信息如下表,试完成表中每一行的两个空格.
分组
频数
频率
频率累计
[12,15)
分组
频数
[80,85) [85,90) [90,95) [95,100) [100,105) [105,110) [110,115) [115,120) [120,125)
[125,130)
[130,135) 合计
频率
频数/组距
1
0.01 0.002
2
0.02 0.004
4
0.04 0.008
14
整体介绍:
用样本的有关情况去估计总体的相应情况, 这种估计大体分为两类,一类是用样本频率分 布估计总体分布,一类是用样本的某种数字特 征(例如平均数、方差等)去估计总体的相应 数字特征。
解:
产品 频数 频率
(1)样本的频率分布表为:
一级品 5
0.17
二级品 8
0.27
三级品 13 0.43
次品
4
0.13
(2)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.
频数/组距
0.06 0.05 0.04 0.03 0.02 0.01
分组
B. 7.5~9.5
D. 11.5~13.5
频数
频率
频数累计
5.5~7.5
2
0.1
2
7.5~9.5
6
0.3
8
9.5~11.5
8
0.4
16
11.5~13.5
4
0.2
20
合计
20
1.0
4.一个容量为100的样本,数据的分组和各组的相 关信息如下表,试完成表中每一行的两个空格.
分组
频数
频率
频率累计
[12,15)
分组
频数
[80,85) [85,90) [90,95) [95,100) [100,105) [105,110) [110,115) [115,120) [120,125)
[125,130)
[130,135) 合计
频率
频数/组距
1
0.01 0.002
2
0.02 0.004
4
0.04 0.008
14
整体介绍:
用样本的有关情况去估计总体的相应情况, 这种估计大体分为两类,一类是用样本频率分 布估计总体分布,一类是用样本的某种数字特 征(例如平均数、方差等)去估计总体的相应 数字特征。
用样本的频率分布估计总体分布1ppt1
2.决定组距与组数:组数=
极差 组距
=
4.1 0.5
=
8.2
3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
a
8
4.列频率分布表
100位居民月平均用水量的频率分布表
a
9
5.画频率分布直方图
频率/组距
0.50
0.40 0.30 0.20 0.10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
a
10
探究:
同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同。不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断。分
别以1和0.1为组距重新作图,然后谈谈你对图的印象。
a
11
画一组数据的频率分布直方图,可以按以 下的步骤进行:
一、求极差,即数据中最大值与最小值的差 二、决定组距与组数 :组距=极差/组数 三、分组,通常对组内数值所在区间,
a
17
分组
频数
[80,85) [85,90) [90,95) [95,100) [100,105) [105,110) [110,115) [115,120) [120,125)
[125,130)
[130,135) 合计
频率
频数/组距
1
0.01 0.002
2
0.02 0.004
4
0.04 0.008
a
2
整体介绍:
用样本的有关情况去估计总体的相应情况, 这种估计大体分为两类,一类是用样本频率分 布估计总体分布,一类是用样本的某种数字特 征(例如平均数、方差等)去估计总体的相应 数字特征。
《用样本的频率分布估计总体》_精品教学PPT人教版1
3.某校在“创新素质实践行”活动中组织学生进行社会调查, 并对学生的调查报告进行了评比.如图所示的是将某年级60篇 学生调查报告进行整理,分成5组画出的频率分布直方图.那 么在这次评比中被评为优秀的调查报告有(分数大于或等于80 分为优秀且分数为整数)( )
4.从某小学随机抽取100名同学,将他们的身高(单 位:厘米)数据绘制成频率分布直方图(如图). 若要从身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生中,用分层抽样的方法选取18 人参加一项活动,则从身高在[140 ,150]内的学生 中选取的人数应为__________ .
分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3, 3.5) [3.5, 4) [4, 4.5]
合计
频率
频率/组距
0.04
0.08
0.15 0.50
0.22 0.40
0.25 0.30
0.14 0.20
0.06 0.10
0.04
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67 年龄
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
小结:
画频率分布直方图的步骤: 第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (强调取整)
解:组距为3
分组
频数
[12.5, 15.5) 3
[15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10
用样本的频率分布估计总体分布 课件
3.茎叶图 茎叶图也是用来表示数据的一种图,其画法如下: (1)将两个数据分为“茎”(高位)和“叶”(低位)两部分; (2)将最小茎和最大茎之间的数按大小次序排成一列; (3)将各个数据的“叶”按大小次序写在其茎两侧.
想一想 茎叶图有何优点与缺点? 提示:优点:茎叶图不但可以保留所有信息而且可以随时记 录,这对数据的记录和表示都能带来方便. 缺点:当样本数据较多时,茎叶就会很长,茎叶图就显得不 太方便.
【名师点评】 频率分布直方图的性质: (1)每个小矩形的面积表示样本数据落在该组内的频率. (2)所有小矩形的面积和等于1. (3)利用一组的频数和频率,可以求样本容量. 提醒:频率分布直方图中的纵轴不是频率,而是频率/组距.
互动探究 3.在例3中,试求样本中不达标的学生人数. 解:样本容量为150,不达标的学生频率为1-0.88=0.12.所 以,样本中不达标的学生有150×0.12=18(人).
【名师点评】 (1)在列频率分布表时,极差、组距、组数 有如下关系:
极差
极差
①若组距为整数,则组距=组数;
②若极组差距不为整数,则极组差距的整数部分+1=组数.
(2)组距和组数的确定没有固定的标准,将数据分组时,组
数力求合适,使数据的分布规律能较清楚地呈现出来,组
数太多或太少,都会影响我们了解数据的分布情况,若样
易错警示 求解频率分布直方图问题时的常见错误
例4 有一个容量为200的样本,其频率分布直方图如图所 示,根据样本的频率分布直方图估计,样本数据落在区间 [10,12]内的频数为( )
A.18 C.54
B.36 D.72
【常见错误】 (1)直观判断区间[10,12]对应的小矩形的高为 0.09,即为样本数据落在该区间的频率,得出错误答案A.(2) 求不出样本数据落在该区间内的频率. 【解析】 设样本数据落在区间[10,12]内的频率为2x,则 (0.02+0.05+x+0.15+0.19)×2=1,得x=0.09,所以样本 数据落在区间[10,12]内的频数为0.09×2×200=36. 【答案】 B
用样本的频率分布估计总体分布 课件
频率 (3)在 xOy 坐标平面内画频率分布直方图时,x=样本数据,y=组距,
频率 这样每一组的频率可以用该组的组距为底、组距为高的小矩形的 面积来表示.其中,矩形的高=频组率距=组距×样1 本容量×频数;
(4)同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的 频率分布直方图的形状也会不同; (5)同一个总体,由于抽样的随机性,如果随机抽取另外一个容量 为100的样本,所形成的样本频率分布直方图一般会与前一个样本 频率分布直方图有所不同,但它们都可以近似地看做总体的分布.
【探究1】 一个容量为n的样本,分成若干组,已知某组的频数 和频率分别为40,0.125,则n的值为________. 解析 由题意得4n0=0.125,解得 n=320.
答案 320
【探究2】 在画频率分布直方图时,某组的频数为10,样本容量
为50,总体容量为600,则该组小矩形的面积是______.
解析 该组小矩形的面积即是数据落在该组的频率:1500=15.
答案
1 5
【探究3】 从某小区抽取100户居民进行月用电量调查,发现其 用电量都在50至350度之间,频率分布直方图如图所示.直方图中 x的值为________.
解析 ∵(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50 =1,∴x=0.004 4. 答案 0.004 4
用样本的频率分布估计总体分布
知识点1 频率分布直方图 1.频率分布直方图的画法
最大值与最小值
不小于k的最小
左闭右开
分组 频数累计 频数
频率
合计
样本容量
1
频率/组距 各小长方形的面积
1
2.频率分布折线图与总体密度曲线
频率 这样每一组的频率可以用该组的组距为底、组距为高的小矩形的 面积来表示.其中,矩形的高=频组率距=组距×样1 本容量×频数;
(4)同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的 频率分布直方图的形状也会不同; (5)同一个总体,由于抽样的随机性,如果随机抽取另外一个容量 为100的样本,所形成的样本频率分布直方图一般会与前一个样本 频率分布直方图有所不同,但它们都可以近似地看做总体的分布.
【探究1】 一个容量为n的样本,分成若干组,已知某组的频数 和频率分别为40,0.125,则n的值为________. 解析 由题意得4n0=0.125,解得 n=320.
答案 320
【探究2】 在画频率分布直方图时,某组的频数为10,样本容量
为50,总体容量为600,则该组小矩形的面积是______.
解析 该组小矩形的面积即是数据落在该组的频率:1500=15.
答案
1 5
【探究3】 从某小区抽取100户居民进行月用电量调查,发现其 用电量都在50至350度之间,频率分布直方图如图所示.直方图中 x的值为________.
解析 ∵(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50 =1,∴x=0.004 4. 答案 0.004 4
用样本的频率分布估计总体分布
知识点1 频率分布直方图 1.频率分布直方图的画法
最大值与最小值
不小于k的最小
左闭右开
分组 频数累计 频数
频率
合计
样本容量
1
频率/组距 各小长方形的面积
1
2.频率分布折线图与总体密度曲线
01用样本的频率分布估计总体分布PPT课件
[0.5,1)
“频数累计”(可省),
“频数”,
[1,1.5)
“频率”, “频率/组距”
[1.5,2)
五列,最后一行是合计 [2,2.5)
频数 频率=
样本容量
注意: 频数的合计应是样本 容量,
[2.5,3) [3,3.5) [3.5,4) [4,4.5]
频率合计应是1.
合计
频数累计
频数 频率 频率/组距
你能根据上述频率分布直方图指出居民月均
用水量的一些数据特点吗? 大部分居民的月均用水都在1t~3t之间
【课堂探究3】 如果市政府希望85%以上的居民每月的用水量
不超过标准,根据上述频率分布表,你对制定居民 月用水量标准(即a的取值)有何建议? 88%的居民在3t以下,标准可定为3t. 在实际中,取a=3t一定能保证85%以上的居民用水 不超标吗? 在实际中,对统计结论是需要进行评价的.
(1)如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
(2)为了较合理地确定这个标准,你认为需要做哪些工作?
假设通过抽样,我们获得了100位居民某年的月 平均用水量(单位:t) ,如下表:
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
用样本的频率分布估计总体分布 课件
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内, 以“正”字确定各个小组内数据的个数. (5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定 不能标成频率.
类型 二 频率分布直方图的应用
1.如图是根据
部分城市某年6月份的平均气温
(单位:℃)数据得到的样本频率
分布直方图,其中平均气温的范
二、频率分布折线图、总体密度曲线
1.频率分布折线图的定义
连接频率分布直方图中各小长方形上端的_____,就得到频率 中点
分布折线图.
2.总体密度曲线的定义
在样本频率分布直方图中,随着样本容量的增加,所分组数的
增加,组距减小,相应的频率折线图会越来越接近于一条_____ 光滑
_____,统计中称这条光滑曲线为总体密度曲线.它能够精确地
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大 多集中在80~100之间,中位数是98分. 甲同学的得分情况除一个特殊得分外,也大致对称,多集中在 70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于 低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.
【拓展提升】
1.频率分布直方图的应用
频率分布指的是一个样本数据在各个小范围内所占比例的大
小,一般用频率分布直方图反映样本的频率分布,其中
(1)频率分布直方图中纵轴表示 ;
(2)频率分布直方图中,各个小长频方率形的面积等于频率,各个 组距
小长方形的面积之和为1;
(3)长方形的高的比也就是频率之比;
(4)对于一组样本取其一代表值,一般取其中值,可以近似地估
【解析】1.选D.列频率分布表如下:
分组
频数累计
频数 频率
[5.5,7.5)
人教a版必修三:《2.2.1用样本的频率分布估计总体分布(1)》ppt课件(38页)
填要点、记疑点
主目录
探要点、究所然
当堂测、查疑缺
探要点、究所然
2.2.1(一)
探究点二:频率分布直方图
跟踪训练 2 下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位:cm).
区间界限 人数 区间界限 人数
[122,126) [126,130) [130,134) [134,138) [138,142) 5 8 10 22 33
明目标、知重点
填要点、记疑点
主目录
探要点、究所然
当堂测、查疑缺
探要点、究所然
2.2.1(一)
探究点一:频率分布表
分组 [150.5,153.5) [153.5,156.5) [156.5,159.5) [159.5,162.5) [162.5,165.5) [165.5,168.5) [168.5,171.5) [171.5,174.5)
主目录
频率 0.025 0.075 0.15 0.225 0.35 0.075 0.075 0.025 1
探要点、究所然 当堂测、查疑缺
探要点、究所然
2.2.1(一)
探究点二:频率分布直方图
(2)频率分布直方图如图所示.
明目标、知重点
填要点、记疑点
主目录
探要点、究所然
当堂测、查疑缺
探要点、究所然
明目标、知重点 填要点、记疑点
频数 5 8 10 22 33 20 11 6 5 120
主目录
频率 0.04 0.07 0.08 0.18 0.28 0.17 0.09 0.05 0.04 1
探要点、究所然 当堂测、查疑缺
探要点、究所然
2.2.1(一)
用样本的频率分布估计总体分布 课件
提示由于组数增多,组距减少,长方形上端中点的数量增多,且间 距变小,各相邻长方形上端中点的折线缩短,折线变得近似于曲线.
4.在上述背景下,相应的频率分布折线图越来越接近于一条光滑 曲线,统计中称这条光滑曲线为总体密度曲线.那么下图中阴影部 分的面积有何实际意义?
提示图中阴影部分的面积,就是总体在区间(a,b)内的取值的百分 比.
14
0.14
24
0.24
15
0.15
12
0.12
9
0.09
11
0.11
0.008 0.028 0.048 0.030 0.024 0.018 0.022
[125,130) [130,135]
6
0.06
0.012
2
0.02
0.004
(2)频率分布直方图和频率分布折线图如图所示.
(3)从频率分布表得,样本中底部周长小于100 cm的频率为 0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm的频率 为0.11+0.06+0.02=0.19,所以估计该片经济林中底部周长小于100 cm的树占21%,底部周长不小于120 cm的树占19%.
解:甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中 位数是98;甲同学的得分情况也大致对称,中位数是88.乙同学的成 绩比较稳定,总体情况比甲同学好.
提示为了制定一个较为合理的标准a,必须先了解全市居民日常 用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们 占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析 样本数据来估计全市居民用水量的分布情况.
4.在上述背景下,相应的频率分布折线图越来越接近于一条光滑 曲线,统计中称这条光滑曲线为总体密度曲线.那么下图中阴影部 分的面积有何实际意义?
提示图中阴影部分的面积,就是总体在区间(a,b)内的取值的百分 比.
14
0.14
24
0.24
15
0.15
12
0.12
9
0.09
11
0.11
0.008 0.028 0.048 0.030 0.024 0.018 0.022
[125,130) [130,135]
6
0.06
0.012
2
0.02
0.004
(2)频率分布直方图和频率分布折线图如图所示.
(3)从频率分布表得,样本中底部周长小于100 cm的频率为 0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm的频率 为0.11+0.06+0.02=0.19,所以估计该片经济林中底部周长小于100 cm的树占21%,底部周长不小于120 cm的树占19%.
解:甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中 位数是98;甲同学的得分情况也大致对称,中位数是88.乙同学的成 绩比较稳定,总体情况比甲同学好.
提示为了制定一个较为合理的标准a,必须先了解全市居民日常 用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们 占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析 样本数据来估计全市居民用水量的分布情况.
用样本的频率分布估计总体分布 课件
根据上面的数据列出频率分布表、绘出频率分布直方图,并估计
长度在[5.75,6.05)cm之间的麦穗在这批麦穗中所占的百分比.
分析:依据步骤画出频率分布直方图;用样本中的百分比(即频率)
来估计长度在[5.75,6.05)cm之间的麦穗在这批麦穗中所占的百分
比.
解:步骤是:(1)计算极差,7.4-4.0=3.4(cm).
2
0.2
3
0.3
4
0.4
1
0.1
10
1.0
试画出频率分布直方图.
错解:频率分布直方图如图所示:
错因分析:频率分布直方图画错了.事实上,这里纵轴的单位是
频率 组距
,
不是频率.例如,当数据在[12.45,12.95)时,
频率 组距
=
0.2 0.5
=
0.4,
故图中第
一个矩形的高度应为0.4 个单位,而非 0.2 个单位.
频率分布直方图的绘制与应用 【例1】 一个农技站为了考察某种麦穗长的分布情况,在一块试 验地里抽取了100个麦穗,量得长度如下(单位:cm):
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
反思:用茎叶图表示数据的特点如下: ① 用茎叶图表示数据有两个突出的优点,一是统计图上没有原始信息的损
失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录, 用 3| 3 8 9 就表示了 33,38,39 这 3 个数据,方便记录与表示.但茎叶图只便于表示 两位有效数字的数据,虽然可以表示两个人以上的比赛结果(或两个以上的记 录),但没有表示两个记录那么直观、清晰.
cm,组数为 12. (3)将数据分组. 使分点比数据多一位小数,并且把第 1 小组的起点稍微减小一点.那么所分
的 12 个小组可以是 3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.
(4)列频率分布表.
对各个小组作频数累计,然后数频数,算频率,列频率分布表,如下表所示:
茎叶图
个茎叶图中得到;二是茎叶 样本数据较多或数据位数较 图便于记录和表示,能够展 多时,不方便表示数据
示 数 据的分布情况
【例题 1】 一个农技站为了考察某种麦穗长的分布情况,在一块试验地里抽取 了 100 个麦穗,量得长度如下(单位:cm): 6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3 根据上面的数据列出频率分布表、绘出频率分布直方图,并估计长度在 5.75~6.05 cm 之间的麦穗在这批麦穗中所占的百分比.
分组
频 数 累计
频数
频率
3.95~4.25
1
0.01
4.25~4.55
1
0.01
4.55~4.85
2
0.02
4.85~5.15
5
0.05
5.15~5.45
11
0.11
5.45~5.75
15
0.15
5.75~6.05
28
0.28Hale Waihona Puke 6.05~6.3513
0.13
6.35~6.65
11
0.11
6.65~6.95
组距
组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的 频率大小.
②在频率分布直方图中,各个小矩形的面积之和等于 1. ③ 频数 =样本容量.
相 应 的频率
【例题 4】 某校举行演讲比赛,9 位评委给选手 A 打出的分数的茎叶图如图所 示,统计员在去掉一个最高分和一个最低分后,算得平均分为 91,复核员在复核 时,发现有一个数字(茎叶图中的 x)无法看清,若统计员计算无误,则数字 x 应该 是( )
【做一做 3】 对于频率分布折线图与总体密度曲线的关系,下列说法中正 确的是( )
A.频率分布折线图与总体密度曲线无关 B.频率分布折线图就是总体密度曲线 C.样本容量很大的频率分布折线图就是总体密度曲线 D.如果样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会 无限接近于一条光滑曲线,即为总体密度曲线 答案:D
分析:用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示 两人每场数学考试成绩的个位数.
解:甲、乙两人数学成绩的茎叶图如图所示. 从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是 98;
甲同学的得分情况除一个特殊得分外,也大致对称,中位数是 88.因此乙同学发 挥比较稳定,总体得分情况比甲同学好.
A.总体密度曲线 B.茎叶图 C.频率分布折线图 D.频率分布直方图 解析:所有的统计图中,仅有茎叶统计图完好无损地保存着所有原始数据的 信息. 答案:B
1.估计总体分布 剖析:总体分布是指总体取值的分布规律,即某小组数据在总体数据中所占
的比例大小.这种分布我们一般是不知道的.用样本估计总体是统计的基本思想, 对于不易知道的总体分布,常常用样本的频率分布对其进行估计.样本的容量越 大,这种估计就越精确.用样本估计总体的思想就是用部分考察全体、用有限考 察无限,也就是用观察测量值来探究客观规律的一种重要的基本思想.通常用统 计图(表)来直观地展现样本数据的分布状况,常用的统计图表有频率分布表、频 率分布直方图、频率分布折线图、茎叶图、总体密度曲线等.我们不但要能认 识各种统计图,从中提取各种信息,而且还要能制作各种统计图,表达问题的数 据信息.
A.15
B.16
C.110
D.不确定
解析:该组的频率是10
50
=
15.
答案:A
3.频率分布折线图和总体密度曲线 (1)类似于频数分布折线图,连接频率分布直方图中各个小长方形上端的中 点,就得到频率分布折线图. 一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.例如,如果 要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一 个城市的时候大.可以想像,随着样本容量的增加,作图时所分的组数增加,组距 减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线 为总体密度曲线.
分析:依据步骤画出频率分布直方图;用样本中的百分比(即频率)来估计长度在 5.75~6.05 cm 之间的麦穗在这批麦穗中所占的百分比. 解:步骤是:
(1)计算极差,7.4-4.0=3.4(cm). (2)决定组距与组数.
若取组距为 0.3 cm,由于30..43=1113,需分成 12 组,组数合适.于是取定组距为 0.3
【例题 2】 某中学高一(2)班甲、乙两名同学自高中以来每次数学考试成绩情 况如下: 甲的得分:95,75,86,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101. 画出两人的数学成绩茎叶图.请根据茎叶图对两人的数学成绩进行比较.
② 茎叶图在样本数据较少,较为集中且位数不多时比较适用.由于它较好地 保留了原始数据,所以可以帮助分析样本数据的大致频率分布,还可以用来分析 样本数据的一些数字特征,如众数、中位数、平均数等.
【例题 3】 (2011·山东寿光高三抽测,理 14)为了解某小区老年人在一天中锻
炼身体的时间,随机调查了 50 人,根据调查数据,画出了锻炼时间在 0~2 小时的
茎叶图的特征:统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶 图中得到;茎叶图中的数据可以随时记录,随时添加,方便记录与表示.但是茎叶 图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两位以
上的数据虽然能够记录,但是没有表示两位数记录那么直观、清晰.
【做一做 4】 没有信息的损失,所有的原始数据都可以从图中得到的统计 图是( )
(2)意义:频率分布直方图中,每个小矩形的面积表示相应组的频率,所有小 矩形的面积的总和等于 1.
(3)频率分布的估计:频率分布是指各个小组数据在容量中所占比例的大小, 可以用样本的频率分布估计总体的频率分布,频率分布表是反映样本的频率分 布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.
频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围 内取值的百分比,它能给我们提供更加精细的信息.
(2)估计方法:实际上,尽管有些总体密度曲线是客观存在的,但是在实际应 用中我们并不知道它的具体表达形式,需要用样本来估计.由于样本是随机的, 不同的样本得到的频率分布折线图不同;即使对于同一个样本,不同的分组情况 得到的频率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变 化而变化的,因此不能用样本的频率分布折线图得到准确的总体密度曲线.
估计总体分布的步骤是: (1)选择适当的抽样方法从总体中抽取样本,即收集数据. (2)利用样本数据画出统计图或计算数字特征. (3)结合统计图分析样本取值的分布规律. (4)用样本取值的分布规律估计总体分布,由于是用科学抽样抽取的样本, 那么样本与总体取值的分布规律近似,有时也可看成相同. (5)利用总体分布解决有关问题.
2.频率分布表、频率分布直方图、频率分布折线图和茎叶图的优缺点比较
剖析:如下表:
优点
缺点
频率分 布表
表 示 数量较确切
分析数据分布的总体态势不 方便
频率分 布 直 方图
原有的具体数据信息被抹掉 表示数据分布情况非常直观 了
频 率 分布 折线图
能 反 映数据的变化趋势
不 能 显示原有数据信息
一是所有的信息都可以从这
样本频率分布直方图(如图).则 50 人中锻炼身体的时间在区间[0.5,1.5)小时的人
数是
.
解析:根据频率分布直方图,锻炼身体的时间在区间[0.5,1.5)小时的频率为 (0.8+0.6)×0.5=0.7,则人数为 0.7×50=35. 答案:35
反思:频率分布直方图的性质: ① 因为小矩形的面积=组距×频 率=频率,所以各个小矩形的面积表示相应各
10
0.10
6.95~7.25
2
0.02
7.25~7.55 合计
1
0.01
100
1.00
(5)画频率分布直方图,如图所示.
从表中看到,样本数据落在 5.75~6.05 之间的频率是 0.28,于是可以估计,在 这块地里,长度在 5.75~6.05 cm 之间的麦穗约占 28%.