高三数学课件:总体分布的估计条形图
合集下载
高三数学课件总体分布的估计优选PPT文档
产品 总体密度曲线反映了总体分布,即反映了总体在各个范围内取值的概率. 一 二三 次 级 级级 品 品 品品
频率 组距
25.235 25.295 25.355 25.415 25.475 25.535
产品尺寸
频率分布直方图中每个小矩形的面积就是样本中 数据落在该组内的频率. 样本的容量越大,所分组数越多,各组的频率就越 接近于总体在相应各组取值的概率.当样本的容量 无限增大,分组的组距无限缩小,那么频率分布直 方图就会无限接近于一条光滑的曲线——总体密度 曲线.
0.2. 由总体密度曲线可知,总体在区间(a,b)内取值的概率就是由x轴、直线x=a、x=b以及总体密度曲线所围成的图形的面积.
样本的容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率. 频率分布条形图的横轴表示试验的结果,纵轴表示频率
0.1. 当样本的容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑的曲线——总体密度曲线.
这种总体取值的概率分布规律通常称为总体分布
相应的概率.由此可得下表: 解:(1)样本的频率分布表
把正面向上的结果记为0,反面向上的结果记为1,则上面的频率分布表还可以用下面的条形图来表示 解:(1)样本的频率分布表
把正面向上的结果记为0,反面向上的结果记为1,则上面的频率分布表还可以用下面的条形图来表示
频率[1分1布.条3形5图,1的1横.轴4表5示] 试验的结7果,纵轴表示频率
0.07
由总体密度曲线可知,总体在区间(a,b)内取值的概率就是由x轴、直线x=a、x=b以及总体密度曲线所围成的图形的面积.
解:(1)样本的频率分布表
产品 一级品
频数 5
频率 0.17
二级品
频率 组距
25.235 25.295 25.355 25.415 25.475 25.535
产品尺寸
频率分布直方图中每个小矩形的面积就是样本中 数据落在该组内的频率. 样本的容量越大,所分组数越多,各组的频率就越 接近于总体在相应各组取值的概率.当样本的容量 无限增大,分组的组距无限缩小,那么频率分布直 方图就会无限接近于一条光滑的曲线——总体密度 曲线.
0.2. 由总体密度曲线可知,总体在区间(a,b)内取值的概率就是由x轴、直线x=a、x=b以及总体密度曲线所围成的图形的面积.
样本的容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率. 频率分布条形图的横轴表示试验的结果,纵轴表示频率
0.1. 当样本的容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑的曲线——总体密度曲线.
这种总体取值的概率分布规律通常称为总体分布
相应的概率.由此可得下表: 解:(1)样本的频率分布表
把正面向上的结果记为0,反面向上的结果记为1,则上面的频率分布表还可以用下面的条形图来表示 解:(1)样本的频率分布表
把正面向上的结果记为0,反面向上的结果记为1,则上面的频率分布表还可以用下面的条形图来表示
频率[1分1布.条3形5图,1的1横.轴4表5示] 试验的结7果,纵轴表示频率
0.07
由总体密度曲线可知,总体在区间(a,b)内取值的概率就是由x轴、直线x=a、x=b以及总体密度曲线所围成的图形的面积.
解:(1)样本的频率分布表
产品 一级品
频数 5
频率 0.17
二级品
高中数学:22《总体分布的估计》课件必修
。
大样本的总体分布近似其他分布
其他分布
除了正态分布,大样本的总体分布还 可以近似其他类型的分布,如t分布、 卡方分布和F分布等。这些分布在统计 学中也非常重要,特别是在小样本或 非正态总体的情况下。
近似方法
近似其他分布的方法通常涉及到对样 本统计量进行适当的变换或使用适当 的估计量。这些方法有助于在非正态 总体或小样本情况下获得更准确的统 计推断结果。
04
小样本的总体分布
小样本的定义和性质
定义
小样本是指从总体中随机抽取的 一部分个体,其数量相对较少。
性质
小样本具有代表性、随机性和独 立性,可以用来估计总体的分布 和特征。
小样本的总体分布的估计方法
03
频数分布表法
直方图法
经验分布函数法
将小样本数据按照一定标准进行分类,统 计各类别的频数和频率,从而估计总体分 布。
以某品牌电视机的使用寿命为例,随机抽取20台电视机作为小样本 ,通过计算平均寿命和标准差等统计量来估计该品牌电视机的总体分 布。
05
总体分布的检验
拟合优度检验
总结词
拟合优度检验用于评估样本数据与理论分ቤተ መጻሕፍቲ ባይዱ的拟合程度,判断样本数据是否符合预期的分布形态。
详细描述
拟合优度检验通过比较样本数据的频数与理论分布的预期频数,计算两者之间的差异程度,常用的方法有卡方检 验、柯尔莫哥洛夫-斯米尔诺夫检验等。这些方法可以帮助我们判断样本数据是否符合正态分布、泊松分布等理 论分布。
独立性检验
总结词
独立性检验用于判断两个分类变量是否 独立,即一个变量的取值是否不受另一 个变量的影响。
VS
详细描述
独立性检验通过比较观察到的频数与期望 频数,计算两者之间的差异程度,常用的 方法有卡方检验、Fisher's exact test等 。这些方法可以帮助我们判断两个分类变 量是否相互独立,从而为进一步的数据分 析和建模提供依据。
大样本的总体分布近似其他分布
其他分布
除了正态分布,大样本的总体分布还 可以近似其他类型的分布,如t分布、 卡方分布和F分布等。这些分布在统计 学中也非常重要,特别是在小样本或 非正态总体的情况下。
近似方法
近似其他分布的方法通常涉及到对样 本统计量进行适当的变换或使用适当 的估计量。这些方法有助于在非正态 总体或小样本情况下获得更准确的统 计推断结果。
04
小样本的总体分布
小样本的定义和性质
定义
小样本是指从总体中随机抽取的 一部分个体,其数量相对较少。
性质
小样本具有代表性、随机性和独 立性,可以用来估计总体的分布 和特征。
小样本的总体分布的估计方法
03
频数分布表法
直方图法
经验分布函数法
将小样本数据按照一定标准进行分类,统 计各类别的频数和频率,从而估计总体分 布。
以某品牌电视机的使用寿命为例,随机抽取20台电视机作为小样本 ,通过计算平均寿命和标准差等统计量来估计该品牌电视机的总体分 布。
05
总体分布的检验
拟合优度检验
总结词
拟合优度检验用于评估样本数据与理论分ቤተ መጻሕፍቲ ባይዱ的拟合程度,判断样本数据是否符合预期的分布形态。
详细描述
拟合优度检验通过比较样本数据的频数与理论分布的预期频数,计算两者之间的差异程度,常用的方法有卡方检 验、柯尔莫哥洛夫-斯米尔诺夫检验等。这些方法可以帮助我们判断样本数据是否符合正态分布、泊松分布等理 论分布。
独立性检验
总结词
独立性检验用于判断两个分类变量是否 独立,即一个变量的取值是否不受另一 个变量的影响。
VS
详细描述
独立性检验通过比较观察到的频数与期望 频数,计算两者之间的差异程度,常用的 方法有卡方检验、Fisher's exact test等 。这些方法可以帮助我们判断两个分类变 量是否相互独立,从而为进一步的数据分 析和建模提供依据。
高中数学第2章2.2总体分布的估计课件苏教必修3.ppt
频率 提示:以面积的形式,因为矩形的面积=组距×组距,
并且各个小矩形的面积之和等于 1.
3.茎叶图可以表示三位数吗? 提示:可以,前2位作为茎,最后一位作为叶, 茎叶图最好表示两位数.
考点一
课堂互动讲练
考点突破 频率分布表,频率分布直方图,折线图
频率分布直方图的特点: 频率
(1)纵轴表示组距,即矩形的高,以横轴上相邻两 点为端点的线段是矩形的底.
例2 (本题满分14分)美国历届总统中,就任时年纪 最小的是罗斯福,他于1901年就任,当时年仅42岁; 就任时年纪最大的是里根,他于1981年就任,当时 69岁.下面按时间顺序(从1789年的华盛顿到2009年 的奥巴马,共44任)给出了历届美国总统就任时的年 龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,5
(3)茎叶图的优缺点 用茎叶图刻画数据有两个优点:一是所有的信息都 可以从这个茎叶图中得到;二是茎叶图便于记录和 表示.但茎叶图表示三位或三位以上的数据时不够 方便.茎叶图如果表示三位数可把这组数据的前两 位作为茎,第三位数作为叶.
问题探究
1.将样本的数据进行分组的目的是什么? 提示:从样本中的一个数字中很难直接看出样本 所包含的信息,通过分组并计算其频率,目的是 通过描述样本数据分布的特征,从而估计总体的 分布情况. 2.频率分布直方图以怎样的形式反映了数据落在 各个小组内的频率大小?
分组
[145.5,149.5) [149.5,153.5) [153.5,157.5) [157.5,161.5) [161.5,165.5) [165.5,169.5]
合计
频数累计 1 5 25 40 48 50
频数 1 4 20 15 8 2 50
并且各个小矩形的面积之和等于 1.
3.茎叶图可以表示三位数吗? 提示:可以,前2位作为茎,最后一位作为叶, 茎叶图最好表示两位数.
考点一
课堂互动讲练
考点突破 频率分布表,频率分布直方图,折线图
频率分布直方图的特点: 频率
(1)纵轴表示组距,即矩形的高,以横轴上相邻两 点为端点的线段是矩形的底.
例2 (本题满分14分)美国历届总统中,就任时年纪 最小的是罗斯福,他于1901年就任,当时年仅42岁; 就任时年纪最大的是里根,他于1981年就任,当时 69岁.下面按时间顺序(从1789年的华盛顿到2009年 的奥巴马,共44任)给出了历届美国总统就任时的年 龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,5
(3)茎叶图的优缺点 用茎叶图刻画数据有两个优点:一是所有的信息都 可以从这个茎叶图中得到;二是茎叶图便于记录和 表示.但茎叶图表示三位或三位以上的数据时不够 方便.茎叶图如果表示三位数可把这组数据的前两 位作为茎,第三位数作为叶.
问题探究
1.将样本的数据进行分组的目的是什么? 提示:从样本中的一个数字中很难直接看出样本 所包含的信息,通过分组并计算其频率,目的是 通过描述样本数据分布的特征,从而估计总体的 分布情况. 2.频率分布直方图以怎样的形式反映了数据落在 各个小组内的频率大小?
分组
[145.5,149.5) [149.5,153.5) [153.5,157.5) [157.5,161.5) [161.5,165.5) [165.5,169.5]
合计
频数累计 1 5 25 40 48 50
频数 1 4 20 15 8 2 50
高中数学必修三 1.5 估计总体的分布课件
0.07 频率/组距
0.05
0.03
体重(kg)
54.5 58.5 62.5 66.5 70.5 74.5
根据上图可得这100名学生中体重在[56.5,64.5]的学生人数 是( C )
A. 20
B. 30
C. 40
D. 50
3、观察新生婴儿的体重,其频率分布直方图如图所示, 则新生婴儿体重(2700,3000)的频率为: 0.3 .
别以1和0.1为组距重新作图,然后谈谈你对图的印象。
当样本容量无限增大,分组的组距无限缩小,那 么频率分布直方图就会无限接近一条光滑曲线
——总体密度曲线.
频率
组距
S
月均用水量\t
a b
总体密度曲线
总体密度曲线反映了总体在各个范围内取值 的概率,精确地反映了总体的分布规律。是研究总 体分布的工具.
画频率分布直方图的步骤: 1、求极差(即一组数据中最大值与最小值的差)
知道这组数据的变动范围158-121=37(mm). 2、决定组距与组数(将数据分组)
组距:指每个小组的两个端点的距离.
组数:将数据分组,当数据在100个左右时,
按数据多少常分5-12组.
组数=
极差 组距
37 5
7.4
3、将数据分组.(7.4取整,分为8组)
为0.2范围的是 ( D )
A. 5.5~7.5
B. 7.5~9.5
C. 9.5~11.5
D. 11.5~13.5ຫໍສະໝຸດ 分组频数频率
5.5~7.5
2
0.1
7.5~9.5
6
0.3
9.5~11.5
8
0.4
11.5~13.5
4
0.2
0.05
0.03
体重(kg)
54.5 58.5 62.5 66.5 70.5 74.5
根据上图可得这100名学生中体重在[56.5,64.5]的学生人数 是( C )
A. 20
B. 30
C. 40
D. 50
3、观察新生婴儿的体重,其频率分布直方图如图所示, 则新生婴儿体重(2700,3000)的频率为: 0.3 .
别以1和0.1为组距重新作图,然后谈谈你对图的印象。
当样本容量无限增大,分组的组距无限缩小,那 么频率分布直方图就会无限接近一条光滑曲线
——总体密度曲线.
频率
组距
S
月均用水量\t
a b
总体密度曲线
总体密度曲线反映了总体在各个范围内取值 的概率,精确地反映了总体的分布规律。是研究总 体分布的工具.
画频率分布直方图的步骤: 1、求极差(即一组数据中最大值与最小值的差)
知道这组数据的变动范围158-121=37(mm). 2、决定组距与组数(将数据分组)
组距:指每个小组的两个端点的距离.
组数:将数据分组,当数据在100个左右时,
按数据多少常分5-12组.
组数=
极差 组距
37 5
7.4
3、将数据分组.(7.4取整,分为8组)
为0.2范围的是 ( D )
A. 5.5~7.5
B. 7.5~9.5
C. 9.5~11.5
D. 11.5~13.5ຫໍສະໝຸດ 分组频数频率
5.5~7.5
2
0.1
7.5~9.5
6
0.3
9.5~11.5
8
0.4
11.5~13.5
4
0.2
《估计总体的分布》课件1(14张PPT)(北师大版必修3)
2、回归直线必经过点
3.
x
x1 x2 x3 x4 …. xn
y y1 y2 y3 y4 …. yn
求线性回归方程的系数:
n
b
x1 y1 xn yn nx y
x12xn2来自2nx
xi yi nxy
i 1 n
xi2 n(x)2
i 1
a y bx
线性回归方程:
xi 2
1.96 2.25 2.56 2.89 3.24 3.61
4 4.41 24.92
xi yi
2.38 2.685 3.008 3.315 3.654 3.99 4.32 4.641 27.993
b
x1y1 xn yn nx y
x12
xn2
2
nx
a y bx
分析:由于问题中 要求根据身高预报 体重,因此选取身 高为自变量,体重 为因变量.
1. 散点图;
2.回归方程:
y 0.849x 85.172
身高172cm女大学生体重 yˆ = 0.849×172 - 85.712 = 60.316(kg)
例2:上节中的练习热茶的杯数(y)与气温(x) 之间是线性相关的
抽象概括:
若有n个样本点:(x1,y1),… ,(xn,yn),可以 用下面的表达式来刻画这些点与直线y=a+bx的接近程 度:
[ y1 (a bx1)]2 [ yn (a bxn )]2
使上式达到最小值的直线y=a+bx就是所求的直线,这 种方法称为最小二乘法。
如果用x表示 x1 x2 ... xn ,用y表示 y1 y2 ... yn 则可得到
3.
x
x1 x2 x3 x4 …. xn
y y1 y2 y3 y4 …. yn
求线性回归方程的系数:
n
b
x1 y1 xn yn nx y
x12xn2来自2nx
xi yi nxy
i 1 n
xi2 n(x)2
i 1
a y bx
线性回归方程:
xi 2
1.96 2.25 2.56 2.89 3.24 3.61
4 4.41 24.92
xi yi
2.38 2.685 3.008 3.315 3.654 3.99 4.32 4.641 27.993
b
x1y1 xn yn nx y
x12
xn2
2
nx
a y bx
分析:由于问题中 要求根据身高预报 体重,因此选取身 高为自变量,体重 为因变量.
1. 散点图;
2.回归方程:
y 0.849x 85.172
身高172cm女大学生体重 yˆ = 0.849×172 - 85.712 = 60.316(kg)
例2:上节中的练习热茶的杯数(y)与气温(x) 之间是线性相关的
抽象概括:
若有n个样本点:(x1,y1),… ,(xn,yn),可以 用下面的表达式来刻画这些点与直线y=a+bx的接近程 度:
[ y1 (a bx1)]2 [ yn (a bxn )]2
使上式达到最小值的直线y=a+bx就是所求的直线,这 种方法称为最小二乘法。
如果用x表示 x1 x2 ... xn ,用y表示 y1 y2 ... yn 则可得到
北师大版高中数学必修三课件5.1估计总体的分布
3.02.92.42.41.91.31.41.80.72.0
2.52.82.32.31.81.31.31.60.92.3 2.62.72.42.11.71.41.21.50.52.4
2.52.62.32.11.61.01.01.70.82.4
2.82.52.22.01.51.01.21.80.62.2
如果希望大部分居民的日常生活不受影响,那么标准
ɑ定为多少比较合理?你认为为了较为合理地确定出 这个标准,需要做什么工作?
解析:由于城市住户较多,通常采用抽样调查的方
式,通过分析样本数据来估计全市居民用水量的分
布情况.假设通过抽样,我们获得了100位居民某年
的月均用水量(单位:t):
100位居民的月均用水量(单位:t)
用图中矩形的高度来反映频数.
我们也可以用区间上矩形的面积来反映频率,得到 下图.
f , 若每个小矩形的宽度为△xi(分组的宽度),高为小 Δx
i i
矩形的面积恰为相应的频率fi,通常我们称这样的 图形为频率分布直方图.
思考交流 观察此频率分布直方图,你能 知道: (1)头盖骨的宽度位于哪个 区间的数据最多? (2)头盖骨的宽度在140~ (1)140~145mm的最多 145mm的频率约是多少? (3)头盖骨的宽度小于 (2)0.434 140mm的频率约是多少? (3)0.283 (4)头盖骨的宽度在137~ (4)0.298 142mm的频率约是多少?
道这组数据的变动范围是4.3-0.2=4.1(t). 2.决定组距与组数(将数据分组). 组距:指每个小组的两个端点的距离.
组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组.
组数= 极差 4.1 8.2 组距 0.5
高三数学课件:总体分布的估计 条形图
2 3 4 5 6 7 8 9 10 11 12 点数和
掷两枚骰子的等可能性结果
6 7 8 9 10 11 12 第 5 6 7 8 9 10 11 二 4 5 6 7 8 9 10 枚 骰3 4 5 6 7 8 9 子
23 4 5 6 7 8 12 3 4 5 6 7
123456 第一枚骰子
(1)列出学生参加各运动队的频率分布表;
(2)画出表示频率分布的条形图.
练习
解:频率分布表如下:
频率分布条形图如下:
试验结果
频 数 频率
参加田径队(1) 13 0.13
参加体操队(2) 10 0.10
参加足球队(3) 24 0.24
参加篮球队(4) 27 0.27
参加排球队(5) 15 0.15
参加乒乓球队(6) 11 0.11
总体分布的估计
条形图
总体分布的估计
在统计中,用样本的有关情况估计总体的相 应情况大体上有两类方法:
一、用样本的频率分布去估计总体分布; 二、用样本的某种数字特征去估计总体相 应数字特征。
1、进行“抛掷硬币”试验的试验结
果
试验结果 频数
频率
பைடு நூலகம்
概率
正面向上 36124 0.5011
0.5
反面向上 35964 0.4989
频 数 203 407 591 805 994 1218 989 813 602 381 197 频 率 0.028 0.057 0.082 0.112 0.138 0.169 0.137 0.113 0.084 0.053 0.027
频率分布的条形图
频率
6 36 5 36 4 36 3 36 2 36 1 36
频率
掷两枚骰子的等可能性结果
6 7 8 9 10 11 12 第 5 6 7 8 9 10 11 二 4 5 6 7 8 9 10 枚 骰3 4 5 6 7 8 9 子
23 4 5 6 7 8 12 3 4 5 6 7
123456 第一枚骰子
(1)列出学生参加各运动队的频率分布表;
(2)画出表示频率分布的条形图.
练习
解:频率分布表如下:
频率分布条形图如下:
试验结果
频 数 频率
参加田径队(1) 13 0.13
参加体操队(2) 10 0.10
参加足球队(3) 24 0.24
参加篮球队(4) 27 0.27
参加排球队(5) 15 0.15
参加乒乓球队(6) 11 0.11
总体分布的估计
条形图
总体分布的估计
在统计中,用样本的有关情况估计总体的相 应情况大体上有两类方法:
一、用样本的频率分布去估计总体分布; 二、用样本的某种数字特征去估计总体相 应数字特征。
1、进行“抛掷硬币”试验的试验结
果
试验结果 频数
频率
பைடு நூலகம்
概率
正面向上 36124 0.5011
0.5
反面向上 35964 0.4989
频 数 203 407 591 805 994 1218 989 813 602 381 197 频 率 0.028 0.057 0.082 0.112 0.138 0.169 0.137 0.113 0.084 0.053 0.027
频率分布的条形图
频率
6 36 5 36 4 36 3 36 2 36 1 36
频率
高中数学 《总体分布的估计》课件 苏教版必修_2
n=250
n=2500
m m/n m m/n 12 0.048 157 0.0628
14 0.056 152 0.0608
17 0.068 157 0.0628
11 0.044 136 0.0544
22 0.088 152 0.0608
9 0.036 135 0.0540
15 0.060 143 0.0572
135 0.0540
143 0.0572
160 0.0640
149 0.0596
153 0.0612
注意到本例中,次品频率总
附近摆动,说明出现次品的概率
因此,试可验结以果 得到下表概率:
次品(可以用0表示)
0.06
正品(可以用1表示)
0.94
这张表反映了总体取值的概率分布规律 ——取0的概率为0.06,取1的概率为0.94 . 这种总体取值的概率分布规律通常称为总 体概率分布,简称总体分布.
抽样序号 频 数 样本容量 频 率
1(02、9) 62
100 0.62
2(02、10) 48
80
0.60
3(02、11) 122
200 0.61
4(02、12) 30
50
0.60
5(03、1) 53
90 0.59
关于“频率分布” 根据所抽取样本的大小,分别
计算某一事件出现的频率,这些 率的分布规律(取值状况),叫做 本的也频就是率说分频布率分. 布即频率规律
通常将样本的容量、样本中出现该 事件的频数以及计算所得的相应频率列 在一张表中,叫做样本频率分布表.(一 般由以下四个部分:序号、样本容量、 事件的频数、事件的频率)
又如:在稳定的生产条件下,把一定时期
《总体分布的估计》PPT课件
用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数 据的新方式
〈一〉频率分布的概念: 频率分布是指一个样本数据在各个小范围内 所占比例的大小。一般用频率分布直方图反 映样本的频率分布
〈二〉画频率分布直方图其一般步骤为 (1)计算一组数据中最大值与最小值的差,即求极差 (2)决定组距与组数 (3)将数据分组 (4)列频率分布表 (5)画频率分布直方图
第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1
第二步: 决定组距与组数: (强调取整)
当样本容量不超过100时, 按照数据的多少, 常分成5~12组.
为方便组距的选择应力求”取整”.
本题如果组距为0.5(t).
则
组数=
组数=
极差 组距
4.1 0.5
8.2
第三步: 将数据分组 ( 给出组的界限)
第四步: 列频率分布表. (包括分组、频数、频率、频率/组距)
第五步: 画频率分布直方图(在频率分布表的基础上绘制,横
坐标为样本数据尺寸,纵坐标为频率/组距.)
频率折线图的优点是它反映了数据的变化趋势.如果 将样本容量取得足够大,分组的组距取得足够小,则 这条折线将趋于一条曲线,我们称这一曲线为总体分 布的密度曲线.
从图中我们可以看到,月均 用水量在区间[2,2.5)内 的居民最多,在[1.5,2) 内次之,大部分居民的月 均用水量都在[1,3)之间.
直方图能够很容易地表示大量数据,非常直观地 表明分布的形状,使我们能够看到分布表中看不清楚 的数据模式,但是直观图也丢失了一些信息,例如, 原始数据不能在图中表示出了.
频率分布表:
〈一〉频率分布的概念: 频率分布是指一个样本数据在各个小范围内 所占比例的大小。一般用频率分布直方图反 映样本的频率分布
〈二〉画频率分布直方图其一般步骤为 (1)计算一组数据中最大值与最小值的差,即求极差 (2)决定组距与组数 (3)将数据分组 (4)列频率分布表 (5)画频率分布直方图
第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1
第二步: 决定组距与组数: (强调取整)
当样本容量不超过100时, 按照数据的多少, 常分成5~12组.
为方便组距的选择应力求”取整”.
本题如果组距为0.5(t).
则
组数=
组数=
极差 组距
4.1 0.5
8.2
第三步: 将数据分组 ( 给出组的界限)
第四步: 列频率分布表. (包括分组、频数、频率、频率/组距)
第五步: 画频率分布直方图(在频率分布表的基础上绘制,横
坐标为样本数据尺寸,纵坐标为频率/组距.)
频率折线图的优点是它反映了数据的变化趋势.如果 将样本容量取得足够大,分组的组距取得足够小,则 这条折线将趋于一条曲线,我们称这一曲线为总体分 布的密度曲线.
从图中我们可以看到,月均 用水量在区间[2,2.5)内 的居民最多,在[1.5,2) 内次之,大部分居民的月 均用水量都在[1,3)之间.
直方图能够很容易地表示大量数据,非常直观地 表明分布的形状,使我们能够看到分布表中看不清楚 的数据模式,但是直观图也丢失了一些信息,例如, 原始数据不能在图中表示出了.
频率分布表:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体分布的估计
在统计中,用样本的有关情况估计总体的相
应情况大体上有两类方法:
一、用样本的频率分布去估计总体分布;
二、用样本的某种数字特征去估计总体相应数字特征。
« ---- ---- -----
洪脸结果频数频率概率
正面筍上36124 0.5011 0.5
反面向上35964 0.4989 0.5 h进行“拋掷硬币”试脸的试脸结
注意点:
趣出频率分布的条形图
正面向上反面向上①各直方长条的宽度要相同;
②相邻长条之呵的间隔要追旨结论:去试脸次救无限增丸对,两种试脸结果的频率丸政相同
1 •在100名学生中,每人参加一个运动队,其中参加田径队的有13人,参加体操队的有10人,参加足球队的有
24人,参加篮球队的有27人,参加排球队的有15人,参加乒乓球队的有11人.
(1)列出学生参加各运动队的频率分布表;
(2)画出表示频率分布的条形图.
练习
廿解:濒率分布表如卜:
频率分布条形图如下:
频率
结果
►
番体分布
乍除了抽样造成的误差,精确地反映了总体取值的
概率分布规律。
这种总体取值的概率分布规律通常成为总体分布。
频率分布与总体分布的关系:
(1)通过样本的频数分布、频率分布可以估计总体的概率分布.
(2)研究总体概率分布往往可以研究其频数分布、频率分布.
2■同时掷两枚骰子,共掷7200次,点数和的分布频数如下表所示,计算各个结果的频率,作出频率分布条形图:
36
6
36 5
36 4
36 3
36 2
36 1
频率
4 5 6 7
8 9 10 11 12点数和
掷两枚骰子的等可能性结果 9 10 11 12 8 9 10 7 8 9 10 6 7 8 9 5 6 7 8 4 5 6 7 3 4 5 6
6 7 8
第 5 6 7
4 5 6
骰 3 4 5
子 2 3 4
1 2 3
1 2
第
二枚骰
子。