众数中位数平均数与频率分布直方图的关系
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一 众数、中位数、平均数的概念
众数、中位数、平均数都是描述一组 数据的集中趋势的特征数,只是描述的角 度不同,其中以平均数的应用最为广泛. 众数:在一组数据中,出现次数最多 的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列, 把处在最中间位置的一个数据(或最中 间两个数据的平均数)叫做这组数据的 中位数.
3、平均数是频率分布直方图的“重心”.
是直方图的平衡点. n 个样本数据的平均数由 公式:
X=
1 ( x1 x 2 x n ) n
假设每组数据分别为〔a1, b1)、 〔a2, b2)、 … … 〔ak, bk)时, 且每组数据相应的 频率分别为f1、 f2 、 …… fk;那么样本的平 均数(或总体的数学期望)由下列公式计算即 可。
总体分布的估计
练习:对某电子元件进行寿命追踪调查,情况如下: 寿命 个数 100~200 20 200~300 30 300~400 400~500 80 40 500~600 30
(1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的概率;
(4)估计电子元件寿命在400h以上的概率;
0.5 0.4 0.3 0.2 0.1
O
0.5
1
1.5
Biblioteka Baidu
2
2.5
3
3.5
4
4.5
月平均用水量(t)
例题分析:月均用水量的众数是2.25t.如图所示:(2+2.5)/2=2.25
2、从频率分布直方图中估计中位数
(中位数是样本数据所占频率的等分线。)
• 当最高矩形的数据组为〔a, b) 时, 设中位 数为(a+X),根据中位数的定义得知, 中位 数左边立方图的小矩形面积为0.5, 列方程 得: • 当最高矩形的数据组之前所有小矩形的面 积之和为fm;(频率直方图的面积计算,即组距乘以频率/组距。) • x*最高矩形的(频率/组距)+ fm=0.5
思考:从样本数据可知,所求得该样本的众 数、中位数和平均数,这与我们从样本频率 分布直方图得出的结论有偏差,你能解释一 下原因吗? 频率分布直方图损失了一些样本数据,得 到的是一个估计值,且所得估值与数据分组 有关. 注:在只有样本频率分布直方图的情况下,我 们可以按上述方法估计众数、中位数和平均 数,并由此估计总体特征.
(5).样本的期望值为: 100 200 200 300 300 400 0.10 0.15 0.40 2 2 2 400 500 500 600 0.20 0.15 15 140 90 82.5 365. 2 2 我们估计总体生产的电 子元件的寿命的 期望值(总体均值)为 365.
总体分布的估计
(3) 由 频 率 分 布 表 可 以 出 看,寿命在 100h ~ 400 的电子元件出现的频为 率 : 0.65, 所 以 我 们 估 计 电 子 元件寿命在 100h ~ 400h的 概 率 为 : 0.65.
( 4 ) .由频率分布表可知,寿 命在400h以上的电子 元件出现的频率为: 0.20 0.15 0.35 ,故我们 估计电子元件寿命在 400h以上的概率为: 0.35.
(5)估计总体的数学期望.
总体分布的估计
寿命 100~200 200~300 300~400 400~500 500~600 合计
频率/组距
频数 20 30 80 40 30 200
频率 0.10 0.15 0.40 0.20 0.15 1
累积频率 0.10 0.25 0.65 0.85 1
0
100 200 300 400 500 600 寿命(h)
• 求解X, 那么a+X即为中位数。
思考题:如何从频率分布直方图中估计中位数? 频率/组距
0.50 0.44 0.40 0.30 0.16 0.20 0.08 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
中位数左边立方图的小矩形面积为0.5 月均用水量 /t 0~2的小矩形面积之和为: 0.5×(0.08+0.16+0.30+0.44)=0.49 0.5-0.49=0.01 0.01/0.5=0.02 如图在直线t=2.02之前所有小矩形的面积为0.5 所以该样本的中位数为2.02
练习.(广东11变式题1)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 45,55, 55,65 ,65,75 , 75,85 , 85,95 由此得到频率 分布直方图如图3,则这20名工人中一天生产 该产品 数量在 的中位 数 .
二 、 众数、中位数、平均数 与频率分布直方图的关系
(在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观 便于形象地进行分析。)
1、众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。 当最高矩形的数据组为〔a, b) 时, 那 么(a+b)/2就是众数。
频率 组距
平均数: 一组数据的算术平均数,即
x=
1 ( x1 x 2 x n ) n
1、 平均数 :由数据及频率计算平均数,即 x = x1f1+x2f2+……xkfk (其中fk是xk的频率。) 2、加权平均数 :由数据及其权数和样本容量计算平均 数 ,即 x = (x1n1+x2n2+……xknk)/n (其中nk是xk的权数, n为样本容量, 且n1+n2 +……nk=n. ) 3、 已知xn的平均数为x, 则kxn+b的平均数为kx+b。
由频率分布直方图估计样本平 均数(或总体数学期望)公式:
X =( a1+b1)/2* f1+ (a2+b2)/2* f2+ … … (ak+bk)/2* fk (其中每组数据的频率还可以由频率直方图的面积计算而得,即组距乘以频率/组距。)
练习.(广东11变式题2)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 45,55, 55,65 ,65,75 , 75,85 , 85,95 由此得到频率 分布直方图如图3,则这20名工人中一天生产 该产品 数量在 的平均 数 .
众数、中位数、平均数都是描述一组 数据的集中趋势的特征数,只是描述的角 度不同,其中以平均数的应用最为广泛. 众数:在一组数据中,出现次数最多 的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列, 把处在最中间位置的一个数据(或最中 间两个数据的平均数)叫做这组数据的 中位数.
3、平均数是频率分布直方图的“重心”.
是直方图的平衡点. n 个样本数据的平均数由 公式:
X=
1 ( x1 x 2 x n ) n
假设每组数据分别为〔a1, b1)、 〔a2, b2)、 … … 〔ak, bk)时, 且每组数据相应的 频率分别为f1、 f2 、 …… fk;那么样本的平 均数(或总体的数学期望)由下列公式计算即 可。
总体分布的估计
练习:对某电子元件进行寿命追踪调查,情况如下: 寿命 个数 100~200 20 200~300 30 300~400 400~500 80 40 500~600 30
(1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的概率;
(4)估计电子元件寿命在400h以上的概率;
0.5 0.4 0.3 0.2 0.1
O
0.5
1
1.5
Biblioteka Baidu
2
2.5
3
3.5
4
4.5
月平均用水量(t)
例题分析:月均用水量的众数是2.25t.如图所示:(2+2.5)/2=2.25
2、从频率分布直方图中估计中位数
(中位数是样本数据所占频率的等分线。)
• 当最高矩形的数据组为〔a, b) 时, 设中位 数为(a+X),根据中位数的定义得知, 中位 数左边立方图的小矩形面积为0.5, 列方程 得: • 当最高矩形的数据组之前所有小矩形的面 积之和为fm;(频率直方图的面积计算,即组距乘以频率/组距。) • x*最高矩形的(频率/组距)+ fm=0.5
思考:从样本数据可知,所求得该样本的众 数、中位数和平均数,这与我们从样本频率 分布直方图得出的结论有偏差,你能解释一 下原因吗? 频率分布直方图损失了一些样本数据,得 到的是一个估计值,且所得估值与数据分组 有关. 注:在只有样本频率分布直方图的情况下,我 们可以按上述方法估计众数、中位数和平均 数,并由此估计总体特征.
(5).样本的期望值为: 100 200 200 300 300 400 0.10 0.15 0.40 2 2 2 400 500 500 600 0.20 0.15 15 140 90 82.5 365. 2 2 我们估计总体生产的电 子元件的寿命的 期望值(总体均值)为 365.
总体分布的估计
(3) 由 频 率 分 布 表 可 以 出 看,寿命在 100h ~ 400 的电子元件出现的频为 率 : 0.65, 所 以 我 们 估 计 电 子 元件寿命在 100h ~ 400h的 概 率 为 : 0.65.
( 4 ) .由频率分布表可知,寿 命在400h以上的电子 元件出现的频率为: 0.20 0.15 0.35 ,故我们 估计电子元件寿命在 400h以上的概率为: 0.35.
(5)估计总体的数学期望.
总体分布的估计
寿命 100~200 200~300 300~400 400~500 500~600 合计
频率/组距
频数 20 30 80 40 30 200
频率 0.10 0.15 0.40 0.20 0.15 1
累积频率 0.10 0.25 0.65 0.85 1
0
100 200 300 400 500 600 寿命(h)
• 求解X, 那么a+X即为中位数。
思考题:如何从频率分布直方图中估计中位数? 频率/组距
0.50 0.44 0.40 0.30 0.16 0.20 0.08 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
中位数左边立方图的小矩形面积为0.5 月均用水量 /t 0~2的小矩形面积之和为: 0.5×(0.08+0.16+0.30+0.44)=0.49 0.5-0.49=0.01 0.01/0.5=0.02 如图在直线t=2.02之前所有小矩形的面积为0.5 所以该样本的中位数为2.02
练习.(广东11变式题1)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 45,55, 55,65 ,65,75 , 75,85 , 85,95 由此得到频率 分布直方图如图3,则这20名工人中一天生产 该产品 数量在 的中位 数 .
二 、 众数、中位数、平均数 与频率分布直方图的关系
(在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观 便于形象地进行分析。)
1、众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。 当最高矩形的数据组为〔a, b) 时, 那 么(a+b)/2就是众数。
频率 组距
平均数: 一组数据的算术平均数,即
x=
1 ( x1 x 2 x n ) n
1、 平均数 :由数据及频率计算平均数,即 x = x1f1+x2f2+……xkfk (其中fk是xk的频率。) 2、加权平均数 :由数据及其权数和样本容量计算平均 数 ,即 x = (x1n1+x2n2+……xknk)/n (其中nk是xk的权数, n为样本容量, 且n1+n2 +……nk=n. ) 3、 已知xn的平均数为x, 则kxn+b的平均数为kx+b。
由频率分布直方图估计样本平 均数(或总体数学期望)公式:
X =( a1+b1)/2* f1+ (a2+b2)/2* f2+ … … (ak+bk)/2* fk (其中每组数据的频率还可以由频率直方图的面积计算而得,即组距乘以频率/组距。)
练习.(广东11变式题2)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 45,55, 55,65 ,65,75 , 75,85 , 85,95 由此得到频率 分布直方图如图3,则这20名工人中一天生产 该产品 数量在 的平均 数 .