众数、中位数、平均数与频率分布直方图的关系
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中位数:将一组数据按大小依次排列, 把处在最中间位置的一个数据(或最中 间两个数据的平均数)叫做这组数据的 中位数.
平均数: 一组数据的算术平均数,即
x=
1 ( x1 x 2 x n ) n
1、 平均数 :由数据及频率计算平均数,即 x = x1f1+x2f2+……xkfk (其中fk是xk的频率。) 2、加权平均数 :由数据及其权数和样本容量计算平均 数 ,即 x = (x1n1+x2n2+……xknk)/n (其中nk是xk的权数, n为样本容量, 且n1+n2 +……nk=n. ) 3、 已知xn的平均数为x, 则kxn+b的平均数为kx+b。
三、用频率分布直方图估计总体数字的特征 的利弊: 总体的各种数值特征都可以由两种途径来估计, 直接利用样本数据或由频率分布直方图来估计。 两种方法各有利弊;比如:
1、通过频率分布直方图的估计精度低; 2、通过频率分布直方图的估计结果与数据分组 有关; 3、在不能得到样本数据,只能得到频率分布直 方图的情况下,也可以估计总体特征,而且直方 图比较直观便于形象地进行分析。
总体分布的估计
练习:对某电子元件进行寿命追踪调查,情况如下: 寿命 个数 100~200 20 200~300 30 300~400 400~500 80 40 500~600 30
(1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的概率;
(4)估计电子元件寿命在400h以上的概率;
0.5 0.4 0.3 0.2 0.1
O
0.5
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
例题分析:月均用水量的众数是2.25t.如图所示:(2+2.5)/2=2.25
2、从频率分布直方图中估计中位数
(中位数是样本数据所占频率的等分线。)
• 当最高矩形的数据组为〔a, b) 时, 设中位 数为(a+X),根据中位数的定义得知, 中位 数左边立方图的小矩形面积为0.5, 列方程 得: • 当最高矩形的数据组之前所有小矩形的面 积之和为fm;(频率直方图的面积计算,即组距乘以频率/组距。) • x*最高矩形的(频率/组距)+ fm=0.5
思考:从样本数据可知,所求得该样本的众 数、中位数和平均数,这与我们从样本频率 分布直方图得出的结论有偏差,你能解释一 下原因吗? 频率分布直方图损失了一些样本数据,得 到的是一个估计值,且所得估值与数据分组 有关. 注:在只有样本频率分布直方图的情况下,我 们可以按上述方法估计众数、中位数和平均 数,并由此估计总体特征.
• 求解X, 那么a+X即为中位数。
思考题:如何从频率分布直方图中估计中位数? 频率/组距
0.50 0.44 0.40 0.30 0.16 0.20 0.08 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
中位数左边立方图的小矩形面积为0.5 月均用水量 /t 0~2的小矩形面积之和为: 0.5×(0.08+0.16+0.30+0.44)=0.49 0.5-0.49=0.01 0.01/0.5=0.02 如图在直线t=2.02之前所有小矩形的面积为0.5 所以该样本的中位数为2.02
四、三种数字特征的优缺点 :
(1)众数体现了样本数据的最大集中点,但它显然对 其他数据信息的忽视使得无法客观地反映总体特征。 (2)中位数是样本数据所占频率的等分线,它不受 少数几个极端值的影响,这在某些情况下是优点, 但它对极端值不敏感有时也会成为缺点. (3)由于平均数与每一个样本的数据有关,所以任 何一个样本数据的改变都会引起平均数的改变,这 是众数、中位数都不具有的性质。但平均数受数据 中的极端值的影响较大,使平均数在估计总体时可 靠性降低。
由频率分布直方图估计样本平 均数(或总体数学期望)公式:
X =( a1+b1)/2* f1+ (a2+b2)/2* f2+ … … (ak+bk)/2* fk (其中每组数据的频率还可以由频率直方图的面积计算而得,即组距乘以频率/组距。)
练习.(广东11变式题2)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 45,55, 55,65 ,65,75 , 75,85 , 85,95 由此得到频率 分布直方图如图3,则这20名工人中一天生产 该产品 数量在 的平均 数 .
用样本数字特征估计总体数字特征
(制作老师: 欧阳文丰)
众数、中位数、平均数与频率分布直方 图的关系
一 众数、中位数、平均数的概念
众数、中位数、平均数都是描述一组 数据的集中趋势的特征数,只是描述的角 度不同,其中以平均数的应用最为广泛. 众数:在一组数据中,出现次数最多 的数据叫做这组数据的众数.
众数、中位数、平均数与频率分布直方图的关系:
Hale Waihona Puke Baidu
3、平均数是直方图的“重心”(平衡点).
(5)估计总体的数学期望.
总体分布的估计
寿命 100~200 200~300 300~400 400~500 500~600 合计
频率/组距
频数 20 30 80 40 30 200
频率 0.10 0.15 0.40 0.20 0.15 1
累积频率 0.10 0.25 0.65 0.85 1
0
100 200 300 400 500 600 寿命(h)
总体分布的估计
(3) 由 频 率 分 布 表 可 以 出 看,寿命在 100h ~ 400 的电子元件出现的频为 率 : 0.65, 所 以 我 们 估 计 电 子 元件寿命在 100h ~ 400h的 概 率 为 : 0.65.
( 4 ) .由频率分布表可知,寿 命在400h以上的电子 元件出现的频率为: 0.20 0.15 0.35 ,故我们 估计电子元件寿命在 400h以上的概率为: 0.35.
解:平均数是6,方差是8,标准差是 2 2 .
2 a 2、 2 a 3 的平均数、方差、 如果求 2 a1、 标准差?已知ai的平均数X、方差Y、标准差Z, 则b+kai的平均数
是b+kx, 方差是k的平方与Y的乘积,标准差是k与Z的乘积。
(当然Y=Z的平方!)
总结
1、众数在样本数据的频率分布直方图中,就 是最高矩形的中点的横坐标。 2、中位数左边和右边的直方图的面积应该 相等,由取可估计中位数的值。
3、平均数是频率分布直方图的“重心”.
是直方图的平衡点. n 个样本数据的平均数由 公式:
X=
1 ( x1 x 2 x n ) n
假设每组数据分别为〔a1, b1)、 〔a2, b2)、 … … 〔ak, bk)时, 且每组数据相应的 频率分别为f1、 f2 、 …… fk;那么样本的平 均数(或总体的数学期望)由下列公式计算即 可。
(5).样本的期望值为: 100 200 200 300 300 400 0.10 0.15 0.40 2 2 2 400 500 500 600 0.20 0.15 15 140 90 82.5 365. 2 2 我们估计总体生产的电 子元件的寿命的 期望值(总体均值)为 365.
练习.(广东11变式题1)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 45,55, 55,65 ,65,75 , 75,85 , 85,95 由此得到频率 分布直方图如图3,则这20名工人中一天生产 该产品 数量在 的中位 数 .
1、在一次歌手大奖赛上,七位评委为歌手打出的分数 如下: 9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分 和一个最低分后,所剩数据的平均值和方差分别为 _________________ ; 9.5,0.016 去掉最高分和最低分合理吗? 2 2 2、已知数据 a1 , a2 , a的平均数是 3,方差为2,求 3 数据 2a1 , 2a 的平均数、方差、标准差? 2 , 2a3
二 、 众数、中位数、平均数 与频率分布直方图的关系
(在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观 便于形象地进行分析。)
1、众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。 当最高矩形的数据组为〔a, b) 时, 那 么(a+b)/2就是众数。
频率 组距
平均数: 一组数据的算术平均数,即
x=
1 ( x1 x 2 x n ) n
1、 平均数 :由数据及频率计算平均数,即 x = x1f1+x2f2+……xkfk (其中fk是xk的频率。) 2、加权平均数 :由数据及其权数和样本容量计算平均 数 ,即 x = (x1n1+x2n2+……xknk)/n (其中nk是xk的权数, n为样本容量, 且n1+n2 +……nk=n. ) 3、 已知xn的平均数为x, 则kxn+b的平均数为kx+b。
三、用频率分布直方图估计总体数字的特征 的利弊: 总体的各种数值特征都可以由两种途径来估计, 直接利用样本数据或由频率分布直方图来估计。 两种方法各有利弊;比如:
1、通过频率分布直方图的估计精度低; 2、通过频率分布直方图的估计结果与数据分组 有关; 3、在不能得到样本数据,只能得到频率分布直 方图的情况下,也可以估计总体特征,而且直方 图比较直观便于形象地进行分析。
总体分布的估计
练习:对某电子元件进行寿命追踪调查,情况如下: 寿命 个数 100~200 20 200~300 30 300~400 400~500 80 40 500~600 30
(1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的概率;
(4)估计电子元件寿命在400h以上的概率;
0.5 0.4 0.3 0.2 0.1
O
0.5
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
例题分析:月均用水量的众数是2.25t.如图所示:(2+2.5)/2=2.25
2、从频率分布直方图中估计中位数
(中位数是样本数据所占频率的等分线。)
• 当最高矩形的数据组为〔a, b) 时, 设中位 数为(a+X),根据中位数的定义得知, 中位 数左边立方图的小矩形面积为0.5, 列方程 得: • 当最高矩形的数据组之前所有小矩形的面 积之和为fm;(频率直方图的面积计算,即组距乘以频率/组距。) • x*最高矩形的(频率/组距)+ fm=0.5
思考:从样本数据可知,所求得该样本的众 数、中位数和平均数,这与我们从样本频率 分布直方图得出的结论有偏差,你能解释一 下原因吗? 频率分布直方图损失了一些样本数据,得 到的是一个估计值,且所得估值与数据分组 有关. 注:在只有样本频率分布直方图的情况下,我 们可以按上述方法估计众数、中位数和平均 数,并由此估计总体特征.
• 求解X, 那么a+X即为中位数。
思考题:如何从频率分布直方图中估计中位数? 频率/组距
0.50 0.44 0.40 0.30 0.16 0.20 0.08 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
中位数左边立方图的小矩形面积为0.5 月均用水量 /t 0~2的小矩形面积之和为: 0.5×(0.08+0.16+0.30+0.44)=0.49 0.5-0.49=0.01 0.01/0.5=0.02 如图在直线t=2.02之前所有小矩形的面积为0.5 所以该样本的中位数为2.02
四、三种数字特征的优缺点 :
(1)众数体现了样本数据的最大集中点,但它显然对 其他数据信息的忽视使得无法客观地反映总体特征。 (2)中位数是样本数据所占频率的等分线,它不受 少数几个极端值的影响,这在某些情况下是优点, 但它对极端值不敏感有时也会成为缺点. (3)由于平均数与每一个样本的数据有关,所以任 何一个样本数据的改变都会引起平均数的改变,这 是众数、中位数都不具有的性质。但平均数受数据 中的极端值的影响较大,使平均数在估计总体时可 靠性降低。
由频率分布直方图估计样本平 均数(或总体数学期望)公式:
X =( a1+b1)/2* f1+ (a2+b2)/2* f2+ … … (ak+bk)/2* fk (其中每组数据的频率还可以由频率直方图的面积计算而得,即组距乘以频率/组距。)
练习.(广东11变式题2)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 45,55, 55,65 ,65,75 , 75,85 , 85,95 由此得到频率 分布直方图如图3,则这20名工人中一天生产 该产品 数量在 的平均 数 .
用样本数字特征估计总体数字特征
(制作老师: 欧阳文丰)
众数、中位数、平均数与频率分布直方 图的关系
一 众数、中位数、平均数的概念
众数、中位数、平均数都是描述一组 数据的集中趋势的特征数,只是描述的角 度不同,其中以平均数的应用最为广泛. 众数:在一组数据中,出现次数最多 的数据叫做这组数据的众数.
众数、中位数、平均数与频率分布直方图的关系:
Hale Waihona Puke Baidu
3、平均数是直方图的“重心”(平衡点).
(5)估计总体的数学期望.
总体分布的估计
寿命 100~200 200~300 300~400 400~500 500~600 合计
频率/组距
频数 20 30 80 40 30 200
频率 0.10 0.15 0.40 0.20 0.15 1
累积频率 0.10 0.25 0.65 0.85 1
0
100 200 300 400 500 600 寿命(h)
总体分布的估计
(3) 由 频 率 分 布 表 可 以 出 看,寿命在 100h ~ 400 的电子元件出现的频为 率 : 0.65, 所 以 我 们 估 计 电 子 元件寿命在 100h ~ 400h的 概 率 为 : 0.65.
( 4 ) .由频率分布表可知,寿 命在400h以上的电子 元件出现的频率为: 0.20 0.15 0.35 ,故我们 估计电子元件寿命在 400h以上的概率为: 0.35.
解:平均数是6,方差是8,标准差是 2 2 .
2 a 2、 2 a 3 的平均数、方差、 如果求 2 a1、 标准差?已知ai的平均数X、方差Y、标准差Z, 则b+kai的平均数
是b+kx, 方差是k的平方与Y的乘积,标准差是k与Z的乘积。
(当然Y=Z的平方!)
总结
1、众数在样本数据的频率分布直方图中,就 是最高矩形的中点的横坐标。 2、中位数左边和右边的直方图的面积应该 相等,由取可估计中位数的值。
3、平均数是频率分布直方图的“重心”.
是直方图的平衡点. n 个样本数据的平均数由 公式:
X=
1 ( x1 x 2 x n ) n
假设每组数据分别为〔a1, b1)、 〔a2, b2)、 … … 〔ak, bk)时, 且每组数据相应的 频率分别为f1、 f2 、 …… fk;那么样本的平 均数(或总体的数学期望)由下列公式计算即 可。
(5).样本的期望值为: 100 200 200 300 300 400 0.10 0.15 0.40 2 2 2 400 500 500 600 0.20 0.15 15 140 90 82.5 365. 2 2 我们估计总体生产的电 子元件的寿命的 期望值(总体均值)为 365.
练习.(广东11变式题1)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 45,55, 55,65 ,65,75 , 75,85 , 85,95 由此得到频率 分布直方图如图3,则这20名工人中一天生产 该产品 数量在 的中位 数 .
1、在一次歌手大奖赛上,七位评委为歌手打出的分数 如下: 9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分 和一个最低分后,所剩数据的平均值和方差分别为 _________________ ; 9.5,0.016 去掉最高分和最低分合理吗? 2 2 2、已知数据 a1 , a2 , a的平均数是 3,方差为2,求 3 数据 2a1 , 2a 的平均数、方差、标准差? 2 , 2a3
二 、 众数、中位数、平均数 与频率分布直方图的关系
(在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观 便于形象地进行分析。)
1、众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。 当最高矩形的数据组为〔a, b) 时, 那 么(a+b)/2就是众数。
频率 组距