用频率分布直方图估计三个特征数

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 ( x1 x 2 x n ) n
数,即 x=
频率 组距
众数在样本数据的频率分布直方图中 就是最高矩形的中点的横坐标。 例如下面是100位居民的月均用水量, 从这些样本数据的频率分布直方图可以 看出,月均用水量的众数是 2.25t
0.5 0.4 0.3 0.2 0.1
O
0.5
1
1.5
3、平均数是频率分布直方图的“重心”.是直方图的 频率 组距 平衡点n 个样本数据的平均数由公式:
1 X= ( x1 x 2 x n ) n
0.5 0.4 0.3
0.2
0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
上图显示了居民月均用水量的平均数: x=1.973
ຫໍສະໝຸດ Baidu
2.02这个中位数的估计值,与样本的中 位数值2.0不一样,你能解释其中的原因吗?
2.02这个中位数的估计值,与样本的中 位数值2.0不一样,这是因为样本数据的 频率分布直方图,只是直观地表明分布 的形状,但是从直方图本身得不出原始 的数据内容,所以由频率分布直方图得 到的中位数估计值往往与样本的实际 中位数值不一致.
三、 三种数字特征的优缺点 1、众数体现了样本数据的最大集中点,但它对其它数据信息的 忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉 我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民 数多,但它并没有告诉我们多多少. 2、中位数是样本数据所占频率的等分线,它不受少数几个极 端值的影响,这在某些情况下是优点,但它对极端值的不敏感有 时也会成为缺点。如上例中假设有某一用户月均用水量为10t, 那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是 不能忽视的。 3、由于平均数与每一个样本的数据有关,所以任何一个样本数 据的改变都会引起平均数的改变,这是众数、中位数都不具有的 性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映 出更多的关于样本数据全体的信息,但平均数受数据中的极端值 的影响较大,使平均数在估计时可靠性降低。
2 2.25 2.5
3
3.5
4
4.5
月平均用水量(t)
频率 组距
在样本中,有50%的个体小于或等于中位数, 也有50%的个体大于或等于中位数, 因此,在频率分布直方图中,中位数左边和右边的 直方图的面积应该相等,由此可以估计中位数的值
下图居民月均用水量的中位数的估计值为 2.02
0.5 0.4 0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
用样本的数字特征估计总 体的数字特征
一 众数、中位数、平均数的概念
众数:在一组数据中,出现次数最多的 数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把处 在最中间位置的一个数据(或最中间两个数 据的平均数)叫做这组数据的中位数.
平均数: 一组数据 x1 , x2 xn 的算术平均
相关文档
最新文档