集中趋势和离散趋势

合集下载

集中趋势和离散趋势

集中趋势和离散趋势

集中趋势和离散趋势集中趋势和离散趋势是描述数据分布特征的两个重要概念。

集中趋势用于衡量数据的中心位置,一般用平均值、中位数和众数来表示;而离散趋势则用于量化数据的分散程度,常用的度量包括范围、方差和标准差等。

首先,集中趋势是指数据的中心位置,它反映了数据的一般水平。

平均值是一组数据中所有数值的总和除以数据的个数,它具有高可操作性和表达性,但对于含有极端值的数据可能会有较大的偏差。

中位数是将一组数据按大小顺序排列后位于数列中间的数值,它对异常值不敏感,能够更好地展示数据整体分布情况。

众数是一组数据中出现频率最高的数值,常用于描述离散型数据的集中趋势。

其次,离散趋势是指数据的分散程度或分布的离散程度,它反映了数据的差异程度。

范围是数据的最大值和最小值之间的差异,它直观地反映了数据的波动范围。

方差是数据与平均值之间差异的平均值,它衡量了数据整体的离散程度,数值越大表示数据越分散。

标准差是方差的平方根,它具有与原始数据相同的度量单位,常用于度量连续型数据的离散趋势。

集中趋势和离散趋势在统计学中有广泛的应用。

在描述数据特征时,通过集中趋势可以直观地了解数据的中心位置和一般水平,从而具有参考价值。

而离散趋势则帮助我们了解数据的变异程度,通过度量数据的分散程度可以判断数据的稳定性和可靠性。

这两个概念相辅相成,共同构成了对数据特征的全面描述。

当进行数据分析和决策时,我们需要同时考虑数据的集中趋势和离散趋势。

集中趋势能够帮助我们了解数据的普遍水平,为个体或群体的表现提供参考,而离散趋势可以帮助我们判断数据的稳定性和差异程度,进而做出更加准确的决策。

总之,集中趋势和离散趋势是描述数据特征的两个重要概念。

集中趋势用于衡量数据的中心位置,离散趋势用于度量数据的分散程度。

它们互为补充,帮助我们全面了解数据的特征,从而更好地进行数据分析和决策。

数据的集中趋势与离散程度

数据的集中趋势与离散程度

数据的集中趋势与离散程度统计学中,描述和衡量数据分布特征的两个重要方面是集中趋势和离散程度。

集中趋势指的是数据集中在哪个数值附近,而离散程度描述了数据的分散程度。

在本文中,我将详细介绍集中趋势和离散程度的定义、常用的衡量指标和如何应用。

一、集中趋势集中趋势是指数据集中在哪个数值处的趋势或位置,常用的衡量指标包括均值、中位数和众数。

1. 均值均值是数据集所有观测值的算术平均数。

它是最常用的衡量集中趋势的指标。

计算均值的方法是将所有观测值相加,再除以观测值的个数。

均值受极端值的影响较大。

2. 中位数中位数是将数据集按照大小排序后,位于中间位置的观测值。

如果数据集的个数是奇数,则中位数就是排序后位于中间的观测值;如果数据集的个数是偶数,则中位数是中间两个观测值的平均数。

中位数对极端值不敏感,更能反映数据的典型情况。

3. 众数众数是数据集中出现频率最高的观测值。

一个数据集可能存在一个众数,也可能存在多个众数,或者没有众数。

众数主要用于描述离散型数据。

二、离散程度离散程度是描述数据分散程度的指标,常用的衡量指标包括极差、方差和标准差。

1. 极差极差是数据集中最大观测值和最小观测值之间的差值。

极差越大,表示数据的离散程度越大;极差越小,表示数据的离散程度越小。

极差对极端值非常敏感。

2. 方差方差是数据集观测值与均值之差的平方的平均值。

方差衡量了数据与其均值之间的离散程度,数值越大表示数据的离散程度越大,反之亦然。

方差对极端值非常敏感。

3. 标准差标准差是方差的平方根,用于衡量数据集的离散程度。

标准差具有与原始数据相同的度量单位,比方差更容易解释和理解。

标准差越大,表示数据的离散程度越大,反之亦然。

三、应用集中趋势和离散程度的概念和指标在各个领域具有广泛的应用。

在金融领域,通过分析股票价格的均值和离散程度,可以评估股票的风险和收益。

在市场调研中,通过分析产品价格的中位数和标准差,可以了解市场需求和产品价值的稳定性。

第2讲 频数分布的集中趋势与离散趋势

第2讲   频数分布的集中趋势与离散趋势

第二讲 频数分布的集中趋势与离散趋势① 频数分布通过调查或试验取得原始资料后,要对全部资料进行检查和核对后,才能进行数据的整理。

根据样本资料的多少确定是否分组,一般样本容量n<30称为小样本,可直接进行统计描述分析,样本容量n>30称为大样本,此时须将数据分成若干组后进行描述分析。

1、频数分布表1)、频数表的编制相同观察结果出现的次数称为频数。

将所有观察结果的频数按一定顺序排列在一起便是频数表(frequency table)。

步骤:① 找出最大和最小值,计算极差 R=X max ―X min② 根据斯梯阶公式确定组距n RH log 322.31+=③ 扫描样本值,划记后获得频数 2)、频数表的用途① 大样本数据(不限于计量资料)常用的表达方式。

② 便于观察数据的分布类型。

③ 便于发现资料中远离群体的某些特大或特小的可疑值,必要时经检验后舍去。

④ 当样本含量足够大时,各组段的分布频率作为分布概率的估计值。

样本量与分组数量的关系样本量分组数30 ~ 60 5 ~ 860 ~ 100 7 ~ 10100 ~ 200 9 ~ 12200 ~ 500 10 ~ 18500以上15 ~ 30例1:某地随机检查了140名成年男性红细胞数(1012/L)4.765.26 5.61 5.95 4.46 4.57 4.31 5.18 4.92 4.27 4.77 4.885.00 4.73 4.47 5.34 4.70 4.81 4.93 5.04 4.40 5.27 4.63 5.50 5.24 4.97 4.71 4.44 4.94 5.05 4.78 4.52 4.63 5.51 5.24 4.98 4.33 4.83 4.56 5.44 4.79 4.91 4.26 4.38 4.87 4.99 5.60 4.46 4.95 5.07 4.80 5.30 4.65 4.77 4.50 5.37 5.49 5.22 4.58 5.074.81 4.54 3.82 4.01 4.89 4.625.12 4.85 4.59 5.08 4.82 4.935.05 4.40 4.14 5.01 4.37 5.24 4.60 4.71 4.82 4.94 5.05 4.79 4.52 4.64 4.37 4.87 4.60 4.72 4.83 5.33 4.68 4.80 4.15 4.65 4.76 4.88 4.61 3.97 4.08 4.58 4.31 4.05 4.16 5.04 5.15 4.50 4.62 4.73 4.47 4.58 4.70 4.81 4.55 4.28 4.78 4.51 4.63 4.36 4.48 4.59 5.09 5.20 5.32 5.05 4.41 4.52 4.64 4.75 4.49 4.22 4.71 5.21 4.94 4.68 5.17 4.91 5.02 4.76R= 5.95 ― 3.82 = 2.13连续型资料:红细胞数(1012/L)(1)频数f(2)组中值X(3)Fx(4)=(2)*(3)3.80~4.00~ 4.20~ 4.40~ 4.60~4.80~5.00~ 5.20~ 5.40~ 5.60~ 5.80~ 261125322717134213.904.104.304.504.704.905.105.305.505.705.907.824.647.3112.5150.4132.386.768.922.011.45.9合计140(∑f)669.8(∑fX)离散型资料:我国某地农村1995年已婚育龄妇女现有子女数的分布子女数(1)妇女数f(2)频率(%)(3)累计频数(4)累计频率(%)(5)0 1 2 3 4 5 6 7 8 9 ≥10 合计137512519130426285602171913695725532681513731561455259.4517.3020.9119.6214.929.414.982.250.100.260.11100.0013751389226934897908119627133322140577143845144996145369145525——9.4526.7547.6567.2882.2091.6196.6098.8599.6499.89100.00——(一)、均数(mean )的计算① 直接法n xn x x x x x in∑=+++=...32 1例2. 10名7岁男童体重(kg )分别为:17.3、 18.0、 19.4、 20.6、21.2、21.8、 22.5、 23.2、 24.0、 25.5,求平均体重。

正态分布的集中趋势和离散统计指标

正态分布的集中趋势和离散统计指标

正态分布的集中趋势和离散统计指标在统计学中,正态分布是一种非常重要且常见的概率分布,也被称为高斯分布。

它具有许多重要特性,其中包括集中趋势和离散统计指标。

在本文中,我们将探讨正态分布的集中趋势和离散统计指标,以及它们在实际应用中的意义和重要性。

1. 集中趋势指标正态分布的集中趋势指标是描述数据集中取值位置的统计量。

常见的集中趋势指标包括均值、中位数和众数。

其中,均值是所有数据值的平均数,是最常用的集中趋势指标之一。

在正态分布中,均值通常位于分布的中心位置,并且具有对称性。

除了均值,中位数和众数也是描述集中趋势的重要指标。

中位数是将数据集等分为两部分的数值,而众数则是数据集中出现最频繁的数值。

在实际应用中,集中趋势指标可以帮助我们理解数据分布的中心位置,判断数据的平均水平,并做出相应的决策。

在财务报表分析中,我们可以利用均值来评估企业的盈利水平,进而制定财务策略和规划预算。

在医学研究中,研究人员也常用中位数来描述疾病的发病率,以便做出治疗方案和预防措施。

2. 离散统计指标除了集中趋势指标外,正态分布还具有离散统计指标,用于描述数据的分散程度和波动性。

常用的离散统计指标包括标准差、方差和极差。

标准差是数据偏离均值的平均距离,是描述数据离散程度的重要统计量。

方差则是标准差的平方,用于衡量数据的波动性和离散程度。

另外,极差是描述数据取值范围的统计量,可以帮助我们了解数据的最大和最小取值之间的差异程度。

在实际应用中,离散统计指标可以帮助我们评估数据的波动性和风险程度,从而制定相应的风险管理和控制策略。

在金融投资中,我们可以利用标准差来衡量资产价格的波动性,进而评估投资风险并调整投资组合。

在生产制造中,研究人员也常用方差来评估生产过程的稳定性和一致性,以便提高生产效率和质量。

个人观点和理解对于正态分布的集中趋势和离散统计指标,我认为它们在数据分析和决策制定中起着至关重要的作用。

集中趋势指标可以帮助我们理解数据的中心位置,从而判断平均水平和典型取值。

集中和离散趋势指标

集中和离散趋势指标

集中和离散趋势指标1.引言1.1 概述概述部分将介绍集中和离散趋势指标的基本概念和背景。

集中趋势指标和离散趋势指标是统计学中常用的分析工具,用于描述和度量数据集中和离散程度的重要指标。

在实际问题中,我们经常遇到需要描述和分析数据集中和离散程度的情况。

集中趋势指标主要关注数据的中心值,用于度量数据集中在何处,以及数据的均匀分布程度。

而离散趋势指标则用于度量数据的分散程度,即数据的离散程度有多大。

集中趋势指标和离散趋势指标在统计学、经济学、金融学等领域被广泛应用。

例如,在统计学中,我们常常使用平均值、中位数、众数等指标来描述数据的集中趋势;而方差、标准差、极差等指标则用于度量数据的离散趋势。

本文将分别介绍集中趋势指标和离散趋势指标的定义和解释,并列举一些常见的集中趋势指标和离散趋势指标的示例。

通过对这些指标的应用和分析,我们能够更加客观地了解数据的分布特征,为后续的数据分析和决策提供依据。

在下一章节的正文部分,我们将详细介绍集中趋势指标和离散趋势指标的定义、计算方法和使用场景。

希望通过本文的介绍,读者能够对集中和离散趋势指标有一个全面的认识,并能够在实际应用中灵活运用这些指标,提高数据分析的精确性和准确性。

接下来,我们将开始介绍集中趋势指标的相关内容,包括定义和解释等方面的内容。

敬请关注!1.2 文章结构文章结构部分的内容:本文将围绕集中和离散趋势指标展开讨论。

首先,在引言部分进行概述,介绍集中和离散趋势指标的基本概念和作用。

然后,通过分析文章目录可以看出,正文部分将重点介绍集中趋势指标和离散趋势指标,包括它们的定义和解释以及常见的指标类型。

最后,在结论部分对集中趋势指标和离散趋势指标的应用进行总结。

具体而言,在正文部分,我们会首先介绍集中趋势指标,包括其定义和解释。

随后,会详细介绍一些常见的集中趋势指标,例如均值、中位数和众数等。

这些指标能够反映数据集中在某个位置或数值上的趋势,有助于我们对数据的整体特征进行理解和分析。

3第三章 集中趋势和离散趋势

3第三章 集中趋势和离散趋势

f
2
Sm1 i
fm
式中: U ——中位数所在组的上限
Sm1 ——大于中位数组的各组次数之和
中位数最大的特点是:它是序列中间1项或2项的平均数,不受极 端值的影响,所以在当一个变量数列中含有特大值与特小值的情 况下,采用中位数较为适宜。正式由于中位数的这一特点,在统 计研究中,当遇到掌握统计资料不多而且各标志值之间差异程度 较大或频数分布有偏态时,为避免计算标志值所得的算术平均数 偏大或偏小,就可利用中位数来表示现象的一般水平。
返回本章
返回总目录
4. 中位数
中位数是一种按其在数列中的特殊位置而决定的平均数。把总 体各单位标志值按大小顺序排列后,处在中点位次的标志值就 是中位数,它将全部标志值分成两个部分,一半标志值比它大, 一半标志值比它小,而且比它大的标志值个数和比它小的标志 值个数相等。
要求得中位数,首先要确定中位数的位次。
返回本章
返回总目录
用偏度系数准确地测定分布的偏斜程度和进行比较分析。
※ Pearson偏度系数,用SK 表示。
SK X MO
SK 为无量纲的系数,通常取值在-3~+3之间。绝对值越大,
说明分布的倾斜程度越大。
SK =0 SK > 0 SK < 0
对称分布 右偏分布 左偏分布
返回本章
返回总目录
过给定的范围,就说明有不正常情况产伤。但极差受到极端是的影响,测
定结果往往不能反映数据的实际离散程度。
返回本章
返回总目录
2. 四分位差
四分位差是根据四分位数计算的。首先把变量各单位标志值从 小到大排序,再将数列四等分,处于四分位点位次的标志值就 是四分位数,记作 M1,M2,M3 ,M1 为第一四分位数(也称为下 四分位数),M2 为第二四分位数,就是中位数 Me ,M3 为第三 四分位数。 四分位差的计算公式为: 四分位差 M3 M1

集中趋势与离散趋势

集中趋势与离散趋势
交互式数据探索
允许用户自定义查询条件、筛选数据和调整图表 参数,以便更深入地探索数据的内在规律和关联 关系。
数据动画
将数据变化过程以动画形式展现出来,帮助用户 更直观地理解数据的变化趋势和动态特征。
06 总结与展望
CHAPTER
主要发现与结论
集中趋势描述
通过平均数、中位数和众数等指标,可以有 效地描述数据的集中趋势,反映数据分布的 中心位置。
众数
一组数据中出现次数最多的数。众数可能不唯一,也可能不存在。众数适用于分类数据和顺序数据,对于数值型 数据,如果数据分布的波动性较大,众数可能不能很好地代表数据的集中趋势。
03 离散趋势
CHAPTER
定义与概念
离散趋势
指一组数据中各数值之间的差异程度 或离散程度,是数据分布的另一个重 要特征。
直方图(Histogram)
将数据按照一定范围进行分组并用矩形条表示,通过矩形条的高度和宽度反映数据的分布 规律。
散点图(Scatter Plot)
用点的位置表示两个变量之间的关系,可通过观察点的分布情况和趋势线分析数据的集中 和离散趋势。
动态数据可视化在趋势分析中的应用
1 2 3
时间序列分析
通过动态展示数据随时间变化的情况,揭示数据 的长期趋势、季节波动和周期性规律。
• 关注数据质量和异常值处理:在实际数据分析中,异常值和数据质量问题是不 可忽视的。未来的研究可以关注如何有效地处理异常值和数据质量问题,以提 高集中趋势和离散趋势分析的准确性和可靠性。例如,可以采用稳健的统计方 法或者数据清洗技术对异常值进行处理,以保证分析结果的稳定性和可靠性。
谢谢
THANKS
Tableau
功能强大的数据可视化工具,支持交互式数据分析和动态图表展示, 适用于大数据处理。

集中趋势离散趋势分布形态

集中趋势离散趋势分布形态

集中趋势离散趋势分布形态【最新版】目录1.什么是集中趋势和离散趋势2.集中趋势的度量指标3.离散趋势的度量指标4.集中趋势和离散趋势的应用正文集中趋势和离散趋势是统计学中常用的概念,用于描述一组数据的特征。

集中趋势是指一组数据所趋向的中心数值,而离散趋势则是指数据值之间的差异程度。

集中趋势的度量指标包括算术均数、几何均数、中位数和百分位数。

算术均数是一组数据所有数值的和除以数据个数,它对总体的平均水平具有代表性。

几何均数适用于描述正偏态分布的数据集,它是所有数据值的乘积的 n 次方根。

中位数是一组数据排序后位于中间位置的数值,它对总体的中心位置具有代表性。

百分位数则是将一组数据按照大小排序后,某个百分比位置的数值。

离散趋势的度量指标包括方差、标准差、范围、四分位差和离散系数。

方差是一组数据与其算术均值之差的平方和的平均值,它反映了数据的波动程度。

标准差是方差的平方根,它也是描述数据离散程度的一个常用指标。

范围是一组数据中最大值与最小值之差,它反映了数据的范围。

四分位差是一组数据中上四分位数与下四分位数之差,它用于描述数据的中间50% 范围内的离散程度。

离散系数是标准差与算术均值之比,它用于比较不同单位或量级的数据集的离散程度。

集中趋势和离散趋势在实际应用中有着广泛的应用。

例如,在经济学中,可以使用集中趋势度量指标来描述收入、财富或产量的分布情况,而离散趋势度量指标则可以用来评估经济不平等程度或市场竞争程度。

在生物学中,集中趋势和离散趋势可以用来描述生物种群的特征,如平均寿命、身高、体重等。

在教育学中,集中趋势和离散趋势可以用来评估学生的学术表现,如平均成绩、成绩分布等。

总之,集中趋势和离散趋势是描述数据特征的重要概念,它们在实际应用中有着广泛的应用价值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Variance and Standard Deviation
返回总目录
集中趋势的测度
集中趋势是对频数分布资料的集中状况和平均水平的综 合测度。而离散趋势是对频数分布资料的差异程度和离 散程度的测度,用来衡量集中趋势所测度的代表性,或 者反映变量值的稳定性和均匀性。
常用来表达数列集中趋势的测度有算术平均数、调和平均 数、几何平均数、中位数和众数。这些测度在统计学中也 称为平均指标或平均数,可以用来反映标志值的典型水平 和标志值分布的中心位置或集中趋势。
几何平均数
(概念要点)
1. 2. 3. 4. 5. 集中趋势的测度值之一 N 个变量值乘积的 N 次方根 适用于特殊的数据 主要用于计算平均发展速度 计算公式为
GM N X 1 X 2 X N N X i
i 1 N
6. 可看作是均值的一种变形
1 log GM (log X 1 log X 2 log X N ) N

XH
m1 m2 m3 mn mn m1 m2 m3 X1 X 2 X 3 Xn
m
i 1 n
n
i
mi X i 1 i
调和平均数
(概念要点)
1. 集中趋势的测度值之一 2. 均值的另一种表现形式 3. 易受极端值的影响 4. 用于定比数据 5. 不能用于定类数据和定序数据 6. 计算公式为L源自fmfSm1
i
——中位数所在组的组距
也可以利用中位数所在组的上限来测算中位数,即中位数的 上限公式为 :
Me U
f
2
Sm 1 fm
i
式中: U
Sm1
——中位数所在组的上限 ——大于中位数组的各组次数之和
中位数最大的特点是:它是序列中间1项或2项的平均数,不受极 端值的影响,所以在当一个变量数列中含有特大值与特小值的情
均值
(概念要点)
1. 集中趋势的测度值之一 2. 最常用的测度值 3. 一组数据的均衡点所在 4. 易受极端值的影响 5. 用于数值型数据,不能用于定类数据和定 序数据
均值
(计算公式)
设一组数据为:X1 ,X2 ,… ,XN 简单均值的计算公式为
N
X1 X 2 X N X N
X
i 1
i
N
设分组后的数据为:X1 ,X2 ,… ,XK 相应的频数为: F1 , F2,… ,FK 加权均值的计算公式为
X 1 F1 X 2 F2 X N FN X F1 F2 FN
X F
i 1 K i
K
i
F
i 1
i
简单均值
(算例)
原始数据: 10 5 9 13 6 8
况下,采用中位数较为适宜。正式由于中位数的这一特点,在统
计研究中,当遇到掌握统计资料不多而且各标志值之间差异程度 较大或频数分布有偏态时,为避免计算标志值所得的算术平均数

数据分布的特征
集中趋势 (位置) 离散趋势 (分散程度) 偏态和峰度 (形状)
数据分布的特征和测度
数据的特征和测度
集中趋势
众 数 中位数 均 值
Mode Median Mean
离散程度
极差
分布的形状
偏 态
Skewness
四分位差 方差和标准差 离散系数
Range Quartiles
峰 度
Kurtosis
返回本章
集中趋势
(Central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据一般水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值
4. 低层次数据的集中趋势测度值适用于高层次的测量数据, 反过来,高层次数据的集中趋势测度值并不适用于低层次 的测量数据 5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握 的数据的类型来确定
log X
i 1
N
i
N
几何平均数
(算例)
一位投资者持有一种股票,1996年、1997年、1998年和1999 年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资 者在这四年内的平均收益率。
GM N X 1 X 2 X N 4 104.5% 102.0% 103.5% 105.4% 103.84%
X
i 1 K i 1 K
20 1
100 1
X甲
i
Fi
i
F
K i 1 K i

0 1 20 1 100 8 82 (分) 11 8
X乙
X F F
i 1 i
i

0 8 20 1 100 1 12 (分) 8 11
均值
(数学性质)
其计算公式为: X G n X 1 X 2 X 3 X n N X
在用几何平均数法计算平均数时,如果 N 大于2, 可采用对数法计算。计算公式为:
ln X G 1 1 ln X1 ln X 2 ln X 3 ln X n ln X N N
1 1 1 1 X X2 X3 Xn 1 1 N XH

XH
N 1 1 1 1 X1 X 2 X 3 Xn
N
X
1
设m为权数,则加权调和平均数的计算公式为:
m m1 m2 m3 n X X2 X3 Xn 1 1 m1 m2 m3 mn XH
N 1 2
当总体位数 N 为奇数时,中位数就是中位数位次上的那个数据; 当 N 为偶数时,中位数是中位数位次上2项数据的算术平均数。
分组资料时,中位数位次 f
2
可以利用中位数所在组的下限来测算中位数,即中位数的下
限公式为 :
Me L
f
2
S m 1 fm
i
式中:
Me
——中位数 ——中位数所在组的下限 ——中位数所在组的次数 ——总次数即各组次数总和 ——小于中位数组的各组次数之和
第3章 数据分布特征
观察:一个平均工资掩盖了多少差异
► ►




3月25日,北京市统计局宣布,2008年,北京市职工年平均工资为44715元,折合每月3726元,比2007年增长了12 %。与往年一样,这样的数据又是引来一片质疑声。因为它和太多市民对实际收入的感受差距很大,也解释不了为什么 大家的收入逐年增长,而消费却总是无法提振的尴尬。 有关部门对上述职工平均工资的统计给出了一些解释,使得社会对这一数据在统计意义上的正确性没有多少疑问, 却对它的代表性和实际意义产生了更多的怀疑。按照相关解释,目前的职工平均工资统计,所涉及的统计对象还只是企 事业单位、机关与社会团体,并没有将社会中小企业纳入。而且职工工资总额计算方法不是按实际发到职工手里的现金 计算,还包括单位代扣代缴的社会保险、住房公积金等。 这样一解释,大家有些明白了,原来北京市职工年平均工资统计里的“职工”只是你我中间的一部分人群,这部分 人群的收入可能是比较高而且稳定的,自然平均工资也相对偏高一些。但这种“有你没我”的统计,如何能反映整个城 市的收入全貌呢?再从收入本身来说,按照《中国保险报》人士的统计,北京地区养老保险单位缴费比例20%,个人缴 费比例8%;医疗保险单位缴费比例7.5%,个人缴费比例 2%;生育保险缴费比例为0.6%,单位承担;失业保险单位缴 费比例2%,个人缴费比例1%;工伤保险按行业性质分为0.6%、1.2%、2%三档基准费率,只由单位承担。以上合计, 社保总负担至少已占个人工资总额的42%左右,外加单位和个人各缴(扣)12%以内的住房公积金,“职工工资”里面将 有可能高达66%的份额并不在市民的腰包里。而剩下34%的“职工工资”,也还只是税前收入。难怪与大家的实际感受 有如此大的差异。 统计的口径是这样,再回到平均的概念上来。很多年来,我们的职工平均工资统计数据只有平均数,而没有覆盖社 会不同群体(如国企高管、公务员、教师、农民工)以及不同行业(如金融、电信、私企、电力、石油)的具体分布数 据。这样的统计无法显示不同行业以及同一行业内职工与管理人员巨大的收入差异,网民将这样的统计形象地概括为: “张家有财一千万,十个邻居穷光蛋,平均下来算一算,个个都有上百万”。一个与太多市民收入真实情况不相符的统 计层面的工资增长,自然无法得到大家在幸福感上的共鸣。可见,一个“平均”,掩盖了多少差异;一个“增长”,隐 藏了多少问题。 当然,并不是说平均值的统计方法是不需要的。GDP的人均值在分析一个国家经济增长阶段时有很大的价值,历史 地看,平均值的变化也总是有其时代意义的。但是,平均值的统计方法也是有缺陷的,因为它反映不了贫富分化和财富 流向的变动。 在统计数字与社会现实的差异面前,我们是应该为了统计数字的“喜人增长”而无视社会现实,还是应该为了真实 地反映社会现实,修正统计部门的计算口径和方法?答案是明摆着的,只有真实的数据才能让大家了解目前社会存在的 真正问题,也才能为正确的决策提供有价值的参考。这样真实的统计也许很难,但在失真和真实之间,统计部门其实没 有选择。 【作者:陈联科 来源:京华时报】
X1 X 2 X 3 X 4 X 5 X 6 X N 6 10 5 9 13 6 8 6 8.5
i 1 i
X
N
加权均值
(算例)
计算50 名工人日加工零件数的均值
表4-1 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 某车间50名工人日加工零件均值计算表 组中值(Xi) 107.5 112.5 117.5 122.5 127.5 132.5 137.5 — 频数(Fi) 3 5 8 14 10 6 4 50 XiFi 322.5 562.5 940.0 1715.0 1275.0 795.0 550.0 6160.0
相关文档
最新文档