统计学 第三章 变量分布特征的描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.算术平均数的优缺点
算术平均数也有其局限性,主要表现在以下两 个方面:一是算术平均数易受特殊值(特大或特 小值)的影响,当变量存在少数几个甚至一个特 别大或特别小的变量值时,就会导致算术平均数 迅速增大或迅速变小,从而影响对变量值一般水 平的代表性;二是根据组距数列计算算术平均数 时,由于组中值具有假定性而使得计算结果只是 一个近似值,尤其是当组距数列存在开口组时, 算术平均数的准确性会更差。
2.分位数
• 分位数是将变量的数值按大小顺序排列并等分 为若干部分后,处于等分点位置的数值。常用 的分位数有四分位数、十分位数和百分位数, 他们分别是将数值序列4等分、10等分和100等 分的3个点、9个点和99个点上的数值。其中四 分位数第2点的数值、十分位数第5个点的数值 和百分位数第50个点的数值,就是中位数。所 以,中位数就是一个特殊的分位数。
在一组数据中出现次数最多的数就是这 组数据众数,众数和平均数一样,也是 描述一组数据集中趋势的统计量,但它 和平均数有以下两点不同:一是平均数 只是一个“虚拟”的数,即一组数据的 和除以该组数据的个数所得的商,而众 数不是“虚拟”的数,是一组数据中出 现次数最多的那个数据,是这组数据中 真实存在的一个数据。
张村有个张千万,隔壁九个穷光蛋,平均 起来算一算,人人都是张百万。 对于这样的问题,不是“平均数”的错, 也不是统计学的错,统计学中有现成解决 的办法,就是计算“中位数”。打油诗里 的“张村”个人财产中位数就是“零”。 这个时候平均数不能说明的问题,中位数 就说清楚了。
第二节 离中趋势的描述
2.加权算术平均数
加权算术平均数是根据变量数列计算的,即以各组变量值 (或组中值)乘以相应的频数求出各组标志总量,加总各组标志 总量得出总体标志总量,再用总体标志总量除以总频数。 若以xi表示第组i 的变量值(或组中值)(=1,2,…,k), i 以 f 表示第 i组的频数(=1,2,…,k),以k表示分组数,则加 权算术平均数的计算公式为: k
第三章 变量分布特征的描述
第一节 集中趋势的描述 第二节 离中趋势的描述
第三节 分布形状的描述
第一节 集中趋势的描述 一、集中趋势与平均指标 二、数值平均数 三、位置平均数
平均指标是将变量的各变量值差异抽象 化、以反映变量值一般水平或平均水平的指 标,也就是反映变量分布中心值或代表值的 指标。 平均指标的具体表现称为平均数,平均 数因计算方法不同可分为数值平均数和位置 平均数两类。
下限公式为:
(式中
为众数组频数与下一组频数之差, 为众数组频数与上一组频数之差;
L、d的含义与中位数公式的相同。)
上限公式为:
(式中U的含义与中位数公式的相同。) 1 d M0 L 1 2
1
M 0 U 1 d 1 2
2
一般来说,平均数、中位数和众数 都是一组数据的代表,分别代表这 组数据的“一般水平”、“中等水 平”和“多数水平”。平均数涉及 所有的数据,中位数和众数只涉及 部分数据。它们互相之间可以相等 也可以不相等,没有固定的大小关 系。
一、离中趋势和离散指标
二、离散指标的测度
结束!
平均数的大小与一组数据里的每个数据 都有关系,任何一个数据的变动都会引起 平均数大小的改变,而众数则仅与一组数 据的出现的次数有关,某些数据的变动对 众数没有影响,所以在一组数据中,如果 个别数据变动较大,但某个数据出现的次 数最多,此时用该数据(即众数)表示这 组数据的“集中趋势”比较合适。
中位数是通过排序得到的,它不受最 大、最小两个极端数值的影响。中 位数在一定程度上综合了平均数和 众数的优点,具有比较好的代表性。 当一组数据中的个别数据变动较大 时,常用它来描述这组数据的集中 趋势。
根据中位数的原理,你能写出四分 位数的公式吗?
反映了一组数据的集中程度.日常生 活中诸如“最佳”、“最受欢迎”、 “最满意”等,都与众数有关系,它 反映了一种最普遍的倾向。
根据单项式数列确定众数比较容易,只要找出出现频 数最多或出现频率最高的变量值即可。如果根据组距 Mo 式数列来确定众数,则先要找出频数最多的一组作为 众数组,然后运用公式来确定众数。
x =
x1 f 1 x2 f 2 xk f f 1 f 2 f k
k
xLeabharlann Baiduf
i 1 k i
i
f
i 1
(可简记为 x
i
x f f
i
i i
)
3.算术平均数的数学性质
1) 各变量值与算术平均数的离差之和等于零,即:
( xi x) =0
( xi x) f i =0
(对于简单算术平均数) (对于加权算术平均数)
2) 各变量值与算术平均数的离差平方之和为最小值, 即: ( xi x) =最小值 ( xi x) ( x x )
2
2
2
i
0
只有当
x x0
时,等号成立。
4.算术平均数的优缺点
算术平均数具有以下几个优点:一是可以利用 算术平均数来推算总体标志总量,因为算术平均数 与变量值个数之乘积等于总体标志总量(变量值总 和);二是由算术平均数的两个数学性质可知,算 术平均数在数理上具有无偏性与有效性(方差最小 性)的特点,这使得算术平均数在统计推断中得到 了极为广泛的应用。三是算术平均数具有良好的代 数运算功能,可以进行代数计算。