数据特征的测度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•计算方法:
( X X ) 2 加权式: 简单式: n
( X X ) 2 f f
•特点:是离散程度最主要的测度值。
(三)离散系数
含义:是测度离散程度的相对指标,是一组数据 标准差与均值的比值。用 V表示。 •计算方法: V
x
•作用:主要用于比较不同组别数据的离散程度。
下列指标属于反映总体单位数值分布集中趋势的 有( ) A、全距 B、标准差 C、平均数 D、变异系数
有甲乙两个生产班组,平均日产零件数分别为 30件、35件,标准差分别为9.22件、9.8件, 通过计算比较( )。 A、V甲>V乙 B、V甲<V乙
有5个标志值,最大值52,最小值35,平均 数是42,各标志值与平均数离差的平方和为 178。据此,下列计算的表示变异指标正确 的是( ) A、全距=17 B、 σ =5.97 C、 σ =35.60 D、V=14.21% E、V=84.76%
xf
(一)平均数
有两种商品。甲商品价格从20元上升到25元,而
同期乙商品的价格从25元下降到20元,求两种商
品价格变化幅度。
(一)平均数 2、几何平均数
几何平均数:主要适用于比率的平均。 几何平均数=各数值联乘开高次方
X g n X 1 X 2 X n n X
(二)中位数
将变量数列的各观察值按自小到大的顺序排列, 处于中间位置的数值就是中位数(median)。
加权均值的影响因素:各组变量值;各组权 数(即频数)。
表1:某单位20工人的月工资分组表
月工资 500 700 800 850 900 950 1200 合计 频数(人) 1 3 4 5 4 2 1 20
该单位20名工人的月平均工资为多少?
表2:某单位50工人的月工资分组表 月工资
100 110 115 120 125 130 150 合计
表4:某市50个家庭住房分组表
住房面积(平方米) 频数(f) 组中值(x) 70以下 70—90 90—110 110—130 130以上 7 10 18 9 6 60 80 100 120 140 xf 420 800 1800 1080 840
合计
平均住房面积
50
—
4940
4940 x 98.(平方米) 8 f 50
i 1
n
(一)平均数
•均值的计算方法:
(1)简单均值
x x (用于未分组资料) n
某单位10名工人的月工资如下:(单位:元)
800 850 700 900 500 800 950 850 850 1200
该单位10名工人的月平均工资为多少?
(一)平均数
(2)加权均值
x
xf f
(用于已分组资料)
x
图3:平均数、中数、众数三者在分布中的相对位置
(一)偏斜系数
负偏态
平 中 众
图4:平均数、中数、众数三者在分布中的相对位置
第四节 位次指标
(一)四分位数 (二)箱索图
(三)其他分位数
(一)
四分位数
三个数值将变量数列划分为项数相等四 部分,此3个数值即是四分位数,分别称 为第一四分位数、第二、四分位数,记 作Q1,Q2,和Q3。而第二四分位数即是 中位数。
mo
图1:众数
x
练习 统计中寻找数据一般水平的代表值或中心 值的方法是测度( )。 A、离中趋势 B、离散趋势 C、集中趋势 D、发展趋势
测度集中趋势时,不受数据中极端值影响的 有( )。 A、均值 B、几何平均数 C、众数 D、中位数 E、算术平均数
第二节 离散趋势指标
(一)全距 (二)标准差
(二)箱索图
X
150 170 190 210 230 250 270
图5:箱索图
第三节 偏态与峰度
(一)偏斜系数
(二)峰度系数
(一)偏斜系数
偏斜系数
如果仅比较算术平均数对众数的偏离幅度,即 为偏态的绝对度量。
0M X kS ) d M X (3 kS
(一)偏斜系数
正态
众中平
图2:平均数、中数、众数三者在分布中的相对位置
(一)偏斜系数
正偏态
f
众中 平
(三)变异系数
离散趋势的测度
Ƅ极差: 是一数列中极大 值与极小值之差。 全距
Ƅ 离差
离中趋势的测度
标准差
Ƅ 方差 Ƅ 标准差
离散系数
Ƅ 标准差与平均数 的比值。
(一)全距
全距,又称极差(range),是一数列中最大值与 最小值之差。
nim
X xam X R
(二)标准差
含义:是各变量值与其均值离差平方和的平均数 的平方根。用 σ 表示。
(1) 确定未分组资料中位数的方法。例如:45, 63,72,75,76,77,78,79,80,81,84, 93,95,其中第7项是78。恰好处于中间位置。
(二)中位数 (2)已分组数据的中位数
M d Lmd
f /2 F
f md
md 1
i
(三)众数
众数(mode)指数列中出现次数最多的数值. f
Ƅ 切尾平均数
集中趋势指标
中位数
将数据按顺序排列 后,处于中间位置 的数据。
众数 指数列中出现次数 最多的数据。
(一)平均数 1、算术平均数
算术平均数:一列数据之和除以数据个数的商。 算术平均数=数据之和/和数个数
x1 x2 xn X n x x n
X
i 1
n
n
xi n
频数(人)
3 5 8 14 10 6 4 50
该单位50名工人的月平均工资为多少?
表3:某单位50工人的月工资分组表 月工资
110以下 110——115 115——120 120——125 125——130 130——135 135以上 合计
频数(人)
3 5 8 14 10 6 4 50
该单位50名工人的月平均工资为多少?
第二讲 数据特征的测度
第一节 第二节 第三节 第四节
集中趋势指标 离散趋势指标 偏态与峰度 位次指标
第一节 集中趋势指标
描述数据集中趋势或中心位置的量数,统 称为集中趋势指标,主要包括:
(一)平均数
(二)中位 (三)众数
集中趋势指标
平均数
Leabharlann Baidu
Ƅ 算术平均数 Ƅ 几何平均数
Ƅ 倒数平均数