1.1数据的数字特征资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《数据分析》电子教案
第一章 数据描述性分析
偏度
2020年11月4日星期三
偏向左 <0
频 数
对称 =0
频 数
偏向右 >0
频 数
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
2020年11月4日星期三
均值、方差等数字特征
峰度
g2
n(n 1) (n 1)(n 2)(n 3)s4
如果这n个观测值就是所要研究对象的全体,那 么数据分析的任务就是提取数据中包含的有用的 信息。如果数据是从总体中抽出的样本,就要分 析推断样本中包含的总体的信息。
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
2020年11月4日星期三
均值、方差等数字特征
x 2 s2 s CV
k vk k uk
G1 g1 G2 g2
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
2020年11月4日星期三
总体数字特征和样本数字特征
负时,两侧极端数据较少。
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
总体的数据特征
2020年11月4日星期三
• 设观测数据是由总体X中取出的样本,总体的分布
函数是F(x)。当X为离散分布时,总体的分布可由
概率分布列刻画:
pi PX xi ,
i 1,2,.
2020年11月4日星期三
均值、方差等数字特征
变异系数:刻画数据相对分散性的度量
CV= 100 s (%)
x
校正平方和
CSS=
n
(xi x)2
i 1
未校平方和
n
USS

x
2 i
i 1
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
2020年11月4日星期三
总体为连续分布时,总体的分布可由概率密 度f(x)刻画。连续分布中最重要的是正态分布,它 的概率密度φ(x)及分布函数分别为Φ(x)
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
总体的数据特征
2020年11月4日星期三
ຫໍສະໝຸດ Baidu(x)
1
2
exp
(x )2 2 2
n
( xi
i 1
x)4 3 (n 1)2 (n 2)(n 3)
n2 (n 1)u4 (n 1)(n 2)(n 3)s4
3 (n 1)2 (n 2)(n 3)
当数据的总体分布为正态分布时,峰度近似为
0;当分布较正态分布的尾部更为分散时,峰度为
正,否则峰度为负。
当峰度为正时,两侧极端数据较多;当峰度为
x
(x) (t)dt
具有正态分布的总体成为正态总体。
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
总体的数据特征
2020年11月4日星期三
• 与样本数字特征对应的是总体的数字特征
总体均值
E(x)
总体方差
2 Var( X )
总体标准差 总体变异系数
2020年11月4日星期三
均值、方差等数字特征
偏度
g1
n (n 1)(n 2)s3
n
( xi
i 1
x)3
n2u3
(n 1)(n 2)s3
其中s是标准差。偏度是刻画数据对称性的指 标。关于均值对成的数据其偏度为0,右侧更分散 的数据偏度为正,左侧更分散的数据偏度为负。
NORTH UNIVERSITY OF CHINA
细尾,峰度为负
正态分布,总 体峰度为0
粗尾,峰 度为正
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
2020年11月4日星期三
总体数字特征和样本数字特征
根据统计学的结果,样本数字特征是相应的总 体数字特征的矩估计。当总体数字特征存在时,相 应的样本数字特征是总体数字特征的相合估计,从 而当n较大时,有
• 一元数据的数字特征主要是以下几种。设n 个观
测值为
x1, x2 ,, xn ,
• 其中n 称为样本容量。
1 均值:即是 x1, x2, , xn 的平均数:
x
1 n
n i 1
xi
均值表示数据的集中位置。
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
2020年11月4日星期三
均值、方差等数字特征
2 方差、标准差与变异系数 方差是描述数据取值分散性的一个度量,
s2
1 n 1
n i1
( xi
x)2
其量纲是数据量纲的平方。
标准差
s
s2
1 n 1
n i1
( xi
x)2
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
第一章 数据描述性分析
第一节
2020年11月4日星期三
第一章
数据的数字特征
一、均值、方差等数字特征 二、总体的数据特征 三、分位数、三均值与极差
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
数据描述性分析
2020年11月4日星期三
• 数据分析研究的对象是数据,它们是n个观测值: x1, x2 ,, xn ,
均值、方差等数字特征
3 偏度与峰度
偏度与峰度是刻画数据的偏态、尾重程度的
度量。它们与数据的矩有关。数据的矩分为原点
矩与中心矩。 k阶原点矩
vk
1 n
n
xik
i 1
K阶中心矩
u k
1 n n i1 ( xi
x)k
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
《数据分析》电子教案
第一章 数据描述性分析
2020年11月4日星期三
偏度为正的概率密度
偏度为负的概率密度
f(x)
f(x)
x
NORTH UNIVERSITY OF CHINA
x
《数据分析》电子教案
第一章 数据描述性分析
总体峰度是以同方差的 正态分布为标准,比较 总体分布尾部分散性的 指标。
2020年11月4日星期三
Var(X )
NORTH UNIVERSITY OF CHINA
《数据分析》电子教案
第一章 数据描述性分析
总体的数据特征
总体原点矩(k阶) k E( X k )
总体中心矩(k阶) k E(x )k
总体偏度 总体峰度
G1
3 3
G2
4 4
3
2020年11月4日星期三
NORTH UNIVERSITY OF CHINA
相关文档
最新文档