空间数据的统计分析方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

散点图
折线图
直方图
20
垂直条形图
....................................................................................................................................................................................................
如果各个数据之间的差异程度较小,用平均值就有较 好的代表性; 如果数据之间的差异程度较大,特别是有个别极端值 的情况,用中位数或众数有较好的代表性。
13
数据的离散程度分析
数据的离散程度分析主要是用来反映数据之间的差异 程度, 常用的指标有:方差和标准差。 方差是标准差的平方,根据不同的数据类型有不同的 计算方法。 反映数据的离散程度的指标还包括: 极差、离差、平均离差、离差平方和、变差系数等。
X
1 n
n
xi
i 1
➢加权算术平均值:考虑数据对数据总体的影响的权 重值的不同,将每个数据乘以其权值后再相加,所得 的和除以数据的总体权重数。
n
n
X p Pi xi / Pi Pi为数据xi的权值
i 1
p 1
10
➢调和平均值:各个数据的倒数的算术平均数的倒数 ,又称为倒数平均值。
调和平均值也分为简单调和平均数和加权调和平均数
频数: 将变量xi(i=1,2,…,n)按大小顺序排列,并按一定的 间距分组。变量在各组出现或发生的次数称为频数。 频率:各组频数与总频数之比叫做频率。 频率分布图:计算出各组的频率后,就可以做出频率分布 图。 频率直方图:若以纵轴表示频率,横轴表示分组,就可做 出频率直方图,用以表示事件发生的概率和分布状况。
一般情况下,如果样本的偏度接近于0,而峰度接近于 3,就可以判断总体的分布接近于正态分布。
19
➢统计图表分析
用图形的形式表达数据,比用文字表达更清晰、更 简明。
对于属性数据,统计图的主要类型有柱状图、扇形 图、直方图、折线图和散点图等。
垂直条形图
水平条形图
扇形图
.
....................................................................................................................................................................................................
16
➢极差 极差是一组数据中最大值与最小值之差,即: R=max{x1, x2, …, xn} - min{x1, x2, …, xn}
17
➢离差、平均离差与离差平方和
离差:一组数据集中的各数据值与其平均数之差称
为离差。 d x i x
一个数据集的离差和恒等于0。
(x x) 0
平均离差:将离差取绝对值,然后求和,再取平均 数,就得到平均离差。
描述性统计分析:对调查总体所有变量的有关数据进 行统计性描述,主要包括数据的频数分析、数据的集 中趋势分析、数据的离散程度分析、数据的分布、以 及一些基本的统计图形。
6
对于空间数据来说,描述性分析是空 间数据分析的第一步,
通过描述性分析,提取有价值的空间 信息,便于后续的空间分析和处理。
7
Baidu Nhomakorabea
数据的频数分析
d
1 n
n
| xi
i 1
x
|
离差平方和:对离差求平方和就得到离差平方和。
n
d 2 ( xi x ) 2
i 1
18
➢数据的分布
在统计分析中,通常要假设样本的分布属于正态分布 ,因此需要用偏度和峰度两个指标来检查样本是否符 合正态分布。
偏度:衡量的是样本分布的偏斜方向和程度; 峰度:衡量的是样本分布曲线的尖峰程度。
第七章 空间数据的统计分析方法 (1)
1
主要内容:
➢GIS属性数据 ➢一般统计分析 ➢探索性数据分析 ➢探索性空间数据分析方法 ➢空间点模式分析方法 ➢格网或面状数据空间统计分析方法 ➢地统计分析概述 ➢空间变异函数 ➢克里金估计方法 ➢地统计分析研究展望 ➢空间统计分析软件
2
GIS属性数据
3
GIS属性数据
14
➢方差和标准差
方差是均方差的简称,是以离差平方和除以变量个数 求得的。
n
2 ( xi x ) 2 / n i 1
n
2 ( xi x ) 2 /( n 1) i 1
15
➢方差和标准差 标准差是方差的平方根。
n
( xi x )2 / n i 1
n
( xi x ) 2 /( n 1) i 1
8
数据的集中趋势分析
数据的集中趋势分析是用来反映数据的一般水平,常 用的指标有平均值、中位数和众数等。
➢平均值: 是衡量数据的中心位置的重要指标,反映了一些数据 必然性的特点,包括算术平均值、加权算术平均值、 调和平均值和几何平均值。
9
数据的集中趋势分析
➢算术平均值:将所有数据相加,再除以数据的总数目。
属性数据是GIS的重要特征。 属性数据包含了两方面的含义: ➢它是什么,即它有什么样的特性,划分为地物的 哪一类;(类别属性) ➢实体的详细描述信息,例如一栋房子的建造年限 、房主、住户等。 (描述属性)
4
一般统计分析
5
一般统计分析
指对GIS地理空间数据库中的属性数据进行常规统计分 析。 ➢先对数据进行描述性统计分析, ➢再选择进一步分析的方法。
简单调和平均数:
n 1
Xt
1 /(
i1 xi n
)
加权调和平均数:
n Pi
X tp
1/(
i 1 n
xi
)
Pi
p 1
11
几何平均数:是n个数据连乘的积开n次方根。
n
X g n xi i 1
12
➢中位数:一种反映数据的中心位置的指标,其确定 方法是将所有数据以由小到大的顺序排列,位于中央 的数据值就是中位数。 ➢众数:在数据中发生频率最高的数据值。
散点图
.
水平条形图 折线图
扇形图 直方图
➢柱状图:用水平或垂直长方形表示不同种类间某一 属性的差异,每个长方形表示一个种类,其长度表示 这个种类的属性数值。
➢扇形图:将圆划分为若干个扇形,表示各种成分在 总体中的比重,各种成分的比重可以用扇形的面积或 者弧长来表示,当有很多种成分或成分比重差异悬殊 时表示效果不好。
相关文档
最新文档