第9章 空间统计分析

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
21-12=9
(3)分位数(quantile )
将数列按大小排列,把数列划分为相等个 数的分段,处于分段点上的值就是分位数。
(4)离差(deviation) 表示各数值与其平均值的离散程度,其值 等于某个数值与该数据集的平均值之差
d xi x
(5)平均离差(mean deviation)
是把离差取决对值,然后求和,再除以变 量个数
(1)最大值(max)与最小值(min) 把数据从小到大排列,最前端的值就是最 小值,最后一个就是最大值
(2)极差(range ) 一个数据集的最大值与最小值的差值称为 极差,它表示这个数据集的取值范围
极差计算公式: x=xmax-xmin
(xmax为最大值,xmin为最小值) 如:
12,12,13,14,16,21 这组数的极差就是
9.2 基本统计量
常用的基本统计量主要包括:最大值、最 小值、极差、均值、中值、总和、众数、 种类、离差、方差、标准差、变差系数、 峰度和偏度等。这些统计量反映了数据集 的范围、集中情况、离散程度、空间分布 等特征,对进一步的数据分析起着铺垫作 用
基本统计量
描述数据特征的统计量
集中趋势
平均数 中位数 众数 分位数
9.1.2主要分析内容
1. 原始DEM数据及派生地形因子基本统计特征的分析 地形因子的最大值、最小值、极差、中值、总和、平均 值、离差、方差、标准差、频数等基本统计量
2. 地形因子关联特征及空间分布规律的研究 对地形因子分析的主要内容之一就是查明因子之间的相 互关系和内在联系,并选定合适的因子建立地学模型, 利用这种模型对地形的发展与动态做出数值预测。
离散程度
极值 极差 离差 平均离差 离差平方和
方差 标准差 变差系数
分布形状
偏度 峰度
其他统计量
总和 比率 比例 种类
图10.1 基本统计量
9.2.1 代表数据集中趋势的统计量
(1)频数和频率
将变量xi(i=1,…,n)按照大小顺序排列,并
按一定的间距分组,变量在各组出现或发生的次 数称为频数(absoluter frequency ) ;各组频数与 总频数之比叫做频率(frequency ) 。 如有一组测量数据,数据的总个数N=148最小的 测量值xmin=0.03,最大的测量值xmax=31.67, 按组距为△x=3.000将148个数据分为11组,其中 分布在15.05~18.05范围内的数据有26个,则称 该数据组的频数为26。
9.2.2 代表数据离散程度的统计量
有时虽然两个数据集的平均数相等,但各数据分 布在平均数左右的疏密程度却不相同,也就是它 们的离散程度不一样,为了把一个数据集的离散 程度表现出来,就需要研究离散度。
离散程度越大,数据波动性越大,以小样本数据 代表数据总体的可靠性越低;离散程度越小,则 数据波动性小,以小样本数据代表数据总体的可 靠性越高。
9.2.1 代表数据集中趋势的统计量
(2)平均数(mean)
平均数反映了数据取值的集中位置。对于数据Xi
(i=1,2,…,n),通常有简单算术平均数、加 权算术平均数、调和平均数和集合平均数。
简单算术平均数:将所有数据的数值相加,再除
以数据的总数目,公式为
X
1 n
n i 1
xi
加权算术平均数(Weighted means ):当数据对数 据总体的影响的权重值不同时,计算该平均数, 将每个数据乘以权值后再相加,所得到的和除以 数据的总体权重数,计算公式为
第3组数:1、100、101、10000的中位数是100.5 注意:中位数 和数值的大小没有绝对的关系
(4)众数(Mode ) 众数是数据集中出现频数(次数)最多的某个 (或某几个)数。 (众数可以不存在或多于一个) 例如:1,2,3,3,4的众数是3。 但是,如果有两个或两个以上个数出现次数都 是最多的,那么这几个数都是这组数据的众数。 例如:1,2,2,3,3,4的众数是2和3。 还有,如果所有数据出现的次数都一样,那么 这组数据没有众数。 例如:1,2,3,4,5没有众数。
再如在3.149324中,‘9’出现的频数是3,出现的 频率是3/18=16.7%
计算出各组的频率后,可以作出频率分布 图,若以纵轴表示频率,横轴表示分组, 就可以作出频率直方图,用以表示事件发 生的频率和分布状况。
分组编号
数值
频数
1(1~3) 1, 1, 2, 3, 3, 3
6
2(4~6) 4, 5, 5, 6
中位数的定义可知,所研究的数据中有一 半小于中位数,一半大于中位数
实例:
第1组数:1、2、3、6、7的中位数是3。 原理: 如果总数个数是奇数的话,按从小到大的顺序,取中 间的那个数
第2组数:1、2、3、5的中位数是2.5。 原理:如 果总数个数是偶数的话,按从小到大的顺序,取中间 那两个数的平均数.(2+3)÷2=2.5
平均数也分简单调和平均数和加权调和平均数,
其公式分别为
X t
n n1
x i 1 i
n
Pi
X tp
i1
n Pi x i 1 i
几何平均数(geometric mean ):是n个数据连乘的 积开n次方根,计算公式为
n
X g n xi i 1
(3)中位数(Median )
一组数据按从小到大(或从大到小)的顺 序依次排列,处在中间位置的一个数(或 最中间两个数据的平均数,注意:和众数 不同,中位数不一定在这组数据中)。
4
3(7~9) 7, 8, 8, 8, 9
5
4(10~12) 10, 10, 11, 12
4
5(13~15) 13, 13, 14, 14, 15, 15 6
频率
0.24

0.16 率
0.20
分 布
0.16 表
0.24
0.25
0.2

0.15


0.1

0.05

0 1~3
4~6
7~9 10~12 13~15
n
Pi xi
Xp
来自百度文库
i1 n
Pi
i1
例: 你的小测成绩是80分,期末考成绩是90分, 老师要计算总的平均成绩,就按照小测40%、期 末成绩60%的比例来算,所以你的平均成绩是:
80×40%+90×60%=86
调和平均数(harmonic mean ):各个数据的倒数
的算术平均数的倒数,又称为倒数平均数,调和
相关文档
最新文档