第9章空间统计分析-PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 原始DEM数据及派生地形因子基本统计特征的分析 地形因子的最大值、最小值、极差、中值、总和、平均 值、离差、方差、标准差、频数等基本统计量 2. 地形因子关联特征及空间分布规律的研究 对地形因子分析的主要内容之一就是查明因子之间的相 互关系和内在联系,并选定合适的因子建立地学模型, 利用这种模型对地形的发展与动态做出数值预测。
计算出各组的频率后,可以作出频率分布 图,若以纵轴表示频率,横轴表示分组, 就可以作出频率直方图,用以表示事件发 生的频率和分布状况。
分组编号 1(1~3) 2(4~6)
数值 1, 1, 2, 3, 3, 3 4, 5, 5, 6
频数 6 4
频率 0.24 0.16
3(7~9)
4(10~12)
集中趋势 平均数 中位数 众数 分位数
离散程度 极值 极差 离差 平均离差 离差平方和
分布形状 偏度 峰度
方差 标准差 变差系数
图10.1 基本统计量
9.2.1 代表数据集中趋势的统计量
(1)频数和频率 将变量xi(i=1,…,n)按照大小顺序排列,并 按一定的间距分组,变量在各组出现或发生的次 数称为频数(absoluter frequency ) ;各组频数与 总频数之比叫做频率(frequency ) 。 如有一组测量数据,数据的总个数N=148最小的 测量值xmin=0.03,最大的测量值xmax=31.67, 按组距为△x=3.000将148个数据分为11组,其中 分布在15.05~18.05范围内的数据有26个,则称 该数据组的频数为26。 再如在3.149324中,‘9’出现的频数是3,出现的 频率是3/18=16.7%
7, 8, 8, 8, 9
10, 10, 11, 12
5
4 6
0.20
0.16 0.24
频 率 分 布 表
5(13~15) 13, 13, 14, 14, 15, 15
0.25 0.2 0.15 0.1 0.05 0 1~3 4~6 7~9 10~12
频 率 直 方 图
13~15
9.2.1 代表数据集中趋势的统计量
(4)众数(Mode ) 众数是数据集中出现频数(次数)最多的某个 (或某几个)数。 (众数可以不存在或多于一个) 例如:1,2,3,3,4的众数是3。 但是,如果有两个或两个以上个数出现次数都 是最多的,那么这几个数都是这组数据的众数。 例如:1,2,2,3,3,4的众数是2和3。 还有,如果所有数据出现的次数都一样,那么 这组数据没有众数。 例如:1,2,3,4,5没有众数。
(1)最大值(max)与最小值(min) 把数据从小到大排列,最前端的值就是最 小值,最后一个就是最大值 (2)极差(range ) 一个数据集的最大值与最小值的差值称为 极差,它表示这个数据集的取值范围
极差计算公式: x=xmax-xmin (xmax为最大值,xmin为最小值) 如: 12,12,13,14,16,21 这组数的极差就是 21-12=9
第9章 DEM地形统计分析
9.1概述
9.1.1基本概念 地形统计分析是指应用统计方法对描述地 形特征的各种可量化的因子或参数进行相 关、回归、趋势面、聚类等统计分析,找 出各因子或参数的变化规律和内在联系, 并选择合适的因子或参数建立地学模型, 从更深层次探讨地形演化及其空间变异规 律。
9.1.2主要分析内容
9.2.2 代表数据离散程度的统计量
有时虽然两个数据集的平均数相等,但各数据分 布在平均数左右的疏密程度却不相同,也就是它 们的离散程度不一样,为了把一个数据集的离散 程度表现出来,就需要研究离散度。 离散程度越大,数据波动性越大,以小样本数据 代表数据总体的可靠性越低;离散程度越小,则 数据波动性小,以小样本数据代表数据总体的可 靠性越高。
(2)平均数(mean) 平均数反映了数据取值的集中位置。对于数据Xi (i=1,2,…,n),通常有简单算术平均数、加 权算术平均数、调和平均数和集合平均数。
简单算术平均数:将所有数据的数值相加,再除
以数据的总数目,公式为
1 n X xi n i 1
加权算术平均数(Weighted means ):当数据对数 据总体的影响的权重值不同时,计算该平均数, 将每个数据乘以权值后再相加,所得到的和除以 数据的总体权重数,计算公式为
ห้องสมุดไป่ตู้
9.2 基本统计量
常用的基本统计量主要包括:最大值、最 小值、极差、均值、中值、总和、众数、 种类、离差、方差、标准差、变差系数、 峰度和偏度等。这些统计量反映了数据集 的范围、集中情况、离散程度、空间分布 等特征,对进一步的数据分析起着铺垫作 用
基本统计量
描述数据特征的统计量
其他统计量 总和 比率 比例 种类
Xt n
n
i 1
1 xi
X
tp
i1 n
Pi Pi xi
i1
几何平均数(geometric mean ):是n个数据连乘的 积开n次方根,计算公式为 n
Xg n
x
i 1
i
(3)中位数(Median ) 一组数据按从小到大(或从大到小)的顺 序依次排列,处在中间位置的一个数(或 最中间两个数据的平均数,注意:和众数 不同,中位数不一定在这组数据中)。 中位数的定义可知,所研究的数据中有一 半小于中位数,一半大于中位数
X
p
n
i1
Pi x i
n
i1
Pi
例: 你的小测成绩是80分,期末考成绩是90分, 老师要计算总的平均成绩,就按照小测40%、期 末成绩60%的比例来算,所以你的平均成绩是: 80×40%+90×60%=86
调和平均数(harmonic mean ):各个数据的倒数 的算术平均数的倒数,又称为倒数平均数,调和 平均数也分简单调和平均数和加权调和平均数, 其公式分别为 n
实例: 第1组数:1、2、3、6、7的中位数是3。 原理: 如果总数个数是奇数的话,按从小到大的顺序,取中 间的那个数 第2组数:1、2、3、5的中位数是2.5。 原理:如 果总数个数是偶数的话,按从小到大的顺序,取中间 那两个数的平均数.(2+3)÷2=2.5 第3组数:1、100、101、10000的中位数是100.5 注意:中位数 和数值的大小没有绝对的关系
计算出各组的频率后,可以作出频率分布 图,若以纵轴表示频率,横轴表示分组, 就可以作出频率直方图,用以表示事件发 生的频率和分布状况。
分组编号 1(1~3) 2(4~6)
数值 1, 1, 2, 3, 3, 3 4, 5, 5, 6
频数 6 4
频率 0.24 0.16
3(7~9)
4(10~12)
集中趋势 平均数 中位数 众数 分位数
离散程度 极值 极差 离差 平均离差 离差平方和
分布形状 偏度 峰度
方差 标准差 变差系数
图10.1 基本统计量
9.2.1 代表数据集中趋势的统计量
(1)频数和频率 将变量xi(i=1,…,n)按照大小顺序排列,并 按一定的间距分组,变量在各组出现或发生的次 数称为频数(absoluter frequency ) ;各组频数与 总频数之比叫做频率(frequency ) 。 如有一组测量数据,数据的总个数N=148最小的 测量值xmin=0.03,最大的测量值xmax=31.67, 按组距为△x=3.000将148个数据分为11组,其中 分布在15.05~18.05范围内的数据有26个,则称 该数据组的频数为26。 再如在3.149324中,‘9’出现的频数是3,出现的 频率是3/18=16.7%
7, 8, 8, 8, 9
10, 10, 11, 12
5
4 6
0.20
0.16 0.24
频 率 分 布 表
5(13~15) 13, 13, 14, 14, 15, 15
0.25 0.2 0.15 0.1 0.05 0 1~3 4~6 7~9 10~12
频 率 直 方 图
13~15
9.2.1 代表数据集中趋势的统计量
(4)众数(Mode ) 众数是数据集中出现频数(次数)最多的某个 (或某几个)数。 (众数可以不存在或多于一个) 例如:1,2,3,3,4的众数是3。 但是,如果有两个或两个以上个数出现次数都 是最多的,那么这几个数都是这组数据的众数。 例如:1,2,2,3,3,4的众数是2和3。 还有,如果所有数据出现的次数都一样,那么 这组数据没有众数。 例如:1,2,3,4,5没有众数。
(1)最大值(max)与最小值(min) 把数据从小到大排列,最前端的值就是最 小值,最后一个就是最大值 (2)极差(range ) 一个数据集的最大值与最小值的差值称为 极差,它表示这个数据集的取值范围
极差计算公式: x=xmax-xmin (xmax为最大值,xmin为最小值) 如: 12,12,13,14,16,21 这组数的极差就是 21-12=9
第9章 DEM地形统计分析
9.1概述
9.1.1基本概念 地形统计分析是指应用统计方法对描述地 形特征的各种可量化的因子或参数进行相 关、回归、趋势面、聚类等统计分析,找 出各因子或参数的变化规律和内在联系, 并选择合适的因子或参数建立地学模型, 从更深层次探讨地形演化及其空间变异规 律。
9.1.2主要分析内容
9.2.2 代表数据离散程度的统计量
有时虽然两个数据集的平均数相等,但各数据分 布在平均数左右的疏密程度却不相同,也就是它 们的离散程度不一样,为了把一个数据集的离散 程度表现出来,就需要研究离散度。 离散程度越大,数据波动性越大,以小样本数据 代表数据总体的可靠性越低;离散程度越小,则 数据波动性小,以小样本数据代表数据总体的可 靠性越高。
(2)平均数(mean) 平均数反映了数据取值的集中位置。对于数据Xi (i=1,2,…,n),通常有简单算术平均数、加 权算术平均数、调和平均数和集合平均数。
简单算术平均数:将所有数据的数值相加,再除
以数据的总数目,公式为
1 n X xi n i 1
加权算术平均数(Weighted means ):当数据对数 据总体的影响的权重值不同时,计算该平均数, 将每个数据乘以权值后再相加,所得到的和除以 数据的总体权重数,计算公式为
ห้องสมุดไป่ตู้
9.2 基本统计量
常用的基本统计量主要包括:最大值、最 小值、极差、均值、中值、总和、众数、 种类、离差、方差、标准差、变差系数、 峰度和偏度等。这些统计量反映了数据集 的范围、集中情况、离散程度、空间分布 等特征,对进一步的数据分析起着铺垫作 用
基本统计量
描述数据特征的统计量
其他统计量 总和 比率 比例 种类
Xt n
n
i 1
1 xi
X
tp
i1 n
Pi Pi xi
i1
几何平均数(geometric mean ):是n个数据连乘的 积开n次方根,计算公式为 n
Xg n
x
i 1
i
(3)中位数(Median ) 一组数据按从小到大(或从大到小)的顺 序依次排列,处在中间位置的一个数(或 最中间两个数据的平均数,注意:和众数 不同,中位数不一定在这组数据中)。 中位数的定义可知,所研究的数据中有一 半小于中位数,一半大于中位数
X
p
n
i1
Pi x i
n
i1
Pi
例: 你的小测成绩是80分,期末考成绩是90分, 老师要计算总的平均成绩,就按照小测40%、期 末成绩60%的比例来算,所以你的平均成绩是: 80×40%+90×60%=86
调和平均数(harmonic mean ):各个数据的倒数 的算术平均数的倒数,又称为倒数平均数,调和 平均数也分简单调和平均数和加权调和平均数, 其公式分别为 n
实例: 第1组数:1、2、3、6、7的中位数是3。 原理: 如果总数个数是奇数的话,按从小到大的顺序,取中 间的那个数 第2组数:1、2、3、5的中位数是2.5。 原理:如 果总数个数是偶数的话,按从小到大的顺序,取中间 那两个数的平均数.(2+3)÷2=2.5 第3组数:1、100、101、10000的中位数是100.5 注意:中位数 和数值的大小没有绝对的关系