总复习-空间分析&区域模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间分析与区域模型 总复习
1. 2. 3. 4. 名词解释(20 ± ) 简答题(30 ± ) 做图题(30± ) 论述题(20± )
“空间分析”总复习
一.绪论 二.空间基础&量测 三.探索性空间数据分析 四.空间点数据分析 五.空间格数据分析 六.空间插值与地统计 七.空间回归 八.地图代数
一 绪论
随机分布:任何一点在任何一个位置发生的概率 相同,某点的存在不影响其它点的分布。又称 泊松分布(Poisson distribution)。
均匀分布:个体间保持一定的距离,每一个点尽 量地远离其周围的邻近点。在单位(样方)中个体 出现与不出现的概率完全或几乎相等。 聚集分布:许多点集中在一个或少数几个区域, 大面积的区域没有或仅有少量点。总体中一个 或多个点的存在影响其它点在同一取样单位中 的出现概率。
可变面元问题:尺度效应
x = 均值,n=9
x=(10+5+5+15+10+10+5+15+5)/n=8.88;
x=8.47; n=3
x=9.33; n=3
可变面元问题:区划效应 原 始 数 据 左 右 平 均 上 下 平 均
O’Sullivan&Unwin(2003),p.31
3.3 边界效应
3 5 2 1 3
1 0 1 3 1
2 2 2 2 2
2 2 2 2 2
0 0 10 0 0
0 0 10 0 0
x
随机
Quadrat # 1 2 3 4 5 6 7 8 9 10 Number of Points Per Quadrat (xi -xa )^2 3 1 1 1 5 9 0 4 2 0 1 1 1 1 3 1 3 1 1 1 20 20 2.222 2.000 1.111
3. 箱线图&五数总结 箱线图(boxplot)也称箱须图(boxwhisker plot)需要五个数,称为五数总结: ① 最小值 ② 下四分位数:Q1 ③ 中位数(median) ④ 上四分位数:Q3 ⑤ 最大值 The inter-quartile range :IQR = Q3 - Q1
Box plot
Number of observations)
Outliers
Hinge (1.5 times IQR)
75th percentile Median 25th percentile IQR
Hinge (1.5 times IQR) Variable name: Percent students
4. 核密度估计(Kernel Density Esቤተ መጻሕፍቲ ባይዱimation, KDE)
点模式的三种基本空间分布
随机
均匀
聚集
2. 空间点模式分析方法 2.1 基于密度的方法:测度一阶效应
① 样方分析 (Quadrat Analysis) ② 样方分析的统计检验 ③ 核密度估计 (Kernel Density Estimation)
2.2 基于距离的方法:测度二阶效应
① 最近邻距离 (Nearest Neighbor Distance) ② 最近邻距离的统计检验 ③ G 函数 (G Function) ④ F 函数 (F Function) ⑤ K 函数 (K Function)
1. 空间/属性数据的类型 1.1 空间数据的类型
• • • • 空间点数据(Point Data) 空间线数据(Line Data Network) 空间面数据(Areal Data) 地统计数据(Geostatistical Data)
来源:http://ua.t.u-tokyo.ac.jp/okabelab/freesat/ FreeSAT:Free Spatial Analysis Tools
均匀
Number of Points Quadrat Per # Quadrat (xi -xa )^2 1 2 0 2 2 0 3 2 0 4 2 0 5 2 0 6 2 0 7 2 0 8 2 0 9 2 0 10 2 0 20 0 Variance Mean Var/Mean 0.000 2.000 0.000
三、探索性空间数据分析
1. 2. 3. 4. 概述 茎叶图 箱线图&五数总结 核密度估计(Kernel Density Estimation, KDE)
1. 概述
三种类型的数据分析
Classical
Problem Data Model Analysis Conclusions
EDA
1 n x xi ˆ f ( x) K h nh i 1
0.5
reference 0.3 0.1
dnorm(x)
0.0
0.1
0.2
0.3
0.4
0.05
-3
-2
-1
0 x
1
2
3
应用不同带宽生成的100个服从正态分布随 机数的核密度估计。
四、空间点模式分析
1. 概述 2. 空间点模式分析方法
2 3 5 6 6 6 8 9 9 4 5 6 7 8 9 2 4 9 8
茎叶图制作方法
① 选择适当的数字为茎,通常是起首数字, 茎之间的间距相等; ② 每列标出所有可能叶的数字,叶子按数值 大小依次排列;
③ 由第一行数据,在对应的茎之列,顺序记 录茎后的一位数字为叶,直到最后一行数 据,需排列整齐(叶之间的间隔相等)。
Exploratory Data Analysis(EDA)
“Exploratory data analysis is an attitude, NOT a bundle of techniques” (Tukey 1977). “Let data speak for themselves”
• 核密度估计(KDE) 是估计一个随机变量概率密度 函数(pdf)的非参数方法。 • If x1, x2, ..., xn ~ ƒ is an independent and identicallydistributed(i.i.d) sample of a random variable, then the kernel density approximation of its probability density function is
1. 概述
• 点模式分析由植物学家和生态学家在1930s 应用。但是,随后许多不同领域也开始应用 点模式分析,如考古学、流行病学、天文学 和犯罪学。 • 一般来说,点模式分析可以用来描述任何类 型的事件数据(incident data)。因为每一事 件都可以抽象化为空间上的一个位置点。
空间点模式的三种基本分布
Tukey was an American statistician, born in New Bedford, Massachusetts, and obtained a B.A. in 1936 and M.Sc. in 1937, in chemistry, from Brown University, before moving to Princeton University where he received a Ph.D. in mathematics.
0. 1. 2. 3. 空间分析概念 空间数据与属性数据的类型 空间分析的框架 空间统计陷阱
0. 空间分析概念
空间分析( Spatial Analysis) :没有统一定义。
• 空间分析是对数据的空间信息、属性信息或二者 共同信息的统计描述或说明。 --Goodchild(1987) • 空间分析是对于地理空间现象的定量研究,其常 规能力是操纵空间数据成为不同的形式,并且提 取潜在信息。 --Openshaw(1997)&Bailey and Gartell(1995) • 空间分析是结果随着分析对象位置变化而改变的 一系列方法。 --Longley et al.(2001, p.278) • 空间分析是基于地理对象的位置和形态特征的空 间数据分析技术,其目的在于提取和传输空间信 息。 —郭仁忠
– Generally true with discrete data – Definitely true with continuous data 空间自相关破坏了经典统计当中的样本 独立性假设。
3.2 可变面元问题
随面积单元定义的不同而变化的问题,就是可变 面元问题(Modifiable Areal Unit Problem , MAUP)。古老但依然没有很好解决。 MAUP的类型: ① 尺度效应(Scale effect):当空间数据经聚合 而改变其单元面积的大小 、形状和方向时,分 析结果也随之变化的现象。 ② 区划效应(Zoning effect):给定尺度下不同 的单元组合方式导致分析结果产生变化的现象。
2.1 基于密度的方法 ①样方分析-两种方式 利用所有点:
样方的形状、大小、方向对 结果有影响 – 如果样方太大/小,那 么 ……?
–
随机抽样方法:
有增加样本量的作用 – 可以描述一个没有完全数 据的空间点过程
–
样方分析步骤
a). 研究区域中打上网格,建议方格大小为:
QuadratSize = 2A /n
2. 空间分析的框架
属性数据
数据库
空间数据
图示
可视化
GIS 数据库管理系统
模式描述
探索性分析
统计软件
假设检验
模型构建
基于Anselin和 Getis(1992)提出的 一般框架,GIS环 境下空间分析模块 的关系见右图。参 照GIS输入、存储、 分析和输出等功能, GIS环境下空间分 析可进一步细分为 选择、操作、探索 和确认4种。
Problem Data Analysis Model Conclusions
Bayesian
Problem Data Model Prior Distribution Analysis Conclusions
来源:NIST/SEMATECH e-Handbook of Statistical Methods, http://www.itl.nist.gov/div898/handbook/
1.2 属性数据的类型
属性(Attribute):与空间数据库中一个独 立对象(记录)关联的数据项。属性已成 为描述一个位置任何可记录特征或性质的 术语。 • • • • 名义(Nominal)量 次序(Ordinal)量 间隔(Interval)量 比率(Ratio)量
Stevens S. S. On the Theory of Scales of Measurement[J]. Science, 1946, 103(2684): 677-680.
John Wilder Tukey (1915.6.16 –2000.6.26)
2. 茎叶图(Stem-and-Leaf plot) Tukey在1977 年提出。 茎叶图:单变量、小数据集数据分布 的图示方法。
示例:
55 49 37 57 46 40 64 35 73 62 61 43 72 48 54 69 45 78 46 59 40 58 56 52 49 42 62 53 46 81 茎叶 3|5 7 4|0 0 5|2 3 6|1 2 7|2 3 8|1
3. 空间统计分析陷阱(基本问题)
3.1 空间自相关(Spatial autocorrelation)
地理学第一定律: everything is related to everything else, but near things are more related than distant things (Tobler,1970).
A:研究区域面积,n:点的个数。
b). 确定每个网格中点的个数。 c). 计算均值(Mean)、方差(Var)和方差均值 比:VMR=Var/Mean
– 对于均匀分布,方差=0,因此VMR的期望值= 0; – 对于随机分布,方差=均值,因此VMR的期望值= 1; – 对于聚集分布,方差大于均值。因此VMR的期望值 >1 。
边界效应(edge effect)指分析中由于实体向一个或多 个边界近似时出现的误差。
radius
radius
二、空间基础&量算
1. 地理空间数据的特征
时空特征 多维结构 多尺度性 不确定性
海量性
地理空间数据特征
2. 地理空间问题
在进行空间分析时,一般主要从以下几个 方面入手: 空间位置 空间分布与格局 资源配置与规划 空间关系与影响 空间动态与过程
1. 2. 3. 4. 名词解释(20 ± ) 简答题(30 ± ) 做图题(30± ) 论述题(20± )
“空间分析”总复习
一.绪论 二.空间基础&量测 三.探索性空间数据分析 四.空间点数据分析 五.空间格数据分析 六.空间插值与地统计 七.空间回归 八.地图代数
一 绪论
随机分布:任何一点在任何一个位置发生的概率 相同,某点的存在不影响其它点的分布。又称 泊松分布(Poisson distribution)。
均匀分布:个体间保持一定的距离,每一个点尽 量地远离其周围的邻近点。在单位(样方)中个体 出现与不出现的概率完全或几乎相等。 聚集分布:许多点集中在一个或少数几个区域, 大面积的区域没有或仅有少量点。总体中一个 或多个点的存在影响其它点在同一取样单位中 的出现概率。
可变面元问题:尺度效应
x = 均值,n=9
x=(10+5+5+15+10+10+5+15+5)/n=8.88;
x=8.47; n=3
x=9.33; n=3
可变面元问题:区划效应 原 始 数 据 左 右 平 均 上 下 平 均
O’Sullivan&Unwin(2003),p.31
3.3 边界效应
3 5 2 1 3
1 0 1 3 1
2 2 2 2 2
2 2 2 2 2
0 0 10 0 0
0 0 10 0 0
x
随机
Quadrat # 1 2 3 4 5 6 7 8 9 10 Number of Points Per Quadrat (xi -xa )^2 3 1 1 1 5 9 0 4 2 0 1 1 1 1 3 1 3 1 1 1 20 20 2.222 2.000 1.111
3. 箱线图&五数总结 箱线图(boxplot)也称箱须图(boxwhisker plot)需要五个数,称为五数总结: ① 最小值 ② 下四分位数:Q1 ③ 中位数(median) ④ 上四分位数:Q3 ⑤ 最大值 The inter-quartile range :IQR = Q3 - Q1
Box plot
Number of observations)
Outliers
Hinge (1.5 times IQR)
75th percentile Median 25th percentile IQR
Hinge (1.5 times IQR) Variable name: Percent students
4. 核密度估计(Kernel Density Esቤተ መጻሕፍቲ ባይዱimation, KDE)
点模式的三种基本空间分布
随机
均匀
聚集
2. 空间点模式分析方法 2.1 基于密度的方法:测度一阶效应
① 样方分析 (Quadrat Analysis) ② 样方分析的统计检验 ③ 核密度估计 (Kernel Density Estimation)
2.2 基于距离的方法:测度二阶效应
① 最近邻距离 (Nearest Neighbor Distance) ② 最近邻距离的统计检验 ③ G 函数 (G Function) ④ F 函数 (F Function) ⑤ K 函数 (K Function)
1. 空间/属性数据的类型 1.1 空间数据的类型
• • • • 空间点数据(Point Data) 空间线数据(Line Data Network) 空间面数据(Areal Data) 地统计数据(Geostatistical Data)
来源:http://ua.t.u-tokyo.ac.jp/okabelab/freesat/ FreeSAT:Free Spatial Analysis Tools
均匀
Number of Points Quadrat Per # Quadrat (xi -xa )^2 1 2 0 2 2 0 3 2 0 4 2 0 5 2 0 6 2 0 7 2 0 8 2 0 9 2 0 10 2 0 20 0 Variance Mean Var/Mean 0.000 2.000 0.000
三、探索性空间数据分析
1. 2. 3. 4. 概述 茎叶图 箱线图&五数总结 核密度估计(Kernel Density Estimation, KDE)
1. 概述
三种类型的数据分析
Classical
Problem Data Model Analysis Conclusions
EDA
1 n x xi ˆ f ( x) K h nh i 1
0.5
reference 0.3 0.1
dnorm(x)
0.0
0.1
0.2
0.3
0.4
0.05
-3
-2
-1
0 x
1
2
3
应用不同带宽生成的100个服从正态分布随 机数的核密度估计。
四、空间点模式分析
1. 概述 2. 空间点模式分析方法
2 3 5 6 6 6 8 9 9 4 5 6 7 8 9 2 4 9 8
茎叶图制作方法
① 选择适当的数字为茎,通常是起首数字, 茎之间的间距相等; ② 每列标出所有可能叶的数字,叶子按数值 大小依次排列;
③ 由第一行数据,在对应的茎之列,顺序记 录茎后的一位数字为叶,直到最后一行数 据,需排列整齐(叶之间的间隔相等)。
Exploratory Data Analysis(EDA)
“Exploratory data analysis is an attitude, NOT a bundle of techniques” (Tukey 1977). “Let data speak for themselves”
• 核密度估计(KDE) 是估计一个随机变量概率密度 函数(pdf)的非参数方法。 • If x1, x2, ..., xn ~ ƒ is an independent and identicallydistributed(i.i.d) sample of a random variable, then the kernel density approximation of its probability density function is
1. 概述
• 点模式分析由植物学家和生态学家在1930s 应用。但是,随后许多不同领域也开始应用 点模式分析,如考古学、流行病学、天文学 和犯罪学。 • 一般来说,点模式分析可以用来描述任何类 型的事件数据(incident data)。因为每一事 件都可以抽象化为空间上的一个位置点。
空间点模式的三种基本分布
Tukey was an American statistician, born in New Bedford, Massachusetts, and obtained a B.A. in 1936 and M.Sc. in 1937, in chemistry, from Brown University, before moving to Princeton University where he received a Ph.D. in mathematics.
0. 1. 2. 3. 空间分析概念 空间数据与属性数据的类型 空间分析的框架 空间统计陷阱
0. 空间分析概念
空间分析( Spatial Analysis) :没有统一定义。
• 空间分析是对数据的空间信息、属性信息或二者 共同信息的统计描述或说明。 --Goodchild(1987) • 空间分析是对于地理空间现象的定量研究,其常 规能力是操纵空间数据成为不同的形式,并且提 取潜在信息。 --Openshaw(1997)&Bailey and Gartell(1995) • 空间分析是结果随着分析对象位置变化而改变的 一系列方法。 --Longley et al.(2001, p.278) • 空间分析是基于地理对象的位置和形态特征的空 间数据分析技术,其目的在于提取和传输空间信 息。 —郭仁忠
– Generally true with discrete data – Definitely true with continuous data 空间自相关破坏了经典统计当中的样本 独立性假设。
3.2 可变面元问题
随面积单元定义的不同而变化的问题,就是可变 面元问题(Modifiable Areal Unit Problem , MAUP)。古老但依然没有很好解决。 MAUP的类型: ① 尺度效应(Scale effect):当空间数据经聚合 而改变其单元面积的大小 、形状和方向时,分 析结果也随之变化的现象。 ② 区划效应(Zoning effect):给定尺度下不同 的单元组合方式导致分析结果产生变化的现象。
2.1 基于密度的方法 ①样方分析-两种方式 利用所有点:
样方的形状、大小、方向对 结果有影响 – 如果样方太大/小,那 么 ……?
–
随机抽样方法:
有增加样本量的作用 – 可以描述一个没有完全数 据的空间点过程
–
样方分析步骤
a). 研究区域中打上网格,建议方格大小为:
QuadratSize = 2A /n
2. 空间分析的框架
属性数据
数据库
空间数据
图示
可视化
GIS 数据库管理系统
模式描述
探索性分析
统计软件
假设检验
模型构建
基于Anselin和 Getis(1992)提出的 一般框架,GIS环 境下空间分析模块 的关系见右图。参 照GIS输入、存储、 分析和输出等功能, GIS环境下空间分 析可进一步细分为 选择、操作、探索 和确认4种。
Problem Data Analysis Model Conclusions
Bayesian
Problem Data Model Prior Distribution Analysis Conclusions
来源:NIST/SEMATECH e-Handbook of Statistical Methods, http://www.itl.nist.gov/div898/handbook/
1.2 属性数据的类型
属性(Attribute):与空间数据库中一个独 立对象(记录)关联的数据项。属性已成 为描述一个位置任何可记录特征或性质的 术语。 • • • • 名义(Nominal)量 次序(Ordinal)量 间隔(Interval)量 比率(Ratio)量
Stevens S. S. On the Theory of Scales of Measurement[J]. Science, 1946, 103(2684): 677-680.
John Wilder Tukey (1915.6.16 –2000.6.26)
2. 茎叶图(Stem-and-Leaf plot) Tukey在1977 年提出。 茎叶图:单变量、小数据集数据分布 的图示方法。
示例:
55 49 37 57 46 40 64 35 73 62 61 43 72 48 54 69 45 78 46 59 40 58 56 52 49 42 62 53 46 81 茎叶 3|5 7 4|0 0 5|2 3 6|1 2 7|2 3 8|1
3. 空间统计分析陷阱(基本问题)
3.1 空间自相关(Spatial autocorrelation)
地理学第一定律: everything is related to everything else, but near things are more related than distant things (Tobler,1970).
A:研究区域面积,n:点的个数。
b). 确定每个网格中点的个数。 c). 计算均值(Mean)、方差(Var)和方差均值 比:VMR=Var/Mean
– 对于均匀分布,方差=0,因此VMR的期望值= 0; – 对于随机分布,方差=均值,因此VMR的期望值= 1; – 对于聚集分布,方差大于均值。因此VMR的期望值 >1 。
边界效应(edge effect)指分析中由于实体向一个或多 个边界近似时出现的误差。
radius
radius
二、空间基础&量算
1. 地理空间数据的特征
时空特征 多维结构 多尺度性 不确定性
海量性
地理空间数据特征
2. 地理空间问题
在进行空间分析时,一般主要从以下几个 方面入手: 空间位置 空间分布与格局 资源配置与规划 空间关系与影响 空间动态与过程