计量地理学第三章统计分析方法1相关分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y
i
rxy
l xy l xx l yy
•举例,北京市多年各月平均气温与5cm深的平 均地温,如表所示,请计算两者的相关系数
月 份 1 2 3 4 5 6 7 8 9 10 11 4.0 4.6 12 -2.8 -1.9
气 温
地 温
-4.7 -2.3 4.4 -3.6 -1.4 5.1
i
v )( yi y )
2
(v
i 1
53
i
v)
(y
i 1
53
2
60527.59 16274170.6 0 290.19
i
y)
60527.59 0.8808 = 4034.13 17.03
计算结果表明,降水量(p)和纬度(y) 之间异向相关,而蒸发量(v)与纬度(y) 之间同向相关。
13. 2
14. 5
20. 2
22. 3
24. 2
26. 9
26. 0
28. 2
24. 6
26. 5
19. 5
21. 1
12. 5
13. 4
用导出公式
rxy
l xy l xx l yy
x y xy
i i i i 2
xi 2 xi n
– 相关程度
研究两个地理要素之间的相互关系是否密切
– 相关方向
正相关:y值随x的增加而变大或随x的减少而变小 负相关:y值随x的增加而变小或随x的减少而增大
1、一般常用相关系数的计算
rxy
( x x )( y y ) ( x x) ( y y)
2
2
rxy为要素x与y之间的相关系数,它就是 表示该两要素之间相关程度的统计指标, 其值在[-1,1]区间之内
地理要素之间的相关分析的任务,是揭示 地理要素之间相互关系的密切程度。而地 理要素之间相互关系的密切程度的测定, 主要是通过对相关系数的计算与检验来完 成的
一、地理相关的意义
相关与地理相关
– 相关是指两个或两个以上变数间相互关系是否密切。 在研究这种关系时并不专指哪一个是自变量,哪一个 是因变量,而视实际需要确定。相关分析仅限于测定 两个或两个以上变数具有相关关系者,其主要目的是 计算出表示两个或两个以上变数间的相关程度和性质 – 地理相关,就是应用相关分析法来研究各地理要素间 的相互关系和联系强度的一种度量指标
0.01 0.601
5
6 7 8
0.900
0.829 0.714 0.643
1.000
0.943 0.893 0.833
18
20 22 24
0.399
0.377 0.359 0.343
0.564
0.534 0.508 0.485
9
10 12 14
0.600
0.564 0.456 0.456
0.783
0.746 0.712 0.645
26
28 30 --
0.329
0.317 0.306 --
0.465
0.448 0.432 --
n代表样本个数,α代表不同的置信水平,也称显著水 平,表中的数值为临界值 r 。
在上例中,n=31,表中没有给出相应的样 本个数下的临界值 r ,但是同一显著水平 下,随着样本数的增大,临界值 r 减少。在 n=30时,查表得: r0.01 =0.432,由于 r ' xy =0. 806 > =0.432,所以在α=0.01的置信 水平上来看,中国大陆各省(直辖市、自治 区)人口规模与GDP是等级相关的。
地理要素间的关系
– 函数关系:确定性的关系,这种关系在地理各 要素间较少见,这是因为许多地理要素的变化 具有随机性的缘故; – 相关关系:即要素间既存在密切的关系,但又 不能由一个(或几个)要素(或变量)的值明 确地求出另一个要素(变量)的值
二、地理相关程度的度量方法
(一)简单直线相关程度的度量
检验相关系数ρ=0的临界值(rα)表
–左边的f 值称为自由度,其数值为f=n-2,这 里n 为样本数;上方的α代表不同的置信水平; 表内的数值代表不同的置信水平下相关系数 ρ=0 的临界值,即ra;公式p={|r|> rα } = α 的意思是当所计算的相关系数r 的绝对值 大于在a 水平下的临界值rα 时,两要素不相 关(即ρ=0)的可能性只有a。 –一般而言,当|r|<rα时,则认为两要素不 相关,这时的样本相关系数就不能反映两要 素之间的关系
r
( xi )( yi ) xi yi n 2 2 ( xi ) ( yi ) 2 2 xi yi n n
1 3323.19 (138.8)(155.7) 12 1 1 2 2 3056.16 (138.8) 3616.11 (155.7) 12 12 0.9995
11
12 合计
4.0
-2.8
9
11
4.6
-1.9
9
11
0.00
0.00
0.00
0.00 2.00
6 2 rs 1 0 . 993 2 12(12 1)
秩相关系数的检验
表3.1.5
n
4 0.05 1.000
秩相关系数检验的临界值
显著水平α 0.01 --
显著水平α
n
16
0.05 0.425
(1)对伦敦市月平均气温(T)与降水量(P)之 间的相关系数,f=12-2=10,在显著性水平
r0.10 0.4973。 3.1.3,得知: 0上,查表 .10
因为 rTP 0.4895 r 0.4973 ,所以,伦敦市月 平均气温(T)与降水量(P)之间的相关性并不显
著。
相关分析实例
伦敦的月平均气温与降水量
月份 平均气温t o 1 2 3 4 5 6 7 8 9 10 11 12
( C) 降雨量p (mm)
3.8
4
5.8
8 11.3 14.4 16.5 16.2 13.8 10.8
6.7
4.7
77.7 51.2 60.1 54.1 55.4 56.8
45 55.3 67.5 73.3 76.6 79.6
– rxy>0,表示正相关,即两要素同向发展 – rxy<0,表示负相关,即两要素异向发展 – rxy 的绝对值越接近于1,表示两要素的关系 越密切; 越接近于0,表示两要素的关系越 不密切
1 l xy ( xi x )( yi y ) xi yi xi n 2 1 2 2 l xx ( xi x ) xi xi n 2 1 2 2 l yy ( yi y ) yi yi n
2
(t
i 1
12
i
t)
( p
i 1
12
2
300.91 250.55 1508 .34
i
p)
300 .91 0.4895 15.83 38 .84
计算结果表明,伦敦市的月平均气温( t ) 与降水量(p)之间呈负相关,即异向相关。
rvy
(v
i 1
53
相关系数的检验:
相关系数是根据要素之间的样本值计算 出来,它随着样本数的多少或取样方式的不 同而不同,因此它只是要素之间的样本相关 系数,只有通过检验,才能知道它的可信度。
检验是通过在给定的置信水平下,查相 关系数检验的临界值表来实现的。
表3.1.3 检验相关系数
0
0.02
的临界值(r )表
(三)多要素相关与相关矩阵
– 如果问题涉及到多个要素(n个),则对于其中任何两个 要素xi和xj ,都可以按照下面的公式计算。得到多要素的 相关系数矩阵
p{| r | r }
0.10 1 2 3 4 5 6 7 8 9 10 11 12 0.98769 0.90000 0.8054 0.7293 0.6694 0.6215 0.5822 0.5494 0.5214 0.4973 0.4762 0.4575 0.05 0.99692 0.95000 0.8783 0.8114 0.7545 0.7067 0.6664 0.6319 0.6021 0.5760 0.5529 0.5324 0.01 0.999877 0.99000 0.95873 0.91720 0.8745 0.8343 0.7977 0.7646 0.7348 0.7079 0.6835 0.6614 0.001 0.999998 0.999000 0.991160 0.97406 0.95074 0.92493 0.8982 0.8721 0.8471 0.8233 0.8010 0.7800 0.999507 0.98000 0.93433 0.8822 0.8329 0.7887 0.7493 0.7155 0.6851 0.6581 0.6339 0.6120
yi 2 yi n
n
2
相关系数计算表
月份 1 2 3 4 5 6 7 8 9 10 11 12 总和 气温(x) -4.7 -2.3 4.4 13.2 20.2 24.2 26.0 24.6 19.5 12.5 4.0 -2.8 138.8 21611.16 地温(y) -3.6 -1.4 5.1 14.5 22.3 26.9 28.2 26.5 21.1 13.4 4.6 -1.9 155.7 xy 16.92 3.22 22.44 191.40 450.46 650.98 733.20 651.90 411.45 167.50 18.40 5.32 3323.19 x2 22.09 5.29 19.36 174.24 408.04 585.64 676.00 605.16 380.25 156.25 16.00 7.84 3056.16 y2 12.96 1.96 26.01 210.25 497.29 723.61 795.24 702.25 445.21 179.56 21.16 3.61 3619.11
r0.01
(二)简单非线性相 关程度的度量
– 表示简单非线性相关程 度的统计量,通常用相 关指数Ryx来度量
R yx
ˆ y y 1 y y
i i i
2
2
ˆi f ( xi ) y
– 相关指数的性质,随相关曲线形状的不同而异:
相关指数的分布范围介于0到1之间,即0≤ Ryx ≤1 相关指数的值大,两个要素(变量)间的相关程度 越密切。当Ryx=1时,表示两个要素间为完全曲线 相关;当Ryx=0时,表示两个要素间为完全无曲线 相关 相关指数必大于或至少等于用同一批资料所求得的 相关系数的绝对值,即Ryx≥∣r∣ Ryx的性质与上述情况基本相同,但在通常情况下, Ryx与Rxy不相等,仅当完全相关或完全无关时,两 者才相等
资料来源:.tw/V4/climate/wta_station/wta20.htm
根据表 3.1.1 中的数据,我们可以利用公 式( 3.1.1 ),计算伦敦市月平均气温( T ) 与降水量(P)之间的相关系数:
rTP
(t
i 1
12
i
t )( pi p )
2、顺序(等级)相关系数计算
rs 1 n n 1
2
6 d
2 i
月份
气温 (x)
平均气温 顺序号Ts
地温(y)
5cm平均地温 d=Ts-Tds 顺序号Tds
d2
1
2 3
-4.7
-2.3 4.4
12
10 8
-3.6
-1.4 5.1
12
10 8
0.00
0.00 0.00
0.00
0.00 0.00
第三章 统计分析方法
§1 地理要素间的相关分析 §2 地理要素间的回归分析 §3 时间序列分析法 §4 系统聚类分析方法 §5 主成分分析方法 §6 马尔可夫预测方法 §7 地 地理相关程度的度量方法 相关系数的显著性检验 多要素间相关程度的测度
4
5 6 7 8 9 10
13.2
20.2 24.2 26.0 24.6 19.5 12.5
6
4 3 1 2 5 7
14.5
22.3 26.9 28.2 26.5 21.1 13.4
6
4 2 1 3 5 7
0.00
0.00 1.00 0.00 -1.00 0.00 0.00
0.00
0.00 1.00 0.00 1.00 0.00 0.00