计量地理学复习重点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量地理学复习重点
3、统计分组:是根据研究目的,按照一定的分组标志将地理数据分成若干组。
步骤:P24
①求极差R (全距):R=X max -X min (一组数据的最大值和最小值)
②确定组数n :组数的多少是根据样本容量的多少确定的,一般说,样本容量大,组数可多一些,反之就少。可用Sturges 公式计算:n=1+3.32lgN
③计算组距h :即一组两头分界点距离h=R/N
④计算组限Yi :即各组分界点的数值。第一组下限y=X min -½h ;第一组上限
=下限+组距
⑤计算组中值:m=(上限+下限)/2
集中化指数是一个描述地理数据分布的集中化程度的指数。
A ——实际数据的累计百分比总和;
R ——均匀分布时的累计百分比总和;
M ——集中分布时的累计百分比总和。
集中化指数在[0,1]区间上取值。
4、简述描述地理数据一般水平的指标P25
①平均值:指所有数据的和与样本总量的商,并分为分组的平均数和未分组的平均数。
②中位数:指将各个数据从小到大排列,居于中间位置的那个数,且中位数在频数分布图中居于中央,把面积等分为左右两部分,在累计频率图上,累计频率为50%所对应的数值
③众数:指数据中出现频数最多的那个数,且在频数分布图上居最高点。
5、描述地理数据分布的离散程度的指标P27
①极差:指所有数据中最大值与最小值之差。
②离差:指每一个地理数据与平均值的差,它代表着每一个地理数据与平均值的离散程度。
③离差平方和:指各个地理数据与平均值之差的平方的总和,它从总体上衡量一组地理数据与平均值的离散程度。
R M R
A I --=
④方差:指各个数据分别与其平均数之差的平方的和的平均数。
⑤标准差:指方差的平方根。(方差与标准差是从平均概况衡量一组地理数据与平均值的离散程度。)
⑥变异系数:表示了地理数据的相对变化(波动)程度
6、描述地理数据分布特征的参数:P28
(1)偏度系数:它测度了地理数据分布的不对称性情况,刻画了以平均值为中心的偏向情况。
g1<0,表示负偏,即均值在峰值的左边;
g1>0,表示正偏,即均值在峰值的右边;
g1=0,表示对称分布。
(2)峰度系数:它测度了地理数据在均值附近的集中程度。
标准正态分布的峰度系数g2=0;
g2>0,表示地理数据分布的集中程度高于正态分布;
g2<0,表示地理数据分布的集中程度低于正态分布。
7、洛伦茨曲线和集中化指数计算P30
第三章讲义内容
1、点状分布的测度:
①最邻近距离的测度:地理事物点状分布的相对位置与其最邻近点之间的距离,是点型配置的重要特征。
顺序法和区域法所求得的最邻近距离的合计是一致的,但更高级位的平均距离是不一致的。点型分布为随机型或均等型时用区域法,点型分布为凝集型时用顺序法。
②中间位置的测度:
中项中心:两条相互垂直的直线的交叉点,这两条直线一般取南北向和东西向,每条直线将点状分布的点子二等分。
平均中心:也称分布重心,其确定方法如下,
1任意在分布图上作x轴和y轴,通常这种数轴画在分布点的西侧和南侧。
2确定每一点的x轴和y轴坐标。
3计算x坐标轴和y坐标轴的平均值x,y,这里x,y就是平均中心c的坐标(x,
y)
③离散程度的测度。
2、网络图的概念:是一些点以及由点连成的直线所组成的图形,与通常所说的几何图形,函数图像完全不同,分为有何图与无何图。
3、运输系统网络的4个特征:
①结点的直通性:表现在环中结点与网络中其他环路结点的联结状况,以及运输流在结点上与网络中其他结点的联结状况。
②道路系统的里程:以最小里程为标准,从哪一站出发到各站的里程最少。
③道路系统的运输量(吨公里):以运输量最少作为标准确定从哪一站出发到各站最优。
④考虑中转——运输费用的综合影响把中转因素考虑进去,会造成费用的增加。第四章
1、偏相关系数与复相关系数的区别:
(1)偏相关系数:
概念:在多要素所构成的地理系统中,先不考虑其他要素的影响,单独研究两个要素之间的相互关系的密切程度时,称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。
偏相关系数的性质:①偏相关系数分布的范围在-1—1之间;②偏相关系数的绝对值越大,表示其偏相关程度越大;③偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数。
偏相关系数的显著性检验,一般采用t检验法。
(2)几个要素与某一个要素之间的复相关程度,用复相关系数来测定。
复相关系数的性质:①复相关系数介于0到1之间;②复相关系数越大,则表明要素之间的相关程度越密切。复相关系数为1,表示完全相关。复相关系数为0,表示完全无关;③复相关系数必大于或至少等于单相关系数的绝对值。
复相关系数的显著性检验,一般采用F检验法。
2、一级偏相关系数的计算P91公式(4.1.4)(4.1.5)(4.1.6)
3、回归分析的计算P95
4、偏回归系数的意义P98:是当其他变量Xj(j不等于i)都固定时,自变量Xi每变化一个单位而使因变量y平均改变的数值。
5、时间序列的组成成分:P108
①长期趋势(T):是时间序列随时间的变化而逐渐增加或减少的长期变化之趋势。
②季节变动(S):是时间序列在一年中或固定时间内,呈现出的固定规则的变动。
③循环变动(C):又称景气循环变动,是指沿着趋势线如钟摆般地循环变动。
④不规则变动(R):是指在时间序列中由于随机因素影响所引起的变动。
6、时间序列的组合模型:P110
(1)加法模型:加法模型假定时间序列是基于四种成分相加而成的。
(2)乘法模型:乘法模型假定时间序列是基于四种成分相乘而成的。
7、常用的聚类要素数据处理办法:P124
(1)总和标准化法:分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和;
(2)标准差标准化:得到的数据各要素的平均值为0,标准差为1;
(3)极大值标准化:所得的新数据,各要素的极大值为1,其余各数值小于1;
(4)极差的标准化:得到的数据,各要素的极大值为1,极小值为0,其余的数值均在0和1之间。
8、常见的距离有P126:绝对值距离、欧式距离、明科夫斯基距离、切比雪
夫距离
9、主成分分析原理P135:是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度看,这是一种将维处理技术,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多的反映原来较多变量指标所反映的信息。
10、主成分分析的步骤P136
(1)计算相关系数矩阵
(2)计算特征值与特征向量
(3)计算主成分贡献率及累计贡献率