计量地理学考试重点
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
趋势面分析:用数学的方法,以数学模型来模拟(或拟合)地理数据的空间分布及其区域性变化趋势的方法,称为趋势面分析。
趋势面分析效果检测:
拟合指数I检验
I>75%拟合程度较好
第六章
聚类分析:根据地理变量(或指标或样品的属性或特征的相似性、亲疏程度,用数学的方法把它们逐步地分型划类,最后得到一个能反映个体或站点之间、群体之间亲疏关系的分类系统。
第二章
1.地理数据按性质可分
(1)定性数据:用来表示定性变量的数据
(2)定量数据:用来表示定量变量的数据
2.按取值来分:
(1)离散型数据:用计数方法获取的数据
(2)连续型数据:用度量、测量、称量、观测方法获取的数据
地理数据的变换
常用方法:①对数变换;
②标准化;
③取倒数;
④概率变换
统计分组的步骤
(1)确定全距R R=
(1)设Vi为顶点。求出所有M(Vi,Vj),Vj为未标号点,如果没有Vj,计算结束;
(2)计算M(J)=min{M(j),M(i)+M(Vi,Vj)};
(3)算出M(j0)=min[M(J)],i=j0,返回步骤1。
点与点之间的离散度
道路网络
(1)直达度(2)里程(3假定中转一次,相当于延长10km(4)运输量与人口数量成比例
[问答]常见非线性回归模型的建立
(1)幂函数型
(2)指数函数型
(3)对数函数型
在多元回归中,各个平方和的自由度可按下述原则来确定:
①总平方和lyy的自由度仍为n-1
②回归平方和的自由度等于自变量的个数k;
③剩余平方和的自由度等于n-k-1
建立幂函数乘积模型
幂函数乘积模型: y=kx1ax2bx3c
①求r:根据r计算ry1,ry2,ry3
数据越大,回归效果越不好;
数据越小,回归效果越好。
[计算见作业]一元线性地理回归模型建立步骤
(1)计算∑xi,∑yi,∑xiyi ,∑xi2,∑yi2
(2)计算相关系数,若相关则建立回归模型。
(3)根据公式,首先得到回归系数b,然后计算得到常数a,得出一元线性回归模型:
y=a+bx
(4)估计误差。
(5)方差分析。
1.小概率原理:即在指定的随机试验中,某事件出现的概率非常微小,就可以认为在一次试验中此事件是不可能出现的。
2.应用小概率时需注意:
ⅰ必须对样本统计量概率分布作出假定
ⅱ必须对小概率界限作出具体规定.
称“显著性水平”,通常用0.01,0.05,0.10等。
3具体步骤
1.对地理问题详查之后,根据观测数据选择适当的概率模型F;
4x1 + 5x2≤200
9x1 + 4x2≤360
x1≥0 , x2≥0\
并使其目标函数
Z = 7x1 + 12x2
达到最大值。
解:(1)把不等式视为等式
(2)画出线性函数图像
(3)得到可行解集
(4)寻找最优解
(5)得到最优解G(20,24),目标函数最大值428.0
集中趋势:
(1)算术均值
(2)几何均值
(3)中位数
(4)众数
算术均值:样本均值,适用于正态分布
未分组
已分组
几何均值:适用于偏态分布
中位数:按大小排列起来,位居中间的变量值
众数:出现频数最大的变量值
绝对离散度
[论述题]
相对离散度适用情况
a.当两组数单位不同
b.均值相差较大
c.标准差相同
总结:均值和离散度结合来度量地理特征
[计算见作业]判别分析原理
1.构建判别函数:Y=C1X1+C2X2+……+CmXm=ΣCiXi
2.依据极值原理和费歇尔准则,建立方程组
l11c1+l12c2+...+l1mcm=x1A-x1B=d1
l21c1+l22c2+...+l2mcm=x2A-x2B=d2
.................................
0集中,越集中Q越小密集分布
Id =1/4(或接近1/4)均匀型均匀分布
1分散型分散分布
相对于指定位置的离散度(绘制普通罗伦兹曲线)
以指定位置为圆心,以1/4公里为半径(折合图上比例尺绘制同心圆)
最短路径
Dijkstra算法:找出起点V1至终点Vn最短路径和长度。
设G为有向图,对每一顶点Vi,Vj赋值M(Vi,Vj),令起点V1的M(1)=0,作如下循环:
界线网络
离散型区域分布绘制空间罗伦兹曲线
集中度测度:I=(C-550)/450,其中C=C1+C2+C3+……+C10,C为横轴10等分点对应在曲线上的纵坐标值。
高程曲线法适用于:对高于或低于不同值的空间连续变化现象的分析
高程积分:高程曲线与坐标轴围成的面积同过高程曲线与双轴交点所引的平行双轴的线围成的面积之比
标准差标准化:经这样变化后的数据,均值为0,方差为1,且与指标的量纲无关;
极差标准化:经这样变化后的数据,其变换范围在0和பைடு நூலகம்之间,而且有消除了量纲的影响。
聚类分析的统计量
相似系数:夹角余弦(cosθ)
相关系数(r)
距离系数:绝对距离
欧式距离
判别分析准则
费歇尔准则:各类均值之间差别最大,各类内部离差平方和最小。
时间序列的三个特性:1.趋势性部分; 2.周期性部分;3.随机性部分:
第四章
随机变量:在一定条件下,受随机因素的影响而在试验结果中能取不同数值的量,称为随机变量。
统计假设检验:对未知母体的参数或分布情况先作出某种假设,再选取适当的统计量,然后根据实测的样本资料,来对所作的假设进行检验,从而判断原假设是否正确,称为统计假设检验。
一组样本数据当中最大与最小值之差
(2)确定适当的组数n=1+3.32lgN
(3)确定组距h
(4)确定组段上下限
第一组下限=
第一组上限=第一组下限+h
第二组下限=第一组上限
第二组上限=第二组下限+h,以此类推
(5)统计各组段中数据出现的次数(频数)
样本容量(总数)=各个组段频数之和
样本特征值:根据样本计算出来数值,能反映样本分布特征
5.贡献率计算
综合距离:D2=|C1d1|+|C2d2|+……+|Cmdm|
X1的贡献率=|C1d1|/D2*100%
Xm的贡献率=|Cmdm|/D2*100%
6.效果检验
F>Fp,nA+nB-p-1判别效果显著
F<Fp,nA+nB-p-1判别效果不显著,否定原假设。
第八章
主成份分析:是把原来多个指标化为少数几个综合的指标的一种分析方法
第三章
空间分布的类型
1.点状分布
2.线状分布
3.离散型区域分布
4.连续型区域分布
中项中心:把点按东西向和南北向二等分的互相垂直的两条线的交点。
几何中心(分布重心;平均中心)把点放在某一坐标系中测出每个点的坐标进行坐标求均值,得到的均值点就是几何中心。特点:唯一性,精确性
相对于中项中心的离散程度根据Id值可判断点状分布
具有下列三点性质:
(1)相关系数值介于-1≤r≤+1之间;
(2)当相关系数为正值时,表示两个要素(或变数)之间为正相关,相关系数为负值时,表示两个要素(或变数)之间为负相关;
(3)相关系数的绝对值r越大,表示两个要素间相关程度越密切。
相关指数R2表示简单非线性相关程度的统计量
标准估计误差(亦称剩余标准差)
主成份载荷:为主成份Zk与变量Xi之间的相关系数
第九章
线性规划的含义
1.在一定的人力、物力资源条件下,如何配置才能完成任务最多最好——求最大值线性规划问题。
2.任务已定,如何使用尽量少的人力、物力资源来完成任务——求最小值线性规划问题。
图解法
试求x1,x2的值,使它满足约束条件
3x1 + 10x2≤300
lm1c1+lm2c2+...+lmmcm=xmA-xmB=dm
解该方程组求Ci
3.求均值:Y(A)=ΣCiXi(A)
Y(B)=ΣCiXi(B)
4.求判别临界值:
①在Y(A)>Y(B)前提下,Y>YC , Y€A
Y<YC , Y€B
②在Y(A)<Y(B)前提下,Y>YC , Y€B
Y<YC , Y€A
3正态检验
t分布适用于:当总体方差未知,样本容量不大,对正态总体均值进行检验。
F检验法适用于:总体方差检验
第五章
地理相关的意义
所谓相关,是指两个或两个以上变数间相互关系是否密切。
所谓地理相关,就是应用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标。
相关系数:用来度量直线相关程度和方向的指标。
2.根据事实的逻辑程序,选择一个原假设和备择假设H0;
3.选取显著性水平α;
4.确定一个检验用的统计量;
5.求出拒绝区间的界限;
6.将计算值与临界值进行比较,作出的判断
计算值大于临界值落入拒绝区间舍弃原假设
计算值小于临界值落入接受区间接受原假设
克方(χ2)检验法适用于:
1二组或多组数据差异性检验;
2方差比较
假设ry1<ry2<ry3,即y3与x3关系密切
②y与x3作相关
用c=lgy/lgx求出c
③y/x3c与x2作相关
用b=lg(y/x3c)/lgx求出b
④y/x3cx2b与x1作相关
用a=lg(y/x3cx2b)/lgx求出a
⑤同样k=y/x1ax2bx3c可求出k
⑥检验:绘制实测y与计算y在普通方格纸,若直线倾角为450且通过原点,则拟合较好。
趋势面分析效果检测:
拟合指数I检验
I>75%拟合程度较好
第六章
聚类分析:根据地理变量(或指标或样品的属性或特征的相似性、亲疏程度,用数学的方法把它们逐步地分型划类,最后得到一个能反映个体或站点之间、群体之间亲疏关系的分类系统。
第二章
1.地理数据按性质可分
(1)定性数据:用来表示定性变量的数据
(2)定量数据:用来表示定量变量的数据
2.按取值来分:
(1)离散型数据:用计数方法获取的数据
(2)连续型数据:用度量、测量、称量、观测方法获取的数据
地理数据的变换
常用方法:①对数变换;
②标准化;
③取倒数;
④概率变换
统计分组的步骤
(1)确定全距R R=
(1)设Vi为顶点。求出所有M(Vi,Vj),Vj为未标号点,如果没有Vj,计算结束;
(2)计算M(J)=min{M(j),M(i)+M(Vi,Vj)};
(3)算出M(j0)=min[M(J)],i=j0,返回步骤1。
点与点之间的离散度
道路网络
(1)直达度(2)里程(3假定中转一次,相当于延长10km(4)运输量与人口数量成比例
[问答]常见非线性回归模型的建立
(1)幂函数型
(2)指数函数型
(3)对数函数型
在多元回归中,各个平方和的自由度可按下述原则来确定:
①总平方和lyy的自由度仍为n-1
②回归平方和的自由度等于自变量的个数k;
③剩余平方和的自由度等于n-k-1
建立幂函数乘积模型
幂函数乘积模型: y=kx1ax2bx3c
①求r:根据r计算ry1,ry2,ry3
数据越大,回归效果越不好;
数据越小,回归效果越好。
[计算见作业]一元线性地理回归模型建立步骤
(1)计算∑xi,∑yi,∑xiyi ,∑xi2,∑yi2
(2)计算相关系数,若相关则建立回归模型。
(3)根据公式,首先得到回归系数b,然后计算得到常数a,得出一元线性回归模型:
y=a+bx
(4)估计误差。
(5)方差分析。
1.小概率原理:即在指定的随机试验中,某事件出现的概率非常微小,就可以认为在一次试验中此事件是不可能出现的。
2.应用小概率时需注意:
ⅰ必须对样本统计量概率分布作出假定
ⅱ必须对小概率界限作出具体规定.
称“显著性水平”,通常用0.01,0.05,0.10等。
3具体步骤
1.对地理问题详查之后,根据观测数据选择适当的概率模型F;
4x1 + 5x2≤200
9x1 + 4x2≤360
x1≥0 , x2≥0\
并使其目标函数
Z = 7x1 + 12x2
达到最大值。
解:(1)把不等式视为等式
(2)画出线性函数图像
(3)得到可行解集
(4)寻找最优解
(5)得到最优解G(20,24),目标函数最大值428.0
集中趋势:
(1)算术均值
(2)几何均值
(3)中位数
(4)众数
算术均值:样本均值,适用于正态分布
未分组
已分组
几何均值:适用于偏态分布
中位数:按大小排列起来,位居中间的变量值
众数:出现频数最大的变量值
绝对离散度
[论述题]
相对离散度适用情况
a.当两组数单位不同
b.均值相差较大
c.标准差相同
总结:均值和离散度结合来度量地理特征
[计算见作业]判别分析原理
1.构建判别函数:Y=C1X1+C2X2+……+CmXm=ΣCiXi
2.依据极值原理和费歇尔准则,建立方程组
l11c1+l12c2+...+l1mcm=x1A-x1B=d1
l21c1+l22c2+...+l2mcm=x2A-x2B=d2
.................................
0集中,越集中Q越小密集分布
Id =1/4(或接近1/4)均匀型均匀分布
1分散型分散分布
相对于指定位置的离散度(绘制普通罗伦兹曲线)
以指定位置为圆心,以1/4公里为半径(折合图上比例尺绘制同心圆)
最短路径
Dijkstra算法:找出起点V1至终点Vn最短路径和长度。
设G为有向图,对每一顶点Vi,Vj赋值M(Vi,Vj),令起点V1的M(1)=0,作如下循环:
界线网络
离散型区域分布绘制空间罗伦兹曲线
集中度测度:I=(C-550)/450,其中C=C1+C2+C3+……+C10,C为横轴10等分点对应在曲线上的纵坐标值。
高程曲线法适用于:对高于或低于不同值的空间连续变化现象的分析
高程积分:高程曲线与坐标轴围成的面积同过高程曲线与双轴交点所引的平行双轴的线围成的面积之比
标准差标准化:经这样变化后的数据,均值为0,方差为1,且与指标的量纲无关;
极差标准化:经这样变化后的数据,其变换范围在0和பைடு நூலகம்之间,而且有消除了量纲的影响。
聚类分析的统计量
相似系数:夹角余弦(cosθ)
相关系数(r)
距离系数:绝对距离
欧式距离
判别分析准则
费歇尔准则:各类均值之间差别最大,各类内部离差平方和最小。
时间序列的三个特性:1.趋势性部分; 2.周期性部分;3.随机性部分:
第四章
随机变量:在一定条件下,受随机因素的影响而在试验结果中能取不同数值的量,称为随机变量。
统计假设检验:对未知母体的参数或分布情况先作出某种假设,再选取适当的统计量,然后根据实测的样本资料,来对所作的假设进行检验,从而判断原假设是否正确,称为统计假设检验。
一组样本数据当中最大与最小值之差
(2)确定适当的组数n=1+3.32lgN
(3)确定组距h
(4)确定组段上下限
第一组下限=
第一组上限=第一组下限+h
第二组下限=第一组上限
第二组上限=第二组下限+h,以此类推
(5)统计各组段中数据出现的次数(频数)
样本容量(总数)=各个组段频数之和
样本特征值:根据样本计算出来数值,能反映样本分布特征
5.贡献率计算
综合距离:D2=|C1d1|+|C2d2|+……+|Cmdm|
X1的贡献率=|C1d1|/D2*100%
Xm的贡献率=|Cmdm|/D2*100%
6.效果检验
F>Fp,nA+nB-p-1判别效果显著
F<Fp,nA+nB-p-1判别效果不显著,否定原假设。
第八章
主成份分析:是把原来多个指标化为少数几个综合的指标的一种分析方法
第三章
空间分布的类型
1.点状分布
2.线状分布
3.离散型区域分布
4.连续型区域分布
中项中心:把点按东西向和南北向二等分的互相垂直的两条线的交点。
几何中心(分布重心;平均中心)把点放在某一坐标系中测出每个点的坐标进行坐标求均值,得到的均值点就是几何中心。特点:唯一性,精确性
相对于中项中心的离散程度根据Id值可判断点状分布
具有下列三点性质:
(1)相关系数值介于-1≤r≤+1之间;
(2)当相关系数为正值时,表示两个要素(或变数)之间为正相关,相关系数为负值时,表示两个要素(或变数)之间为负相关;
(3)相关系数的绝对值r越大,表示两个要素间相关程度越密切。
相关指数R2表示简单非线性相关程度的统计量
标准估计误差(亦称剩余标准差)
主成份载荷:为主成份Zk与变量Xi之间的相关系数
第九章
线性规划的含义
1.在一定的人力、物力资源条件下,如何配置才能完成任务最多最好——求最大值线性规划问题。
2.任务已定,如何使用尽量少的人力、物力资源来完成任务——求最小值线性规划问题。
图解法
试求x1,x2的值,使它满足约束条件
3x1 + 10x2≤300
lm1c1+lm2c2+...+lmmcm=xmA-xmB=dm
解该方程组求Ci
3.求均值:Y(A)=ΣCiXi(A)
Y(B)=ΣCiXi(B)
4.求判别临界值:
①在Y(A)>Y(B)前提下,Y>YC , Y€A
Y<YC , Y€B
②在Y(A)<Y(B)前提下,Y>YC , Y€B
Y<YC , Y€A
3正态检验
t分布适用于:当总体方差未知,样本容量不大,对正态总体均值进行检验。
F检验法适用于:总体方差检验
第五章
地理相关的意义
所谓相关,是指两个或两个以上变数间相互关系是否密切。
所谓地理相关,就是应用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标。
相关系数:用来度量直线相关程度和方向的指标。
2.根据事实的逻辑程序,选择一个原假设和备择假设H0;
3.选取显著性水平α;
4.确定一个检验用的统计量;
5.求出拒绝区间的界限;
6.将计算值与临界值进行比较,作出的判断
计算值大于临界值落入拒绝区间舍弃原假设
计算值小于临界值落入接受区间接受原假设
克方(χ2)检验法适用于:
1二组或多组数据差异性检验;
2方差比较
假设ry1<ry2<ry3,即y3与x3关系密切
②y与x3作相关
用c=lgy/lgx求出c
③y/x3c与x2作相关
用b=lg(y/x3c)/lgx求出b
④y/x3cx2b与x1作相关
用a=lg(y/x3cx2b)/lgx求出a
⑤同样k=y/x1ax2bx3c可求出k
⑥检验:绘制实测y与计算y在普通方格纸,若直线倾角为450且通过原点,则拟合较好。