空间回归方法-空间统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间回归模型
徐成东
深圳CDC培训课程
2014‐11‐13
空间回归分析基础
–什么是回归分析
•寻求两种或两种以上变量间相互依赖的定量关系的一种统计分
析方法。
•热点探测回答了“Where”的问题,回归分析试图回答“Why”–回归分析目的
•检验理论:基本目标是测量一个或多个变量的变化对另一变量
变化的影响程度
•进行预测:基本目标是构建一个持续、准确的预测模型。
•寻找假设:基本目标是通过回归分析来探索这些关系并解答想
要检验的假设情况。
–回归分析基本步骤
•①从一组数据出发确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法。
•②对这些关系式的可信程度进行检验。
•③优化回归方程。在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法。
•④利用所求的关系式对某一过程进行预测或控制。
–空间分析常见问题
–为什么要有空间回归
回归分析常见问题问题影响解决方案
遗漏了解释变量回归模型丢失关键解释变
量,其系数和相应的关联
P 值将不可信。
检查OLS 残差或对OLS 回归残差运行
热点分析,尝试找出可能的缺失变量。
非线性关系线性模型中如果解释变量
与因变量之间的关系存在
非线性关系,则所获得的
模型质量不佳。
通过创建散点图了解模型中变量之间
的关系。可通过变换变量来修复曲线
性。
数据异常值异常值可使回归关系背离
最佳拟合,从而使回归系
数发生偏差。
可通过散点图和其他图(直方图)检
验数据的极值。如果异常值存在错误,
请修正或移除异常值。如果异常值正
确,则不能将其移除。
回归分析常见问题问题影响解决方案
多重共线性多重共线性可导致模型不
可靠。
应通过创建交互变量或增大采样从模
型中移除冲突变量或对其进行修改。
正态分布偏差当回归模型残差不服从均
值为零的正态分布时,系
数p 值不可靠。
对数据预处理时,做正态变换。
残差的方差不一致当模型不能很好地预测
某些值时,结果将出现
偏差。
使用加权最小二乘法或其它相关模型
进行计算