数学建模中的重要问题解答
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图二1979~2008年北京市水资源短缺风险
由图二可以看出,1985、1987、1991和1996年四年均没有发生水资源短缺风险,且水资源短缺风险模拟值均为0,其中1985、1987、1996年风险发生的概率均不到70%,这和实际情形是吻合的,以1991年为例,该年风险发生的计算概率为70%,这一年的实际情况是水资源总量仅为42.29亿 ,但实际总用水量已达到42.03亿 ,已处于风险的边缘状态。虽然1982、1984、1994、1998年等缺水计算概率较高,但由于其缺水影响程度较小,所以由模糊概率计算相应的水资源短缺风险综合评价较小。图3的进一步分析可知,只要真实风险存在(缺水发生),描述风险发生的概率吵过了70%,以1999年为例说明,1999年是枯水年,水资源短缺风险模拟计算值最大,描述风险发生的概率接近100%。以上分析说明模型的计算结果与实际情形是吻合的。
7.1.3 水资源短缺影响因子分析:
根据中提出的水资源短缺风险影响因子,利用Mahalanobis距离法筛选出水资源短缺风险敏感因子,见表5。从表5中第3栏可以看出,水资源总量、污水排放总量、农业用水量、生活用水量在步骤1至步骤4中移出模型的概率均小于0.1,同时在每步中这个变量均使得最近的两类间的Mahalanobis距离最大,因此,这4个变量是影响北京地区水资源短缺风险的敏感因子。
(10)
5.5 判别分析:
判别分析可用于识别影响水资源短缺风险的敏感因子,能够从诸多表明观测对象特征的自变量中筛选出提供较多信息的变量,且使这些变量之间的相关程度较低 ,线性判别函数的一般形式为:
(11)
常用的判别分析方法是距离判别法(马氏距离法),即每步都使得相距最近的两类间的马氏距离最大的变量进入判别函数,其计算公式为:
2010数学与应用数学2班
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
Байду номын сангаас表5敏感因子筛选
步骤
容许度
移出概率
最小Mahalanobis距离的平方
组间
1
污水排放总量
1
0.089
2
污水排放总量
0.681
0.020
0.186
2,5
水资源总量
0.681
0
0.237
1,4
3
污水排放总量
0.392
0.028
0.847
1,5
⑤ 即便现在北京加大力度南水北调工程,但不不能真正意义上解释北京的水资源紧张局面。水资源系统是一个复杂的大系统,广泛存在着随机性和模糊性。由于随机性是因果律的破缺,模糊性是排中率的破缺,在水资源短缺风险评价模型的设计中同时考虑这两种因素的影响。
3.2 主要符号说明:
:供水量
:需水量
x :缺水量
:模糊集
三.条件假设及符号说明
3.1条件假设:
京水资源短缺风险存在可以和模糊性与随机性联系在一起,构建隶属函数来描述。
② 北京近30年(1979-2008)来,每年的总用水量和可用的水资源总量符合Logistic的拟合规律。
③ 北京水资源短缺风险存在与年平均降水量成正相关。
④ 再生水利用(南水北调)可在一定程度上缓解北京水资源短缺的紧张局面。
7.1.2 水资源短缺风险分类:
利用Quick Cluster对1979-2008年北京市的水资源短缺风险进行聚类,各类风险最终的类中心和特征如表四所示。
表4水资源短缺风险类别与特性
水资源短缺风险类别
类中心
风险特性
低风险
0.03
可以忽略的风险
较低风险
0.32
可以接受的风险
中风险
0.54
边缘风险
较高风险
:所反映研究对象特征的变量
:各变量的系数(判别系数)
Y :另一类观测量
四.问题分析
4.1 评价判定主要风险因子:
我们发现,风险因子可分为两类。
(一)自然因素:人口数、入境水量、水资源总量、地下水深埋、气候条件等:
(二)社会环境因素:污水排放总量、污水处理率、农业用水量、工业用水量、第三产业用水量、水利工程设施、水资源污染等。
五.模型的建立与检验
5.1 基于模糊概率的水资源短缺风险:
对于一个供水系统来说,水源短缺即供水量 大于需水量 ,从而使系统处于失事状态。基于水资源系统的模糊不确定性构造一个合适的隶属函数来描述供水紧缺带来的损失。定义模糊集 如下:
(2)
模糊集 上的隶属函数 构造为:
(3)
事件 发生的概率,模糊概率为:
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
北京市水资源短缺风险综合评价
一.摘要
本文以北京地区水资源短缺风险问题及北京市水资源短缺情况数据来进行综合评价,首先构造隶属函数 以评价水资源系统的模糊性,其次利用logistic回归模型模拟和预测水资源短缺风险发生的概率,而后建立了基于模糊概率的水资源短缺风险评价模型,最后利用判别分析识别出水资源短缺风险敏感因子并提出改进方案。
Risk= (1)
式中: 为第i个有害事件; 表示第i个事件发生的频率; 表示第i个有害事件发生的可能性为 的概率; 表示第i个事件的结果; 表示第i个事件结果为 的概率,风险模型采用了向量的表示形式。水资源短缺风险是指在特定的环境条件下,由于来水和用水存在模糊与随机不确定性,使区域水资源系统发生供水短缺的概率以及相应的缺水影响程度。基于上述理由我们设计了基于模糊概率的水资源短缺风险评价模型。
(12)
该判别法公式可以求出 与 的马氏距离。
综上所述,水资源短缺风险评价模型 的建模与计算步骤如下图所示。
图一
六.数据的收集
由于建模分析需要大量的数据,我们收集了近三十年来北京水资源的每年总用水量,每年农业、工业、第三产业用水量,每年平均降水量等数据,并作出了整理归纳,如附件所示。数据来源:北京统计信息网http://www.bjstats.gov.cn/lhzl/bj60n/201001/t20100119_164026.htm
0.73
比较严重的风险
高风险
0.84
无法承受的风险
图三北京市1979~2008年的水资源短缺风险分类结果
由图三所示,高风险、较高风险以及中风险基本都集中发生在降雨量少的年份,较低风险以及低风险都集中在降雨量大的年份。以1994年和1999年为例年,1999的降雨量是历年中最少的,风险值也是最大的,属于高风险年;1994年的降雨量是历年中最大的,风险值接近于0,属于低风险。进一步,从图三中的拟合线可以看出,水资源短缺险与降雨量是高度负相关的。
4.2 对北京水资源短缺风险的综合评价、等级划分及理由:
水资源系统是一个复杂的大系统,广泛存在着随机性和模糊性。由于随机性是因果律的破缺,模糊性是排中率的破缺,在水资源短缺风险评价模型的设计中应同时考虑这两种因素的影响。
为了更好地研究北京水资源短缺风险,我们借鉴Klplan提出的最具代表性的风险定义 :
180.631
1.268
1
0.26
由表1可知, 检验的显著性水平是 。检验通过,原假设成立,即建立的Logistic回归模型对数据拟合良好。
由表2可知,26个发生缺水的年份都被该模型正确估计出来,正确率为100%;只1有个未缺水的年份被估计为缺水,那么总的正确判断率为96.7%。由此可知,所建立的回归方程可以应用。
表一Hosmer-Losmer检验
步骤
卡方
自由度
显著性水平
1
5.859
8
0.653
表二最终观测量分类结果
观测
未缺水年份
缺水年份
正确率
未缺水年份
3
1
75%
缺水年份
0
26
100%
总的百分比
96.7%
表三最终模型统计表
系数
标准误差
自由度
显著性水平
缺水量x
0.308
0.159
3.733
1
0.053
常数
203.403
(4)
假设 ,则有:
(5)
所以,水资源短缺风险的定义可表示为:
(6)
上述风险定义将水资源短缺风险存在的模糊性和随机性联系在一起,其中随机不确定性 体现了水资源短缺风险发生的概率,而模糊不确定性则体现了水资源短缺风险的影响程度。依据概率密度函数 和隶属函数的 形式计算水资源短缺风险 。
5.2 水资源短缺风险的模拟概率分布:
根据表3中的系数,Logistic回归模型如下:
(13)
7.1.1 水资源短缺风险评价过程:
水资源短缺风险计算分析。根据式(3)、式(6)以及式(13)建立水资源短缺风险评价模型,得到北京市1979~2008年水资源短缺风险的计算结果如图3所示。其中缺水发生的概率,是由Logistic回归模型计算得到,水资源短缺风险值是由基于模糊概率的水资源短缺风险评价模型计算出来的。
我们采用Logistic回归模型模拟数量系列的概率分布,其模型表示为:
(其中, ) (7)
5.3 Logistic回归模型拟合度检验和系数检验:
建立Logistic回归模型后,常用 统计量进行模型的拟合度检验,其表达式为:
(8)
检验的原假设和备择假设为: 为方程对数据的拟合良好, 为方程对数据的拟合不好。
本文最大的亮点是采用采用Logistic回归模型来模拟缺水量系列的概率分布,logistic回归方法具有对因变量数据要求低、计算结果唯一、模型精度高等优点。
二.问题重述
近年来,我国水资源短缺问题日趋严重,尤其是北京水资源短缺已成为焦点话题。
北京是世界上水资源严重缺乏的大都市之一,其人均水资源占有量不足300m3,为全国人均的1/8,世界人均的1/30,属重度缺水地区,附表中所列的数据给出了1979年至2000年北京市水资源短缺的状况。北京市水资源短缺已经成为影响和制约其社会和经济发展的主要因素。政府采取了一系列措施, 如建设南水北调工程, 建立污水处理厂, 调整产业结构等。但是,气候变化和经济社会的不断发展,使水资源短缺风险始终存在。如何对水资源风险的主要因子进行识别,对风险造成的危害等级进行划分,对不同风险因子采取相应的有效措施规避风险或减轻其造成的危害,这对社会经济的稳定、可持续发展战略的实施具有重要的意义。
本题首先要求对北京市水资源短缺风险的主要风险因子进行评价判定,通过对水资源短缺风险因子的评价进而建立一个数学模型对北京市水资源短缺风险进行综合评价,并作出风险等级划分,陈述理由,作出调控方案来使风险降低。 并对其未来两年水资源的短缺风险进行预测,提出应对措施降低风险度。最后根据自己论文对水资源短缺的评价结果,以北京市水行政主管部门为报告对象,写一份建议报告。
:缺水系数中最小缺水量
:缺水系数中最小缺水量
p :为大于1的正整数
:为事件水资源风险的定义
:n维欧式空间
:模糊事件的隶属函数
P :概率测定
:随机变量y的概率密度函数
r :自变量的数量
:分别为自由变量的系数与常数
:实际观测量
:预测数量
B:极大似然估计分类变量系数的向量值
:变量系数渐进方差
y :判别分数
中国水资源网http://www.chinawater.net.cn/jiangwl/contents.html
百度文库www.baidu.com
七.结果分析
建立Logistic回归模型后,将1979~2008年的用水总量、可利用水资源总量等一系列数据代入模型,模拟缺水系列的概率分布。对构建的模型进行 检验,检验结果见表1,模型的预测效果见表2,模型中各变量的相关统计量见表3.
数模模拟赛论文
我们参赛选择的题号是(从A/B中选择一项填写):B
我们的参赛报名号为:B12
职务
姓名
学号
学院
专业和班级
队长
张林
10251003201
数学与计算科学学院
2010数学与应用数学2班
队员
陈强
10251003106
数学与计算科学学院
2010数学与应用数学1班
队员
庞阳华
10251003230
数学与计算科学学院
对于较大样本的系数检验,采用基于 分布的Wald统计量进行检验 ,当自由度为1时,Wald值为变量系数与其标准误差比值的平方,对于两类以上的分类变量来说,其式如下:
(9)
其检验的原假设和备择假设为: 为回归模型的系数等于0, 为回归模型的系数不等于O。
5.4 基于聚类分析 的水资源短缺风险分类 :
为了直观的说明水资源短缺风险程度,利用Quick Cluster过程(快速样本聚类)对风险进行聚类。对于等间隔测度的变量,一般用欧式距离计算。而对于计数变量,一般用测度来表征变量之间的不相似性。其表达式为:
由图二可以看出,1985、1987、1991和1996年四年均没有发生水资源短缺风险,且水资源短缺风险模拟值均为0,其中1985、1987、1996年风险发生的概率均不到70%,这和实际情形是吻合的,以1991年为例,该年风险发生的计算概率为70%,这一年的实际情况是水资源总量仅为42.29亿 ,但实际总用水量已达到42.03亿 ,已处于风险的边缘状态。虽然1982、1984、1994、1998年等缺水计算概率较高,但由于其缺水影响程度较小,所以由模糊概率计算相应的水资源短缺风险综合评价较小。图3的进一步分析可知,只要真实风险存在(缺水发生),描述风险发生的概率吵过了70%,以1999年为例说明,1999年是枯水年,水资源短缺风险模拟计算值最大,描述风险发生的概率接近100%。以上分析说明模型的计算结果与实际情形是吻合的。
7.1.3 水资源短缺影响因子分析:
根据中提出的水资源短缺风险影响因子,利用Mahalanobis距离法筛选出水资源短缺风险敏感因子,见表5。从表5中第3栏可以看出,水资源总量、污水排放总量、农业用水量、生活用水量在步骤1至步骤4中移出模型的概率均小于0.1,同时在每步中这个变量均使得最近的两类间的Mahalanobis距离最大,因此,这4个变量是影响北京地区水资源短缺风险的敏感因子。
(10)
5.5 判别分析:
判别分析可用于识别影响水资源短缺风险的敏感因子,能够从诸多表明观测对象特征的自变量中筛选出提供较多信息的变量,且使这些变量之间的相关程度较低 ,线性判别函数的一般形式为:
(11)
常用的判别分析方法是距离判别法(马氏距离法),即每步都使得相距最近的两类间的马氏距离最大的变量进入判别函数,其计算公式为:
2010数学与应用数学2班
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
Байду номын сангаас表5敏感因子筛选
步骤
容许度
移出概率
最小Mahalanobis距离的平方
组间
1
污水排放总量
1
0.089
2
污水排放总量
0.681
0.020
0.186
2,5
水资源总量
0.681
0
0.237
1,4
3
污水排放总量
0.392
0.028
0.847
1,5
⑤ 即便现在北京加大力度南水北调工程,但不不能真正意义上解释北京的水资源紧张局面。水资源系统是一个复杂的大系统,广泛存在着随机性和模糊性。由于随机性是因果律的破缺,模糊性是排中率的破缺,在水资源短缺风险评价模型的设计中同时考虑这两种因素的影响。
3.2 主要符号说明:
:供水量
:需水量
x :缺水量
:模糊集
三.条件假设及符号说明
3.1条件假设:
京水资源短缺风险存在可以和模糊性与随机性联系在一起,构建隶属函数来描述。
② 北京近30年(1979-2008)来,每年的总用水量和可用的水资源总量符合Logistic的拟合规律。
③ 北京水资源短缺风险存在与年平均降水量成正相关。
④ 再生水利用(南水北调)可在一定程度上缓解北京水资源短缺的紧张局面。
7.1.2 水资源短缺风险分类:
利用Quick Cluster对1979-2008年北京市的水资源短缺风险进行聚类,各类风险最终的类中心和特征如表四所示。
表4水资源短缺风险类别与特性
水资源短缺风险类别
类中心
风险特性
低风险
0.03
可以忽略的风险
较低风险
0.32
可以接受的风险
中风险
0.54
边缘风险
较高风险
:所反映研究对象特征的变量
:各变量的系数(判别系数)
Y :另一类观测量
四.问题分析
4.1 评价判定主要风险因子:
我们发现,风险因子可分为两类。
(一)自然因素:人口数、入境水量、水资源总量、地下水深埋、气候条件等:
(二)社会环境因素:污水排放总量、污水处理率、农业用水量、工业用水量、第三产业用水量、水利工程设施、水资源污染等。
五.模型的建立与检验
5.1 基于模糊概率的水资源短缺风险:
对于一个供水系统来说,水源短缺即供水量 大于需水量 ,从而使系统处于失事状态。基于水资源系统的模糊不确定性构造一个合适的隶属函数来描述供水紧缺带来的损失。定义模糊集 如下:
(2)
模糊集 上的隶属函数 构造为:
(3)
事件 发生的概率,模糊概率为:
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
北京市水资源短缺风险综合评价
一.摘要
本文以北京地区水资源短缺风险问题及北京市水资源短缺情况数据来进行综合评价,首先构造隶属函数 以评价水资源系统的模糊性,其次利用logistic回归模型模拟和预测水资源短缺风险发生的概率,而后建立了基于模糊概率的水资源短缺风险评价模型,最后利用判别分析识别出水资源短缺风险敏感因子并提出改进方案。
Risk= (1)
式中: 为第i个有害事件; 表示第i个事件发生的频率; 表示第i个有害事件发生的可能性为 的概率; 表示第i个事件的结果; 表示第i个事件结果为 的概率,风险模型采用了向量的表示形式。水资源短缺风险是指在特定的环境条件下,由于来水和用水存在模糊与随机不确定性,使区域水资源系统发生供水短缺的概率以及相应的缺水影响程度。基于上述理由我们设计了基于模糊概率的水资源短缺风险评价模型。
(12)
该判别法公式可以求出 与 的马氏距离。
综上所述,水资源短缺风险评价模型 的建模与计算步骤如下图所示。
图一
六.数据的收集
由于建模分析需要大量的数据,我们收集了近三十年来北京水资源的每年总用水量,每年农业、工业、第三产业用水量,每年平均降水量等数据,并作出了整理归纳,如附件所示。数据来源:北京统计信息网http://www.bjstats.gov.cn/lhzl/bj60n/201001/t20100119_164026.htm
0.73
比较严重的风险
高风险
0.84
无法承受的风险
图三北京市1979~2008年的水资源短缺风险分类结果
由图三所示,高风险、较高风险以及中风险基本都集中发生在降雨量少的年份,较低风险以及低风险都集中在降雨量大的年份。以1994年和1999年为例年,1999的降雨量是历年中最少的,风险值也是最大的,属于高风险年;1994年的降雨量是历年中最大的,风险值接近于0,属于低风险。进一步,从图三中的拟合线可以看出,水资源短缺险与降雨量是高度负相关的。
4.2 对北京水资源短缺风险的综合评价、等级划分及理由:
水资源系统是一个复杂的大系统,广泛存在着随机性和模糊性。由于随机性是因果律的破缺,模糊性是排中率的破缺,在水资源短缺风险评价模型的设计中应同时考虑这两种因素的影响。
为了更好地研究北京水资源短缺风险,我们借鉴Klplan提出的最具代表性的风险定义 :
180.631
1.268
1
0.26
由表1可知, 检验的显著性水平是 。检验通过,原假设成立,即建立的Logistic回归模型对数据拟合良好。
由表2可知,26个发生缺水的年份都被该模型正确估计出来,正确率为100%;只1有个未缺水的年份被估计为缺水,那么总的正确判断率为96.7%。由此可知,所建立的回归方程可以应用。
表一Hosmer-Losmer检验
步骤
卡方
自由度
显著性水平
1
5.859
8
0.653
表二最终观测量分类结果
观测
未缺水年份
缺水年份
正确率
未缺水年份
3
1
75%
缺水年份
0
26
100%
总的百分比
96.7%
表三最终模型统计表
系数
标准误差
自由度
显著性水平
缺水量x
0.308
0.159
3.733
1
0.053
常数
203.403
(4)
假设 ,则有:
(5)
所以,水资源短缺风险的定义可表示为:
(6)
上述风险定义将水资源短缺风险存在的模糊性和随机性联系在一起,其中随机不确定性 体现了水资源短缺风险发生的概率,而模糊不确定性则体现了水资源短缺风险的影响程度。依据概率密度函数 和隶属函数的 形式计算水资源短缺风险 。
5.2 水资源短缺风险的模拟概率分布:
根据表3中的系数,Logistic回归模型如下:
(13)
7.1.1 水资源短缺风险评价过程:
水资源短缺风险计算分析。根据式(3)、式(6)以及式(13)建立水资源短缺风险评价模型,得到北京市1979~2008年水资源短缺风险的计算结果如图3所示。其中缺水发生的概率,是由Logistic回归模型计算得到,水资源短缺风险值是由基于模糊概率的水资源短缺风险评价模型计算出来的。
我们采用Logistic回归模型模拟数量系列的概率分布,其模型表示为:
(其中, ) (7)
5.3 Logistic回归模型拟合度检验和系数检验:
建立Logistic回归模型后,常用 统计量进行模型的拟合度检验,其表达式为:
(8)
检验的原假设和备择假设为: 为方程对数据的拟合良好, 为方程对数据的拟合不好。
本文最大的亮点是采用采用Logistic回归模型来模拟缺水量系列的概率分布,logistic回归方法具有对因变量数据要求低、计算结果唯一、模型精度高等优点。
二.问题重述
近年来,我国水资源短缺问题日趋严重,尤其是北京水资源短缺已成为焦点话题。
北京是世界上水资源严重缺乏的大都市之一,其人均水资源占有量不足300m3,为全国人均的1/8,世界人均的1/30,属重度缺水地区,附表中所列的数据给出了1979年至2000年北京市水资源短缺的状况。北京市水资源短缺已经成为影响和制约其社会和经济发展的主要因素。政府采取了一系列措施, 如建设南水北调工程, 建立污水处理厂, 调整产业结构等。但是,气候变化和经济社会的不断发展,使水资源短缺风险始终存在。如何对水资源风险的主要因子进行识别,对风险造成的危害等级进行划分,对不同风险因子采取相应的有效措施规避风险或减轻其造成的危害,这对社会经济的稳定、可持续发展战略的实施具有重要的意义。
本题首先要求对北京市水资源短缺风险的主要风险因子进行评价判定,通过对水资源短缺风险因子的评价进而建立一个数学模型对北京市水资源短缺风险进行综合评价,并作出风险等级划分,陈述理由,作出调控方案来使风险降低。 并对其未来两年水资源的短缺风险进行预测,提出应对措施降低风险度。最后根据自己论文对水资源短缺的评价结果,以北京市水行政主管部门为报告对象,写一份建议报告。
:缺水系数中最小缺水量
:缺水系数中最小缺水量
p :为大于1的正整数
:为事件水资源风险的定义
:n维欧式空间
:模糊事件的隶属函数
P :概率测定
:随机变量y的概率密度函数
r :自变量的数量
:分别为自由变量的系数与常数
:实际观测量
:预测数量
B:极大似然估计分类变量系数的向量值
:变量系数渐进方差
y :判别分数
中国水资源网http://www.chinawater.net.cn/jiangwl/contents.html
百度文库www.baidu.com
七.结果分析
建立Logistic回归模型后,将1979~2008年的用水总量、可利用水资源总量等一系列数据代入模型,模拟缺水系列的概率分布。对构建的模型进行 检验,检验结果见表1,模型的预测效果见表2,模型中各变量的相关统计量见表3.
数模模拟赛论文
我们参赛选择的题号是(从A/B中选择一项填写):B
我们的参赛报名号为:B12
职务
姓名
学号
学院
专业和班级
队长
张林
10251003201
数学与计算科学学院
2010数学与应用数学2班
队员
陈强
10251003106
数学与计算科学学院
2010数学与应用数学1班
队员
庞阳华
10251003230
数学与计算科学学院
对于较大样本的系数检验,采用基于 分布的Wald统计量进行检验 ,当自由度为1时,Wald值为变量系数与其标准误差比值的平方,对于两类以上的分类变量来说,其式如下:
(9)
其检验的原假设和备择假设为: 为回归模型的系数等于0, 为回归模型的系数不等于O。
5.4 基于聚类分析 的水资源短缺风险分类 :
为了直观的说明水资源短缺风险程度,利用Quick Cluster过程(快速样本聚类)对风险进行聚类。对于等间隔测度的变量,一般用欧式距离计算。而对于计数变量,一般用测度来表征变量之间的不相似性。其表达式为: