基于回归分析预测法的年径流预测分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
S 所以b
xi x yi y xy
(7.4.8)
2
xi x
S xx
利用x xi 、y yi ,
n
n
可将a、b表达为
b xi yi x yi xi2 x xi
(7.4.4)
a y bx
(7.4.5)
Sxx 称之为 xi 的方差和(离差平方和)
Sxy 称之为 xi 与 yi 的协方差和(离差积之和)
4.回归预测的模型评价
上述年径流回归预测模型虽经计算可用,但按选择基于最小二乘估计法的线性回 归模型时对自变量有着基本要求:在模型中应包含所有对因变量有重要解释意义 的因素,并且在用于反映这些因素的自变量之间不存在多重相关性。若不满足要 求,存在的危害有:(1)在自变量完全相关的情况下,最小二乘的回归系数无 法估计 ;(2)如果自变量之间存在着不完全的共线现象,则回归系数是可以估 计的,但是,回归系数的估计方差会随着自变量之间的相关程度的不断增强而迅 速扩大 ;(3)在高度相关条件下,回归系数的估计值对样本数据的微小变化将变 得非常敏感,回归系数估计值的稳定性将变得很差 ;(4)当存在严重的多重相关 性的影响时,会给回归系数的统计检验造成一定的困难 ;(5)在自变量高度相关 条件下,对用最小二乘法得到的回归模型,其回归系数物理含义的解释将变得十 分困难,甚至还会出现回归系数的符号与实际概念完全相反的现象;(6)因为回 归模型的建立是基于样本的,多重相关性也是指抽样的数据。如果把所建立的回 归模型用于预测,而多重相关性问题在预测期间仍然存在,则共线性问题对预测 结果并不会产生特别严重的影响。但是,如果样本数据中存在的多重相关问题在 预测期间发生了变化,或者在预测期间共线性的问题不再存在,那么,所得的预 测结果就完全不确定了。
na yi b xi
所以a yi b xi y bx
(7.4.7)
n
将式(7.4.7)代入
Q b
b
yiabxi
2
得
Q
b
b
yi y
b
xi x
2
2
y y i
b
xi x
b
b
xi x
2
y y i
b
x
i
x
x
i
x
2
令其 0,即 xi x yi y b xi x 0
1.2 回归分析的主要内容:
从数据出发,确定因变量和自变量之间的关系;对关系式中的参数进行估计, 并进行统计检验;筛选自变量,即从大量自变量中找出影响显著的,剔除不显著 的;用求得的回归模型进行预测;对预测结果进行分析、评价。
1.3 回归分析模型及求解
1.3.1 一元线性回归预测
一元线性回归预测是处理因变量 y 与自变量 x 之间线性关系的回归预测法,其 数学模型为:
年份 年雨量 X 年径流 Y XY
X^2
Y^2
Y0
Y-Y0
(Y-Y0)^2
1954 2014
1362
2743068 4056196 1855044 1524.2492 -162.2492 26324.8029
1955 1211
728
881608 1466521 529984 682.8658 45.1342 2037.09601
1956 1728
1369
2365632 2985984 1874161 1224.5784 144.4216 20857.5985
1957 1157
695
804115 1338649 483025 626.2846 68.7154 54721.80619
1958 1257
720
905040 1580049 518400 731.0646 -11.0646 7122.425373
1.回归分析预测法
1.1 回归预测的简介
回归预测法,是研究变量与变量之间相互关系的一种数理统计方法。应用回归 分析从一个或几个自变量的值去预测因变量的值。回归预测中的因变量和自变量 在时间上的并进关系,即因变量的预测值要由并进的自变量的值旁推。这类方法 不仅考虑了时间因素,而且考虑了变量之间的因果关系。具体方法有一元线性回 归预测法、多元线性回归预测法、非线性回归预测法等。
y a bx
(7.4.1) y
Y=a+bx
其中 a、b 称为回归系数.
a
x0 x
首先根据 x、y 的现有统计数据,在直角坐标系中作散点图,观察 y 随 x 而变是 否为近似的线性关系。若是,则求出式(7.4.1)中的 a、b 值,就可确定其数学 模型,然后由 x 的未来变化去求相应的 y 值。
a、b 的确定方法
S xx xi x 2
xi2 x 2 2xix
xi2 nx 2 2x xi
xi2 同样,S yy
x xi yi2
( y
x2 yi
x
xi) n
S xy xi yi x yi
3.回归效果检验 y=a+bx 一定程度上反映了 y 与 x 之间的统计线性相关关系,该关系是否密切, 决定了所采用线性预测模型多大程度上可信。这可以通过 y 与 x 的相关系数 rxy 的大小来确定。 rxy 的取值:
3.一元线性回归预测方法在径流预测方面的作用
下面以实例来说明如何通过回归分析预测法进行年径流预测。 下表给出了 1954-1965 年径流与年降雨水文资料,现以表中资料建立回归预测 模型进行分析计算
(1)解联立方程组 b=1.047783 a=-586.016 (2)直接用最小二乘法 Sxx=934948.9 Syy=1136317 Sxy=979623.3 Rxy=0.95042
使用回归分析预测法对年径流进行预测分析相对经典成熟,容易理解且运用广 泛,但仍存在着些许不足,通过实例我们发现正确应用回归分析预测时应注意: ①用定性分析判断现象之间的依存关系;②避免回归预测的任意外推;③应用合 适的数据资料。为了得到如意的预测结果,要求在预测工作中不能机械,要会灵 活使用,要注意了解会影响预测结果的偶然情况,以便对预测结果进行适当修正, 这样才能使预测结果更接近实际,也才能使预测能更好地为经济建设服务。近些 年的“年径流预测的最小二乘支持向量机-马尔可夫链组合模型”、“基于近邻 估计的年径流预测动态联系数回归模型”等都是在回归分析预测的基础上对年径 流进行预测,人类对通过回归分析预测法对年径流预测分析掌握的越来越熟练, 深入分析并具有创新精神,努力实现从传统水利向现代水利、可持续发展水利的 转变。
1959 1029
534
549486 1058841 285156 492.1662 41.8338 21750.06682
1960 1306
778Βιβλιοθήκη 1016068 1705636 605284 782.4068 -4.4068 219.4198862
1961 1029
337
346773 1058841 113569 492.1662 -155.1662 424076.5496
5.结论及建议
水资源规划是全面落实国家或地区实施可持续发展战略的要求,适应经济社会 发展和水资源的时空动态变化,着力缓解水资源短缺、水环境恶化等水问题的一 项重要工作。它是根据国家或地区的社会、经济、资源和环境总体发展规划,以 区域水文特征及水资源状况为基础来进行的。
水资源规划目的是根据经济社会可持续发展和环境保护对水资源的要求,提出 水资源合理开发、优化配置、高效利用、有效保护和综合治理的总体布局及实施 方案,促进我国人口、资源、环境和经济的协调发展,以水资源的可持续利用支 持经济社会的可持续发展。
基于回归分析预测法的年径流预测分析
李璐瑶
(安徽合肥工业大学土木与水利学院 13 级水利水电一班,学号 2013217699)
摘要:水是人类生活以及生产劳动必不可少的重要物质,也是整个生态系统的
重要组成要素。水资源系统工程是对水资源复杂系统进行科学规划、最优设计和 优化运行管理的一门新兴交叉综合性工程技术学科。为了实现水资源的可持续利 用,促进人口、资源、环境和经济的协调持续发展,需要对水资源进行合理有效规 划以及研究水资源规划方法。目前水资源系统分析方法有很多,比如模型化方法、 预测方法、优化方法等,而回归分析预测法是预测方法中最基本的方法,同时也是 统计学中应用最为广泛的一个分支,线性回归预测方法建模相对简单,在年径流 预测分析中也得到了广泛应用。本论文旨在初步了解回归预测法及其如何在年径 流预测中发挥作用并且探讨其局限性和不足。
y i
a
bxi
2
总方差Q ei2 yiabxi
(7.4.6)
根据极值原理,式(7.4.6)对 a、b 分别求偏导,并令其=0,得
Q
a
a
y i a bxi
2
2
y
i
a
b
x
i
a
a
2 y i a b xi
令 Q 0,即 a
yi
a bxi
0
yi na b xi 0
| rxy|=1,样本点完全落在回归线上,y 与 x 有完全的线性关系; 0<rxy<1,y 与 x 有一定的正线性相关关系,即 y 随着 x 的增加而成比例倍数 增加; -1<rxy<0, y 与 x 有一定的负线性相关关系,即 y 随着 x 的增加而成比例倍 数减少; rxy=0,y 与 x 之间不存在线性相关关系。 取一定显著水平,查相关系数表,若|rxy|>表中相应数字 r 临界值,表示 x、 y 间存在线性相关,预测模型可用。 r 临界值是对不同的样本容量 n,在两种置信度 95%、99%下的相关系数的临 界值,即 r 临界值与样本容量 n、以及所要求的置信度 1- (给定的显著水平 ) 有关。
(1)解联立方程组
yi na b xi xi yi a xi b xi2
求解得到:
b
n xi yi
n
x
2 i
xi yi
2
xi
a yi b xi
n
(7.4.2) (7.4.3)
直接用最小二乘法
使拟合的数值与实际值的总方差为最小,即拟合程度最好,则得两者之差 ei
ei
y i
yˆ i
关键词:年径流预测 回归分析 水资源系统
年径流是一个设计到水文,气象及下垫面等诸多因素的复杂过程,它因为确定 性因素的作用变化十分复杂,对未来的描述也很困难。因此准确可靠的年径流预 测对合理开发和优化利用水资源、进行区域水资源安全管理,以及更好的制定区 域社会经济规划具有十分重要的指导意义。提高年径流预测精度,一直是国内外 水文工作者研究的热点和难点。其中,年径流预测方法中使用最广泛的是统计预 测法,常用的预测统计模型为回归模型,其因可操作性强而被广为采用。但由于 年径流过程的自相依性不强,年径流及其影响因子之间存在不确定的非线性关 系,只用单一的统计回归模型往往得不到令人满意的结果。
1962 1316
809
1064644 1731856 654481 792.8848 16.1152 259.699671
1963 1356
929
1259724 1838736 863041 834.7968 94.2032 8874.24289
1964 1266
796
1007736 1602756 633616 740.4948 55.5052 3080.82722
1.3.2 多元线性回归方法 多元线性回归是简单线性回归的推广,研究的是一个变量与多个变量之间的依
赖关系。 多元回归分析预测法,是指通过对两个或两个以上的自变量与一个因变 量的相关分析,从而建立预测模型进行预测的方法。 当自变量与因变量之间存在 线性关系时,称为多元线性回归分析。
2.年径流预测分析
在大量的社会、经济和工程问题中,对于因变量 y(如,当前径流)的全面解 释往往需要多个自变量(如,前期径流和降水)的共同作用。回归分析法是研究 变量和变量之间依存关系的一种数学方法。水资源系统中径流要素受流域自然地 理、气候及人类活动等诸多因素影响,其变化特性和规律十分复杂。表现出随机 性、灰色性、非线性等复杂特征。径流预测,特别是中长期预测,是非常困难的, 一直是国内外研究的热点和难点。由于资料缺乏,在年径流预测时通常选取前面 相邻年份的径流量作为影响因子,故影响因子之间必然存在一定的相关性。
3
33
7
67
0<rxy<1,年径流 y 与年雨量 x 有良好的的正线性相关关系,即年径流 y 随着年 雨量 x 的增加而成比例倍数增加 降雨量和径流量的回归关系:
Y=1.0478X-586.02
(3)当样本容量为 12,置信度为 95%时,查相关系数临界值表得, r 临界值=0.5760
|rxy|>r 临界值,故年雨量 x、年径流 y 间存在线性相关,预测模型可用,其余检 验均略去。 当预测降雨量为 1000mm 时,径流量预测值的点估计: 径流量 Y=1.0478*1000-586.02=461.78mm
1965 1052
383
402916 1106704 146689 516.2656 -133.2656 717759.7201
求和 15721
9440
13346810 21530769 8562450
4109884.255
平均值 1310.0833 786.666666 1112234.1 1794230.75 713537.5