工程水文学第四章 水文统计基本方法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
⒍水文样本系列: 统计参数是பைடு நூலகம்本统计参数。
⒈均值( x
):
反应系列 总水平
定义模比系数: 则:
Ki
xi x
11 ni n1K i K 1K 2n K n
⒉ 均方差σ、变差系数Cv:
反映系列中各变量值集中或离散的程度
n
(xi x)2
i1
n
Cv
n
(Ki 1)2
i 1
n
例4-2: 5, 10, 15 x=10 σ=4.08 995,1000,1005 x=1000 σ=4.08
当m=n时,p=100%,即样本的末项 xn是总体 中的最小值,显然不符合实际,因为随着观测年 数的增多,总会出现更小的数值。对上式进行修 正,有:
数学期望公式:
在频率格纸上以系列各项的频率为横坐标、各 项的值为纵坐标点图,再通过点群中心目估绘光滑 曲线即经验频率曲线。
例4-4:已知某水利枢纽,年最大洪峰流量系列, 绘制经验频率曲线。
Kp
1.33
1.2
0.98
0.82
0.7
0.63
0.52
Xp
864.5 780
637
533
455
409.5
338
理论频率曲线
三、频率与重现期的关系 水文上常用“重现期”来代替“频率” 1. 当研究暴雨或洪水时(一般P≤50%)
T1 P
2. 当研究枯水或年径流时(一般 P≥50%)
例如:
T 1 1 P
0.5
0
0
1
0
225
-3375 0.925 -0.075
1225
-42875 0.825 -0.175
2500 -125000 0.75 -0.25
2790
165750
52.8
0.264102 1.12
(Ki-1)3 0.125
0 -0.00042187 -0.00535938 -0.015625 0.10359375
(Ki-1)2 (7) 1.4562 0.8424 0.2426 0.1570 0.0556 0.0483 0.0004 0.0001 0.0008 0.0014 0.0073 0.0157 0.0248 0.0248 0.0456 0.0849 0.1317 0.1340 0.1510 0.3751 0.4524 4.252
0.5
5
7
10
16 8 11 16 25 41 58 82 130
0.7
7 10 14
22 9 12 17 27 40 56 80 126
1
10 14 20
32 10 14 20 32 42 60 85 134
第六节 水文频率计算—适线法(配线法)
适线法: 是以经验频率点据为基础,在一定的适线准则下, 求解与经验点据拟合最优的频率曲线参数,得到一条 理论频率曲线。
绘出理论频率曲线。
xpx(1Cvp)Kpx
理论频率曲线的绘制: 已知统计参数 Cs、CV、x ,求不同频率 P 对应的值:
xpx(1Cvp)Kpx
然后在频率格纸上绘曲线,横坐标为频率,纵坐 标为水文特征值。
例4-5:某站年径流系列符合P-Ⅲ型分布,已知该系列的,
x650mm, CV=0.25 ,CS=2Cv,试绘理论频率曲线。
即求出的 x p 应满足 :
x p 取决于P、、、a0 四个参数。
令: x x ,Φ是均值为零,标准差为1的 xC v 标准化变量(离均系数)
则有: xx(1Cv)
该式包含CS、P与 Φp的关系,根据拟定CS值,可
得值不,同通过P 下的式Φ即p 值可,求附出表与。各然种后P利相用应已的知的值x p,从和x而CV可
x
1 n
xi
Cv
n
(Ki 1)2
i 1
n
n
( K i 1)3
Cs
i 1
n
C
3 v
样本 1 2 3 4 5
均值 均方差 变差系数 偏态系数
系列 300 200 185 165 150 200
样本系列统计参数计算(P.40)
(xi-x)2 (xi-x)3
Ki
Ki-1
10000 1000000 1.5
目估适线法、优化适线法。
一、目估适线法
(1)将实测资料由大到小排列,计算各项的经验频 率,在频率格纸上点绘经验点据。
(2)选定水文频率分布线型(一般选用P-Ⅲ型)。 (3)初估一组参数 x 、CV、CS。
为了使初估值大致接近实际,可用矩法或其它方 法求出3个参数,作为3个参数第一次的假定值。
当用矩法估计时,因CS的抽样误差太大,一般不 计算CS,而是根据经验假定CS为CV的某一倍数(如 CS =2 CV )。
a0
x (1
2C v ) Cs
理论频率曲线绘制: P xp
水文计算:
一般需求出指定频率P所对应的随机变量取值, 即 P xp 。例如:频率为1%(百年一遇)的设计 洪峰流量 xp1% ? 。这就需要对密度曲线进行积 分,求出等于及大于 x p 的累积频率 P值。
F(xP)P(X xP)
f (x)dx xP
第四章 水文统计基本方法
⒈概率的基本概念 ⒉ 随机变量及其概率分布 ⒊水文频率曲线线型 ⒋P—Ⅲ型分布参数估计 ⒌水文频率计算—适线法 ⒍相关分析
第一节 概述 一、水文现象的随机性: 二、概率论和数理统计学在水文分析中的应用: 三、水文统计解决的问题:
给定样本,求指定频率的设计值 例:求指定频率的设计洪水。 方法:确定频率曲线。
年份 (1) 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970
年最大洪峰流量 (2) 720 1080 1030 1250 1440 1420 1120 2060 1370 2650
序号 (3)
1 2 3 4 5 6 7 8 9 10
由大到小排列 (4) 2650 2060 1440 1420 1370 1250 1120 1080 1030 720
Cs
6 n
(1
3 2
C s2
5 16
C s4 )
CV=2CS时样本参数的均方误(相当误差,%)
cv 参数 100
均值 50 25
变差系数
偏态系数
10 100 50 25 10 100 50 25 10
0.1
11
2
3
7 10 14 22 126 178 252 399
0.3
34
6
9
7 10 15 23 51 72 102 162
年份
(1) 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 总计 均值 变差系数
例4-6:某枢纽处最大洪峰流量频率计算
洪峰流量
(2) 1540 980 1090 1050 1860 1140 790 2750 762 2390 1210 1270 1200 1740 883 1260 408 1050 1520 483 794 26170 1246 0.46
当某一洪水的频率为P=1%时,则T=100年,称此洪
水为百年一遇洪水,表示大于等于这样的洪水平均100
年会遇到一次。
对于p=80%的枯水流量,则 T=5 年,称作以五年一
遇枯水流量作为设计来水的标准。表示小于等于这样
的流量平均5年会遇到一次。说明具有80%的可靠程度。
第五节 P—Ⅲ型分布参数估计
用有限的样本观测资料估计总体分布线型中的参 数,如P—Ⅲ型的 x 、CV、CS 。
xixix总(i1 ,2,,k)
样本均值是随机变量,抽样误差也为随机变量。抽 样误差近似服从正态分布。
可以证明,xi(i1,2,,k) 系列的均方差 x
可作为度量抽样误差的指标,称为均方误。
各参数的均方误(抽样误差):
x
n
2n
1
3 4
C s2
Cv
Cv 2n
1
2C v2
3 4
C s2
2C vC s
解:当CS=2Cv 时,查附表得不同频率下的Kp,代入下式:
xpx(1Cvp)Kpx
P
0.01
0.1
0.2
0.33
0.5
1
2
Kp
2.22
1.96
1.87
1.81
1.77
1.67
1.58
Xp
1443 1274 1215.5 1176.5 1150.5 1085.5 1027
P
10
20
50
75
90
95
99
第二节 概率的基本概念 一、事件 指在一定条件组合下,随机试验的结果。 分为:必然事件、不可能事件、随机事件。 水文测验可看作随机试验。
二、概率 反映随机事件出现的可能性大小的数量标准:
三、频率
P( A) k n
对于水文现象,用频率作为概率的近似值:
w( A) m n
第三节 随机变量及其概率分布
模比系数(Ki)
(5) 2.207 1.918 1.493 1.396 1.236 1.220 1.019 1.011 0.971 0.963 0.915 0.875 0.843 0.843 0.786 0.709 0.637 0.634 0.611 0.388 0.327 21.00
Ki-1 (6) 1.207 0.918 0.493 0.396 0.236 0.220 0.019 0.011 -0.029 -0.037 -0.085 -0.125 -0.157 -0.157 -0.214 -0.291 -0.363 -0.366 -0.389 -0.612 -0.673 0.000
Cv=0.48 Cv=0.0048
⒊偏态系数(Cs): 反映系列在均值两边对称程度
n
( K i 1)3
Cs
i 1
n
C
3 v
正态曲线或正态分布: 密度函数:
密度曲线:
例4-3:计算系列的统计参数均值、变差系数、偏态 系数。
样本 1 2 3 4 5
系列 300 200 185 165 150
二、统计参数对频率曲线的影响:
(1)均值 x 对 频率曲线的影响
1.均值大的 位于小的之上。
2.均值大的较 小的陡。
(2)CV对频率曲线的影响
1.随着CV的 增大,频率曲线 越来越陡。
(3)CS对频率曲线的影响
1. CS越大, 均值(K=1)对应 的频率越小, 频率曲线中部 越向左偏,且 上段 越陡,下 段越平缓。
一、随机变量 随试验结果而发生变化的变量,用 X 表示,取
值用 x i 表示 。
例:水文特征值:年径流、洪峰流量。
离散型随机变量: 连续型随机变量:水文特征值属连续型随机变 量。
二、随机变量的概率分布 随机变量的取值与其概率的对应关系,称为随 机变量的概率分布。 对于水文变量;常研究大于等于某一取值 x 的概 率 F (x) ,即:
序号
(3) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
某枢纽处年最大洪峰流量计算表
排序
(4) 2750 2390 1860 1740 1540 1520 1270 1260 1210 1200 1140 1090 1050 1050 980 883 794 790 762 483 408 26170
一、矩法 用样本矩估计总体矩,并通过矩与参数之间的关 系,来估计频率曲线的参数。
⒈ 均值x 无偏估计:
⒉ CV的无偏估计量:
n
(Ki 1)2
Cv
i 1
n 1
⒊ CS 的无偏估计量:
n
( K i 1)3
Cs
i 1
(n
3)C
3 v
二、权函数法
马秀峰(1984)提出。
三、抽样误差 由随机抽样引起的误差,称为抽样误差。 以均值为例;抽样误差定义为:
F (x) 水文上通常称随机变量的累积频率曲线, 简称频率曲线。
三、概率分布函数与概率密度函数的关系 概率分布函数导数负值,称为概率密度函数。
F (x)
F(x)P(Xx)xf(x)d x
四、随机变量的统计参数
⒈总体统计参数、样本统计参数 ⒉均值、均方差、变差系数、偏态系数
⒊总体:随机变量所有取值的全体。 ⒋样本:从总体中抽取的一部分。 ⒌样本容量:样本包括的项数,样本大小。
经验频率 (5) 9.1 18.2 27.3 36.4 45.5 54.5 63.6 72.7 81.8 90.9
某枢纽年最大洪峰流量经验频率曲线
二、理论频率曲线: 1、皮尔逊Ⅲ型分布曲线( P-Ⅲ)
一端有限,一端无限 的不对称单峰曲线
形状、尺度和 位置参数
可以推证:
4
C
2 S
2 xC vC s
(4)根据假定的 x 、 CV 、 CS ,查附表 ,计算xP 值,以x P为纵坐标,p为横坐标,即可得到频率曲线。
将此线画在绘有经验点据的图上,看与经验点据 配合的情况,若不理想,则修改参数再次进行计算。
(5)最后根据频率曲线与经验点据的配合情况, 从中选择一条与经验点据配合较好的曲线作为采用曲 线。相应于该曲线的参数便看作是总体参数的估值。
1.12
第四节 水文频率曲线线型
一、经验频率曲线 由实测资料(样本)绘制的频率曲线。
⒈绘制 设某水文要素(如年径流量)的实测系列共 n 项, 按由大到小的次序排列为x1、x2、...、x m、...、x n。第m 项的经验频率就是在系列中大于及等于样本 x m 的项数 出现次数(m次)与样本容量(n)之比值,即
⒈均值( x
):
反应系列 总水平
定义模比系数: 则:
Ki
xi x
11 ni n1K i K 1K 2n K n
⒉ 均方差σ、变差系数Cv:
反映系列中各变量值集中或离散的程度
n
(xi x)2
i1
n
Cv
n
(Ki 1)2
i 1
n
例4-2: 5, 10, 15 x=10 σ=4.08 995,1000,1005 x=1000 σ=4.08
当m=n时,p=100%,即样本的末项 xn是总体 中的最小值,显然不符合实际,因为随着观测年 数的增多,总会出现更小的数值。对上式进行修 正,有:
数学期望公式:
在频率格纸上以系列各项的频率为横坐标、各 项的值为纵坐标点图,再通过点群中心目估绘光滑 曲线即经验频率曲线。
例4-4:已知某水利枢纽,年最大洪峰流量系列, 绘制经验频率曲线。
Kp
1.33
1.2
0.98
0.82
0.7
0.63
0.52
Xp
864.5 780
637
533
455
409.5
338
理论频率曲线
三、频率与重现期的关系 水文上常用“重现期”来代替“频率” 1. 当研究暴雨或洪水时(一般P≤50%)
T1 P
2. 当研究枯水或年径流时(一般 P≥50%)
例如:
T 1 1 P
0.5
0
0
1
0
225
-3375 0.925 -0.075
1225
-42875 0.825 -0.175
2500 -125000 0.75 -0.25
2790
165750
52.8
0.264102 1.12
(Ki-1)3 0.125
0 -0.00042187 -0.00535938 -0.015625 0.10359375
(Ki-1)2 (7) 1.4562 0.8424 0.2426 0.1570 0.0556 0.0483 0.0004 0.0001 0.0008 0.0014 0.0073 0.0157 0.0248 0.0248 0.0456 0.0849 0.1317 0.1340 0.1510 0.3751 0.4524 4.252
0.5
5
7
10
16 8 11 16 25 41 58 82 130
0.7
7 10 14
22 9 12 17 27 40 56 80 126
1
10 14 20
32 10 14 20 32 42 60 85 134
第六节 水文频率计算—适线法(配线法)
适线法: 是以经验频率点据为基础,在一定的适线准则下, 求解与经验点据拟合最优的频率曲线参数,得到一条 理论频率曲线。
绘出理论频率曲线。
xpx(1Cvp)Kpx
理论频率曲线的绘制: 已知统计参数 Cs、CV、x ,求不同频率 P 对应的值:
xpx(1Cvp)Kpx
然后在频率格纸上绘曲线,横坐标为频率,纵坐 标为水文特征值。
例4-5:某站年径流系列符合P-Ⅲ型分布,已知该系列的,
x650mm, CV=0.25 ,CS=2Cv,试绘理论频率曲线。
即求出的 x p 应满足 :
x p 取决于P、、、a0 四个参数。
令: x x ,Φ是均值为零,标准差为1的 xC v 标准化变量(离均系数)
则有: xx(1Cv)
该式包含CS、P与 Φp的关系,根据拟定CS值,可
得值不,同通过P 下的式Φ即p 值可,求附出表与。各然种后P利相用应已的知的值x p,从和x而CV可
x
1 n
xi
Cv
n
(Ki 1)2
i 1
n
n
( K i 1)3
Cs
i 1
n
C
3 v
样本 1 2 3 4 5
均值 均方差 变差系数 偏态系数
系列 300 200 185 165 150 200
样本系列统计参数计算(P.40)
(xi-x)2 (xi-x)3
Ki
Ki-1
10000 1000000 1.5
目估适线法、优化适线法。
一、目估适线法
(1)将实测资料由大到小排列,计算各项的经验频 率,在频率格纸上点绘经验点据。
(2)选定水文频率分布线型(一般选用P-Ⅲ型)。 (3)初估一组参数 x 、CV、CS。
为了使初估值大致接近实际,可用矩法或其它方 法求出3个参数,作为3个参数第一次的假定值。
当用矩法估计时,因CS的抽样误差太大,一般不 计算CS,而是根据经验假定CS为CV的某一倍数(如 CS =2 CV )。
a0
x (1
2C v ) Cs
理论频率曲线绘制: P xp
水文计算:
一般需求出指定频率P所对应的随机变量取值, 即 P xp 。例如:频率为1%(百年一遇)的设计 洪峰流量 xp1% ? 。这就需要对密度曲线进行积 分,求出等于及大于 x p 的累积频率 P值。
F(xP)P(X xP)
f (x)dx xP
第四章 水文统计基本方法
⒈概率的基本概念 ⒉ 随机变量及其概率分布 ⒊水文频率曲线线型 ⒋P—Ⅲ型分布参数估计 ⒌水文频率计算—适线法 ⒍相关分析
第一节 概述 一、水文现象的随机性: 二、概率论和数理统计学在水文分析中的应用: 三、水文统计解决的问题:
给定样本,求指定频率的设计值 例:求指定频率的设计洪水。 方法:确定频率曲线。
年份 (1) 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970
年最大洪峰流量 (2) 720 1080 1030 1250 1440 1420 1120 2060 1370 2650
序号 (3)
1 2 3 4 5 6 7 8 9 10
由大到小排列 (4) 2650 2060 1440 1420 1370 1250 1120 1080 1030 720
Cs
6 n
(1
3 2
C s2
5 16
C s4 )
CV=2CS时样本参数的均方误(相当误差,%)
cv 参数 100
均值 50 25
变差系数
偏态系数
10 100 50 25 10 100 50 25 10
0.1
11
2
3
7 10 14 22 126 178 252 399
0.3
34
6
9
7 10 15 23 51 72 102 162
年份
(1) 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 总计 均值 变差系数
例4-6:某枢纽处最大洪峰流量频率计算
洪峰流量
(2) 1540 980 1090 1050 1860 1140 790 2750 762 2390 1210 1270 1200 1740 883 1260 408 1050 1520 483 794 26170 1246 0.46
当某一洪水的频率为P=1%时,则T=100年,称此洪
水为百年一遇洪水,表示大于等于这样的洪水平均100
年会遇到一次。
对于p=80%的枯水流量,则 T=5 年,称作以五年一
遇枯水流量作为设计来水的标准。表示小于等于这样
的流量平均5年会遇到一次。说明具有80%的可靠程度。
第五节 P—Ⅲ型分布参数估计
用有限的样本观测资料估计总体分布线型中的参 数,如P—Ⅲ型的 x 、CV、CS 。
xixix总(i1 ,2,,k)
样本均值是随机变量,抽样误差也为随机变量。抽 样误差近似服从正态分布。
可以证明,xi(i1,2,,k) 系列的均方差 x
可作为度量抽样误差的指标,称为均方误。
各参数的均方误(抽样误差):
x
n
2n
1
3 4
C s2
Cv
Cv 2n
1
2C v2
3 4
C s2
2C vC s
解:当CS=2Cv 时,查附表得不同频率下的Kp,代入下式:
xpx(1Cvp)Kpx
P
0.01
0.1
0.2
0.33
0.5
1
2
Kp
2.22
1.96
1.87
1.81
1.77
1.67
1.58
Xp
1443 1274 1215.5 1176.5 1150.5 1085.5 1027
P
10
20
50
75
90
95
99
第二节 概率的基本概念 一、事件 指在一定条件组合下,随机试验的结果。 分为:必然事件、不可能事件、随机事件。 水文测验可看作随机试验。
二、概率 反映随机事件出现的可能性大小的数量标准:
三、频率
P( A) k n
对于水文现象,用频率作为概率的近似值:
w( A) m n
第三节 随机变量及其概率分布
模比系数(Ki)
(5) 2.207 1.918 1.493 1.396 1.236 1.220 1.019 1.011 0.971 0.963 0.915 0.875 0.843 0.843 0.786 0.709 0.637 0.634 0.611 0.388 0.327 21.00
Ki-1 (6) 1.207 0.918 0.493 0.396 0.236 0.220 0.019 0.011 -0.029 -0.037 -0.085 -0.125 -0.157 -0.157 -0.214 -0.291 -0.363 -0.366 -0.389 -0.612 -0.673 0.000
Cv=0.48 Cv=0.0048
⒊偏态系数(Cs): 反映系列在均值两边对称程度
n
( K i 1)3
Cs
i 1
n
C
3 v
正态曲线或正态分布: 密度函数:
密度曲线:
例4-3:计算系列的统计参数均值、变差系数、偏态 系数。
样本 1 2 3 4 5
系列 300 200 185 165 150
二、统计参数对频率曲线的影响:
(1)均值 x 对 频率曲线的影响
1.均值大的 位于小的之上。
2.均值大的较 小的陡。
(2)CV对频率曲线的影响
1.随着CV的 增大,频率曲线 越来越陡。
(3)CS对频率曲线的影响
1. CS越大, 均值(K=1)对应 的频率越小, 频率曲线中部 越向左偏,且 上段 越陡,下 段越平缓。
一、随机变量 随试验结果而发生变化的变量,用 X 表示,取
值用 x i 表示 。
例:水文特征值:年径流、洪峰流量。
离散型随机变量: 连续型随机变量:水文特征值属连续型随机变 量。
二、随机变量的概率分布 随机变量的取值与其概率的对应关系,称为随 机变量的概率分布。 对于水文变量;常研究大于等于某一取值 x 的概 率 F (x) ,即:
序号
(3) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
某枢纽处年最大洪峰流量计算表
排序
(4) 2750 2390 1860 1740 1540 1520 1270 1260 1210 1200 1140 1090 1050 1050 980 883 794 790 762 483 408 26170
一、矩法 用样本矩估计总体矩,并通过矩与参数之间的关 系,来估计频率曲线的参数。
⒈ 均值x 无偏估计:
⒉ CV的无偏估计量:
n
(Ki 1)2
Cv
i 1
n 1
⒊ CS 的无偏估计量:
n
( K i 1)3
Cs
i 1
(n
3)C
3 v
二、权函数法
马秀峰(1984)提出。
三、抽样误差 由随机抽样引起的误差,称为抽样误差。 以均值为例;抽样误差定义为:
F (x) 水文上通常称随机变量的累积频率曲线, 简称频率曲线。
三、概率分布函数与概率密度函数的关系 概率分布函数导数负值,称为概率密度函数。
F (x)
F(x)P(Xx)xf(x)d x
四、随机变量的统计参数
⒈总体统计参数、样本统计参数 ⒉均值、均方差、变差系数、偏态系数
⒊总体:随机变量所有取值的全体。 ⒋样本:从总体中抽取的一部分。 ⒌样本容量:样本包括的项数,样本大小。
经验频率 (5) 9.1 18.2 27.3 36.4 45.5 54.5 63.6 72.7 81.8 90.9
某枢纽年最大洪峰流量经验频率曲线
二、理论频率曲线: 1、皮尔逊Ⅲ型分布曲线( P-Ⅲ)
一端有限,一端无限 的不对称单峰曲线
形状、尺度和 位置参数
可以推证:
4
C
2 S
2 xC vC s
(4)根据假定的 x 、 CV 、 CS ,查附表 ,计算xP 值,以x P为纵坐标,p为横坐标,即可得到频率曲线。
将此线画在绘有经验点据的图上,看与经验点据 配合的情况,若不理想,则修改参数再次进行计算。
(5)最后根据频率曲线与经验点据的配合情况, 从中选择一条与经验点据配合较好的曲线作为采用曲 线。相应于该曲线的参数便看作是总体参数的估值。
1.12
第四节 水文频率曲线线型
一、经验频率曲线 由实测资料(样本)绘制的频率曲线。
⒈绘制 设某水文要素(如年径流量)的实测系列共 n 项, 按由大到小的次序排列为x1、x2、...、x m、...、x n。第m 项的经验频率就是在系列中大于及等于样本 x m 的项数 出现次数(m次)与样本容量(n)之比值,即