第四章 水文统计基础知识
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当 P≤50%时,对洪水而言 T 1 P
当 P≥50%时,对枯水而言 T 1 1 P
10000 1000 200 100 50 20 10 5 800 700 600 500 400
重现期 2
5 10 20 50 100 200 1000 10000 Cv=2Cs
Cv=2.5C s Cv=3Cs
众值的大小能反映系列中最大几率项和密度曲线的位置。
4).均值、中值、众值的位置关系
y
y
y
o xxx a)
x0
xxx
x0
b)
xxx x c)
a)正偏态; b)正态; 密度曲线图
c)负偏态
水文现象为不对称分布,年洪峰流量频率分布多为正偏。
2、均方差 和变差系数 Cv
均方差和变差系数都是反映随机变量系列对其均值离
采样点
300
200
100
00.01 0.050.10.2 0.5 1 2
5 10 20 30 40 50 60 70 80 90 95 98 9999.5 99.899.9 频率(%)
99.99
水文特征值的选取:年最大值法
流量(m3/s) 180
潮白河流域下会站流量(m3/s)
160
140
120
阅。
数
K P——模比系数,
值表。 K P
KP
xP x
,可Cv根据1 拟定的比值
制成模C比s /系Cv
对于年最大流量系列,公式(4-18)可写成
QP (Cv 1)Q KP Q
式中,QP——频率为 P 的洪峰流量(m3/s); 例4-3
解题思路
1、把历年的年最大流量资料按大小递减次序排列,然后进 行计算;
1 n
n
xi
i 1
均值反映了系列在数值上的大小(系列总体水平的高低),
可以作为系列之间数值大小(水平高低)的比较标准。
系列中各个变量与均值的比值,称为模比系数(或变率),
以K 表示。对任一变量 x,则有:
2).中值 x
Ki
xi x
中值的大小能反映系列中间项和密度曲线的位置。
3).众值 x
n
n
(xi x)2
i1
n 1
比值 x表示相对离散程度,称为变差系数或离差系数,
用 表示。Cv
在水文计算中,利用样本资料推算总体的变差系数可采
用下式: 或
Cv x
n
(xi x)2
i 1
2
(n 1)x
Cv
x
n
(Ki 1)2
i 1
(n 1)
重现期 20年一遇 50年一遇 100年一遇 1000年一遇 10000年一遇
洪水流量(m3/s) 72300 79000 83700 98800 113000
第二节 统计参数的估计
一、总体与样本
总体,总体的容量 样本,样本容量
二、统计参数的估计
累积频率曲线的 三个统计参数:
1.矩法简介
均值 变差系数 偏态系数
100
80
60
40
20
0 1973年 1975年 1978年 1981年 1983年 1986年 1989年 1992年 1994年
水文现象的特性 一、随机性
水文现象是自然现象的一种,在其发生和演变过程 中,包含着必然性的一面,也包含着偶然性的一面。
必然现象是在一定条件下,必然出现或不出现的现 象。偶然现象是在一定条件下,可能出现也可能不出现 的现象,也称随机现象。
x 个统计参数 、 和 C来v表示C,s 其关系式为
4
C2 s
2
CvCs x
a0
x(1
2Cv Cs
)
x 因此,若已知三个统计参数 、 C和v ,C则s P-Ⅲ型曲线及
其方程式就可以确定,也就是确定了密度曲线及密度函数。
P-Ⅲ 型曲线的应用
将P-Ⅲ型曲线的方程式进行一定的积分演算,就可以得到频率曲
• 1、如何由工程设计标准(设计洪水频率或重 现期)推求设计洪水流量(设计洪水水位)?
• 2、设计洪水频率和重现期之间是什么关系? • 3、理论频率曲线的形式是什么样的? • 4、如何求理论频率曲线的三个参数? • 5、求矩适线法中,如何选取水文资料?
经验频率曲线
理论频率曲线
QP (Cv 1)Q KP Q
Cs 0,其频率分布对称于均值,为正态分布; Cs 0,为正偏态,系列中大于均值的变量比小于均值的变量出现的机
会少,其均值对应的频率小于50%;
Cs 0,为负偏态,表明系列中大于均值的变量比小于均值的变量出现
的机会多,其来自百度文库值对应的频率大于50%。
y CS2>0
CS1=0
CS3<0
x2 x1 x3
2)变差系数 C反v 映密度曲线的高矮情况
3)偏态系数C
反映曲线的偏斜程度
s
x 2.统计参数 、 C、v Cs
与频率曲线形状的关系
x 对频率曲线的影响
Cv 对频率曲线的影响
Cs 对频率曲线的影响
x3>x2>x1
x
x3
x2 x1
CV3>CV2>CV1
x
CV3
CV2
CV1=0
x
CS3>C C S2> S1
1、随机变量:随机试验取值随机的变量,分为离散型、连 续型随机变量。 2、概率P:随机变量出现某取值的可能性。 3、频率P:随机变量某取值在试验中出现的比率。
P(A) m n
掷币试验出现正面的频率表
试验者 蒲丰
皮尔逊 皮尔逊
掷币次数 4040 12000 24000
出现正面次数 2040 6018
n
Ki2 n
i 1
n 1
Cv较小时,表示系列的离散程度较小,即变量间的变化幅
度较小,频率分布比较集中;反之, 较Cv大时,系列的离散程
度较大,频率分布比较分散。
3、偏态系数 Cs
偏态系数是反映随机变量系列中各随机变量对其均值
对称性的参数。
对于总体 对于样本
n
(xi x)3
Cs
CS3
CS2 CS1=0
0.1 1
5 10 20
a)
50 75 90 95 99
P(%)
0.1 1
5 10 20
b)
50 75 90 95 99
P(%)
0.1 1
5 10 20
c)
50 75 90 95 99
P(%)
x 、 、 与C频v 率C曲s 线的关系
1)均值 x反映频率曲线的位置高度
2)变差系数 Cv反映频率曲线的陡坦程度
12014
频率 0.5080 0.5016 0.5006
在试验次数足够大的情况下,事件的频率和概 率是十分接近的。
二、随机变量的概率分布
概率分布
例 4-1
X(日) 0 1 2 3 4 5 6 7 8 9 10 P(%) 2 4 6 8 10 13 15 17 13 8 4 100
例4-2 1)计算频率密度及累积频率
三、随机变量的分布参数
一个随机变量系列的频率密度曲线和频率分布曲线的形状 和方程,都可以用几个数值特征值来反映,这些数值特征值 称为统计参数(特征参数,分布参数) 。
水文计算中常用的统计参数有均值 、x变差系数 和Cv
偏态系数 。Cs
1.位置特征参数
1).均值 x
x
x1 x2 xn n
10000 1000 200 100 50 20 10 5 800 700 600 500 400
重现期 2
5 10 20 50 100 200 1000 10000 CCvS==2C2Cs V
CCvS==2.25.C5CV s CCvS==3C3Cs V
CCvS==3.35.C5CV s CCvS==4C4Cs V
1)原点矩(均值为一阶原点矩)
2)中心矩(方差为二阶中心矩)
年降水量组距 发生在组距中 区间频率
Dx(=200mm)
的次数Dm
Dp=Dm/n(%)
频率密度 累积次 累积频率 Dp/Dx(%) 数m P=m/n(%)
2300~2101
1
2100~1901
2
1900~1701
3
…
…
700~501
1
合计
62
1.6
0.008
1
1.6
3.2
0.016
3
4.8
4.8
0.024
Cv=3.5C s Cv=4Cs
采样点
300
200
100
00.01 0.050.10.2 0.5 1 2
5 10 20 30 40 50 60 70 80 90 95 98 9999.5 99.899.9 频率(%)
99.99
宜昌水文站各种频率的设计洪水流量
洪水频率 5% 2% 1% 0.1%
0.01%
0 0
频率直方图
概率分布曲线
F(x)
20
40
60
80
累积频率
累积频率曲线
100
120
x
P(x xP ) F(xP )
f (x)dx
xP
>
P xP x
F(x)=∫
∞
xp
f
(x)dx
(分布曲线)
f (x)
(密度曲线)
f (x)dx 1
P(%)
分布曲线与密度曲线的关系
3)偏态系数
C
反映频率曲线的曲率大小
s
四、几种常用的概率分布曲线
1.正态分布
2.皮尔逊Ⅲ 型曲线(K. Pearson,英国生物 学家)
P-Ⅲ 型曲线的方程式的密度函数为:
y
f (x)
(
)
(
x
a0
)
1
e
(
x
a0
)
( ) 为 函数
曲线的三个参数 、 、 经a过0 换算也可以用系列的三
保持幽默感
要能处乱不惊
第四章 水文统计基础知识
本章重点:
1、理解随机变量及概率分布的概念,掌握常用概率分布曲线; 2、理解总体、样本与抽样误差的概念及统计参数的估计; 3、掌握现行频率计算的方法——适线法,理解频率计算中
几个特殊问题的处理; 4、掌握二元相关分析法。
本章学习思路:
表5.1~5.3 工程设计标准
频率曲线( P-Ⅲ 型曲线)
工程设计标准
设计洪水频率 (洪水重现期)
设计洪水水位 设计洪水流量
频率曲线
公式4-18~公式4-20
经验频率曲线 曲线选用(P- Ⅲ曲线)
理论频率曲线
QP (Cv 1)Q KP Q
统计参数(x,Cv,Cs)(P37~40)
适线方法
求矩适线法 三点适线法
问题启发
x 线纵坐标值 的计算公式,即频率曲线的方程式(分布函数)为: P
xP (Cv 1)x KP x
x 式中, P——频率为 P 的随机变量;
——离均系数,
KP 1 Cv
xP x Cv x
, x这P 是x频 率f (
PP,C和s )偏差
系数 Cs 的函数,为了便于实际应用,制成离均系数 值表,可供查
二、确定性规律 1、周期性:年周期,多年周期。 2、地区性:气候及下垫面相似地区的水文现象规律 相似。 3、相关性:水文现象之间存在一定的因果关系。
第一节 随机变量及其概率分布
一、随机变量 随机变量系列:x1, x2,…, xn
随机变量
离散随机变量
连续随机变量
水文统计法就是将流量、水位、降雨量等实测水文资料作 为随机变量,通过统计分析和计算,推求水文现象(随机事 件)客观规律性的方法。
i 1
n
x
3
C
3 v
n
(xi x)3
Cs
i 1
(n
3)
x
C3 3 v
频率曲线的三个参数,其中均值( x )一般直接采用矩
法计算值;变差系数(Cv)可先用矩法估算,并根据适线拟 合最优的准则进行调整;偏态系数(Cs)一般不进行计算, 而直接采用倍比,我国绝大多数河流可采用 Cs=(2~3)Cv。
x
Cs 值变化情况
统计参数与密度曲线及频率曲线的关系
1.统计参数 x 、 、Cv 与密Cs度曲线形状的
关系
y
x2>x1
y
c c c > v3
v2> v1
cv1=0
cv2
cv3
y
c c c > s3
s2> s1
c c s3
s2
cs1=0
0
x1
x2
x0
x
x0
x
x
a)
b)
c)
1)均值 x反映密度曲线的位置变化
散程度的参数。
x 系列中各随机变量
对其均值
i
的x差称为离差,用
Di 表示,Di xi。 x
n
n
方差是离差的平方和
D2 i
(x,i 可x)以2 用来表示系列总
的离散程度。
i 1
i 1
均方差 表达各随机变量对其均值的平均离散程度。
对于总体 对于样本
n
(xi x)2
i1
6
9.6
…
…
…
…
1.6
0.008
62
100
100
年降水量
年降水量
2)绘制频率直方图 3)绘制累积频率曲线
概率密度曲线
2300 2100 1900 1700 1500 1300 1100 900 700
0
f(x)
0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 频率密度
2500 2000 1500 1000 500
2、计算 Q、 C、v ;Cs
3、计算 QP。
QP (Cv 1)Q KP Q
f (P,Cs )
Cs=n*Cv
五、重现期
在水文计算中,等于和大于某一数值的水文要素特征值 (流量、水位等)出现的次数与总次数的比值,为该特征值
的累积频率(P )。
重现期是指在很长时期内,平均若干年遇到一次大于或等 于(或小于或等于)某值的洪水(或枯水),以年为单位。 重现期 T 与累积频率 P 的关系为:
当 P≥50%时,对枯水而言 T 1 1 P
10000 1000 200 100 50 20 10 5 800 700 600 500 400
重现期 2
5 10 20 50 100 200 1000 10000 Cv=2Cs
Cv=2.5C s Cv=3Cs
众值的大小能反映系列中最大几率项和密度曲线的位置。
4).均值、中值、众值的位置关系
y
y
y
o xxx a)
x0
xxx
x0
b)
xxx x c)
a)正偏态; b)正态; 密度曲线图
c)负偏态
水文现象为不对称分布,年洪峰流量频率分布多为正偏。
2、均方差 和变差系数 Cv
均方差和变差系数都是反映随机变量系列对其均值离
采样点
300
200
100
00.01 0.050.10.2 0.5 1 2
5 10 20 30 40 50 60 70 80 90 95 98 9999.5 99.899.9 频率(%)
99.99
水文特征值的选取:年最大值法
流量(m3/s) 180
潮白河流域下会站流量(m3/s)
160
140
120
阅。
数
K P——模比系数,
值表。 K P
KP
xP x
,可Cv根据1 拟定的比值
制成模C比s /系Cv
对于年最大流量系列,公式(4-18)可写成
QP (Cv 1)Q KP Q
式中,QP——频率为 P 的洪峰流量(m3/s); 例4-3
解题思路
1、把历年的年最大流量资料按大小递减次序排列,然后进 行计算;
1 n
n
xi
i 1
均值反映了系列在数值上的大小(系列总体水平的高低),
可以作为系列之间数值大小(水平高低)的比较标准。
系列中各个变量与均值的比值,称为模比系数(或变率),
以K 表示。对任一变量 x,则有:
2).中值 x
Ki
xi x
中值的大小能反映系列中间项和密度曲线的位置。
3).众值 x
n
n
(xi x)2
i1
n 1
比值 x表示相对离散程度,称为变差系数或离差系数,
用 表示。Cv
在水文计算中,利用样本资料推算总体的变差系数可采
用下式: 或
Cv x
n
(xi x)2
i 1
2
(n 1)x
Cv
x
n
(Ki 1)2
i 1
(n 1)
重现期 20年一遇 50年一遇 100年一遇 1000年一遇 10000年一遇
洪水流量(m3/s) 72300 79000 83700 98800 113000
第二节 统计参数的估计
一、总体与样本
总体,总体的容量 样本,样本容量
二、统计参数的估计
累积频率曲线的 三个统计参数:
1.矩法简介
均值 变差系数 偏态系数
100
80
60
40
20
0 1973年 1975年 1978年 1981年 1983年 1986年 1989年 1992年 1994年
水文现象的特性 一、随机性
水文现象是自然现象的一种,在其发生和演变过程 中,包含着必然性的一面,也包含着偶然性的一面。
必然现象是在一定条件下,必然出现或不出现的现 象。偶然现象是在一定条件下,可能出现也可能不出现 的现象,也称随机现象。
x 个统计参数 、 和 C来v表示C,s 其关系式为
4
C2 s
2
CvCs x
a0
x(1
2Cv Cs
)
x 因此,若已知三个统计参数 、 C和v ,C则s P-Ⅲ型曲线及
其方程式就可以确定,也就是确定了密度曲线及密度函数。
P-Ⅲ 型曲线的应用
将P-Ⅲ型曲线的方程式进行一定的积分演算,就可以得到频率曲
• 1、如何由工程设计标准(设计洪水频率或重 现期)推求设计洪水流量(设计洪水水位)?
• 2、设计洪水频率和重现期之间是什么关系? • 3、理论频率曲线的形式是什么样的? • 4、如何求理论频率曲线的三个参数? • 5、求矩适线法中,如何选取水文资料?
经验频率曲线
理论频率曲线
QP (Cv 1)Q KP Q
Cs 0,其频率分布对称于均值,为正态分布; Cs 0,为正偏态,系列中大于均值的变量比小于均值的变量出现的机
会少,其均值对应的频率小于50%;
Cs 0,为负偏态,表明系列中大于均值的变量比小于均值的变量出现
的机会多,其来自百度文库值对应的频率大于50%。
y CS2>0
CS1=0
CS3<0
x2 x1 x3
2)变差系数 C反v 映密度曲线的高矮情况
3)偏态系数C
反映曲线的偏斜程度
s
x 2.统计参数 、 C、v Cs
与频率曲线形状的关系
x 对频率曲线的影响
Cv 对频率曲线的影响
Cs 对频率曲线的影响
x3>x2>x1
x
x3
x2 x1
CV3>CV2>CV1
x
CV3
CV2
CV1=0
x
CS3>C C S2> S1
1、随机变量:随机试验取值随机的变量,分为离散型、连 续型随机变量。 2、概率P:随机变量出现某取值的可能性。 3、频率P:随机变量某取值在试验中出现的比率。
P(A) m n
掷币试验出现正面的频率表
试验者 蒲丰
皮尔逊 皮尔逊
掷币次数 4040 12000 24000
出现正面次数 2040 6018
n
Ki2 n
i 1
n 1
Cv较小时,表示系列的离散程度较小,即变量间的变化幅
度较小,频率分布比较集中;反之, 较Cv大时,系列的离散程
度较大,频率分布比较分散。
3、偏态系数 Cs
偏态系数是反映随机变量系列中各随机变量对其均值
对称性的参数。
对于总体 对于样本
n
(xi x)3
Cs
CS3
CS2 CS1=0
0.1 1
5 10 20
a)
50 75 90 95 99
P(%)
0.1 1
5 10 20
b)
50 75 90 95 99
P(%)
0.1 1
5 10 20
c)
50 75 90 95 99
P(%)
x 、 、 与C频v 率C曲s 线的关系
1)均值 x反映频率曲线的位置高度
2)变差系数 Cv反映频率曲线的陡坦程度
12014
频率 0.5080 0.5016 0.5006
在试验次数足够大的情况下,事件的频率和概 率是十分接近的。
二、随机变量的概率分布
概率分布
例 4-1
X(日) 0 1 2 3 4 5 6 7 8 9 10 P(%) 2 4 6 8 10 13 15 17 13 8 4 100
例4-2 1)计算频率密度及累积频率
三、随机变量的分布参数
一个随机变量系列的频率密度曲线和频率分布曲线的形状 和方程,都可以用几个数值特征值来反映,这些数值特征值 称为统计参数(特征参数,分布参数) 。
水文计算中常用的统计参数有均值 、x变差系数 和Cv
偏态系数 。Cs
1.位置特征参数
1).均值 x
x
x1 x2 xn n
10000 1000 200 100 50 20 10 5 800 700 600 500 400
重现期 2
5 10 20 50 100 200 1000 10000 CCvS==2C2Cs V
CCvS==2.25.C5CV s CCvS==3C3Cs V
CCvS==3.35.C5CV s CCvS==4C4Cs V
1)原点矩(均值为一阶原点矩)
2)中心矩(方差为二阶中心矩)
年降水量组距 发生在组距中 区间频率
Dx(=200mm)
的次数Dm
Dp=Dm/n(%)
频率密度 累积次 累积频率 Dp/Dx(%) 数m P=m/n(%)
2300~2101
1
2100~1901
2
1900~1701
3
…
…
700~501
1
合计
62
1.6
0.008
1
1.6
3.2
0.016
3
4.8
4.8
0.024
Cv=3.5C s Cv=4Cs
采样点
300
200
100
00.01 0.050.10.2 0.5 1 2
5 10 20 30 40 50 60 70 80 90 95 98 9999.5 99.899.9 频率(%)
99.99
宜昌水文站各种频率的设计洪水流量
洪水频率 5% 2% 1% 0.1%
0.01%
0 0
频率直方图
概率分布曲线
F(x)
20
40
60
80
累积频率
累积频率曲线
100
120
x
P(x xP ) F(xP )
f (x)dx
xP
>
P xP x
F(x)=∫
∞
xp
f
(x)dx
(分布曲线)
f (x)
(密度曲线)
f (x)dx 1
P(%)
分布曲线与密度曲线的关系
3)偏态系数
C
反映频率曲线的曲率大小
s
四、几种常用的概率分布曲线
1.正态分布
2.皮尔逊Ⅲ 型曲线(K. Pearson,英国生物 学家)
P-Ⅲ 型曲线的方程式的密度函数为:
y
f (x)
(
)
(
x
a0
)
1
e
(
x
a0
)
( ) 为 函数
曲线的三个参数 、 、 经a过0 换算也可以用系列的三
保持幽默感
要能处乱不惊
第四章 水文统计基础知识
本章重点:
1、理解随机变量及概率分布的概念,掌握常用概率分布曲线; 2、理解总体、样本与抽样误差的概念及统计参数的估计; 3、掌握现行频率计算的方法——适线法,理解频率计算中
几个特殊问题的处理; 4、掌握二元相关分析法。
本章学习思路:
表5.1~5.3 工程设计标准
频率曲线( P-Ⅲ 型曲线)
工程设计标准
设计洪水频率 (洪水重现期)
设计洪水水位 设计洪水流量
频率曲线
公式4-18~公式4-20
经验频率曲线 曲线选用(P- Ⅲ曲线)
理论频率曲线
QP (Cv 1)Q KP Q
统计参数(x,Cv,Cs)(P37~40)
适线方法
求矩适线法 三点适线法
问题启发
x 线纵坐标值 的计算公式,即频率曲线的方程式(分布函数)为: P
xP (Cv 1)x KP x
x 式中, P——频率为 P 的随机变量;
——离均系数,
KP 1 Cv
xP x Cv x
, x这P 是x频 率f (
PP,C和s )偏差
系数 Cs 的函数,为了便于实际应用,制成离均系数 值表,可供查
二、确定性规律 1、周期性:年周期,多年周期。 2、地区性:气候及下垫面相似地区的水文现象规律 相似。 3、相关性:水文现象之间存在一定的因果关系。
第一节 随机变量及其概率分布
一、随机变量 随机变量系列:x1, x2,…, xn
随机变量
离散随机变量
连续随机变量
水文统计法就是将流量、水位、降雨量等实测水文资料作 为随机变量,通过统计分析和计算,推求水文现象(随机事 件)客观规律性的方法。
i 1
n
x
3
C
3 v
n
(xi x)3
Cs
i 1
(n
3)
x
C3 3 v
频率曲线的三个参数,其中均值( x )一般直接采用矩
法计算值;变差系数(Cv)可先用矩法估算,并根据适线拟 合最优的准则进行调整;偏态系数(Cs)一般不进行计算, 而直接采用倍比,我国绝大多数河流可采用 Cs=(2~3)Cv。
x
Cs 值变化情况
统计参数与密度曲线及频率曲线的关系
1.统计参数 x 、 、Cv 与密Cs度曲线形状的
关系
y
x2>x1
y
c c c > v3
v2> v1
cv1=0
cv2
cv3
y
c c c > s3
s2> s1
c c s3
s2
cs1=0
0
x1
x2
x0
x
x0
x
x
a)
b)
c)
1)均值 x反映密度曲线的位置变化
散程度的参数。
x 系列中各随机变量
对其均值
i
的x差称为离差,用
Di 表示,Di xi。 x
n
n
方差是离差的平方和
D2 i
(x,i 可x)以2 用来表示系列总
的离散程度。
i 1
i 1
均方差 表达各随机变量对其均值的平均离散程度。
对于总体 对于样本
n
(xi x)2
i1
6
9.6
…
…
…
…
1.6
0.008
62
100
100
年降水量
年降水量
2)绘制频率直方图 3)绘制累积频率曲线
概率密度曲线
2300 2100 1900 1700 1500 1300 1100 900 700
0
f(x)
0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 频率密度
2500 2000 1500 1000 500
2、计算 Q、 C、v ;Cs
3、计算 QP。
QP (Cv 1)Q KP Q
f (P,Cs )
Cs=n*Cv
五、重现期
在水文计算中,等于和大于某一数值的水文要素特征值 (流量、水位等)出现的次数与总次数的比值,为该特征值
的累积频率(P )。
重现期是指在很长时期内,平均若干年遇到一次大于或等 于(或小于或等于)某值的洪水(或枯水),以年为单位。 重现期 T 与累积频率 P 的关系为: