第四章 水文统计的基本知识及方法

合集下载

工程水文学第四章 水文统计基本方法

工程水文学第四章 水文统计基本方法

反应系列 总水平
定义模比系数: 则:
Ki
xi x
1
1 n
n i 1
Ki
K1 K2 Kn n
⒉ 均方差σ、变差系数Cv:
反映系列中各变量值集中或离散的程度
n
(xi x)2
i1
n
Cv
n
(Ki 1)2
i 1
n
例4-2: 5, 10, 15 x=10 σ=4.08 995,1000,1005 x=1000 σ=4.08
Cv=0.48 Cv=0.0048
⒊偏态系数(Cs): 反映系列在均值两边对称程度
n
( Ki 1)3
Cs i1 nCv3
正态曲线或正态分布: 密度函数:
密度曲线:
例4-3:计算系列的统计参数均值、变差系数、 偏态系数。
样本 1 2 3 4 5
系列 300 200 185 165 150
例如:
T 1 1 P
当某一洪水的频率为P=1%时,则T=100年,称此洪
水为百年一遇洪水,表示大于等于这样的洪水平均100
年会遇到一次。
对于p=80%的枯水流量,则 T=5 年,称作以五年一
遇枯水流量作为设计来水的标准。表示小于等于这样的
流量平均5年会遇到一次。说明具有80%的可靠程度。
第五节 P—Ⅲ型分布参数估计
经验频率 (5) 9.1 18.2 27.3 36.4 45.5 54.5 63.6 72.7 81.8 90.9
某枢纽年最大洪峰流量经验频率曲线
二、理论频率曲线: 1、皮尔逊Ⅲ型分布曲线( P-Ⅲ)
一端有限,一端无限 的不对称单峰曲线
形状、尺度和 位置参数
可以推证:
4 CS2

工程水文学第四章 水文统计基本方法共63页文档

工程水文学第四章 水文统计基本方法共63页文档
F (x) 水文上通常称随机变量的累积频率曲线, 简称频率曲线。
三、概率分布函数与概率密度函数的关系 概率分布函数导数负值,称为概率密度函数。
F (x)

F(x)P(Xx)xf(x)d x
四、随机变量的统计参数
⒈总体统计参数、样本统计参数 ⒉均值、均方差、变差系数、偏态系数
⒊总体:随机变量所有取值的全体。 ⒋样本:从总体中抽取的一部分。 ⒌样本容量:样本包括的项数,样本大小。

f (x)dx xP
即求出的 x p 应满足 :
x p 取决于P、、、a0 四个参数。
令: x x ,Φ是均值为零,标准差为1的 xC v 标准化变量(离均系数)
则有: xx(1Cv)
该式包含CS、P与 Φp的关系,根据拟定CS值,可
得值不,同通过P 下的式Φ即p 值可,求附出表与。各然种后P利相用应已的知的值x p,从和x而CV可
经验频率 (5) 9.1 18.2 27.3 36.4 45.5 54.5 63.6 72.7 81.8 90.9
某枢纽年最大洪峰流量经验频率曲线
二、理论频率曲线: 1、皮尔逊Ⅲ型分布曲线( P-Ⅲ)
一端有限,一端无限 的不对称单峰曲线
形状、尺度和 位置参数
可以推证:


4
C
2 S
2 xC vC s
第四章 水文统计基本方法
⒈概率的基本概念 ⒉ 随机变量及其概率分布 ⒊水文频率曲线线型 ⒋P—Ⅲ型分布参数估计 ⒌水文频率计算—适线法 ⒍相关分析
第一节 概述 一、水文现象的随机性: 二、概率论和数理统计学在水文分析中的应用: 三、水文统计解决的问题:
给定样本,求指定频率的设计值 例:求指定频率的设计洪水。 方法:确定频率曲线。

4第四章 水文统计基础知识

4第四章 水文统计基础知识

P-Ⅲ型概率密度曲线的 特点:
(1)单峰型; (2)与x轴有一交点,对应水文 变量的最小值; (3)后端与x轴不相交
P-Ⅲ 型曲线的应用
将P-Ⅲ型曲线的方程式进行一定的积分演算,就可以得到频率曲 线纵坐标值 的计算公式,即频率曲线的方程式(分布函数)为: P
x
xP (Cv 1) x K P x
3、偏态系数
偏态系数是反映随机变量系列中各随机变量对其均 值对称性的参数。 对于总体
Cs
Cs
( xi x) 3
i 1
n
n x C v3
3
对于样本
Cs
( xi x) 3
i 1
n
(n 3) x Cv3
3
频率曲线的三个参数,其中均值( x )一般直接采用矩 法计算值;变差系数(Cv)可先用矩法估算,并根据适线拟 合最优的准则进行调整;偏态系数(Cs)一般不进行计算, 而直接采用倍比,我国绝大多数河流可采用 Cs=(2~3)Cv。
Ki
2).中值 x
xi x
中值的大小能反映系列中间项和密度曲线的位置。
3).众值
x
众值的大小能反映系列中最大几率项和密度曲线的位置。
4).均值、中值、众值的位置关系
y y
y
o
xxx a)
x 0
xxx b)
x 0
xxx
c)
x
a)正偏态;
b)正态; 密度曲线图
c)负偏态
水文现象为不对称分布,年洪峰流量频率分布多为正偏。
频率曲线( P-Ⅲ 型曲线) 设计洪水水位 设计洪水流量
工程设计标准
设计洪水频率 (洪水重现期) 经验频率曲线
公式4-18~公式4-20

《工程水文学》四五章复习

《工程水文学》四五章复习

第四章水文统计基本知识一、概述1.随机现象:是在一定条件下,可能出现也可能不出现的现象。

水文现象2.随机现象所遵循的规律称为统计规律,研究统计规律的学科称为概率论而由随机现象的一部分试验资料去研究全体现象的数量特征和规律的学科称为数理统计学。

3.水文统计:将概率论和数理统计引入水文学,研究水文现象的统计变化规律的学科,被称为水文统计。

二、概率的基本概念1.事件2.概率:随机事件A在试验结果中可能出现也可能不出现,但其出现可能性的大小的数量标准就是概率。

m出现随机事件的结果数n试验中所有可能出现结果数古典概型P(A)=m/n3.频率:水文事件不属古典概型事件。

设事件A在n次试验中出现了m次,则称为事件A的频率 P(A)=m/n,当n趋于无穷大时,P(A)稳定并趋于概率。

4.概率定理加法定理:P(A+B)=P(A)+P(B)-P(AB) ,当A、B互斥时P(AB)=0乘法定理:P(AB)=P(A)P(B/A)=P(B)P(A/B) ,当A、B独立时,P(AB)=P(A)P(B)三、随机变量及其概率分布1.随机变量:表示随机试验结果的一个变量,一般用大写变量表示,如 X,Y,Z等。

水文统计研究的是水文随机变量。

离散型随机变量、连续型随机变量总体与样本总体:随机变量所有取值的全体,样本:从总体中随机抽取的一部分,样本容量:样本包括的项数,样本大小。

2.随机变量的概率分布随机变量的取值与其概率之间的对应关系,记为F(X)。

连续型随机变量的概率分布(区间概率)对于水文变量,研究大于等于某一取值x 的概率,即分布函数F(x)—概率分布曲线 即: F(X)=P(X>Xp)=p水文上通常称概率分布曲线为频率曲线 概率分布函数导数负值,称为概率密度函数3. 随机变量的统计参数:说明随机变量统计规律某些特征的数字,称为随机变量的统计参数。

例如平均降雨量、年平均流量等, (1)均值(数学期望值)均值为分布的中心,表示对象的平均情况,即总体水平的高低(2)均方差表示分布函数的绝对离散程度。

水文统计介绍

水文统计介绍

P-III型曲线的特点: 一端有限另一端无限的不对称单峰正偏曲线
f(x)
皮尔逊Ⅲ 型概率密度曲线
a0 M0(x)
Me(x)
xP
P f ( x)dx
xP
x
在水文计算中,一般要求出指定概率P所相应的随
机变量的取值xP,即求出的 xP满足下列等式:
P
P( X
xP )
xP
(
)
(
x
a0
)
1
e
(
x
因此,由给定的CS 及P,从P-III型曲线离均系数 值表,查出P ,再由下式求:
xP (PCV 1)x
xP即为指定概率 P 所相应的随机变量的取值。这是 水文统计分析中要求计算的一个量
如求频率P=1/100(水文学常称为百年一遇)时的径 流量QP=0.01。
【算例】
已知: 某地年平均降雨量 x =1000 mm, CV =0.5, CS =1.0,若年降雨量符合P - III型分布 试求:P=1% 的年降雨量。
其反映年降雨量(Xx)的经验频率P(Xx)和x的关系。随
着样本容量n的增加,频率P就非常接近于概率,而该经 验分布曲线就非常接近于总体的分布曲线。
三、理论曲线线型
1.正态分布
x
式中, x :均值(平均数);
:均方差(标准差)。 许多随机变量如水文测量误差、抽样误差 等一般服从正态分布。
正态分布曲线的特点:
料中出现大于或等于某一值 x 的次数。
注意:样本的每一项的经验频率用公式P=m/n进
行计算,当m=n时,P=100%,说明样本的最末项 为总体的最小值,这是不合理的。故必须进行修 正,常采用下面的公式进行计算:
经验频率的计算公式: P m n1

第四章 水文统计基本原理与方法 工程水文学

第四章 水文统计基本原理与方法 工程水文学

lim W(A) P(A)
n
五、概率的加法定理与乘法定理
1、概率的加法定理
互不相容(互斥):P(A1+A2+…An)= P(A1)+P(A2)+……P(Ai)
非互斥事件 : P(A1+A2)= P(A1)+P(A2)- P(A1A2)
式中:P(A1+A2+……An)为它们中任一个出现的概率
目估外延。 2、理论累积频率曲线
四.理论累积频率曲线
1.频率密度
正态分布:
1 ( x x )2 f ( x) exp 2 2 2
P
x
x
1 ( x x )2 exp dx 0.683 2 2 2
1 ( x x )2 P exp dx 0.997 2 x 3 2 2 1 ( x x )2 P exp dx 1 2 2 2
若求百年一遇的洪水
,m=1 ,得,n=99年。即
是说,在推求百年一遇的洪水时,至少需要99年的实测资料。
2.经验累积频率曲线绘制步骤
1)将实测水文特征值如水位、流量或降雨量不论年序,按大小 排序,对于洪水资或大于某特征值 x≥xi,的
例4-1:江河中出现的最高水位或最大流量,每年的实测值 各不相同,为互斥事件。某水文站观测到一河段50年的洪 水水位资料如下表4-2,求小于258m水位出现的频率。
水位高程Hi(m) 出现的频数 fi(年) 频率w(Hi)%
250 3 6
255 7 14
258 9 18
265 16 32
268 15 30
均系数表。后经雷布京等人的修正,成为专用水文计算表。
1961年中国科学院水文研究所又对此离均系数ФP计算表进行 修正扩展,加密点据,将ФP值补充到Cs=6.4。 x K p 1 pCv;xP KP x 理论累计频率曲线的坐标值:令 K

工程水文第4章水文统计的基本知识

工程水文第4章水文统计的基本知识

样本抽样误差的均方值称为均方误,是衡
量抽样误差的大小的常用指标。
皮尔逊Ⅲ型分布参数矩法估计的均方误公式:
X

n
2n 1 3 2 cs 4 3 2 CS 2C V C S 4

Cv
Cv 2n
6
2 1 2cv
Cs
n
(1
3 5 2 4 CS CS 2 16
第四章
第一节
水文统计的基本知识
水文现象
第二节
第三节 第四节 第五节 第六节
概率的基本概念
随机变量及其概率分布 水文常用频率曲线 统计参数估算 适线法估计水文分布参数
第一节
水文现象
水文现象是自然现象的一种,在其发生和
演变过程中,包含着必然性的一面,也包着偶
然性的一面。
必然现象是在一定条件下,必然出现或不
样本参数的均方误(相对误差,%)
参数
EX
100 50 25 10 100 50
CV
25 10 100 50
CS
25 10
n Cv
0.1 0.3 0.5 0.7 1.0
1 3 5 7 10
1 4 7 10 14
2 6 10 14 20
3 10 12 22 23
7 7 8 9 10
50 10 11 12 14
F(x)
概率分布函数与密度函数关系
三、随机变量的分布参数
概率分布曲线完整地刻划了随机变量的
统计规律。但在一些实际问题中,有时只要 知道概率分布某些特征数值。这种以简便的 形式显示出随机变量分布规律的某些特征数 字称为随机变量的分布参数。
均值
x
x i pi i

工程水文第4章水文统计的基本知识精品PPT课件

工程水文第4章水文统计的基本知识精品PPT课件
P(A/B)=P(B/A)P(A)/ P(B)
=0.3×0.1 / 0.2
=0.15
第三节 随机变量及其概率分布
一、水文随机变量 随机变量是表示随机试验结果的数 量表示。水文随机变量一般指水文特征 值,如水位、流量、雨量等,属连续型 随机变量。
二、随机变量的概率分布
随机变量的取值x与其概率P 的对应关系,
二、概率
随机事件A在试验结果中可能出现也可 能不出现,但其出现可能性的大小的数量标 准就是概率。
古典概率表达式
P(A) m n
三、频率
水文事件不属古典概型事件,只能通过
试验来估算概率。设事件A在n次试验中出 现了m次,则称
W (A)
m n
为事件A的频率。
试验者 蒲丰 皮尔逊 皮尔逊
掷币试验出现正面的频率表
称为随机变量的概率分布。水文统计学研究随 机变量的取值大于某一个值的概率
F(x)=P(X>x)
称此为随机变量的概率分布函数或概率 分布曲线。
x
1100
某雨量站的年雨量分布曲线
1000
900
800
700
0.2
0.4
0.6
0.8
(((1()23)4)年)年P雨P(雨(量X量X>超小≤x过)于9x=08)000m0=.mm1的m0的的.概1设概的率计率设值计x值x
P(P(PX(>Xx>X9=>08009x)09))5=m==m01.0-2.502.1= 0.9 P(X≤x 8=007)20=m1m-0.52=0.48
1.0
P(X > x)
函数f(x)=-F ’(x)为概率密度函数,
简称为密度函数或密度曲线。
f(x)
f(x)dx

第四章 水文统计

第四章 水文统计

E (xx )
2
(8-6)
值愈大,分布愈分散; 值愈小,分布愈集中。
2 2> 1
x
变差系数(离差系数,离势系数〕
对于均值不同的二个系 列,用均方差来比较其 离散程度就不合适,则 要采用均方差和均值的 比来表示:
f(x)
变差系数对密 度函数的影响
CV1
C V E(x) x
元素,即为图中的阴影面积; 通过密度函数f(x)可求出随机变量 X 概率分 布函数F(x),其与密度函数f(x) 有如下的数学关
系:
F ( x ) P ( X x ) ( x ) dx f
x

可见,随机变量的二个函数:
f(x) 密度函数,反映随机变量X落入dx 区 间的平均概率; F(x) 分布函数,反映随机变量X超过某 个值 x 的概率。 这两个函数能完整地描述随机变量的分布 规律。
一般称之为随机系列或随机数列。
随机变量的分类:
离散型随机变量
随机变量仅取得区间内某些间断的离散值, 则称为离散型随机变量。如洪峰次数,只能取0, 1, 2…,不能取相邻两数值之间的任何值。
连续型随机变量
随机变量可以取得一个有限区间内的任何数 值,则称为连续型随机变量。如某河流断面的流量
可以取0 ~ 极限值之间的任何实数值。
0
, , a 0:三个参数,它们与三个统计参数 x , cv , cs
有一定的关系,其表达式为:
4 2 c s
2 x c c v s
2 c v a x ( 1 ) 0 c s
可见,当以上三个参数确定后, P-III 型密度函 数亦完全确定。
P-III型曲线的特点:

第四章 水文统计基本知识

第四章 水文统计基本知识

水文现象的统计规律
水文现象是一种自然现象,它具有必然性,也具有偶然性。 其中偶然现象(随机现象)所遵循的规律称为统计规律 水文统计及其任务 研究随机现象统计规律的学科称为概率论, 而由随机现象的 一部分试验资料去研究总体现象的数字特征和规律的学科称为 数理统计学。概率论与数理统计学应用到水文分析与计算上则 称为水文统计
对于连续型随机变量:
变量的取值充满整个数值区间,无法一一列出其 每一个可能值,只能以区间的概率分析其分布规律
连续系列按由大到小顺序排列,分成N组,组距 值△ x=xi+1 - xi,任一组内概率为△p,则区间平均概 率为f(x)= △p/△x,此值称为△x区间对应的概率密 度
区间足够小时,
x
f ( x)
2 (- 1 10) (10 10)2 (19 10)2 乙 7.35 3
表明:乙系列的离散程度大于甲系列 均值相同时,均方差可以反映其离散程度;但均值不 同时,却无法比较。因此引入离差系数(变差系数)
2 离差系数(变差系数、离势系数):均方差和平均数 的比值,表征随机变量分布的相对离散度

频率
水文事件不属古典概率事件,其试验结果可能的
总数未知,试验结果是否等可能也未知,因而不能
预先推知某事件的概率。为此引入“频率”概念来 计算随机水文事件的概率 频率:设随机事件A在重复试验n次中出现 f 次,则 f 与 n 的比值称为事件A的频率,即 W(A)=f / n
这里的n 不是所有可能的结果总数,仅是随机试验
(3) 年重现期与次重现期
水文计算中为延长实测样本系列的容量,常在一年中 取多个样本系列,所得重现期为次重现期 排水工程的设计标准常遇T<1年,因而需一年多次取样 设平均每年所取样本为α个,n年所得样本容量 由年频率P(χ≥χi) = m/n 次频率Pˊ(χ≥χi) = m/S=P/ α S=nα,

水文统计基本原理与方法

水文统计基本原理与方法

1 T p
当考虑水库兴利调节,研究枯水问题时,设计频率P>50%,则
1 T 1 p
·对于暴雨洪水(防洪,设计频率 P≤50%)
T
1 1 (年) P P ( x p )
三峡:P=0.01%,Q0.01%=91100m3 /s,指平均每 10000 年遇到
91100 m3 /s 的洪水 1 次洪峰流量

4-5 理论频率曲线
2、皮尔逊Ⅲ型分布
(2)皮尔逊Ⅲ型累积频率P的查算
水文计算中,一般需要求出指定频率P所相应的随机变量取 值xp,也就是通过对密度曲线进行积分:
1 x a P Px x p x a e dx 0 x
(2)连续型随机变量 若某随机变量可以取得一个有限或无限区间内的任何数值,则 成为连续型随机变量。
4-3 随机变量及其概率分布
1、随机变量
(3)总体与样本 在数理统计中,把研究对象的个体集合成为总体。 从总体中随机抽取n个个体成为总体的一个随机样本,简称样 本。
4-3 随机变量及其概率分布
4-2 概率的基本概念和定理
1、事件
在概率论中,对随机现象的测验叫做随机试验,随机试验的结 果称为事件。事件可以分为必然事件、不可能事件和随机事件 三种。
2、概率
随机事件的概率计算公式:
P ( A) k n
式中:P(A)―在一定的条件组合下,出现随机事件A的概率 ; k― 有利于随机事件A的结果数 ; n― 在试验中所有可能出现的结果。
4-3 随机变量及其概率分布
2、随机变量的概率分布
F(x)=P(X≥x) 代表随机变量X大于等于某一取值x的概率。
在数学上称此曲线为分 布曲线,水文统计中常 称分布曲线为随机变量 的累积频率曲线,简称 频率曲线。

第四章 水文统计基础知识

第四章 水文统计基础知识
x 线纵坐标值 的计算公式,即频率曲线的方程式(分布函数)为: P
xP (Cv 1)x KP x
x 式中, P——频率为 P 的随机变量;
——离均系数,


KP 1 Cv

xP x Cv x
, x这P 是x频 率f (
PP,C和s )偏差
系数 Cs 的函数,为了便于实际应用,制成离均系数 值表,可供查
重现期 20年一遇 50年一遇 100年一遇 1000年一遇 10000年一遇
洪水流量(m3/s) 72300 79000 83700 98800 113000
第二节 统计参数的估计
一、总体与样本
总体,总体的容量 样本,样本容量
二、统计参数的估计
累积频率曲线的 三个统计参数:
1.矩法简介
均值 变差系数 偏态系数
n
Ki2 n
i 1
n 1
Cv较小时,表示系列的离散程度较小,即变量间的变化幅
度较小,频率分布比较集中;反之, 较Cv大时,系列的离散程
度较大,频率分布比较分散。
3、偏态系数 Cs
偏态系数是反映随机变量系列中各随机变量对其均值
对称性的参数。
对于总体 对于样本
n
(xi x)3
Cs
散程度的参数。
x 系列中各随机变量
对其均值
i
的x差称为离差,用
Di 表示,Di xi。 x
n
n
方差是离差的平方和
D2 i
(x,i 可x)以2 用来表示系列总
的离散程度。
i 1
i 1
均方差 表达各随机变量对其均值的平均离散程度。
对于总体 对于样本
n

第四章 水文统计基本原理与方法 工程水文学

第四章 水文统计基本原理与方法 工程水文学

求的安全率称设计频率标准。
§4-2经验累积频率曲线与理论累积 频率曲线
§4-2经验累积频率曲线与理论累积频率曲线
一、频率密度曲线与频率分布曲线
1.频率密度函数与分布函数
水文现象中的变量为连续型随机变量,其累积频率P(x≥xi)、
P(x≤xi)可以用一连续函数F(x)来表示,即P(x≥xi)=F(x), F(x) 称该随机变量的分布函数。
例 4-2 :某城市在不同河流上建有独立运行的两水泵站。 A 泵 站受到洪水淹没破坏的概率为 2%,B泵站破坏的概率为 5%,求 洪水期它们同时遭到破坏的概率有多大?
1 P( AB ) P( A) P( B ) 2% 5% 10000
六、累积频率与重现期
1. 累积频率 1)定义:一定范围内,水文特征值出现的总可能性即累积频率。 (累积频率可以预测多个水文特征值未来发生的概率。)
2、安全率:建筑物保持正常运转的可能性大小(即概率)称
为安全率,其值为1-P。
3、保证率:建筑物在n年内保持安全运转的可能性大小称之为 保证率,由概率的乘法定理,保证率为(1-P)n。 4、风险率:n年内安全运转遭到破坏的可能性的大小则称之为 风险率,为1-(1-P)n。 5、设计频率标准:国家根据工程的重要性和建筑物等级制定 的建筑物允许破坏率或要求的安全率。这一允许的破坏率或要
均系数表。后经雷布京等人的修正,成为专用水文计算表。
1961年中国科学院水文研究所又对此离均系数ФP计算表进行 修正扩展,加密点据,将ФP值补充到Cs=6.4。 x K p 1 pCv;xP KP x 理论累计频率曲线的坐标值:令 K
xP x(1 P Cv )
P与 xP一一对应。以x为纵坐标,P为横坐标,可绘出一条P~

水文统计知识点总结

水文统计知识点总结

水文统计知识点总结一、水文统计学的基本概念1. 水文变量:水文变量是指用以描述水文过程的各种物理量或指标,如降水量、径流量、蒸发量、地下水位等。

2. 水文数据:水文数据是对水文变量进行观测测量所得到的数据,包括观测数据、统计数据和模拟数据等。

3. 概率分布:概率分布是描述随机变量的取值与其概率之间关系的数学函数。

在水文统计学中,常见的概率分布包括正态分布、指数分布、伽马分布、威布尔分布等。

4. 参数估计:参数估计是通过样本数据推断总体参数的过程。

在水文统计学中,常用的参数估计方法包括最大似然估计法、矩估计法、贝叶斯估计法等。

5. 假设检验:假设检验是用来检验统计推断的结论是否成立的一种方法。

在水文统计学中,常用的假设检验方法包括t检验、F检验、χ²检验等。

6. 置信区间:置信区间是对参数估计结果的可信程度进行界定的一种区间估计方法。

在水文统计学中,常用的置信区间估计方法包括Z检验法、t检验法、Bootstrap法等。

二、水文数据的统计描述和分析1. 数据的收集和整理:水文数据的收集包括实地观测和监测站点数据的获取、卫星遥感数据的获取等。

数据的整理包括数据的输入、存储、清洗、筛选等工作。

2. 数据的描述统计分析:通过对水文数据进行描述统计分析,可以得到数据的中心趋势、离散程度、分布形状等信息,包括均值、方差、标准差、偏度、峰度等统计指标。

3. 数据的频率分布分析:频率分布分析是通过概率分布函数对水文数据进行描述和分析,包括经验频率分布、经验概率密度函数、经验累积分布函数等。

4. 数据的极值分析:极值分析是通过极值理论对水文数据的极值情况进行分析,包括极大值和极小值的分布、频率和概率等。

5. 数据的趋势分析:趋势分析是对水文数据的长期变化趋势进行分析,包括线性趋势、非线性趋势、周期性趋势等。

6. 数据的变异分析:变异分析是对水文数据的空间和时间变异特征进行分析,包括空间变异、时间变异、季节性变异等。

第四章 水文统计的基本知识

第四章  水文统计的基本知识

实例 某地区位于甲、乙二河的汇合点,当任 某地区位于甲、乙二河的汇合点, 一河流泛滥时,该地区就会被淹没。 一河流泛滥时,该地区就会被淹没。设在某个 时期内,甲河泛滥的概率P =0.1; 时期内,甲河泛滥的概率P(A)=0.1;乙河泛 滥的概率P =0.2;又知当甲河泛滥时, 滥的概率P(B)=0.2;又知当甲河泛滥时, 乙河泛滥的概率P B/A)=0.3。 乙河泛滥的概率P(B/A)=0.3。求这个时期 内该地区被淹没的概率。又当乙河泛滥时, 内该地区被淹没的概率。又当乙河泛滥时,甲 河泛滥的概率是多少? 河泛滥的概率是多少? 事件相容且不独立, 解:因A、B事件相容且不独立,故该地区被淹 没的概率为: 没的概率为:
非互斥事件: 互斥事件: P(A+B)= P(A)+ P(B)-P(AB) A+B) P( P( AB) 2、概率乘法定理 对于两个独立事件, 对于两个独立事件,该两项事件同时 发生的概率等于这两个事件概率的乘积, 发生的概率等于这两个事件概率的乘积, AB)=P( 即: P(AB)=P(A)·P(B) 不独立事件: AB) P( B/A) 不独立事件: P(AB)= P(A)P(B/A) P(AB)= P(B)P(A/B) AB) P( A/B) 式中,P(B/A)——事件B在事件A已发生 式中, B/A)——事件 在事件A 事件B 情况下的概率,简称为B的条件概率。 情况下的概率,简称为B的条件概率。
( )
( )
( )
( )
本节小结
一、事件的分类 二、概率、频率及二者的区别和联系 概率、 三、概率的加法定理和乘法定理
§4—3 随机变量及其概率分布
一、随机变量 1、定义:随试验结果而发生变化的量。 定义:随试验结果而发生变化的量。 总体:某种随机变量所取数值的全体。 总体:某种随机变量所取数值的全体。 样本: 样本:从总体中不带主观成分任意抽取的 一部分。 一部分。 样本容量:样本所包含的项数。 样本容量:样本所包含的项数。 水文现象中的随机变量, 水文现象中的随机变量,一般是指某 水文特征值,如某站的年降水量等。 种水文特征值,如某站的年降水量等。 它们的总体通常是无限的, 它们的总体通常是无限的,而样本则 是指有限期间的实测水文数列。 是指有限期间的实测水文数列。

工程水文学第四章 水文统计基本方法 共63页

工程水文学第四章 水文统计基本方法 共63页

第二节 概率的基本概念 一、事件 指在一定条件组合下,随机试验的结果。 分为:必然事件、不可能事件、随机事件。 水文测验可看作随机试验。
二、概率 反映随机事件出现的可能性大小的数量标准:
三、频率
P( A) k n
对于水文现象,用频率作为概率的近似值:
w( A) m n
第三节 随机变量及其概率分布
Cs
i 1
(
n

3)C
3 v
二பைடு நூலகம்权函数法
马秀峰(1984)提出。
三、抽样误差 由随机抽样引起的误差,称为抽样误差。 以均值为例;抽样误差定义为:
xixix总(i1 ,2, ,k)
样本均值是随机变量,抽样误差也为随机变量。抽 样误差近似服从正态分布。
可以证明,xi(i1,2,,k) 系列的均方差 x
样本系列统计参数计算(P.40)
(xi-x)2 (xi-x)3
Ki
Ki-1
10000 1000000 1.5
0.5
0
0
1
0
225
-3375 0.925 -0.075
1225
-42875 0.825 -0.175
2500 -125000 0.75 -0.25
2790
165750
52.8
0.264102 1.12
用有限的样本观测资料估计总体分布线型中的参 数,如P—Ⅲ型的 x 、CV、CS 。
一、矩法 用样本矩估计总体矩,并通过矩与参数之间的关 系,来估计频率曲线的参数。
⒈ 均值x 无偏估计:
⒉ CV的无偏估计量:
n
(Ki 1)2
Cv
i 1
n 1
⒊ CS 的无偏估计量:

第四章 水文统计的基本方法

第四章    水文统计的基本方法

P(X=k)=Cknpk(1-p)n-k (1称X服从参数n、p的二项分布。可计算A出现K次的概率。 服从参数n 的二项分布。可计算A出现K次的概率。 (3)泊松分布(Poission分布) 泊松分布(Poission分布) 分布 当n→∞,p<<0.01时,令np=λ,则二项分布的极限分布为: p<<0.01时 np=λ 二项分布的极限分布为: P(X=k)= λke-λ/k! 称二项分布的极限分布为泊松分布。 称二项分布的极限分布为泊松分布。 2 连续型随机变量的概率分布 定义:F(x)=P(X≤ 定义:F(x)=P(X≤x)=∫x-∞f(x)dx 式中, F(X)为随机变量X的概率分布;f(x)为随机变量X 式中,称F(X)为随机变量X的概率分布;f(x)为随机变量X的概 为随机变量 为随机变量 率密度函数( function)。 率密度函数(probability density function)。 (1)几种常用的连续分布函数 均匀分布( U(a,b)) a. 均匀分布(X~U(a,b))
AυB
A∩B
A B
A-B
A
A

概率
随机事件A出现的可能性大小,称为事件A 随机事件A出现的可能性大小,称为事件A发生的概率 P(A)=m/n {4{4-1)
式中, P(A)——A的概率; m——事件A出现的次数;n——所有试验次数。 事件A 所有试验次数。 式中, P(A) A的概率; 事件 出现的次数; 所有试验次数 上式只适合古典随机试验,即试验的所有可能结果都是等可能的。事实上, 上式只适合古典随机试验,即试验的所有可能结果都是等可能的。事实上, 水文事件不具备这种性质。为了计算随机水文事件的概率,下面给出频率。 水文事件不具备这种性质。为了计算随Z限 V兴 Z死 V死 V V防洪

第4章 水文统计的基本知识及方法

第4章 水文统计的基本知识及方法
Cv = σ σ = E (X ) x
离差系数表示分布函数的相对离散程度;Cv越大,分布函 离差系数表示分布函数的相对离散程度;Cv越大, 越大 数越分散,反之亦然。 数越分散,反之亦然。
17/60
图4-8
例1:若系列1为5,10,15和系列2为1,10,19;计算均方差并比较 若系列1 10,15和系列 和系列2 10,19; 它们的离散程度。 它们的离散程度。 答案1 答案1:σ1=4.08和σ2=7.35 4.08和 例2:若序列1为5,10,15和序列2为995,1000,1005;计算变差系 10,15和序列 和序列2 995,1000,1005; 若序列1 数并比较它们的离散程度。 数并比较它们的离散程度。 答案2 答案2:EX1=10,σ1=4.08,Cv1=0.408和EX2=1000, 10, 4.08, =0.408和 1000, σ2=4.08,Cv2=0.00408 4.08,
《工程水文学》 工程水文学》
1/60
第4章 水文统计的基本知识及方法
4.1 概述 4.2 概率的基本概念 4.3 随机变量及其概率分布 4.4 统计参数估算 4.5 现行水文频率计算方法——适线法 现行水文频率计算方法—— ——适线法 4.6 相关分析
2/60
4.1 概述
水文现象 水文现象受多种因素影响,具有随机性,故为随机现象。 水文现象受多种因素影响,具有随机性,故为随机现象。 譬如: 譬如: • 同一距离用同一皮尺测多次,所得的结果彼此有差异; 同一距离用同一皮尺测多次,所得的结果彼此有差异; • 给定相同的降雨强度和降雨时间,在同一块场地上进行多次 给定相同的降雨强度和降雨时间, 人工降雨实验,每次所得结果彼此不同; 人工降雨实验,每次所得结果彼此不同; • 某水文站年平均流量每年都不相同。 某水文站年平均流量每年都不相同。 上述例子说明,在基本条件保持不变的情况下, 上述例子说明,在基本条件保持不变的情况下,多次试验 会获得不一致的结果。其原因是除主要条件外, 会获得不一致的结果。其原因是除主要条件外,还有许多次要 因素作用。 因素作用。 随机性规律需要用大量资料加以统计, 随机性规律需要用大量资料加以统计,以得到统计规律及 相应的数字特征,常采用概率论 数理统计进行研究 概率论和 进行研究。 相应的数字特征,常采用概率论和数理统计进行研究。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p
(x a0)
dx
上式直接积分是非常繁杂的。为便于在工作中运用,因此水
文上制作专用的离均系数Φ值表,以供查算。
25/60
若令
x x = ,则 xCV
x = x (1 或Cv)

dx = xCvd
式中,Φ是均值为零、方差1的标准化变量,称为离均系数。
于是,对于频率p,则有:
p( >
其概率分布曲线如p.80 所示,也称作水文频率曲线或累 积频率曲线。
图4-4
10/60
4.3.3 随机变量的分布(统计) 参数
一方面,虽然随机变量的概率分布能完整地描述其统计变 化规律,实际上,有时仅需要知道它的统计参数(数字特 征)就足够了。 另一方面,随机变量的统计参数分为总体统计参数和样本 统计参数,而水文随机变量的总体始终是未知的,所以只
4.3.1 随机变量 概念:指随机试验结果发生变化的变量,分为离散型的和连 续型的随机变量两类。水文统计研究的对象是水文随机变量。 连续型随机变量
自记水位过程—— Z(t)~t
自记雨量过程—— P(t)~t
C
A
B
7/60
离散型随机变量
年降雨量
X={x1},X={x2},…,X={xn-1}, X={xn}
xp = x(变为 Cv P=
KP,式中 x KP与p
ቤተ መጻሕፍቲ ባይዱ
和Cs有关,可查p.295 附表3。假如有了p和xp的一组对应 值,即可绘制理论频率分布曲线。
27/60
4.4 统计参数估算
上述各种频率曲线都含有未知的分布参数。要推求某一指定
频率P的随机变量取值XP,就必须确定这些未知分布参数。
同时,前面给出了随机变量X的总体统计参数估计方法。事实
p
)=
f (,C )d
s
p

上式包含Cs、p与Φp的关系。根据不同的Cs值,通过积分 求出p与Φp之间的关系,可制成专用的Φ值表,供查值计算 之用,见p.293 附表2 所示。 如:给定P和Cs值,从Ф值表查得ФP,再将已知的均值和Cv p即 ) 可求出相应的xP值。类似地,取不同 代入 xp = x(1中, Cv 的p值,得到一系列的xp,便可绘制出理论频率曲线。
能用样本统计参数来估计总体的统计参数。
水文水利计算中常用的统计参数包括位置特征参数(平均
数、众数、中位数)和离散特征参数(均值、均方差、变差系
数、偏态系数等)。
11/60
位置特征参数
描述随机变量在数轴上位置的特征数。
平均数—— 随机分布的中心 离散型平均数: 连续型平均数: E(X)=∑ni=1xipi E(X)=∫abx f(x)dx
式中,
称为模比系数或变率。
表明模比系数的均值等于1。利用Ki,能使随机变量数字
特征的表达式中减少一个参数。
14/60
离散特征参数
刻划随机变量分布离散程度的指标。 标准差(均方差) —— 离散型随机变量
= D(X) =
2 (xi E(X)) pi n
i=1
连续型随机变量
=
D(X) =
21/60
(x U)2 1 2 2 e 2
图5-10
2)皮尔逊(Pearson)分布型:包括P-III型分布、对数P-III 型分布、…… P-III型分布—— 英国生物学家皮尔逊研究各种非正态分布 函数曲线时,提出了13种分布曲线类型,其中第III型被引入 水文学中,其概率分布函数为
数并比较它们的离散程度。 答案2:EX1=10,σ1=4.08,Cv1=0.408和EX2=1000, σ2=4.08,Cv2=0.00408
问1:甲地区年降雨量的均值为1200mm,均方差为1=360mm;乙地区年降雨 量的均值为800mm,均方差为1=320mm。试比较甲、乙两地区降水量的分散 程度。
上,水文变量的总体是未知的,只知道一个观测样本系列x1, x2,…,xn(n为样本容量),又如何用有限的样本(时间序 列)估计总体的分布参数呢? 参数估计方法有很多,如矩法、三点法、权函数法、极大似
然法、概率权重矩法等。
28/60
4.4.1 样本估计总体
样本—— 随机水文系列 样本容量—— 样本的项数,即水文系列长度 总体—— 随机变量全体 这里仅介绍用矩法进行P-III型分布的参数估计方法。
f(x) = (x a0) ()
1
e (x a0)
式中, ()为的伽玛函数(gamma);、、a0分别为形状参
数、尺度参数和位置参数。
22/60
P-III型曲线的形状及其特点:一端有限,另一端无限的曲
线;单峰而倒置的铃形;不对称的正偏分布;其位置取决于
参数a0,形状取决于,与Cs有关。、和a0三个参数一经 确定,P-III型密度函数随之确定。P.84 图5-11
众数—— 概率密度分布的峰点值 p.81 Fig.5-5 中位数—— 位置居中的数字 p.81 Fig.5-6
f(x) f(x)
12/60
X1x2x3
X
X1x2x3
X
均值或数学期望值—— x 或 E(x)
离散型随机变量
连续型随机变量
x = E (X ) = p i x
i=1

n
i
x = E (X ) =
4/60
4.2 概率的基本概念
事件:在一定的条件组合下,随机试验的结果。其结果分为
三类:必然事件、不可能事件和随机事件。 概率:随机事件A出现的可能性大小,称为事件A发生的概 率,计算式为
P(A)=m/n
式中,P(A)为事件A的概率;m为事件A出现的次数;n为所 有试验次数。 上式为古典随机试验,满足“随机等可能,独立同分布”。
《工程水文学》
1/60
第4章 水文统计的基本知识及方法
4.1 概述
4.2 概率的基本概念 4.3 随机变量及其概率分布
4.4 统计参数估算
4.5 现行水文频率计算方法——适线法
4.6 相关分析
2/60
4.1 概述
水文现象 水文现象受多种因素影响,具有随机性,故为随机现象。 譬如: • 同一距离用同一皮尺测多次,所得的结果彼此有差异; • 给定相同的降雨强度和降雨时间,在同一块场地上进行多次 人工降雨实验,每次所得结果彼此不同; • 某水文站年平均流量每年都不相同。
上述例子说明,在基本条件保持不变的情况下,多次试验 会获得不一致的结果。其原因是除主要条件外,还有许多次要 因素作用。 随机性规律需要用大量资料加以统计,以得到统计规律及 相应的数字特征,常采用概率论和数理统计进行研究。
3/60
水文统计 将概率论和数理统计理论引入水文学,研究水文现象的统计 变化规律和数字特征的学科被称为水文统计。 基本任务——利用所获得的水文、气象资料,研究和分析随 机水文现象(如河川径流)的统计变化规律,并以此为基础, 对其未来的长期变化作出概率意义下的定量预估,为水利工程 的规划、设计、施工和运行管理提供水文依据。 譬如: • 某流域修建一个水库,其规模取决于水库运行期间(未来 100年)的径流和洪水的大小。但是,未来100年的径流 和洪水有多大?必须做出估计。 • 南水北调工程西线方案中,调多少水量为最优? • 某水电站装机容量和多年平均发电量是多少?等等
其概率分布满足两个条件:0≤pi≤1,且 pi=1
连续型的——用随机变量X大于某值xp的概率p表示, 即 F(X)=P(X≤x)=∫x-≦f(x)dx 或 F(X)=P(X≥xp)=p
密度函数:分布函数导数的负值,记为f(x),即
f(x)=-F’(x)=-dF(x)/dx
9/60
如p.80 所示,则有 F(X)=P(X≥x)=∫xp≦f(x)dx
率曲线),大致可分为正态分布和P-III型分布两种类型。
20/60
1)正态分布型:包括正态分布、对数正态分布、三参数对数 正态分布、……
正态分布—— 概率密度函数,X~N(u,2),其均值u和均方
差完全确定了分布函数的形状。一般地,水文测量误差、抽样
误差服从正态分布。
f(x) =
密度曲线的特点:单峰; 关于均值u对称,即Cs=0; 曲线两端无限,且与x轴渐进; 处出现拐点,曲线与x轴围成 的面积为68.3%;3之间的曲 线与x轴围成的面积为99.7%。


(x E(X)) 2f (x)dx
设有水文随机变量观测序列x1,x2,x3,…,xn, 则均方差为:

15/60
=
i= 1
(x
n
i
x )
2
n
均方差表示分布函数的绝对离散程度;均方差越大,分布 函数越分散,其值变化幅度也越大,反之亦然。
图4-7
16/60
离势系数(离差系数或变差系数)—— Cv
19/60
图5-9
4.3.4 几种常用的概率分布曲线 理论频率曲线:由实测的水文要素样本系列,通过理论频
率分布方程式估算出相应的频率值,再用频率曲线拟合频率
点据所得到的频率曲线。
常用的理论频率分布
从定义 P(X > xp) = x

p
x)dx = p
f
可知:若p
键在于确定随机变量X的概率密度函数f(x)。由于水文随机变 量复杂多变,其概率分布的确定十分困难。 目前,国内外水文计算中经常使用的概率分布曲线(或水文频
26/60
例如:某站年平均径流深系列符合p-Ⅲ型分布,已知该 系列的R=1000mm,σ=162.5mm,Cs=2Cv,计算设计保证 率p=1%的设计年径流量。 解:由Cv=σ/R=162.5/650=0.25,则 Cs=2Cv=0.5,p=1%,查表得Ф=2.68代入 pCv) xp = x(1进行计算,有 R1%=100×(1+2.68×0.25)=1670mm 另外,当Cs/Cv等于一定倍数时,可令模比系数 KP=1+ΦPCv,则
相关文档
最新文档