水文统计基本原理与方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、随机变量
若随机事件的试验结果可用一个数X来表示,X随试验结果的不 同而取得不同的数值,它是带有随机性的,则将这种随机试验 结果X称为随机变量。随机变量可分为两类:即离散型随机变 量和连续型随机变量。 (1)离散型随机变量
若某随机变量只能取得有限个或可列无穷多个离散数值,称为 离散型随机变量。
图4-3
x
4-4 经验频率曲线
5、经验频率曲线存在的问题
经验频率曲线计算工作量小,绘制简单,查用方便,但受 实测资料所限,往往难以满足设计上的需要。为此,提出用
理论频率曲线来配合经验点据,这就是水文频率计算适线
(配线)法 。
4-5 理论频率曲线
1、正态分布
(1)正态分布的频率密度函数式
f x 1 e
x x 2
2 2
2
正态分布的密度曲线与x轴所围成的面积
利用正态分布的概率密度函数,经定积分计算可得,正态分布 的密度曲线与x轴所围成的面积应等于1。
4-5 理论频率曲线
1、正态分布
(2)正态分布曲线在水文中的应用 正态频率曲线在普通 格纸上是一条规则的 S形曲线,它在 P=50%前后的曲线 方向虽然相反,但形 状完全一样,如图 4—5中的①线。水文 计算中常用的一种 “频率格纸”,其横 坐标的分划就是按把 标准正态频率曲线拉 成一条直线的原理计 算出来的,如图4—5 中的②线。
4-5 理论频率曲线
2、皮尔逊Ⅲ型分布
(1)表达式 皮尔逊Ⅲ型曲线是一条一端有限一端无限的不对称单峰、 正偏曲线,数学上常称伽玛分布,其概率密度函数为:
x a0 1 e xa f x
4 Cs
2
0
2 xCv C s
2Cv a0 x 1 C s
某站年雨量概率分布曲线 由图中可知,X=900,相应的P(X x)=0.15,说明 大于900mm降雨的可能性为15%;同理,大于500 mm 降雨的可能性为60%
由概率的加法定理:
随机变量X落在(x ,x+ x) 的概率可用下式表示:
P
P(X x)
P(X>x+ x)
x x+ ห้องสมุดไป่ตู้x
X
P(X x)=P(X > x+x)+P(x+ x > X x) P(x+ x > X x)= P(X x)-P(X > x+x) =F(x)-F(x+ x)
随机性
偶然现象是指事物在发展、变化中可能出现也可能不出现的现 象,偶然现象也称随机现象;偶然现象仍然是有规律的,一般 称为统计规律。
4-1 概述
2、水文统计规律的研究
数学中研究随机现象统计规律的学科称为概率论,而由随机现
象的一部分试验资料去研究总体现象的数字特征和规律的学科
称为数理统计学。 概率论与数理统计学应用到水文分析与计算上则称为水文统 计。
4-5 理论频率曲线
2、皮尔逊Ⅲ型分布
(2)皮尔逊Ⅲ型累积频率P的查算
水文计算中,一般需要求出指定频率P所相应的随机变量取 值xp,也就是通过对密度曲线进行积分:
1 x a P Px x p x a e dx 0 x
4-1 概述
3、水文统计的任务
水文统计的任务就是研究和分析水文随机现象的统计变化特性。 并以此为基础对水文现象未来可能的长期变化作出在概率意义 下的定量预估,以满足工程规划、设计、施工以及运营期间的 需要。 水文统计的基本方法和内容具体有以下三点: (1)根据已有的资料(样本),进行频率计算,推求指定频 率的水文特征值; (2)研究水文现象之间的统计关系,应用这种关系延长、插 补水文特征值和作水文预报; (3)根据误差理论,估计水文计算中的随机误差范围。
以水文变量为纵坐标,以经验频率为横坐标,点绘经验频 率点据,根据点群趋势绘出一条平滑的曲线,称为经验频 率曲线。
x
4-4 经验频率曲线
2、经验频率公式
(1)纯经验频率公式
m P 100% n
P—— x m 的经验频率;m——变量 xi 从大—→小排列的序号 n——观测资料的总项数
x
1 ( x x) D n
x i
2
( x x) n
i
2
4-3 随机变量及其概率分布
3、随机变量的统计参数
(3)变差系数
水文计算中用均方差与均值之比作为衡量系列的相对离散程度 的一个参数,称为变差系数,或称离差系数、离势系数,用Cv 表示。
C
V
x
(k 1)
i
·对于枯水(灌溉、发电、供水等,P≥50%)
1 1 T P ( x p ) 1 P
1 1 例如 P=80%, T 1 80% 20% 5(年)
4. 经验频率曲线绘制
(1)xi由大→小排列,排列序号m表示大小次序,即表 示x≥xi的累积次数 m P (2)计算x≥xi的经验频率: n 1 100% (3)点绘(xi,Pi),绘出经验频率曲线于几率格纸上, 图4-3,绘出一拟合最佳的平滑曲线 (4)推求设计值:P→xp
f (x)——密度函数
两者之间的关系: G ( x) 1 F ( x) *水文更关心的是超过某一个洪水流量, 故用超过制
4-3 随机变量及其概率分布
【例题4—2】
某水文站具有104年实测年降水量资料,现按下列步骤 进行统计分析。
出现次数(年) 序号 (1) 1 2 3 4 5 6 7 8 年降水量区间 (2) 1500~1300.1 1300~1100.1 1100~900.1 900~700.1 700~500.1 500~300.1 300~100.1 合计 组内 (3) 1 1 13 21 39 25 4 104 累积 (4) 1 2 15 36 75 100 104 频率(%) 组内△P (5) 0.95 0.95 12.5 20.2 37.5 24.0 3.9 100.0 累积频率 P (6) 0.95 1.9 14.4 34.6 72.1 96.1 100 组内平均频率密度
2、随机变量的概率分布
(1)概率分布 随机变量可以取所有可能值中的任何一个值,但是取某一可能 值的机会是不同的,有的机会大,有的机会小,随机变量的取 值与其概率有一定的对应关系。一般将这种对应关系称为概率 分布。
X P (X=xi) x1 p1 x2 p2 …… …… xi pi …… ……
4-3 随机变量及其概率分布
4-2 概率的基本概念和定理
1、事件
在概率论中,对随机现象的测验叫做随机试验,随机试验的结 果称为事件。事件可以分为必然事件、不可能事件和随机事件 三种。
2、概率
随机事件的概率计算公式:
P ( A) k n
式中:P(A)―在一定的条件组合下,出现随机事件A的概率 ; k― 有利于随机事件A的结果数 ; n― 在试验中所有可能出现的结果。
2
n
4-3 随机变量及其概率分布
3、随机变量的统计参数
(4)偏态系数 在数理统计中采用偏态系数CS作为衡量系列不对称程度的参数。
( x i x) C
s
3
n
2
(x
n 3
3
x) i
3
C
s
(k i 1)
nCv 3
x
4-4 经验频率曲线
1、定义
对水文样本资料,由大→小排列(超过制),按经验频率公式公 式计算出来的概率。 如 x1,x2,…,xn p1,p2,…,pn (x1,p1)……(xi,pi)
则,降雨量落在900和500mm的可能性为: 60%-15% = 45%
两种不同的统计概念
工程数学(概率论) 1.分布函数不同,小于制(不及制)
G ( x) P( Z x)
水文统计 大于制(超过制)
F ( x) P( Z x)
xp
f ( x)dx
xp
f ( x)d ( x)
(1)均值
x x x 1 x x n n
1 2 n n i 1
i
模比系数
k
i
x
x
i
1 k k k k k 1 n n
1 2 n n i 1 i
4-3 随机变量及其概率分布
3、随机变量的统计参数
(2)均方差
均方差是反映系列中各变量集中或离散的程度。研究系列集中 或离散程度,常采用方差Dx或均方差。
4-4 经验频率曲线
2、经验频率公式
(2)数学期望公式
对于纯经验频率公式,当m=n时,p=100%,即样本的末项就是总
体的最小值,显然不合理。为了由样本比较好的估计总体概率, 我国采用数学期望公式
P
m 100% n 1
x
4-4 经验频率曲线
3、频率与重现期关系
频率与重现期
频率曲线绘制后,就可在频率曲线上求出指定频率p的设计值xp。 由于“频率”较为抽象,水文上常用“重现期”来代替“频率”。
2、随机变量的概率分布
(2)区间概率
对于连续型随机变量来说,由于它的所有可能取值有无限多个, 而取任何个别值的概率为零,因此,只能研究随机变量取值在 某个区间的概率。
4-3 随机变量及其概率分布
2、随机变量的概率分布
(3)概率分布曲线与概率密度曲线
设事件X≥x 的概率用P(X≥x)来表示,它是随随机变量取值x 而变化的,所以P(X≥x)是x的函数,称为随机变量x的分布函 数,记为F(x),即:F(x)=P(X≥x)
工程水文及水利计算
第四章:水文统计基本原理与方法
主要内容
4-1 概述 4-2 概率的基本概念和定理
4-3 随机变量及其概率分布
4-4 经验频率曲线 4-5 理论频率曲线 4-6 皮Ⅲ型分布参数估计方法 4-7 水文频率计算——适线法
4-8 相关分析
4-1 概述
1、水文现象的特性
确定性
必然现象是指事物在发展、变化中必然会出现的现象;水文学 中称水文现象的这种必然性为确定性。
所谓重现期是指某随机变量的取值在长时期内平均多少年出现一 次,又称多少年一遇。如100年一遇,指平均每100年遇到1次, 并非每隔100年一定遇到1次。 根据研究问题的性质不同,频率P与重现期T的关系有两种表示方 法。
x
4-4 经验频率曲线
3、频率与重现期关系
频率与重现期
当为了防洪,研究暴雨洪水问题时,一般设计频率P<50%, 则
1 T p
当考虑水库兴利调节,研究枯水问题时,设计频率P>50%,则
1 T 1 p
·对于暴雨洪水(防洪,设计频率 P≤50%)
T
1 1 (年) P P ( x p )
三峡:P=0.01%,Q0.01%=91100m3 /s,指平均每 10000 年遇到
91100 m3 /s 的洪水 1 次洪峰流量
P (10—4/mm) x
(7) 0.475 0.475 6.250 10.100 18.750 12.000 1.950
4-3 随机变量及其概率分布
【例题4—2】
某水文站具有104年实测年降水量资料,现按下列步骤 进行统计分析。
4-3 随机变量及其概率分布
3、随机变量的统计参数
说明随机变量统计规律的数字特征,称为随机变量的统计参数。 统计参数有总体统计参数与样本统计参数之分。水文计算中常 用的样本统计参数有均值、均方差、变差系数、偏态系数、矩。
4-3 随机变量及其概率分布
2、随机变量的概率分布
F(x)=P(X≥x) 代表随机变量X大于等于某一取值x的概率。
在数学上称此曲线为分 布曲线,水文统计中常 称分布曲线为随机变量 的累积频率曲线,简称 频率曲线。
年降雨量(mm)
900 500
F ( x ) P( X x )
P(X x) 0 0.2 0.4 0.6 0.8 1.0
4-2 概率的基本概念和定理
3、频率
设事件A在n次试验中出现了m次,则称
W ( A) m n
W(A)为事件A在n次试验中出现的频率。
4、概率与频率的关系
概率——度量总体某事件可能出现的机会: P ( A)
m 频率——对样本而:P ( A) n
k N
当 n—→N 时,频率—→概率
4-3 随机变量及其概率分布
(2)连续型随机变量 若某随机变量可以取得一个有限或无限区间内的任何数值,则 成为连续型随机变量。
4-3 随机变量及其概率分布
1、随机变量
(3)总体与样本 在数理统计中,把研究对象的个体集合成为总体。 从总体中随机抽取n个个体成为总体的一个随机样本,简称样 本。
4-3 随机变量及其概率分布
若随机事件的试验结果可用一个数X来表示,X随试验结果的不 同而取得不同的数值,它是带有随机性的,则将这种随机试验 结果X称为随机变量。随机变量可分为两类:即离散型随机变 量和连续型随机变量。 (1)离散型随机变量
若某随机变量只能取得有限个或可列无穷多个离散数值,称为 离散型随机变量。
图4-3
x
4-4 经验频率曲线
5、经验频率曲线存在的问题
经验频率曲线计算工作量小,绘制简单,查用方便,但受 实测资料所限,往往难以满足设计上的需要。为此,提出用
理论频率曲线来配合经验点据,这就是水文频率计算适线
(配线)法 。
4-5 理论频率曲线
1、正态分布
(1)正态分布的频率密度函数式
f x 1 e
x x 2
2 2
2
正态分布的密度曲线与x轴所围成的面积
利用正态分布的概率密度函数,经定积分计算可得,正态分布 的密度曲线与x轴所围成的面积应等于1。
4-5 理论频率曲线
1、正态分布
(2)正态分布曲线在水文中的应用 正态频率曲线在普通 格纸上是一条规则的 S形曲线,它在 P=50%前后的曲线 方向虽然相反,但形 状完全一样,如图 4—5中的①线。水文 计算中常用的一种 “频率格纸”,其横 坐标的分划就是按把 标准正态频率曲线拉 成一条直线的原理计 算出来的,如图4—5 中的②线。
4-5 理论频率曲线
2、皮尔逊Ⅲ型分布
(1)表达式 皮尔逊Ⅲ型曲线是一条一端有限一端无限的不对称单峰、 正偏曲线,数学上常称伽玛分布,其概率密度函数为:
x a0 1 e xa f x
4 Cs
2
0
2 xCv C s
2Cv a0 x 1 C s
某站年雨量概率分布曲线 由图中可知,X=900,相应的P(X x)=0.15,说明 大于900mm降雨的可能性为15%;同理,大于500 mm 降雨的可能性为60%
由概率的加法定理:
随机变量X落在(x ,x+ x) 的概率可用下式表示:
P
P(X x)
P(X>x+ x)
x x+ ห้องสมุดไป่ตู้x
X
P(X x)=P(X > x+x)+P(x+ x > X x) P(x+ x > X x)= P(X x)-P(X > x+x) =F(x)-F(x+ x)
随机性
偶然现象是指事物在发展、变化中可能出现也可能不出现的现 象,偶然现象也称随机现象;偶然现象仍然是有规律的,一般 称为统计规律。
4-1 概述
2、水文统计规律的研究
数学中研究随机现象统计规律的学科称为概率论,而由随机现
象的一部分试验资料去研究总体现象的数字特征和规律的学科
称为数理统计学。 概率论与数理统计学应用到水文分析与计算上则称为水文统 计。
4-5 理论频率曲线
2、皮尔逊Ⅲ型分布
(2)皮尔逊Ⅲ型累积频率P的查算
水文计算中,一般需要求出指定频率P所相应的随机变量取 值xp,也就是通过对密度曲线进行积分:
1 x a P Px x p x a e dx 0 x
4-1 概述
3、水文统计的任务
水文统计的任务就是研究和分析水文随机现象的统计变化特性。 并以此为基础对水文现象未来可能的长期变化作出在概率意义 下的定量预估,以满足工程规划、设计、施工以及运营期间的 需要。 水文统计的基本方法和内容具体有以下三点: (1)根据已有的资料(样本),进行频率计算,推求指定频 率的水文特征值; (2)研究水文现象之间的统计关系,应用这种关系延长、插 补水文特征值和作水文预报; (3)根据误差理论,估计水文计算中的随机误差范围。
以水文变量为纵坐标,以经验频率为横坐标,点绘经验频 率点据,根据点群趋势绘出一条平滑的曲线,称为经验频 率曲线。
x
4-4 经验频率曲线
2、经验频率公式
(1)纯经验频率公式
m P 100% n
P—— x m 的经验频率;m——变量 xi 从大—→小排列的序号 n——观测资料的总项数
x
1 ( x x) D n
x i
2
( x x) n
i
2
4-3 随机变量及其概率分布
3、随机变量的统计参数
(3)变差系数
水文计算中用均方差与均值之比作为衡量系列的相对离散程度 的一个参数,称为变差系数,或称离差系数、离势系数,用Cv 表示。
C
V
x
(k 1)
i
·对于枯水(灌溉、发电、供水等,P≥50%)
1 1 T P ( x p ) 1 P
1 1 例如 P=80%, T 1 80% 20% 5(年)
4. 经验频率曲线绘制
(1)xi由大→小排列,排列序号m表示大小次序,即表 示x≥xi的累积次数 m P (2)计算x≥xi的经验频率: n 1 100% (3)点绘(xi,Pi),绘出经验频率曲线于几率格纸上, 图4-3,绘出一拟合最佳的平滑曲线 (4)推求设计值:P→xp
f (x)——密度函数
两者之间的关系: G ( x) 1 F ( x) *水文更关心的是超过某一个洪水流量, 故用超过制
4-3 随机变量及其概率分布
【例题4—2】
某水文站具有104年实测年降水量资料,现按下列步骤 进行统计分析。
出现次数(年) 序号 (1) 1 2 3 4 5 6 7 8 年降水量区间 (2) 1500~1300.1 1300~1100.1 1100~900.1 900~700.1 700~500.1 500~300.1 300~100.1 合计 组内 (3) 1 1 13 21 39 25 4 104 累积 (4) 1 2 15 36 75 100 104 频率(%) 组内△P (5) 0.95 0.95 12.5 20.2 37.5 24.0 3.9 100.0 累积频率 P (6) 0.95 1.9 14.4 34.6 72.1 96.1 100 组内平均频率密度
2、随机变量的概率分布
(1)概率分布 随机变量可以取所有可能值中的任何一个值,但是取某一可能 值的机会是不同的,有的机会大,有的机会小,随机变量的取 值与其概率有一定的对应关系。一般将这种对应关系称为概率 分布。
X P (X=xi) x1 p1 x2 p2 …… …… xi pi …… ……
4-3 随机变量及其概率分布
4-2 概率的基本概念和定理
1、事件
在概率论中,对随机现象的测验叫做随机试验,随机试验的结 果称为事件。事件可以分为必然事件、不可能事件和随机事件 三种。
2、概率
随机事件的概率计算公式:
P ( A) k n
式中:P(A)―在一定的条件组合下,出现随机事件A的概率 ; k― 有利于随机事件A的结果数 ; n― 在试验中所有可能出现的结果。
2
n
4-3 随机变量及其概率分布
3、随机变量的统计参数
(4)偏态系数 在数理统计中采用偏态系数CS作为衡量系列不对称程度的参数。
( x i x) C
s
3
n
2
(x
n 3
3
x) i
3
C
s
(k i 1)
nCv 3
x
4-4 经验频率曲线
1、定义
对水文样本资料,由大→小排列(超过制),按经验频率公式公 式计算出来的概率。 如 x1,x2,…,xn p1,p2,…,pn (x1,p1)……(xi,pi)
则,降雨量落在900和500mm的可能性为: 60%-15% = 45%
两种不同的统计概念
工程数学(概率论) 1.分布函数不同,小于制(不及制)
G ( x) P( Z x)
水文统计 大于制(超过制)
F ( x) P( Z x)
xp
f ( x)dx
xp
f ( x)d ( x)
(1)均值
x x x 1 x x n n
1 2 n n i 1
i
模比系数
k
i
x
x
i
1 k k k k k 1 n n
1 2 n n i 1 i
4-3 随机变量及其概率分布
3、随机变量的统计参数
(2)均方差
均方差是反映系列中各变量集中或离散的程度。研究系列集中 或离散程度,常采用方差Dx或均方差。
4-4 经验频率曲线
2、经验频率公式
(2)数学期望公式
对于纯经验频率公式,当m=n时,p=100%,即样本的末项就是总
体的最小值,显然不合理。为了由样本比较好的估计总体概率, 我国采用数学期望公式
P
m 100% n 1
x
4-4 经验频率曲线
3、频率与重现期关系
频率与重现期
频率曲线绘制后,就可在频率曲线上求出指定频率p的设计值xp。 由于“频率”较为抽象,水文上常用“重现期”来代替“频率”。
2、随机变量的概率分布
(2)区间概率
对于连续型随机变量来说,由于它的所有可能取值有无限多个, 而取任何个别值的概率为零,因此,只能研究随机变量取值在 某个区间的概率。
4-3 随机变量及其概率分布
2、随机变量的概率分布
(3)概率分布曲线与概率密度曲线
设事件X≥x 的概率用P(X≥x)来表示,它是随随机变量取值x 而变化的,所以P(X≥x)是x的函数,称为随机变量x的分布函 数,记为F(x),即:F(x)=P(X≥x)
工程水文及水利计算
第四章:水文统计基本原理与方法
主要内容
4-1 概述 4-2 概率的基本概念和定理
4-3 随机变量及其概率分布
4-4 经验频率曲线 4-5 理论频率曲线 4-6 皮Ⅲ型分布参数估计方法 4-7 水文频率计算——适线法
4-8 相关分析
4-1 概述
1、水文现象的特性
确定性
必然现象是指事物在发展、变化中必然会出现的现象;水文学 中称水文现象的这种必然性为确定性。
所谓重现期是指某随机变量的取值在长时期内平均多少年出现一 次,又称多少年一遇。如100年一遇,指平均每100年遇到1次, 并非每隔100年一定遇到1次。 根据研究问题的性质不同,频率P与重现期T的关系有两种表示方 法。
x
4-4 经验频率曲线
3、频率与重现期关系
频率与重现期
当为了防洪,研究暴雨洪水问题时,一般设计频率P<50%, 则
1 T p
当考虑水库兴利调节,研究枯水问题时,设计频率P>50%,则
1 T 1 p
·对于暴雨洪水(防洪,设计频率 P≤50%)
T
1 1 (年) P P ( x p )
三峡:P=0.01%,Q0.01%=91100m3 /s,指平均每 10000 年遇到
91100 m3 /s 的洪水 1 次洪峰流量
P (10—4/mm) x
(7) 0.475 0.475 6.250 10.100 18.750 12.000 1.950
4-3 随机变量及其概率分布
【例题4—2】
某水文站具有104年实测年降水量资料,现按下列步骤 进行统计分析。
4-3 随机变量及其概率分布
3、随机变量的统计参数
说明随机变量统计规律的数字特征,称为随机变量的统计参数。 统计参数有总体统计参数与样本统计参数之分。水文计算中常 用的样本统计参数有均值、均方差、变差系数、偏态系数、矩。
4-3 随机变量及其概率分布
2、随机变量的概率分布
F(x)=P(X≥x) 代表随机变量X大于等于某一取值x的概率。
在数学上称此曲线为分 布曲线,水文统计中常 称分布曲线为随机变量 的累积频率曲线,简称 频率曲线。
年降雨量(mm)
900 500
F ( x ) P( X x )
P(X x) 0 0.2 0.4 0.6 0.8 1.0
4-2 概率的基本概念和定理
3、频率
设事件A在n次试验中出现了m次,则称
W ( A) m n
W(A)为事件A在n次试验中出现的频率。
4、概率与频率的关系
概率——度量总体某事件可能出现的机会: P ( A)
m 频率——对样本而:P ( A) n
k N
当 n—→N 时,频率—→概率
4-3 随机变量及其概率分布
(2)连续型随机变量 若某随机变量可以取得一个有限或无限区间内的任何数值,则 成为连续型随机变量。
4-3 随机变量及其概率分布
1、随机变量
(3)总体与样本 在数理统计中,把研究对象的个体集合成为总体。 从总体中随机抽取n个个体成为总体的一个随机样本,简称样 本。
4-3 随机变量及其概率分布