第四章 水文统计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P
( x x ) 中,制成 对应关系表: C P~ s~ P xC V
被积函数含有参数 , Cs ,而 x , C V 包含在
P-III型曲线离均系数 P 值表
P(%) p Cs
0.01
3.72 3.94 4.16
0.1
3.09 3.23 3.38
CV值愈大,分布愈分散; CV 值愈小,分布愈集中。
CV2 CV2> CV1 x
c. 反映对称特征的参数:
E(X x)3 偏态系数(偏差系数) Cs 3
f(x)
偏态系数对密度函数的影响
Cs=0 Cs>0 Cs<0
x
若不对称: CS > 0 , 称为正偏; CS < 0 , 称为负偏。
样本
从总体中不带主观成分任意抽取的一部分,
称为样本。样本所包含的项数,称为样本容量。
如实测的水文资料是有限的,是一样本。
随机变量的表示:
它是指随机试验结果的一个数量。在水文
学中,常用大写字母表示,记作 X, 而随机变
量的可能取的值记作x,即:
X = x1, X = x2, X = xn
众数,记为M0(x)
表示概率密度分布峰点所对应的数。
对于离散型随机变量:
M0(x) 是使概率 P ( =xi )等于 最大时所相应的 x i值。
M0(x) =xi P 离散型随机变量的众数
Pi-1 Pi Pi+1
x
对于连续型随机变量:
M0 (x)是概率密度函数f (x)等于最大时所对应 的 xi 值
一般称之为随机系列或随机数列。
随机变量的分类:
离散型随机变量
随机变量仅取得区间内某些间断的离散值, 则称为离散型随机变量。如洪峰次数,只能取0, 1, 2…,不能取相邻两数值之间的任何值。
连续型随机变量
随机变量可以取得一个有限区间内的任何数 值,则称为连续型随机变量。如某河流断面的流量
可以取0 ~ 极限值之间的任何实数值。
E (xx )
2
(8-6)
值愈大,分布愈分散; 值愈小,分布愈集中。
2 2> 1
x
变差系数(离差系数,离势系数〕
对于均值不同的二个系 列,用均方差来比较其 离散程度就不合适,则 要采用均方差和均值的 比来表示:
f(x)
变差系数对密 度函数的影响
CV1
C V E(x) x
并以x 轴为渐近线;
d.
f (x)
f (x ) dx 1
x x x
2.皮尔逊 Ⅲ 型分布 概率密度函数表达式:
( x a) 1 f ( x ) ( x a ) e 0 ( )
0
式中, ()~ 的伽玛函数,
Γ ( ) x1exdx
4.2.水文中常用的概率分布曲线
1.正态分布
1 f ( x ) e 2
2 ( x x ) 2 2
x
(8-9)
式中, x :平均数; :标准差。
许多随机变量如水文测量误差、抽样误差 等一般服从正态分布。
正态分布曲线的特点: a. 单峰,只有一个众数; b. 对于平均数对称, Cs= 0; c. 曲线二端趋于±∞ ,
属性性质: 直接观测到的现象,如天气的
雨天和晴天,婴儿性别,钱币
的正面和背面 ...
事件可以分为三种类型: 1)必然事件
2)不可能事件
3)随机事件 2.概率
为了比较某随机事件出现(或不出现 ) 的
可能性大小,必然赋予一种量化的(以数量表
示)指标,这个数量指标就是事件的概率。
简单(古典)的随机事件的概率定义用下式表示:
P(X x) 0 0.2 0.4 0.6 0.8 1.0
某站年雨量概率分布曲线 由图中可知, X=900 ,相应的 P(X x)=0.15 ,说明 大于 900mm 降雨的可能性为 15% ;同理,大于 500 mm 降雨的可能性为60%
由概率的加法定理:
随机变量X落在(x ,x+ x) 的概率可用下式表示:
概率密度函数:
平均概率密度:
随机变量落在区间 (x, x+x) 的概率与该区
F (x )F (x x ) x 变量落在区间(x, x+x)平均概率。
间长度的比值
称作随机
当 x 0,取极限得:
F ( x ) F ( x Δ x ) F ( x Δ x ) F ( x ) lim lim Δ x 0 Δ x 0 Δ x Δ x F ( x ) f ( x )
2.随机变量的概率分布
对于离散型随机变量:
随机变量的取某一可能值的机会有的大有的小, 即随机变量取值都有一定的概率与之相对应,可表 示为: P ( X x 1 ) P1
P ( X x 2 ) P2 P ( X x n ) Pn
上式中P1, P2, … Pn 表示随机变量X 取值x1, x2, … xn 所对应的概率。
P
P(X x)
P(X>x+ x)
x x+ x
X
P(X x)=P(X > x+x)+P(x+ x > X x) P(x+ x > X x)= P(X x)-P(X > x+x) =F(x)-F(x+ x)
60%-15% = 45%
(8-1)
则,降雨量落在900和500mm的可能性为:
f(x)
皮尔逊Ⅲ 型概率密度曲线
P
xP
f ( x )dx
a0
x
M0(x) Me(x)
xP
在水文计算中,一般要求出指定概率 P 所相应
的随机变量的取值 xP,即求出的 xP满足下列等式:
( x a ) 1 P P ( X x ) ( x a ) e dx P 0 ( ) x
元素,即为图中的阴影面积; 通过密度函数f(x)可求出随机变量 X 概率分 布函数F(x),其与密度函数f(x) 有如下的数学关
系:
F ( x ) P ( X x ) ( x ) dx f
x
可见,随机变量的二个函数:
f(x) 密度函数,反映随机变量X落入dx 区 间的平均概率; F(x) 分布函数,反映随机变量X超过某 个值 x 的概率。 这两个函数能完整地描述随机变量的分布 规律。
m P ( A) n
式中 ,P(A) :一定条件下随机事件A的概率;
n :试验中所有可能的出现的结果数; m :出现随机事件A的结果数。
古典的随机试验是指所有试验的可能结果 都是等可能的,而且试验的可能结果的总数是 有限的。但水文事件不一定符合这种性质。
ቤተ መጻሕፍቲ ባይዱ
3.频率
对于不是古典概型事件,只能通过多次重复 试验来估计事件的概率。 设事件A在n 次随机试验中出现了m 次,则称:
式中, a, b 分别为随机
变量 X 取值的上下限
1/2 1/2
a
Me(x)
b
x
b. 反映离散特征参数
该参数用以反映随机变量分布离散程度 (相对于 随机变量分布中心即平均值的差距 )的指标,通常有 以下几种:
标准差(均方差) (Standard deviation)
f(x)
1
标准差对密度 函数的影响
P (Xx )
它是x的函数,称作随机变量X 的分布函数, 记作F(x), 即
F(x)=P(Xx)
表示随机变量X 大于或等于值 x 的概率,其 几何曲线称作随机变量的概率分布曲线(水文学 上通常称累计频率曲线,简称频率曲线)。
年降雨量(mm)
900 500
F ( x ) P ( X x )
0 P
按上式计算相当复杂,故实用中,采用标准化变换:
取标准变量(离均系数) ( x x ) , 即 xC V xx ( 1 C V) 代入上式,, , a0以相应的
x , C V 和 C S 关系式表示,简化后得:
P ( ) f( ,C d P s)
一般将这种对应关系称作随机变量的概率分布规 律,简称为分布律。可以用以下的分布图形表示:
P
X
x1 x2 x3 x4 … … xn
离散型随机变量概率分布图
对于连续型随机变量:
由于它的所有可能取值有无限个,而取个别值 的概率为零,故无法研究个别值的概率。水文学上 习惯研究随机变量的取值等于或大于某个值的概率, 表示为:
m W ( A) n
为事件A 在n 次试验中出现的频率。
注意:n 不是所有可能的结果总数,仅是随机
试验的次数。
概率和频率的区别: 概率:
在等可能条件下,表达事件客观上出现的 可能性大小,是一个理论值。
频率:
频率是通过若干次试验后才能求得的经验值, 事先不能确定,当试验次数n愈大,即当n趋于 无穷大时,理论上, n 变成试验中所有可能的 结果总数,则频率愈接近概率。
水文现象具有二重性:
水文现象包含着必然性
物理成因分析法 水文现象也包含着 偶然性 ,对水文的偶然 现象(或称随机现象)所遵循的规律一般称做 统计规律。 概率论和数理统计分析方法
4.1. 随机变量及其分布参数
4.1.1
概率的基本概念与定理
1.事件 :是指随机试验的结果。 事件有两种属性: 数量性质:直接测量的量或计算的量,如 年降雨量,年径流量...
a. 反映位置特征参数
平均数 x / 数学期望
对于离散型随机变量:
x 或
n
i 1
x i pi
E(x)
n
i 1
x i pi
离散型随机变量的平均数是以概率为权重的 加权平均值。
对于连续的随机变量:
E ( x ) f ( x ) dx ( 8 5 ) x
a
b
式中,a、b 分别为随机变量 X 取值的上下 限。 数学期望或平均数代表整个随机变量的总 水平的高低,它为分布的中心。
f(x)
M0(x)
x
连续的随机变量的众数
中位数
,记为Me(x)
把概率密度分布分为二个相等部分的数。
对于离散型的随机变量:
将所有变量的可能取值按大小次序排列,
位置居中的数字。
对于连续的随机变量 中位数满足:
M
e
a
(x)
f ( x ) dx
b
f(x)
1 f ( x ) dx 2 M e(x)
4.1.2. 随机变量及其分布参数
1.随机变量
用以表示随机试验结果的一个数量 ( 事先
是未知的 ) ,由于它事先不能确定,是随机的, 称为随机变量。水文现象中的随机变量,一般 指某个水文特征值 ( 如年径流量、年降雨量、
洪峰流量等)。
统计学中几个概念:
总体
在统计数学中,把某种随机变量所取数值的 全体,称为总体。 如年径流量的总体数是无穷的。
称 f(x)为概率密度函数,简称密度函数。 而密度函数的几何曲线称作密度曲线。
f(x)
密度曲线
f(xi) dx xi
F (x ) f(x ) dx
x
x
F(x)
分布曲线
x
通过密度函数 f(x) 可求出随机变量 X落在 (x ~
x+dx) 区间即 dx 上的概率 = f(x)dx ,称之为概率
3.随机变量统计参数
在实际问题中,随机变量的分布函数不易确
定,或有时不一定需要用完整的形式来说明随机变 量,而只要知道其主要特征就可以。随机变量的分 布函数和密度函数中都包含一些参数(如均值、变 差系数、偏态系数),而这些参数能反映随机变量 分布的特点:如有的分布集中,有的分布分散,有 的分布对称,有的分布非对称,等等。在统计学中 用以表示随机变量这些分布特征的某些数值,称之 为随机变量统计参数。
0
, , a 0:三个参数,它们与三个统计参数 x , cv , cs
有一定的关系,其表达式为:
4 2 c s
2 x c c v s
2 c v a x ( 1 ) 0 c s
可见,当以上三个参数确定后, P-III 型密度函 数亦完全确定。
P-III型曲线的特点:
一端有限另一端无限的不对称单峰正偏曲线
第四章、水文统计学
随机变量及其分布参数 水文中常用的概率分布曲线
统计参数估计方法
相关分析
水文时间序列分析
学习要求: (1)了解概率、随机变量及其概率分布的基本概念; (2)了解水文频率曲线常用的线型,要掌握P-III型分布 曲线和经验频率曲线的性质和计算方法; (3)掌握水文频率计算适线法的具体步骤和方法,特别是 参数对频率曲线的影响; (5)了解相关分析的基本概念和方法,特别要掌握两变量 直线相关、曲线相关的方法和具体步骤; (6)水文过程的随机模拟。
( x x ) 中,制成 对应关系表: C P~ s~ P xC V
被积函数含有参数 , Cs ,而 x , C V 包含在
P-III型曲线离均系数 P 值表
P(%) p Cs
0.01
3.72 3.94 4.16
0.1
3.09 3.23 3.38
CV值愈大,分布愈分散; CV 值愈小,分布愈集中。
CV2 CV2> CV1 x
c. 反映对称特征的参数:
E(X x)3 偏态系数(偏差系数) Cs 3
f(x)
偏态系数对密度函数的影响
Cs=0 Cs>0 Cs<0
x
若不对称: CS > 0 , 称为正偏; CS < 0 , 称为负偏。
样本
从总体中不带主观成分任意抽取的一部分,
称为样本。样本所包含的项数,称为样本容量。
如实测的水文资料是有限的,是一样本。
随机变量的表示:
它是指随机试验结果的一个数量。在水文
学中,常用大写字母表示,记作 X, 而随机变
量的可能取的值记作x,即:
X = x1, X = x2, X = xn
众数,记为M0(x)
表示概率密度分布峰点所对应的数。
对于离散型随机变量:
M0(x) 是使概率 P ( =xi )等于 最大时所相应的 x i值。
M0(x) =xi P 离散型随机变量的众数
Pi-1 Pi Pi+1
x
对于连续型随机变量:
M0 (x)是概率密度函数f (x)等于最大时所对应 的 xi 值
一般称之为随机系列或随机数列。
随机变量的分类:
离散型随机变量
随机变量仅取得区间内某些间断的离散值, 则称为离散型随机变量。如洪峰次数,只能取0, 1, 2…,不能取相邻两数值之间的任何值。
连续型随机变量
随机变量可以取得一个有限区间内的任何数 值,则称为连续型随机变量。如某河流断面的流量
可以取0 ~ 极限值之间的任何实数值。
E (xx )
2
(8-6)
值愈大,分布愈分散; 值愈小,分布愈集中。
2 2> 1
x
变差系数(离差系数,离势系数〕
对于均值不同的二个系 列,用均方差来比较其 离散程度就不合适,则 要采用均方差和均值的 比来表示:
f(x)
变差系数对密 度函数的影响
CV1
C V E(x) x
并以x 轴为渐近线;
d.
f (x)
f (x ) dx 1
x x x
2.皮尔逊 Ⅲ 型分布 概率密度函数表达式:
( x a) 1 f ( x ) ( x a ) e 0 ( )
0
式中, ()~ 的伽玛函数,
Γ ( ) x1exdx
4.2.水文中常用的概率分布曲线
1.正态分布
1 f ( x ) e 2
2 ( x x ) 2 2
x
(8-9)
式中, x :平均数; :标准差。
许多随机变量如水文测量误差、抽样误差 等一般服从正态分布。
正态分布曲线的特点: a. 单峰,只有一个众数; b. 对于平均数对称, Cs= 0; c. 曲线二端趋于±∞ ,
属性性质: 直接观测到的现象,如天气的
雨天和晴天,婴儿性别,钱币
的正面和背面 ...
事件可以分为三种类型: 1)必然事件
2)不可能事件
3)随机事件 2.概率
为了比较某随机事件出现(或不出现 ) 的
可能性大小,必然赋予一种量化的(以数量表
示)指标,这个数量指标就是事件的概率。
简单(古典)的随机事件的概率定义用下式表示:
P(X x) 0 0.2 0.4 0.6 0.8 1.0
某站年雨量概率分布曲线 由图中可知, X=900 ,相应的 P(X x)=0.15 ,说明 大于 900mm 降雨的可能性为 15% ;同理,大于 500 mm 降雨的可能性为60%
由概率的加法定理:
随机变量X落在(x ,x+ x) 的概率可用下式表示:
概率密度函数:
平均概率密度:
随机变量落在区间 (x, x+x) 的概率与该区
F (x )F (x x ) x 变量落在区间(x, x+x)平均概率。
间长度的比值
称作随机
当 x 0,取极限得:
F ( x ) F ( x Δ x ) F ( x Δ x ) F ( x ) lim lim Δ x 0 Δ x 0 Δ x Δ x F ( x ) f ( x )
2.随机变量的概率分布
对于离散型随机变量:
随机变量的取某一可能值的机会有的大有的小, 即随机变量取值都有一定的概率与之相对应,可表 示为: P ( X x 1 ) P1
P ( X x 2 ) P2 P ( X x n ) Pn
上式中P1, P2, … Pn 表示随机变量X 取值x1, x2, … xn 所对应的概率。
P
P(X x)
P(X>x+ x)
x x+ x
X
P(X x)=P(X > x+x)+P(x+ x > X x) P(x+ x > X x)= P(X x)-P(X > x+x) =F(x)-F(x+ x)
60%-15% = 45%
(8-1)
则,降雨量落在900和500mm的可能性为:
f(x)
皮尔逊Ⅲ 型概率密度曲线
P
xP
f ( x )dx
a0
x
M0(x) Me(x)
xP
在水文计算中,一般要求出指定概率 P 所相应
的随机变量的取值 xP,即求出的 xP满足下列等式:
( x a ) 1 P P ( X x ) ( x a ) e dx P 0 ( ) x
元素,即为图中的阴影面积; 通过密度函数f(x)可求出随机变量 X 概率分 布函数F(x),其与密度函数f(x) 有如下的数学关
系:
F ( x ) P ( X x ) ( x ) dx f
x
可见,随机变量的二个函数:
f(x) 密度函数,反映随机变量X落入dx 区 间的平均概率; F(x) 分布函数,反映随机变量X超过某 个值 x 的概率。 这两个函数能完整地描述随机变量的分布 规律。
m P ( A) n
式中 ,P(A) :一定条件下随机事件A的概率;
n :试验中所有可能的出现的结果数; m :出现随机事件A的结果数。
古典的随机试验是指所有试验的可能结果 都是等可能的,而且试验的可能结果的总数是 有限的。但水文事件不一定符合这种性质。
ቤተ መጻሕፍቲ ባይዱ
3.频率
对于不是古典概型事件,只能通过多次重复 试验来估计事件的概率。 设事件A在n 次随机试验中出现了m 次,则称:
式中, a, b 分别为随机
变量 X 取值的上下限
1/2 1/2
a
Me(x)
b
x
b. 反映离散特征参数
该参数用以反映随机变量分布离散程度 (相对于 随机变量分布中心即平均值的差距 )的指标,通常有 以下几种:
标准差(均方差) (Standard deviation)
f(x)
1
标准差对密度 函数的影响
P (Xx )
它是x的函数,称作随机变量X 的分布函数, 记作F(x), 即
F(x)=P(Xx)
表示随机变量X 大于或等于值 x 的概率,其 几何曲线称作随机变量的概率分布曲线(水文学 上通常称累计频率曲线,简称频率曲线)。
年降雨量(mm)
900 500
F ( x ) P ( X x )
0 P
按上式计算相当复杂,故实用中,采用标准化变换:
取标准变量(离均系数) ( x x ) , 即 xC V xx ( 1 C V) 代入上式,, , a0以相应的
x , C V 和 C S 关系式表示,简化后得:
P ( ) f( ,C d P s)
一般将这种对应关系称作随机变量的概率分布规 律,简称为分布律。可以用以下的分布图形表示:
P
X
x1 x2 x3 x4 … … xn
离散型随机变量概率分布图
对于连续型随机变量:
由于它的所有可能取值有无限个,而取个别值 的概率为零,故无法研究个别值的概率。水文学上 习惯研究随机变量的取值等于或大于某个值的概率, 表示为:
m W ( A) n
为事件A 在n 次试验中出现的频率。
注意:n 不是所有可能的结果总数,仅是随机
试验的次数。
概率和频率的区别: 概率:
在等可能条件下,表达事件客观上出现的 可能性大小,是一个理论值。
频率:
频率是通过若干次试验后才能求得的经验值, 事先不能确定,当试验次数n愈大,即当n趋于 无穷大时,理论上, n 变成试验中所有可能的 结果总数,则频率愈接近概率。
水文现象具有二重性:
水文现象包含着必然性
物理成因分析法 水文现象也包含着 偶然性 ,对水文的偶然 现象(或称随机现象)所遵循的规律一般称做 统计规律。 概率论和数理统计分析方法
4.1. 随机变量及其分布参数
4.1.1
概率的基本概念与定理
1.事件 :是指随机试验的结果。 事件有两种属性: 数量性质:直接测量的量或计算的量,如 年降雨量,年径流量...
a. 反映位置特征参数
平均数 x / 数学期望
对于离散型随机变量:
x 或
n
i 1
x i pi
E(x)
n
i 1
x i pi
离散型随机变量的平均数是以概率为权重的 加权平均值。
对于连续的随机变量:
E ( x ) f ( x ) dx ( 8 5 ) x
a
b
式中,a、b 分别为随机变量 X 取值的上下 限。 数学期望或平均数代表整个随机变量的总 水平的高低,它为分布的中心。
f(x)
M0(x)
x
连续的随机变量的众数
中位数
,记为Me(x)
把概率密度分布分为二个相等部分的数。
对于离散型的随机变量:
将所有变量的可能取值按大小次序排列,
位置居中的数字。
对于连续的随机变量 中位数满足:
M
e
a
(x)
f ( x ) dx
b
f(x)
1 f ( x ) dx 2 M e(x)
4.1.2. 随机变量及其分布参数
1.随机变量
用以表示随机试验结果的一个数量 ( 事先
是未知的 ) ,由于它事先不能确定,是随机的, 称为随机变量。水文现象中的随机变量,一般 指某个水文特征值 ( 如年径流量、年降雨量、
洪峰流量等)。
统计学中几个概念:
总体
在统计数学中,把某种随机变量所取数值的 全体,称为总体。 如年径流量的总体数是无穷的。
称 f(x)为概率密度函数,简称密度函数。 而密度函数的几何曲线称作密度曲线。
f(x)
密度曲线
f(xi) dx xi
F (x ) f(x ) dx
x
x
F(x)
分布曲线
x
通过密度函数 f(x) 可求出随机变量 X落在 (x ~
x+dx) 区间即 dx 上的概率 = f(x)dx ,称之为概率
3.随机变量统计参数
在实际问题中,随机变量的分布函数不易确
定,或有时不一定需要用完整的形式来说明随机变 量,而只要知道其主要特征就可以。随机变量的分 布函数和密度函数中都包含一些参数(如均值、变 差系数、偏态系数),而这些参数能反映随机变量 分布的特点:如有的分布集中,有的分布分散,有 的分布对称,有的分布非对称,等等。在统计学中 用以表示随机变量这些分布特征的某些数值,称之 为随机变量统计参数。
0
, , a 0:三个参数,它们与三个统计参数 x , cv , cs
有一定的关系,其表达式为:
4 2 c s
2 x c c v s
2 c v a x ( 1 ) 0 c s
可见,当以上三个参数确定后, P-III 型密度函 数亦完全确定。
P-III型曲线的特点:
一端有限另一端无限的不对称单峰正偏曲线
第四章、水文统计学
随机变量及其分布参数 水文中常用的概率分布曲线
统计参数估计方法
相关分析
水文时间序列分析
学习要求: (1)了解概率、随机变量及其概率分布的基本概念; (2)了解水文频率曲线常用的线型,要掌握P-III型分布 曲线和经验频率曲线的性质和计算方法; (3)掌握水文频率计算适线法的具体步骤和方法,特别是 参数对频率曲线的影响; (5)了解相关分析的基本概念和方法,特别要掌握两变量 直线相关、曲线相关的方法和具体步骤; (6)水文过程的随机模拟。