3第三章 水文统计
合集下载
水文学(第三章)
36
二、随机变量的统计参数
说明随机变量数值大小、变化幅度、对称程度
等统计规律的数量特征值,称为随机变量的统计参
数。 统计参数有总体统计参数与样本统计参数之 分。水文计算中常用的样本统计参数有均值、均方 差、变差系数和偏态系数。
37
(一) 均值( )
表示系列中随机变量的平均情况。 1.加权平均法:
布莱士· 帕斯卡(1623年6月19日-1662年8月19日) ,法 国数学家、物理学家、思想家,散文大师,神学家。
费马是法国数学家,议会议 员,真正的事业是学术,尤其 是数学,他生前极少发表自己 的论著,连一部完整的著作也 没有出版。他发表的一些文章 ,也总是隐姓埋名。 他是解析几何的发明者之 一;对于微积分诞生的贡献仅 次于牛顿、莱布尼茨,概率论 的主要创始人,以及独承17世 纪数论天地的人 ,业余数学家 之王。
水文中习惯以纵坐标表示变量x ,横坐标表示概率密
度函数值f(x) ,这样绘制的几何曲线称密度曲线。 27
28
4. 分布函数
设事件X≥xi 的概率用P(X≥xi)来表示,它是随 随机变量取值xi而变化的,所以p(X≥xi)是xi的函 数,称为随机变量xi的分布函数,记为F(x),即:
它代表随机变量X大于等于某一取值x的概率。 其几何图形如下图(b)所示, 图中纵坐标表示变 量x,横坐标表示概率分布函数值F(x),在数学
32
---- 不及制累积概率
当研究事件X ≤xi 的概率时,数理统计学中 常用分布函数G(xi)表示:
称不及制累积概率形式,
---- 超过制累积概率 相应的水文统计用的分布函数F(x)称为 超过制累积概率形式,两者之间有如下关系:
33
2.重现期(T):指随机事件平均的重现时间 间隔。在水文学上指等于及大于(或等于及小 于)一定量级的水文要素值出现一次的平均间 隔年数,以该量级频率的倒数计。
第三章 水文统计方法
四、频率
设事件A在n次试验中出现了m次,则称为事件A在n次试验中
出现的频率。 W(A)=m/n 当试验次数n不大时,事件频率很不稳定,具有随机性; 当试验次数n足够大时,事件频率与概率之差会达到任意小的 程度。
五. 累计频率(P):等量和超量值的频率之和(累计)。
某桥位处测得40年最高水位资料如下表,求水位
0
225 1225 2500
0
-3375 -42875 -125000
1
0.925 0.825 0.75
0
-0.075 -0.175 -0.25
0
-0.00042187 -0.00535938 -0.015625
均值
均方差 变差系数 偏态系数
200
2790
52.8 0.264102
165750
0.10359375
≥25m时的累积频率。
解:当水位H=25m时,W=25% H=30m(大于25m)时, W=5% P=25%+5%=30% 意义:表明若水位为25m时对桥梁会有威胁,则高于25m的
水位对桥梁都会有威胁,其发生的可能性应为30%。
第三节 随机变量及其概率分布 一、随机变量
随试验结果而发生变化的变量,用 X 表示,取值用 xi 表 示 。例: 水文特征值:年径流、洪峰流量。 随机变量分类:
(1)根据实测水文资料,按从大到小的顺序排列; (2)用经验频率公式计算系列中各项的频率; (3)以水文变量X为纵坐标,以经验频率P为横坐标,
点绘经验频率点据;
(4)根据点群趋势绘出一条平滑的曲线。
例题
年份 ( 1) 1961 年最大洪峰流 量 (2) 720
序号 (3) 1 由大到小排列 (4) 2650 经验频率 ( 5) 9.1
水文学第三章
式中:T-重现期,以年计; P-大于等于某水文变量 XP—事件的频率。
b. 当研究枯水问题 水文上关心的是小于XP的事件出现的频率
及相应的重现期。 重现期指在很长的时期内(N年)出现小于
某水文变量XP事件的平均重现间隔期。若水文 变量大于等于XP的频率为P ,则小于XP事件的 频率应为:1-P,在N年内小于XP事件出现的次 数应为N(1-P),因此其重现期为:
物理成因分析法
水文现象也包含着偶然性(Contingency) , 对水文的偶然现象(或称随机现象)所遵循的 规律一般称做统计规律。
概率论和数理统计分析方法
水文分析计算常用到数理统计的方法
进行流域或地区水资源开发利用,首先要了 解流域内未来的河道的来水量,以合理规划;
进行水利工程规划设计,需弄清未来时期河 流中可能的洪水量及其过程,以确定工程的规模。
生的概率等于各个事件发生的概率总和。
[例]袋中有手感完全相同的20个白球和10个黑球, 问:摸出白或黑求的概率是多少?
P(白)= 20 2 20 10 3
P(黑)= 10 1 20 10 3
P(白或黑)=P(白) P(黑)= 2+1 1 33
[例] 某测站有40年的实测枯水位记录,各种水位出现的频率如表3.1所示,试确定水位 H≥2.0m和H≥2.7m的概率?
某站水位频率计算
表3.1
序号
水位H(m)
频数f(a) 频率W(%) 累积频率P (%)
1
4.0
2
5
5
2
3.5
10
25
30பைடு நூலகம்
3
2.7
16
40
70
4
2.0
9
b. 当研究枯水问题 水文上关心的是小于XP的事件出现的频率
及相应的重现期。 重现期指在很长的时期内(N年)出现小于
某水文变量XP事件的平均重现间隔期。若水文 变量大于等于XP的频率为P ,则小于XP事件的 频率应为:1-P,在N年内小于XP事件出现的次 数应为N(1-P),因此其重现期为:
物理成因分析法
水文现象也包含着偶然性(Contingency) , 对水文的偶然现象(或称随机现象)所遵循的 规律一般称做统计规律。
概率论和数理统计分析方法
水文分析计算常用到数理统计的方法
进行流域或地区水资源开发利用,首先要了 解流域内未来的河道的来水量,以合理规划;
进行水利工程规划设计,需弄清未来时期河 流中可能的洪水量及其过程,以确定工程的规模。
生的概率等于各个事件发生的概率总和。
[例]袋中有手感完全相同的20个白球和10个黑球, 问:摸出白或黑求的概率是多少?
P(白)= 20 2 20 10 3
P(黑)= 10 1 20 10 3
P(白或黑)=P(白) P(黑)= 2+1 1 33
[例] 某测站有40年的实测枯水位记录,各种水位出现的频率如表3.1所示,试确定水位 H≥2.0m和H≥2.7m的概率?
某站水位频率计算
表3.1
序号
水位H(m)
频数f(a) 频率W(%) 累积频率P (%)
1
4.0
2
5
5
2
3.5
10
25
30பைடு நூலகம்
3
2.7
16
40
70
4
2.0
9
第三章 水文统计
Zuo Qiting
Cs
P(%)
0.1 3.09 3.81 4.53 5.23
1 2.33 2.68 3.02 3.33
5 1.64 1.77 1.88 1.95
10 1.28 1.32 1.34 1.33
20 0.84
50
80
90
95
99
0 0.5 1.0 1.5
0.00 -0.84 -1.28 -1.64 -2.33
p( x 3 x x 3 ) 99.7%
x x x
正态曲线
Zuo Qiting
二、皮尔逊- III型 皮尔逊Ⅲ型曲线(见图)为一端有限一端无限的不对称 单峰曲线,概率密度函数
a f ( x) ( x a0 ) a 1 e ( x a ( )
3.1.2 水文统计与数理统计的主要差别
1.分布函数形式不同 统计数学中,分布函数采用不及制累积概率形式。
G( x) p
F ( x) p
两者关系是
( X x)
水文计算中,一般是研究超过某值的概率,采用超过制 累积频率的形式。分布函数为:
( X x)
F ( x) 1 G ( x)
年径流及年降水: Cs=2 Cv
Zuo Qiting
二、无偏估计
无偏估计是参数的样本估计量的期望值等于参数的真实值。 估计量的数学期望等于被估计参数,则称此为无偏估计。
1 1 n x ( x1 x 2 xn) xi n n i 1
n Cv n 1
(k 1)
Zuo Qiting
如何来绘制
在频率计算中,现由已知的Cs查Ф 值表得出不同频 率下P的离均系数Ф P,然后将Ф P及已知的x,Cv带入下式, 即可求得对应于频率P的水文特征值xp。
Cs
P(%)
0.1 3.09 3.81 4.53 5.23
1 2.33 2.68 3.02 3.33
5 1.64 1.77 1.88 1.95
10 1.28 1.32 1.34 1.33
20 0.84
50
80
90
95
99
0 0.5 1.0 1.5
0.00 -0.84 -1.28 -1.64 -2.33
p( x 3 x x 3 ) 99.7%
x x x
正态曲线
Zuo Qiting
二、皮尔逊- III型 皮尔逊Ⅲ型曲线(见图)为一端有限一端无限的不对称 单峰曲线,概率密度函数
a f ( x) ( x a0 ) a 1 e ( x a ( )
3.1.2 水文统计与数理统计的主要差别
1.分布函数形式不同 统计数学中,分布函数采用不及制累积概率形式。
G( x) p
F ( x) p
两者关系是
( X x)
水文计算中,一般是研究超过某值的概率,采用超过制 累积频率的形式。分布函数为:
( X x)
F ( x) 1 G ( x)
年径流及年降水: Cs=2 Cv
Zuo Qiting
二、无偏估计
无偏估计是参数的样本估计量的期望值等于参数的真实值。 估计量的数学期望等于被估计参数,则称此为无偏估计。
1 1 n x ( x1 x 2 xn) xi n n i 1
n Cv n 1
(k 1)
Zuo Qiting
如何来绘制
在频率计算中,现由已知的Cs查Ф 值表得出不同频 率下P的离均系数Ф P,然后将Ф P及已知的x,Cv带入下式, 即可求得对应于频率P的水文特征值xp。
第3章-水文统计原理
1/100
1/100 1/50 1/50
1/100
1/50 1/25 1/25
1/100
1/50 1/25 不作规定
桥涵水文
第三章 水文统计原理
桥梁涵洞按跨径分类:
桥涵分类 特大桥
大桥 中桥 小桥 涵洞
多孔跨径总长L(m) L>1000
100≤L≤1000 30<L<100 8≤L≤30 —
单孔跨径Lk(m) Lk >150
就是许多水文现象具有周期循环变化的性质。水 文现象有着以年或者年际(若干年)为周期变化 的规律。
长江汉口水文站 1954年和1955年 流量过程线
桥涵水文
第三章 水文统计原理
1 周期性 2 地区性
水文现象随地区不同而变化的性质。如:南方 河流与北方河流相比,汛期更早、水量更大;山区 河流暴涨暴落,平原河流涨落缓慢。
连续型随机变量
连续型,可表示大小 和单位,一般都带有 只能用 整数或百分数表示。
水文资料属于连续型随机变量。
桥涵水文
第三章 水文统计原理
(三)几率和频率
表示随机事件客观上出现的可能程度的数值称为
该随机事件的几率(或概率)。
随机事件的几率0≤P(A)≤1。
3 不重复性(偶然性)
不重复性是指水文现象虽然在总体上具有一定 的周期性。但是具体出现的时间和大小并不完全一 致。
桥涵水文
第三章 水文统计原理
水文现象的分析方法
1、成因分析法
通过物理成因的分析以探求水文现象必然性规 律的方法。建立因果之间的函数关系,如:新安 江模型、陕北干旱地区的陕北模型等。
P( x xp) F ( xp)
水文学第三章33683-PPT文档资料
m p 100 % n
当m=n时,p=100%,即样本的末项 xn 是总体中的最小值,显然不符合实际,因为随 着观测年数的增多,总会出现更小的数值。
对上式进行修正,有: 数学期望公式
p m 100 % n1
切哥达也夫公式
m 0 .3 p 100 % n 0 .4
海森公式
m 0 .5 p 100 % n
第五节 频率曲线参数估计 用有限的样本观测资料估计总体分布线 型中的参数,如P—Ⅲ型的 、Cv、 Cs。 x
一、矩法 用样本矩估计总体矩,并通过矩与参数之 间的关系,来估计频率曲线的参数。
1 n 均值 x 的无偏估计: x xi n i 1
Cv的无偏估计量:
n C v n 1
( K 1 ) i
水文上常用“重现期”来代替“频率” 1. 当研究暴雨或洪水时(一般p≤50%)
T 1 P
例如,当某一洪水的频率为p=1%时,则T=100 年,称此洪水为百年一遇洪水,表示大于等于 这样的洪水平均100年会遇到一次。 2. 当研究枯水或年径流时(一般p≥50%)
T1 1 P
例如,对于p=90%的枯水流量,则T=10年,称 此为十年一遇枯水流量,表示小于等于这样的 流量平均10年会遇到一次。
第三章 水文统计基本原理及方法
第一节
概述
第二节 概率的基本概念 一、事件 必然事件、不可能事件、随机事件 二、概率 随机事件出现的可能性大小 三、频率 对于水文现象,用频率作为概率的近似值
第三节 随机变量及其概率分布 一、随机变量 水文特征值:年径流、洪峰流量 离散型随机变量 连续型随机变量:水位、流量 二、随机变量的概率分布 随机变量的取值与其概率的对应关系,称 为随机变量的概率分布。 对于水文变量,研究大于等于某一取值x 的概率,即F(x)
当m=n时,p=100%,即样本的末项 xn 是总体中的最小值,显然不符合实际,因为随 着观测年数的增多,总会出现更小的数值。
对上式进行修正,有: 数学期望公式
p m 100 % n1
切哥达也夫公式
m 0 .3 p 100 % n 0 .4
海森公式
m 0 .5 p 100 % n
第五节 频率曲线参数估计 用有限的样本观测资料估计总体分布线 型中的参数,如P—Ⅲ型的 、Cv、 Cs。 x
一、矩法 用样本矩估计总体矩,并通过矩与参数之 间的关系,来估计频率曲线的参数。
1 n 均值 x 的无偏估计: x xi n i 1
Cv的无偏估计量:
n C v n 1
( K 1 ) i
水文上常用“重现期”来代替“频率” 1. 当研究暴雨或洪水时(一般p≤50%)
T 1 P
例如,当某一洪水的频率为p=1%时,则T=100 年,称此洪水为百年一遇洪水,表示大于等于 这样的洪水平均100年会遇到一次。 2. 当研究枯水或年径流时(一般p≥50%)
T1 1 P
例如,对于p=90%的枯水流量,则T=10年,称 此为十年一遇枯水流量,表示小于等于这样的 流量平均10年会遇到一次。
第三章 水文统计基本原理及方法
第一节
概述
第二节 概率的基本概念 一、事件 必然事件、不可能事件、随机事件 二、概率 随机事件出现的可能性大小 三、频率 对于水文现象,用频率作为概率的近似值
第三节 随机变量及其概率分布 一、随机变量 水文特征值:年径流、洪峰流量 离散型随机变量 连续型随机变量:水位、流量 二、随机变量的概率分布 随机变量的取值与其概率的对应关系,称 为随机变量的概率分布。 对于水文变量,研究大于等于某一取值x 的概率,即F(x)
3 水文统计基本原理与方法
3.2 随机变量的概率分布
3.概率密度函数
F(x)与f(x)的关系式
F ( x) P( X x) f ( x)dx
x
F(x)的几何意义就是表示 位于x轴上边的密度曲线所 包围的面积。 密度函数和分布函数从不同 角度反应了随机变量的概率 分布规律。
频率密度曲线一般为“铃形”。 频率分布曲线通常呈“倒S形”。
式中:F ( x) 为分布函数 F(x)的一阶导数,令 f(x)= F ' ( x) 。
'
3.2 随机变量的概率分布
3.概率密度函数 函数 f(x) 为概率密度函数(密度函数或分布
密度函数)。密度函数f(x)的几何曲线为密度 曲线。通过密度曲线可以很方便地求出随机变 量x落在区间dx上的概率,它等于 f(x) dx。
利用实测流量资料推 求桥涵的设计流量时, 往往需要将频率曲线 的头部外延很远,采 用海森机率格纸,仍 有较大的任意性,同 样会产生很大的误差。 显然,仍不能满足水 文计算的要求,必须 进一步寻求绘制和外 延频率曲线的方法。
3.3 水文经验频率曲线
例:某水文站有22年不连续的年最大流量资料,列于表 2—5第3栏,试绘制该站的经验频率曲线,并目估延长, 推求洪水频率为2%、1%和0.33%的流量。 ①把历年的年最大流量资料,按大小递减次序排列,如表2 -5第5栏; ②采用维泊尔公式计算各项流量的经验频率P,列入表2— 5第6栏。 ③然后,按表中经验频率和流量数值,在海森机率格纸上绘 出经验频率点,如图2—5中的圆点; ④再依点群的趋势描绘成一条圆滑的曲线,如图中的细实线, 就是该水文站的经验频率曲线; ⑤将经验频率曲线向上延长(图2-5中的细虚线),可由图 中直接读出所求洪水频率的流量
工程水文学 第三章 水文统计
离散型随机变量及其概率分布
X P(X=xi)
x1 p1
x2 p2
…… ……
xi pi
…… ……
•
水文学关心随机变量取值大于等于某一定值的概率,即P (X≥xi),而该概率是x的函数 【例3.6】
F ( x ) P ( x xi ) f ( x )dx
xi
• F(X)= P(X≥x) 代表X大于某一取值x的概率,其几何曲线 称为概率分布曲线;如果用实测资料点绘的,水文上称为
【例】 某测站有40年的实测枯水位记录,各种水位出现的频率如表3.2所示,试确 定水位H≥2.0m和H≥2.7m的概率?
某站水位频率计算 序号 1 2 3 4 5 ∑ 水位H(m) 4.0 3.5 2.7 2.0 1.9 — 2 10 16 9 3 40 5 25 40 22.5 7.5 100 表3.2 5 30 70 92.5 100 — 频数f(a) 频率W(%) 累积频率P (%)
s 1 Cv x x
( x x)
i
n 1
用模比系数带入上式有:
Cv
2 ( K 1 ) i
n 1
【例】同上一例,计算得Cv甲=0.005, Cv乙=0.33,甲系列在均值两旁要集中, 离散程度小 【例】见教材p50例3.8 【思考】一条河流上、下游断面的年平均流量的 Cv 值哪个大?为什么?
累积频率曲线。
3.2.4 累积频率和重现期
(1)累积频率和随机变量的关系 • 水文特征值属于连续性随机变量 • 在分析水文系列的概率分布时,不用单个的随机变量(x=xi) 的概率,而是用x≥xi(或者x≤xi )的概率P( x≥xi )(或者P ( x≤xi ))。 • 累计频率指等于或大于(等于或小于)某水文要素出现可能 性的量度。 • 一般在实际应用中,用样本的频率分析曲线代替总体系列的 概率分布。
X P(X=xi)
x1 p1
x2 p2
…… ……
xi pi
…… ……
•
水文学关心随机变量取值大于等于某一定值的概率,即P (X≥xi),而该概率是x的函数 【例3.6】
F ( x ) P ( x xi ) f ( x )dx
xi
• F(X)= P(X≥x) 代表X大于某一取值x的概率,其几何曲线 称为概率分布曲线;如果用实测资料点绘的,水文上称为
【例】 某测站有40年的实测枯水位记录,各种水位出现的频率如表3.2所示,试确 定水位H≥2.0m和H≥2.7m的概率?
某站水位频率计算 序号 1 2 3 4 5 ∑ 水位H(m) 4.0 3.5 2.7 2.0 1.9 — 2 10 16 9 3 40 5 25 40 22.5 7.5 100 表3.2 5 30 70 92.5 100 — 频数f(a) 频率W(%) 累积频率P (%)
s 1 Cv x x
( x x)
i
n 1
用模比系数带入上式有:
Cv
2 ( K 1 ) i
n 1
【例】同上一例,计算得Cv甲=0.005, Cv乙=0.33,甲系列在均值两旁要集中, 离散程度小 【例】见教材p50例3.8 【思考】一条河流上、下游断面的年平均流量的 Cv 值哪个大?为什么?
累积频率曲线。
3.2.4 累积频率和重现期
(1)累积频率和随机变量的关系 • 水文特征值属于连续性随机变量 • 在分析水文系列的概率分布时,不用单个的随机变量(x=xi) 的概率,而是用x≥xi(或者x≤xi )的概率P( x≥xi )(或者P ( x≤xi ))。 • 累计频率指等于或大于(等于或小于)某水文要素出现可能 性的量度。 • 一般在实际应用中,用样本的频率分析曲线代替总体系列的 概率分布。
第3章 水文统计基本原理与方法
4、累计频率与重现期
累计频率
设随机变量 X的样本系列为 X1,X 2 , X 3 ,, X K
其相应频数为 f1 , f 2 , f 3 ,, f k ,且有 X1 X 2 X3 X K ,则等量值或超量值的累积频率为
PX
xm
f1
f2
f3 n
fm
l n
式中:l —— 等量值或超量值的累计频数;
频率 P X xi 为破坏率,则破坏事件 X xi 的重现
期为:
TX
xi
1
PX
xi
重现期
采用年抽样法确定设计枯水位或年最小流量 X i 时,
频率 p X xi 为安全率,1-P X xi 为破坏率,
则破坏事件 X xi 的重现期为:
TX
xi
1
1
PX
xi
例题:
设某水文站年最大洪峰流量的频率 PX xi =5%,
也不同。 因此概率 P(X x) 是 X的一个函数,若记该函数
为:
FX PX x
则 F( X) 称为随机变量 X的概率分布函数,它表示随机 变量 X落在区间[ X,∞) 上的概率。
设随机变量的最小值和最大值分别为 X min 和 X max ,可取
的两任意值为 X1,X 2 X 2 X1 变量X的概率分布函
x2 x1
f xdx
频率密度函数的特点:
随机变量值 x越大或越小,对应的频率密度就越 小,频率密度曲线两端以 x轴为渐近线;
x 系列平均数 附近的频率密度较大;
频率密度曲线中存在一个最大的频率密度值,对 应的随机变量值x0称为众值,即事件( X=x0 )出 现的可能性最大;
频率密度曲线与坐标轴 x围成的面积为 1。
第三章 水文统计基本原理与方法
P( A) m 1 n2
【例3-2】掷两个骰子,计算出现点数的概率。
解:掷两个骰子,可能结果总数为36,有限的。出 现哪一面都是等可能的,故为古典概型。
2
3
B=
P(B) =
4
:
:
12
1
36 2
36
3
P( B=1 ) = 0
36
1
36
3.1.4 频率(frequency)
(概率的统计定义)
设事件A在n次试验中出现了m次,则称
P( x x X x) P( X x) P( X x x) F ( x) F ( x x)
称随机变量X出现在区间[x,x+Δx)的平均概率
F ( x) F ( x x) x
为平均概率密度。
令 Δx → 0
lim F ( x) F ( x x) lim F ( x x) F ( x) F '( x)
x0
x
x0
x
记:
f ( x) F '( x) dF( x) dx
称为概率密度函数,简称密 度函数(density function), 其图形称为密度曲线 (density curve)。
密度函数积分即为分 布函数:
F ( x) P( X x) f ( x)dx
x
(3 5)
分布函数(distribution function)的图形称为分 布曲线(density curve), 水文学中称为频率曲线 (frequency curve)。
事件(X≥x) 的概率用P(X≥x)表示,它是随随机
变量X的取值x而变化的,所以P(X≥x)是x的函数,
称为随机变量X的分布函数(distribution function),
【例3-2】掷两个骰子,计算出现点数的概率。
解:掷两个骰子,可能结果总数为36,有限的。出 现哪一面都是等可能的,故为古典概型。
2
3
B=
P(B) =
4
:
:
12
1
36 2
36
3
P( B=1 ) = 0
36
1
36
3.1.4 频率(frequency)
(概率的统计定义)
设事件A在n次试验中出现了m次,则称
P( x x X x) P( X x) P( X x x) F ( x) F ( x x)
称随机变量X出现在区间[x,x+Δx)的平均概率
F ( x) F ( x x) x
为平均概率密度。
令 Δx → 0
lim F ( x) F ( x x) lim F ( x x) F ( x) F '( x)
x0
x
x0
x
记:
f ( x) F '( x) dF( x) dx
称为概率密度函数,简称密 度函数(density function), 其图形称为密度曲线 (density curve)。
密度函数积分即为分 布函数:
F ( x) P( X x) f ( x)dx
x
(3 5)
分布函数(distribution function)的图形称为分 布曲线(density curve), 水文学中称为频率曲线 (frequency curve)。
事件(X≥x) 的概率用P(X≥x)表示,它是随随机
变量X的取值x而变化的,所以P(X≥x)是x的函数,
称为随机变量X的分布函数(distribution function),
第三章 水文统计方法
第三章 水文统计方法
精品课件
第一节 水文统计的意义
一、水文现象的随机性
水文现象:是指地球上的水受外部作用而产生的永无休止的
运动形式,即降雨,入渗,径流,蒸发等现象的统称。
水文现象的随机性:影响水文现象的因素众多,同时各种因 素本身及其组合在时间上、变化上也是错中复杂的,这使得 水文现象在发生时间和数值上不会完全重复,具有一定的偶 尔性和不确定性特点,即随机性。
精品课件
水文统计任务就是研究和分析水文现象的统计变化,并以 此为基础对水文现象未来可能的长期变化作出在概率意义 下的定量预估。 基本方法和具体的内容有以下三点: (1)根据已有的资料进行频率计算,推求指定频率的水文 特征值。 (2)研究水文现象之间的统计关系,应用这种关系延长、 插补水文特征值和水文预报。 (3)根据误差理论,估计水文计算中的随机误差范围。
⒋ 偏态系数(Cs):反映系列中各变量值在均 值 两边的对称程度。(衡量系列不对称程度 的 参数)
精品课件
样本系列统计参数计算
样本 系列
1
300
2
200
3
185
4
165
5
150
均值 200
均方差
变差系数
偏态系数
(xi-x)2 10000
0 225 1225 2500 2790 52.8 0.264102
对于连续型随机变量,无法研究个别的概率,只
能研究某个区间的概率,或是研究事件X ≥ x的概率(累 计概率),以及事件X ≤ x的概率。(水文统计中常用X ≥ x的概率及其分布)
设事件X ≥ x的概率用P(X≥x)来表示,它是随 机变量x取值而变化的。 P(X≥x)是x的函数,称为随机变 量x的分布函数,记为F(x):
精品课件
第一节 水文统计的意义
一、水文现象的随机性
水文现象:是指地球上的水受外部作用而产生的永无休止的
运动形式,即降雨,入渗,径流,蒸发等现象的统称。
水文现象的随机性:影响水文现象的因素众多,同时各种因 素本身及其组合在时间上、变化上也是错中复杂的,这使得 水文现象在发生时间和数值上不会完全重复,具有一定的偶 尔性和不确定性特点,即随机性。
精品课件
水文统计任务就是研究和分析水文现象的统计变化,并以 此为基础对水文现象未来可能的长期变化作出在概率意义 下的定量预估。 基本方法和具体的内容有以下三点: (1)根据已有的资料进行频率计算,推求指定频率的水文 特征值。 (2)研究水文现象之间的统计关系,应用这种关系延长、 插补水文特征值和水文预报。 (3)根据误差理论,估计水文计算中的随机误差范围。
⒋ 偏态系数(Cs):反映系列中各变量值在均 值 两边的对称程度。(衡量系列不对称程度 的 参数)
精品课件
样本系列统计参数计算
样本 系列
1
300
2
200
3
185
4
165
5
150
均值 200
均方差
变差系数
偏态系数
(xi-x)2 10000
0 225 1225 2500 2790 52.8 0.264102
对于连续型随机变量,无法研究个别的概率,只
能研究某个区间的概率,或是研究事件X ≥ x的概率(累 计概率),以及事件X ≤ x的概率。(水文统计中常用X ≥ x的概率及其分布)
设事件X ≥ x的概率用P(X≥x)来表示,它是随 机变量x取值而变化的。 P(X≥x)是x的函数,称为随机变 量x的分布函数,记为F(x):
水文统计的基本方法
年份
1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973
年降水量
549 702 563 612 760 658 528 802 554 643 592 586 745
年份
1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986
第三章 水文统计的基本方法
第二节 概率、频率、重现期
第二节 概率、频率、重现期
教学内容: 一、概率 二、频率 三、重现期 教学要求:
掌握概率、频率和重现期的概念;掌握频率 和概率的联系和区别;掌握频率和重现期的关系。
第二节 概率、频率、重现期
一 、概率 (一)随机试验与随机事件
1、随机试验
①可以在相同的条件下重复进行; ②每次试验的可能结果不止一个,并且能事先知道实验所
三、重现期
1、定义:所谓重现期,是指某随机事件在长期过程中 平均是多少年比现一次,称为“多少年一遇”,用字 母T表示。
2、根据研究问题的性质不同,频率P与重现期T的关 系有两种表示方法 :
(1)在研究暴雨洪水问题时,一般设计频率P<50%,
则:
T1
(年)
P
式中:T——重现期,年; P——频率,%。
第二节 概率、频率、重现期
第三节 随机变量及其频率分布
上节内容提问
1、频率和概率的区别和联系是什么? 答:区别:概率是抽象数.是个理论值;频率是具体数, 是个经验值。联系:频率随实验次数的增多而逐渐稳 定.并趋近于概率。 2、频率P与重现期T的关系如何? 答:在研究暴雨洪水问题时,T ;1
P
水文学第3章 水文统计的基本原理与方法.
离散型随机变量 X可能取的值 : xi 用 pi 表示 X 取 xi 值的概率,即
P(X xi ) pi (i 1,2......)
离散型随机变量取任何可能值时,其概率都不会是负,即 pi ≥ o (i=1、2、……);
连续型随机变量,因其取某一给定值的概率等于零,在 水文上仅讨论随机变量 X 取大于、等于某 xi 值的发生概率:
3.1.4 频 率(事后)
设事件A在n次试验中出现了m次,则称 在n次试验中出现的频率。
W(A) m n
为事件A
当试验次数足够大时,事件的频率与概率之差可达到任意小的 程度,即频率趋于概率。
3.1.5 总体与样本
事件试验各种可能结果的全体称为 总体。 很多水文现象都是 无限总体。 从总体中随机抽取一部分系列,称抽样,抽取的这部分系 列称为一个 随机样本,简称 样本。 样本系列的长短,即样本中所含的项数的多少,称为 样本 容量 或样本大小。
1901-2100
2
mi
Δ p%
1
. 1/62=1 6%
3
. 2/62=3 2%
组内平均 频率密度
累计 频率
Δ p/Δ x 0.00008 0.00016
Δ p%
. 1/62=1 6% . 3/62=4 8%
1101-1300
18
44
. 18/62=29 1%
0.00145
. 44/62=71 1%
501-700
1
62
1/62=1.6%
0.00008 62/62=100%
年降雨量 Δ x=200mm
2101-2300 1901-2100
1101-1300
501-700
组内出 现次数 mi 1 2
P(X xi ) pi (i 1,2......)
离散型随机变量取任何可能值时,其概率都不会是负,即 pi ≥ o (i=1、2、……);
连续型随机变量,因其取某一给定值的概率等于零,在 水文上仅讨论随机变量 X 取大于、等于某 xi 值的发生概率:
3.1.4 频 率(事后)
设事件A在n次试验中出现了m次,则称 在n次试验中出现的频率。
W(A) m n
为事件A
当试验次数足够大时,事件的频率与概率之差可达到任意小的 程度,即频率趋于概率。
3.1.5 总体与样本
事件试验各种可能结果的全体称为 总体。 很多水文现象都是 无限总体。 从总体中随机抽取一部分系列,称抽样,抽取的这部分系 列称为一个 随机样本,简称 样本。 样本系列的长短,即样本中所含的项数的多少,称为 样本 容量 或样本大小。
1901-2100
2
mi
Δ p%
1
. 1/62=1 6%
3
. 2/62=3 2%
组内平均 频率密度
累计 频率
Δ p/Δ x 0.00008 0.00016
Δ p%
. 1/62=1 6% . 3/62=4 8%
1101-1300
18
44
. 18/62=29 1%
0.00145
. 44/62=71 1%
501-700
1
62
1/62=1.6%
0.00008 62/62=100%
年降雨量 Δ x=200mm
2101-2300 1901-2100
1101-1300
501-700
组内出 现次数 mi 1 2
3第三章 水文统计
相关系数r:是定量表示两种变量之间的密切程 度
r2=1: 变量之间为函数关系 r2=0: 零相关 1>r2>0:相关 r<0:负相关 r>0:正相关 相关系数r多大才算合适?
相关系数的显著性检验
相关系数r多大才能满足要求,取决于样本容 量和精度要求。用相关系数临界值来衡量。
a:显著水平,认为方程有意义时,错误判断可能发 生的概率, a:越小,说明要求越高 ra:临界相关系数 n:自由度 练习查表p74
皮尔逊Ⅲ型曲线
引入参数Φ , Φ值为离均系数
PIII模型变为
例:设某水文站, 求 Q 1000m3 / s, cv 0.5, cs 1 .5, 此理论频率曲线及水文站附近某桥的设计洪峰流量 Q1%和Q 5%。
解:按公式3-31
Qp Q(1 cv p )
P=1%,Cs=1.5,查附录B: P= 3.33
I)研究洪峰流量、洪水位、暴雨等最大值问题时
例如,某洪峰流量Qi的频率为P(Q≥Qi)=l%,那么此 洪峰流量的重现期为100年,则称为平均100年出现一 次大干或等于该洪峰流量Qi的事件.或称为百年一遇。
思考题
百年一遇洪水,是指 [________]。 a、大于等于这样的洪水每隔100年必然会出 现一次; b、大于等于这样的洪水平均100年可能出现 一次; c、小于等于这样的洪水正好每隔100年出现 一次; d、小于等于这样的洪水平均100年可能出现 一次;
三点适线法 通过目估法汇出与经验频率曲线点分布配合较好的理 论曲线,从曲线上选择三点,并据此以选定理论频率 曲线上三个参数
若取三点在同一曲线上,则应符合联立方程:
Q1 Q(1 1cv ) Q2 Q(1 2 cv ) Q3 Q(1 3cv )
水文统计
0 E ( X ) pi 1
0
(2)当k=1时
1 E ( X 1 ) xi1 pi
i 1
n
(2)中心矩
定义:随机变量X对分布中心E(X)的离差的k次幂的数
学期望E[X-E(X)]k,称为X的k阶中心矩,记为
k E[ X E ( X )]
k [ xi E ( X )]k pi
( ) e x x 1dx
如果3个参数确定后,该密度函数即随之确定。
3.4 经验频率曲线
通常把由实测资料(样本)所绘制的频率曲线称为经 验频率曲线。 设水文要素的随机变量(样本系列)X1、X2、… Xn 共有n项,按从大到小的顺序排列,则大于或等于 Xn的数值有 m 次,其频率为m/n。经验频率可按下式 计算
皮尔逊Ⅲ型曲线是一条一端有限一端无限的不对称单峰、正 偏曲线(见图3-3),数学上常称伽玛分布,其概率密度函数为:
1 ( x f ( x) ( x 0 ) e ( )
0
0)
式中:Γ(α)―α的伽玛函数; α、β、a0―分别为皮尔逊Ⅲ型分布的形状尺度和位 置未知参数, α﹥0, β﹥0
X的k阶原点矩,记为
k E[ X ]
k
(4-13)
对离散型随机变量,k阶原点矩为
k E[ X ] xik pi
k i 1
n
(4-14)
对连续型随机变量,k阶原点矩为
k E[ X ] xk f ( x)dx
k
(4-15)
k E[ X k ]
(1)当k=0时
若随机变量X的密度为
1 ( x ) 2 / 2 2 f ( x) e 2
工程水文学_第三章_水文统计
• 随机变量:受随机因素影响,遵循统计规律的变量。通俗 地讲,指在随机试验中测量到的数量。对于水文现象而言, 指某种水文特征值,如某地区流域出口的年径流量和洪峰 流量等。分: – 连续性随机变量,如水位、流量; – 离散性随机变量,如投掷硬币的正反面。
• 总体:随机变量所能取值的全体,分有限和无限总体。
3.3 经验频率曲线 3.3.1 经验频率公式
我国目前采用的数学期望公式为:
m P 100 % n 1
当m=1时,P=1/(n+1)
当T=100a, 则 T=1/P=n+1=100 m—xm在n项观测资料中按递减顺序排列的序号,即在n次 观测试验中大于或等于xm的次数
3.3.2 经验频率曲线的绘制和应用
3.1 水文统计的意义及基本概念 3.1.1 水文统计的意义
• 水文现象具有必然性、偶然性(随机性);
• 利用概率论和数理统计的理论和方法,研究和分析水文的 随机现象(已经观测到的水文现象),找出水文现象的统 计规律性; • 以此为基础,对水文现象未来可能的长期变化做出概率意
义下的定量预估,以满足工程规划、设计、施工以及运营
期间的需要。
3.1.2 事件
• 随机试验:对随机现象的观测 • 事件:随机试验的结果。包括: 1)必然事件:在一定能够的条件组合下,必然会发生的
事情。
2)不可能是件:在一定的条件组合下,一定不可能发生 的事情。
3)随机事件:在一定的条件组合下,可能发生也可能不
发生的事件。
3.1.3 总体、样本、样本容量
设计最大流量: Cv<0.5 Cs=(3~4) Cv
Cv>0.5 Cs=(2~3) Cv
年径流及年降水: Cs=2 Cv
• 总体:随机变量所能取值的全体,分有限和无限总体。
3.3 经验频率曲线 3.3.1 经验频率公式
我国目前采用的数学期望公式为:
m P 100 % n 1
当m=1时,P=1/(n+1)
当T=100a, 则 T=1/P=n+1=100 m—xm在n项观测资料中按递减顺序排列的序号,即在n次 观测试验中大于或等于xm的次数
3.3.2 经验频率曲线的绘制和应用
3.1 水文统计的意义及基本概念 3.1.1 水文统计的意义
• 水文现象具有必然性、偶然性(随机性);
• 利用概率论和数理统计的理论和方法,研究和分析水文的 随机现象(已经观测到的水文现象),找出水文现象的统 计规律性; • 以此为基础,对水文现象未来可能的长期变化做出概率意
义下的定量预估,以满足工程规划、设计、施工以及运营
期间的需要。
3.1.2 事件
• 随机试验:对随机现象的观测 • 事件:随机试验的结果。包括: 1)必然事件:在一定能够的条件组合下,必然会发生的
事情。
2)不可能是件:在一定的条件组合下,一定不可能发生 的事情。
3)随机事件:在一定的条件组合下,可能发生也可能不
发生的事件。
3.1.3 总体、样本、样本容量
设计最大流量: Cv<0.5 Cs=(3~4) Cv
Cv>0.5 Cs=(2~3) Cv
年径流及年降水: Cs=2 Cv
水文学 第3章水文统计基本原理与方法
r E X E( X )r
(r 1,2,...,n)
r=1时,一阶中心矩为0
r=2时, r=3时,
2 E X E ( X ) s
2
2
s Cv x
3 E X E( X )
3
3 Cs
s3
四、重现期与频率的关系 水文上常用“重现期”来代替“频率” 1 1. 当研究暴雨或洪水时(一般p≤50%) T P 例如,当某一洪水的频率为p=1%时,则T=100年,称此 洪水为百年一遇洪水,表示大于等于这样的洪水平均 100年会遇到一次。 T 1 2. 当研究枯水或年径流时(一般p≥50%) 1 P 例如,对于p=90%的枯水流量,则T=10年,称此为十年 一遇枯水流量,表示小于等于这样的流量平均10年会 遇到一次。 在频率p≥50%时,工程上习惯于把设计频率叫做设计保 证率,即来水的可靠程度。十年一遇的枯水意思是平 均十年中可能有一年来水小于此枯水年的水量,说明 具有90%的可靠性。
p
f , C s d
该式包含 Cs、P与Φp的关系,查附录3, 由已知的Cs值,查表可得不同P的 Φp值,然 后利用已知的 和Cv值,通过下式即可求出 x 与各种P相应的xp值,从而可绘出理论频率曲 线。
X X (1 cV )
如何求
x
Cv Cs,在以后介绍。
例:某站年径流系列符合pⅢ型分布,已知该系 列的R=650mm,s=162.5mm,Cs =2Cv,试结合 下表计算设计保证率p=90%的设计年径流量。
二、权函数法 当样本容量较小时,用矩法估计的参数将 产生误差,其中尤以Cs的计算误差最大,为了 提高Cs的计算精度,马秀峰(1984)提出了权 函数法。
(r 1,2,...,n)
r=1时,一阶中心矩为0
r=2时, r=3时,
2 E X E ( X ) s
2
2
s Cv x
3 E X E( X )
3
3 Cs
s3
四、重现期与频率的关系 水文上常用“重现期”来代替“频率” 1 1. 当研究暴雨或洪水时(一般p≤50%) T P 例如,当某一洪水的频率为p=1%时,则T=100年,称此 洪水为百年一遇洪水,表示大于等于这样的洪水平均 100年会遇到一次。 T 1 2. 当研究枯水或年径流时(一般p≥50%) 1 P 例如,对于p=90%的枯水流量,则T=10年,称此为十年 一遇枯水流量,表示小于等于这样的流量平均10年会 遇到一次。 在频率p≥50%时,工程上习惯于把设计频率叫做设计保 证率,即来水的可靠程度。十年一遇的枯水意思是平 均十年中可能有一年来水小于此枯水年的水量,说明 具有90%的可靠性。
p
f , C s d
该式包含 Cs、P与Φp的关系,查附录3, 由已知的Cs值,查表可得不同P的 Φp值,然 后利用已知的 和Cv值,通过下式即可求出 x 与各种P相应的xp值,从而可绘出理论频率曲 线。
X X (1 cV )
如何求
x
Cv Cs,在以后介绍。
例:某站年径流系列符合pⅢ型分布,已知该系 列的R=650mm,s=162.5mm,Cs =2Cv,试结合 下表计算设计保证率p=90%的设计年径流量。
二、权函数法 当样本容量较小时,用矩法估计的参数将 产生误差,其中尤以Cs的计算误差最大,为了 提高Cs的计算精度,马秀峰(1984)提出了权 函数法。
第三章 水文统计
Zuo Qiting
经验频率曲线的绘制: 1)将实测水文数据列表,并由大到小,重新排序;
2)根据经验频率公式计算经验频率;
3)以实测水文变量xi为纵坐标,经验频率Pi为横坐标,在 概率格纸 ( 或普通坐标上 ) 上点绘经验频率点,然后用目估 法过经验频率点群绘制一条光滑的曲线; 4)根据工程设计标准,在曲线上查出所对应的水文变量 值。
p( x 3 x x 3 ) 99.7%
x x x
正态曲线
Zuo Qiting
二、皮尔逊- III型 皮尔逊Ⅲ型曲线(见图)为一端有限一端无限的不对称 单峰曲线,概率密度函数
a f ( x) ( x a0 ) a 1 e ( x a ( )
m p 100 % n 1
P为大于等于xi的经验频率;m为水 文变量从大至小排列的序号;n为
样本容量。
频率这个词比较抽象,为便于理解,有时采用重现期这 个词。所谓重现期是指水文事件的平均重现间隔时间,即平 均间隔多少时间出现一次或多少时间遇到一次。 在工程水文中,重现期用字母 T 表示,一般以年为单 位。
i
2
n
(k 1)
i
2
n 1
3 3 ( k i 1 ) ( k i 1 ) n2 Cs (n 1)(n 2) nCv3 (n 3)Cv 3
不偏估值 公式
Zuo Qiting
三、抽样误差
用一个样本的统计参数来估计总体的统计参数是 存在误差的,称之为抽样误差。这种误差是由于从总 体中随机抽取的样本与总体有差异而引起的。
3. 总体、样本、样本容量
将随机变量所能取值的全体称为总体。
总体中的一个单体称作个体。总体是所有个体的集合。 从总体中随机抽取一部分个体称为样本。 样本所含个体的数目称为样本容量(大小)。 水文变量的总体是指自古迄今以至未来的水文系列, 现有的水文观测系列可以当作总体的一个样本。
经验频率曲线的绘制: 1)将实测水文数据列表,并由大到小,重新排序;
2)根据经验频率公式计算经验频率;
3)以实测水文变量xi为纵坐标,经验频率Pi为横坐标,在 概率格纸 ( 或普通坐标上 ) 上点绘经验频率点,然后用目估 法过经验频率点群绘制一条光滑的曲线; 4)根据工程设计标准,在曲线上查出所对应的水文变量 值。
p( x 3 x x 3 ) 99.7%
x x x
正态曲线
Zuo Qiting
二、皮尔逊- III型 皮尔逊Ⅲ型曲线(见图)为一端有限一端无限的不对称 单峰曲线,概率密度函数
a f ( x) ( x a0 ) a 1 e ( x a ( )
m p 100 % n 1
P为大于等于xi的经验频率;m为水 文变量从大至小排列的序号;n为
样本容量。
频率这个词比较抽象,为便于理解,有时采用重现期这 个词。所谓重现期是指水文事件的平均重现间隔时间,即平 均间隔多少时间出现一次或多少时间遇到一次。 在工程水文中,重现期用字母 T 表示,一般以年为单 位。
i
2
n
(k 1)
i
2
n 1
3 3 ( k i 1 ) ( k i 1 ) n2 Cs (n 1)(n 2) nCv3 (n 3)Cv 3
不偏估值 公式
Zuo Qiting
三、抽样误差
用一个样本的统计参数来估计总体的统计参数是 存在误差的,称之为抽样误差。这种误差是由于从总 体中随机抽取的样本与总体有差异而引起的。
3. 总体、样本、样本容量
将随机变量所能取值的全体称为总体。
总体中的一个单体称作个体。总体是所有个体的集合。 从总体中随机抽取一部分个体称为样本。 样本所含个体的数目称为样本容量(大小)。 水文变量的总体是指自古迄今以至未来的水文系列, 现有的水文观测系列可以当作总体的一个样本。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
记作:N(μ,σ2 )。
若已知的密度函数(频率曲线)为正态函数(曲线)则称已知 曲线服从正态分布,记号 ~ 。其中μ、σ2 是两个不确定常数, 是正态分布的参数,不同的μ、不同的σ2对应不同的正态分布。
正态分布的特征
正态曲线呈钟型,两头低,中间高,左右对称,曲线 与横轴间的面积总等于1。
服从正态分布的变量的频数分布由μ、σ完全决定。
离散型随机变量的概率分布一般以分布列 表示,如表
X
x1
P(X= xi)
p1
x2 …… xi p2 …… pi
…… ……
连续型随机变量的概率分布用函数表示:
无法研究个别值的概率,只能研究某个区间的概率, 或是研究事件X≥x的概率,以及事件X ≤x 的概率,后 面二者可以相互转换,水文统计中常用X≥x 的概率及 其分布。
F(x)=P(X≥x) 称为随机变量x的分布函数
分布密度 分布函数 可以近似的用累积频率代替概率
频率密度
累积频率曲线
第三节 统计参数
均值 均方差 变差系数 偏态系数
均值
均方差: 均方差是反映系列中各变量集中或离散的程度
变差系数 系列的相对离散程度
偏态系数
衡量系列不对称程度的参数 CS>0,正偏; CS<0,负偏; Cs=0,对称系列,正态分布
经验频率曲线
海森概率格纸
在概率格纸上绘制则有利于可适当外延 曲线。
第五节 理论频率曲线
经验频率曲线存在的问题 :
经验频率曲线计算工作量小,绘制简单,查用 方便,但受实测资料所限,往往难以满足设计 上的需要。 徒手对曲线两端外延是一种方法,但随意性 很大
数理统计中,常选择比较符合水文现象频率分布 规律的密度函数f(x),借以求解累积频率曲线, ----称为理论频率曲线
正态分布的应用
抽样误差的分布 人体身高分布 学生成绩分布 是其他分布函数的基础:t分布,F分布,误
差函数,余误差函数
第四节 频率与重现期
频率曲线绘制后,就可在频率曲线上求 出指定频率p的设计值xp。由于"频率"较 为抽象,水文上常用"重现期"来代替"频 率"。所谓重现期是指某随机变量的取值 在长时期内平均多少年出现一次,又称 多少年一遇。
I)研究洪峰流量、洪水位、暴雨等最大值问题时
例如,某洪峰流量Qi的频率为P(Q≥Qi)=l%,那么此 洪峰流量的重现期为100年,则称为平均100年出现一 次大干或等于该洪峰流量Qi的事件.或称为百年一遇。
思考题
百年一遇洪水,是指 [________]。 a、大于等于这样的洪水每隔100年必然会出
经验频率曲线
由实测资料绘制而成的, 它是水文频率计 算的基础, 具有一定的实用性
步骤:具体实例在后边适线法再讲 (1)按从大到小的顺序排列 (2)用经验频率公式计算系列中各项的频率
(3)以水文变量x为纵坐标,以经验频率 为横 坐标,点绘经验频率点据,根据点群趋势绘出 一条平滑的曲线,称为经验频率曲线 (4)在曲线上求得指定频率P 的水文变量值xi
第二节 概率与频率
事件 :对随机现象的观测叫做随机试验, 随机试
验的结果称为事件。事件可以分为必然事件、不 可能事件和随机事件三种 .
概率 :
k― 有利于随机事件A的结果数 ; n― 在试验中所有可能出现的结果。
频率(统计概率) 事件A在n次试验中出现了k次
为事件A在n次试验中出现的频率。
现一次; b、大于等于这样的洪水平均100年可能出现
一次; c、小于等于这样的洪水正好每隔100年出现
一次; d、小于等于这样的洪水平均100年可能出现
一次;
2)研究枯水流量、枯水位等最小值问题时, 为了保证灌溉、发电、给水等用水需要, 一般设计频率P>50%.
例如,某枯水位Hi的频率为P(H≥Hi)=95%.那 么此枯水位的重现期T=20年,则称平均20年中有 一年的水位低于枯水位Hi或称为20年一遇。
第三章 水文统计基本原理与方法
第一节 概述
1、 水文现象的两重性 : 必然性,偶然性
偶然现象也称随机现象;偶然现象仍 然是有规律的,一般称为统计规律
2、水文统计的任务 : 研究和分析水文随机现象的统据已有的资料(样本),进行频率计算,
推求指定频率的水文特征值; (2)研究水文现象之间的统计关系,应用这种 关系延长、插补水文特征值和作水文预报; (3) 根据误差理论,估计水文计算中的随机误 差范围。
水文频率分布线型
皮尔逊III型曲线 对数皮尔逊III型曲线 耿贝尔型曲线 克里茨基一闵凯里曲线
皮尔逊Ⅲ型曲线
是一条一端有限一端无限的不对称单峰、 正偏曲线(见图4-4-3),数学上常称伽玛 分布,其概率密度函数为:
正态分布
密度函数分 布曲线
频数表资料所绘 制的直方图
直方图顶端的连线就会逐渐形成一条 高峰位于中央(均数所在处),两侧 逐渐降低且左右对称,不与横轴相交 的光滑曲线图(3)。这条曲线称为频 数曲线或频率曲线 ,近似于数学上的 正态分布(normal distribution)。
正态概率密 度函数为
例:某桥位处测得40年最高水位资料,如表,求水 位H≥25m的累积频率。(按照频率分段的定义思想,
见书47)
计算 H>=25的频率?? 解:当水位H=25m时,W=25%
P=25+5=30% 表明:若水位为25m时对桥梁会有威胁,则高于25m的 水位对桥梁都会有威胁,其发生的可能性应为P=30%。
频率与频率之 间的关系
例 (1)抛硬币,(2)抽奖
随机变量
随机事件的试验结果可用一个数X来表示, X随 试验结果的不同而取得不同的数值,它是带有随 机性的,则将这种随机试验结果X称为随机变量
分为:离散型随机变量和连续型随机变量
随机变量表示:
用大写字母X表示 可能的取值:x1,x2 ,……,xn:叫系列
(1)μ是正态分布的位置参数,描述正态分布的集中
趋势位置。正态分布以X=μ为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于μ。
(2)σ描述正态分布资料数据分布的离散程度,σ越
大,数据分布越分散,σ越小,数据分布越集中。 也称
为是正态分布的形状参数,σ越大,曲线越扁平,反之,
σ越小,曲线越瘦高。
若已知的密度函数(频率曲线)为正态函数(曲线)则称已知 曲线服从正态分布,记号 ~ 。其中μ、σ2 是两个不确定常数, 是正态分布的参数,不同的μ、不同的σ2对应不同的正态分布。
正态分布的特征
正态曲线呈钟型,两头低,中间高,左右对称,曲线 与横轴间的面积总等于1。
服从正态分布的变量的频数分布由μ、σ完全决定。
离散型随机变量的概率分布一般以分布列 表示,如表
X
x1
P(X= xi)
p1
x2 …… xi p2 …… pi
…… ……
连续型随机变量的概率分布用函数表示:
无法研究个别值的概率,只能研究某个区间的概率, 或是研究事件X≥x的概率,以及事件X ≤x 的概率,后 面二者可以相互转换,水文统计中常用X≥x 的概率及 其分布。
F(x)=P(X≥x) 称为随机变量x的分布函数
分布密度 分布函数 可以近似的用累积频率代替概率
频率密度
累积频率曲线
第三节 统计参数
均值 均方差 变差系数 偏态系数
均值
均方差: 均方差是反映系列中各变量集中或离散的程度
变差系数 系列的相对离散程度
偏态系数
衡量系列不对称程度的参数 CS>0,正偏; CS<0,负偏; Cs=0,对称系列,正态分布
经验频率曲线
海森概率格纸
在概率格纸上绘制则有利于可适当外延 曲线。
第五节 理论频率曲线
经验频率曲线存在的问题 :
经验频率曲线计算工作量小,绘制简单,查用 方便,但受实测资料所限,往往难以满足设计 上的需要。 徒手对曲线两端外延是一种方法,但随意性 很大
数理统计中,常选择比较符合水文现象频率分布 规律的密度函数f(x),借以求解累积频率曲线, ----称为理论频率曲线
正态分布的应用
抽样误差的分布 人体身高分布 学生成绩分布 是其他分布函数的基础:t分布,F分布,误
差函数,余误差函数
第四节 频率与重现期
频率曲线绘制后,就可在频率曲线上求 出指定频率p的设计值xp。由于"频率"较 为抽象,水文上常用"重现期"来代替"频 率"。所谓重现期是指某随机变量的取值 在长时期内平均多少年出现一次,又称 多少年一遇。
I)研究洪峰流量、洪水位、暴雨等最大值问题时
例如,某洪峰流量Qi的频率为P(Q≥Qi)=l%,那么此 洪峰流量的重现期为100年,则称为平均100年出现一 次大干或等于该洪峰流量Qi的事件.或称为百年一遇。
思考题
百年一遇洪水,是指 [________]。 a、大于等于这样的洪水每隔100年必然会出
经验频率曲线
由实测资料绘制而成的, 它是水文频率计 算的基础, 具有一定的实用性
步骤:具体实例在后边适线法再讲 (1)按从大到小的顺序排列 (2)用经验频率公式计算系列中各项的频率
(3)以水文变量x为纵坐标,以经验频率 为横 坐标,点绘经验频率点据,根据点群趋势绘出 一条平滑的曲线,称为经验频率曲线 (4)在曲线上求得指定频率P 的水文变量值xi
第二节 概率与频率
事件 :对随机现象的观测叫做随机试验, 随机试
验的结果称为事件。事件可以分为必然事件、不 可能事件和随机事件三种 .
概率 :
k― 有利于随机事件A的结果数 ; n― 在试验中所有可能出现的结果。
频率(统计概率) 事件A在n次试验中出现了k次
为事件A在n次试验中出现的频率。
现一次; b、大于等于这样的洪水平均100年可能出现
一次; c、小于等于这样的洪水正好每隔100年出现
一次; d、小于等于这样的洪水平均100年可能出现
一次;
2)研究枯水流量、枯水位等最小值问题时, 为了保证灌溉、发电、给水等用水需要, 一般设计频率P>50%.
例如,某枯水位Hi的频率为P(H≥Hi)=95%.那 么此枯水位的重现期T=20年,则称平均20年中有 一年的水位低于枯水位Hi或称为20年一遇。
第三章 水文统计基本原理与方法
第一节 概述
1、 水文现象的两重性 : 必然性,偶然性
偶然现象也称随机现象;偶然现象仍 然是有规律的,一般称为统计规律
2、水文统计的任务 : 研究和分析水文随机现象的统据已有的资料(样本),进行频率计算,
推求指定频率的水文特征值; (2)研究水文现象之间的统计关系,应用这种 关系延长、插补水文特征值和作水文预报; (3) 根据误差理论,估计水文计算中的随机误 差范围。
水文频率分布线型
皮尔逊III型曲线 对数皮尔逊III型曲线 耿贝尔型曲线 克里茨基一闵凯里曲线
皮尔逊Ⅲ型曲线
是一条一端有限一端无限的不对称单峰、 正偏曲线(见图4-4-3),数学上常称伽玛 分布,其概率密度函数为:
正态分布
密度函数分 布曲线
频数表资料所绘 制的直方图
直方图顶端的连线就会逐渐形成一条 高峰位于中央(均数所在处),两侧 逐渐降低且左右对称,不与横轴相交 的光滑曲线图(3)。这条曲线称为频 数曲线或频率曲线 ,近似于数学上的 正态分布(normal distribution)。
正态概率密 度函数为
例:某桥位处测得40年最高水位资料,如表,求水 位H≥25m的累积频率。(按照频率分段的定义思想,
见书47)
计算 H>=25的频率?? 解:当水位H=25m时,W=25%
P=25+5=30% 表明:若水位为25m时对桥梁会有威胁,则高于25m的 水位对桥梁都会有威胁,其发生的可能性应为P=30%。
频率与频率之 间的关系
例 (1)抛硬币,(2)抽奖
随机变量
随机事件的试验结果可用一个数X来表示, X随 试验结果的不同而取得不同的数值,它是带有随 机性的,则将这种随机试验结果X称为随机变量
分为:离散型随机变量和连续型随机变量
随机变量表示:
用大写字母X表示 可能的取值:x1,x2 ,……,xn:叫系列
(1)μ是正态分布的位置参数,描述正态分布的集中
趋势位置。正态分布以X=μ为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于μ。
(2)σ描述正态分布资料数据分布的离散程度,σ越
大,数据分布越分散,σ越小,数据分布越集中。 也称
为是正态分布的形状参数,σ越大,曲线越扁平,反之,
σ越小,曲线越瘦高。