第三章 水文统计方法
第三章 水文统计方法

二、水文现象的统计规律
水文现象的统计规律:经过长期的水文观测,各种水文的随机 现象所呈现出来的规律。
三、水文统计及其任务
数学中研究随机现象统计规律的学科称为概率论。 而有随机现象的一部分试验资料去研究总体现象的数字特征和 规律的学科称为数理统计学。 水文统计:概率论与数理统计学应用到水文分析与计算上。
精品课件
水文统计任务就是研究和分析水文现象的统计变化,并以 此为基础对水文现象未来可能的长期变化作出在概率意义 下的定量预估。 基本方法和具体的内容有以下三点: (1)根据已有的资料进行频率计算,推求指定频率的水文 特征值。 (2)研究水文现象之间的统计关系,应用这种关系延长、 插补水文特征值和水文预报。 (3)根据误差理论,估计水文计算中的随机误差范围。
精品课件
第二节 概率的基本概念
一、随机试验
随机试验(E):在概率论中,对随机现象的观测。
具有三个特点: (1)在相同条件下重复进行; (2)每次试验的可能结果不止一个,并且能事先明确试验的
所有可能结果; (3)进行一次试验,试验之前不能确定哪一个结果会出现。
精品课件
二、事件
事件:指在一定的条件组合下,随机试验的结果。 可以是数量性质也可以是属性性质。 事件可以分为三类: (1)必然事件; (2)不可能事件; (3)随机事件。(事件)
精品课件
二、总体和样本
总体:在统计数学上,把研究对象的全体称为总体。 样本:从总体中任意抽取的一部分叫做样本。
三、随机变量的概率分布
概率分布:随机变量可以取所有可能值中的任意一个值, 但是取某一可能值的机会(概率)是不同的,有的机会大, 有的机会小,随机变量的取值与其概率有一定的关系。
精品课件
第三章:水文统计基本原理与方法,水文学,黄廷林,西安建筑科技大学课件

现象(已经观测到的水文现象),找出水文现象的统计规律性;
水文学统计基本原理与方法
3.1.2 事件 随机试验:对随机现象的观测; 事件:随机试验的结果。包括: 1) 必然事件:在一定能够的条件组合下,必然会发生的事情。 2) 不可能是件:在一定的条件组合下,一定不可能发生的事情。 3) 随机事件:在一定的条件组合下,可能发生也可能不发生的事件。 3.1.3 总体、样本、样本容量 随机变量:受随机因素影响,遵循统计规律的变量。通俗地讲,指在随 机试验中测量到的数量。对于水文现象而言,指某种水文特征值,如某 地区流域出口的年径流量和洪峰流量等。分: 1) 连续性随机变量,如水位、流量; 2) 离散性随机变量,如投掷硬币的正反面。 总体:随机变量所能取值的全体,分有限和无限总体。 样本:从总体中随机抽取出的一组观测值。 样本容量:样本中所汉随机变量的项数。
P(白)=
P(黑)=
20 2 20 10 3
10 1 20 10 3
P(白或黑)=
P(红)=
20+10 1 20 10
0 0 20 10
水文学统计基本原理与方法
概率的基本性质:
0 P( A) 1
1) P(A)=1,A属于必然事件; 2) P(A)=0,A属于不可能事件; 3) 0<P(A)<1,A属于随机事件; (3)频率与概率的关系
W ( A)
m n
水文学统计基本原理与方法
(2)概率 概率是指随即事件在客观上出现的可能性,即该事件的发生率,亦称为
机率。根据事件出现的可能性是能够预先估计出来,可分为事先概率和事后
概率: 事先概率:试验之前某随机事件出现的可能性可以预先估计出来,如
1) 投硬币出现正面和反面的机率;
3.水文计算中的数理统计法

方框图
累计频率曲线
某水文站一年的日平均水 位
同理:
概率分布
f (x)
概率密度函数
F (x) P ( X x)
x
f ( x ) dx
x2
P ( x1 X x 2 ) F ( x 2 ) F ( x1 )
f ( x ) dx
x1
§3-3 经验频率曲线
在工程设计中.往往需要知道某一指定频率P
T p
枯水: 它们的频率>50%,重现期为
T
1 1 p
50 例如频率为2%的洪水流量,其重现期 为 2% ,这就是说等于和大于该值流量的重现期是平均50年 一遇;又例如枯水流量P=90%,则 1
T
1
T
1 90%
10
这就是说等于和小于该值流量的重现期是平均10年一 遇。以上所说的重现期,一定要在很长的年代里才能 正确。也就是在很长的年代里,出现时间上间隔的平 均年数,不是固定周期。百年一遇的洪水流量并不意 味着每一百年正好出现一次,实际上,也许会出现几 次,也许一次都不会出现,仅是在很长的年代里,平 均100年可能出现一次而已。频率与重现期的关系还 可从表3—l所列的关系加以说明.
三、重现期
指等于和大于(或等于和小于)某水文特征值平均多少 年可能出现一次,所以又称呼它为多少年一遇。频 率与重现期的关系相当于频率与周期的关系。 由于水文特征值并不具备严格的周期循环,重现期 仅是在很长年代里的平均情况,也就是说平均多少 年出现一次,绝不能说,正好多少年一定出现一次。 重现期并非周期,对于洪水和枯水重现期有不同的 表示方法 。 洪水:它们的频率P<50%,重现期T就是频率P的倒 数,即 1
第三章 水文统计基本原理与方法

的两端或一端与横轴线渐近相切。
y f ( x) ( x a0 ) a 1 e ( x a ( )
( )
——
0
)
0
t 1e t dt ,称为 的伽马函数
0
—— 曲线上点的横坐标值,待定参数 —— 特定参数
,
第三章 水文统计基础知识 → 3)水文经验频率曲线、理论曲线及参数估计
第三章 水文统计基本原理与方法 → (1) 概率统计理论基础
概率
随机事件A客观上出现的可能性,称为概率,用 P(A)表示,又称为机率、或然率等。它是描述随 机事件发生可能性大小的数值标准。 设事件A在重复的随机中共有N种结果,且每种 结果发生的可能性均等,其中事件A出现的可 能结果有f0种,按概率定义,有
曲线参数与统计参数之间的关系:
2 x CV 4 C s 2C S
a0 x(1 ) CS
第三章 水文统计基础知识 → 3)水文经验频率曲线、理论曲线及参数估计
p( ) f , C d
p p s
该式包含 Cs、P与Φp的关系,查附表2,由已 知的Cs值,查表可得不同P的 Φp值,然后利用 已知的 x 和Cv值,通过下式即可求出与各种P 相应的xp值,从而可绘出理论频率曲线。
上述累积频率是指多年平均出现的机会; 重现期则是平均若干年出现一次,而不是固定 的周期。
例4 某大城市从互不相关的三条河流中取水,各设一个 泵房.每一泵房正常运转受洪水破坏的机率为1﹪。试确 定此城市供水受破坏的机率为多大?
解:水文现象总体容量无限,所述破坏机率只能是一 种估计值。供水受破坏的情况有如下几种: (1)三个泵房运转同时破坏的机率:
•重现期
第3章 水文统计原理

P(%)
15.0 10.0 5.0 0.0 1400 1300 1200 1100 1000 900 800 700 600 500 400 300
Q
流量与频率关系的直方图
以流量为横坐标,区间频率为纵坐标,表示年最大流 量的频率分布。
f ( x) lim
p x 0 x
分布曲线与密度曲线的关系图
第4节 经验频率曲线
经验频率曲线:根据实测水文资料
直接点绘的频率曲线。
频率 曲线
理论频率曲线:为了配合经验频率
点群外延频率曲线而提供的一种用 数学方程式表示的频率曲线 。
1.经验频率的计算
我国水文计算中广泛采用的是维泊尔(Weibull )公式,即:
m P 100% n 1
P——统计系列中第m项(按递减顺序)随机变量 的经验频率; m——统计系列的容量; n——计算随机变量的序号(递减次序).
将密度函数代入,推导得频率曲线的分布函数:
x p = Cv +1 x =K p x
Kp
Q p = Cv +1 Q =K p Q
x p、 Q p ——频率为p的随机变量、流量
——离均系数,通过离均系数表查阅
——模比系数,通过模比系数值表查阅
附表 皮尔逊Ⅲ型频率曲线的离均系数
P/% Cs 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.1 3.09 3.23 3.38 3.52 3.67 3.81 3.96 4.10 4.24 4.39 4.53 1 2.33 1.67 2.47 2.54 2.62 2.68 2.75 2.82 2.89 2.96 3.02 5 1.64 2.0 1.70 1.73 1.75 1.77 1.80 1.82 1.84 1.86 1.88 20 0.84 0.84 0.83 0.82 0.82 0.81 0.80 0.79 0.78 0.77 0.76 50 0.00 -0.02 -0.03 -0.05 -0.07 -0.08 -0.10 -0.12 -0.13 -0.15 -0.16 80 -0.84 -0.85 -0.85 -0.85 -0.85 -0.85 -0.85 -0.85 -0.85 -0.85 -0.85
第三章 水文统计

经验频率曲线的绘制: 1)将实测水文数据列表,并由大到小,重新排序;
2)根据经验频率公式计算经验频率;
3)以实测水文变量xi为纵坐标,经验频率Pi为横坐标,在 概率格纸 ( 或普通坐标上 ) 上点绘经验频率点,然后用目估 法过经验频率点群绘制一条光滑的曲线; 4)根据工程设计标准,在曲线上查出所对应的水文变量 值。
p( x 3 x x 3 ) 99.7%
x x x
正态曲线
Zuo Qiting
二、皮尔逊- III型 皮尔逊Ⅲ型曲线(见图)为一端有限一端无限的不对称 单峰曲线,概率密度函数
a f ( x) ( x a0 ) a 1 e ( x a ( )
m p 100 % n 1
P为大于等于xi的经验频率;m为水 文变量从大至小排列的序号;n为
样本容量。
频率这个词比较抽象,为便于理解,有时采用重现期这 个词。所谓重现期是指水文事件的平均重现间隔时间,即平 均间隔多少时间出现一次或多少时间遇到一次。 在工程水文中,重现期用字母 T 表示,一般以年为单 位。
i
2
n
(k 1)
i
2
n 1
3 3 ( k i 1 ) ( k i 1 ) n2 Cs (n 1)(n 2) nCv3 (n 3)Cv 3
不偏估值 公式
Zuo Qiting
三、抽样误差
用一个样本的统计参数来估计总体的统计参数是 存在误差的,称之为抽样误差。这种误差是由于从总 体中随机抽取的样本与总体有差异而引起的。
3. 总体、样本、样本容量
将随机变量所能取值的全体称为总体。
总体中的一个单体称作个体。总体是所有个体的集合。 从总体中随机抽取一部分个体称为样本。 样本所含个体的数目称为样本容量(大小)。 水文变量的总体是指自古迄今以至未来的水文系列, 现有的水文观测系列可以当作总体的一个样本。
水文统计的基本方法

年份
1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973
年降水量
549 702 563 612 760 658 528 802 554 643 592 586 745
年份
1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986
第三章 水文统计的基本方法
第二节 概率、频率、重现期
第二节 概率、频率、重现期
教学内容: 一、概率 二、频率 三、重现期 教学要求:
掌握概率、频率和重现期的概念;掌握频率 和概率的联系和区别;掌握频率和重现期的关系。
第二节 概率、频率、重现期
一 、概率 (一)随机试验与随机事件
1、随机试验
①可以在相同的条件下重复进行; ②每次试验的可能结果不止一个,并且能事先知道实验所
三、重现期
1、定义:所谓重现期,是指某随机事件在长期过程中 平均是多少年比现一次,称为“多少年一遇”,用字 母T表示。
2、根据研究问题的性质不同,频率P与重现期T的关 系有两种表示方法 :
(1)在研究暴雨洪水问题时,一般设计频率P<50%,
则:
T1
(年)
P
式中:T——重现期,年; P——频率,%。
第二节 概率、频率、重现期
第三节 随机变量及其频率分布
上节内容提问
1、频率和概率的区别和联系是什么? 答:区别:概率是抽象数.是个理论值;频率是具体数, 是个经验值。联系:频率随实验次数的增多而逐渐稳 定.并趋近于概率。 2、频率P与重现期T的关系如何? 答:在研究暴雨洪水问题时,T ;1
P
3 水文统计基本原理与方法

3.2 随机变量的概率分布
3.概率密度函数
F(x)与f(x)的关系式
F ( x) P( X x) f ( x)dx
x
F(x)的几何意义就是表示 位于x轴上边的密度曲线所 包围的面积。 密度函数和分布函数从不同 角度反应了随机变量的概率 分布规律。
频率密度曲线一般为“铃形”。 频率分布曲线通常呈“倒S形”。
式中:F ( x) 为分布函数 F(x)的一阶导数,令 f(x)= F ' ( x) 。
'
3.2 随机变量的概率分布
3.概率密度函数 函数 f(x) 为概率密度函数(密度函数或分布
密度函数)。密度函数f(x)的几何曲线为密度 曲线。通过密度曲线可以很方便地求出随机变 量x落在区间dx上的概率,它等于 f(x) dx。
利用实测流量资料推 求桥涵的设计流量时, 往往需要将频率曲线 的头部外延很远,采 用海森机率格纸,仍 有较大的任意性,同 样会产生很大的误差。 显然,仍不能满足水 文计算的要求,必须 进一步寻求绘制和外 延频率曲线的方法。
3.3 水文经验频率曲线
例:某水文站有22年不连续的年最大流量资料,列于表 2—5第3栏,试绘制该站的经验频率曲线,并目估延长, 推求洪水频率为2%、1%和0.33%的流量。 ①把历年的年最大流量资料,按大小递减次序排列,如表2 -5第5栏; ②采用维泊尔公式计算各项流量的经验频率P,列入表2— 5第6栏。 ③然后,按表中经验频率和流量数值,在海森机率格纸上绘 出经验频率点,如图2—5中的圆点; ④再依点群的趋势描绘成一条圆滑的曲线,如图中的细实线, 就是该水文站的经验频率曲线; ⑤将经验频率曲线向上延长(图2-5中的细虚线),可由图 中直接读出所求洪水频率的流量
工程水文学 第三章 水文统计

X P(X=xi)
x1 p1
x2 p2
…… ……
xi pi
…… ……
•
水文学关心随机变量取值大于等于某一定值的概率,即P (X≥xi),而该概率是x的函数 【例3.6】
F ( x ) P ( x xi ) f ( x )dx
xi
• F(X)= P(X≥x) 代表X大于某一取值x的概率,其几何曲线 称为概率分布曲线;如果用实测资料点绘的,水文上称为
【例】 某测站有40年的实测枯水位记录,各种水位出现的频率如表3.2所示,试确 定水位H≥2.0m和H≥2.7m的概率?
某站水位频率计算 序号 1 2 3 4 5 ∑ 水位H(m) 4.0 3.5 2.7 2.0 1.9 — 2 10 16 9 3 40 5 25 40 22.5 7.5 100 表3.2 5 30 70 92.5 100 — 频数f(a) 频率W(%) 累积频率P (%)
s 1 Cv x x
( x x)
i
n 1
用模比系数带入上式有:
Cv
2 ( K 1 ) i
n 1
【例】同上一例,计算得Cv甲=0.005, Cv乙=0.33,甲系列在均值两旁要集中, 离散程度小 【例】见教材p50例3.8 【思考】一条河流上、下游断面的年平均流量的 Cv 值哪个大?为什么?
累积频率曲线。
3.2.4 累积频率和重现期
(1)累积频率和随机变量的关系 • 水文特征值属于连续性随机变量 • 在分析水文系列的概率分布时,不用单个的随机变量(x=xi) 的概率,而是用x≥xi(或者x≤xi )的概率P( x≥xi )(或者P ( x≤xi ))。 • 累计频率指等于或大于(等于或小于)某水文要素出现可能 性的量度。 • 一般在实际应用中,用样本的频率分析曲线代替总体系列的 概率分布。
3第三章 水文统计

相关系数r:是定量表示两种变量之间的密切程 度
r2=1: 变量之间为函数关系 r2=0: 零相关 1>r2>0:相关 r<0:负相关 r>0:正相关 相关系数r多大才算合适?
相关系数的显著性检验
相关系数r多大才能满足要求,取决于样本容 量和精度要求。用相关系数临界值来衡量。
a:显著水平,认为方程有意义时,错误判断可能发 生的概率, a:越小,说明要求越高 ra:临界相关系数 n:自由度 练习查表p74
皮尔逊Ⅲ型曲线
引入参数Φ , Φ值为离均系数
PIII模型变为
例:设某水文站, 求 Q 1000m3 / s, cv 0.5, cs 1 .5, 此理论频率曲线及水文站附近某桥的设计洪峰流量 Q1%和Q 5%。
解:按公式3-31
Qp Q(1 cv p )
P=1%,Cs=1.5,查附录B: P= 3.33
I)研究洪峰流量、洪水位、暴雨等最大值问题时
例如,某洪峰流量Qi的频率为P(Q≥Qi)=l%,那么此 洪峰流量的重现期为100年,则称为平均100年出现一 次大干或等于该洪峰流量Qi的事件.或称为百年一遇。
思考题
百年一遇洪水,是指 [________]。 a、大于等于这样的洪水每隔100年必然会出 现一次; b、大于等于这样的洪水平均100年可能出现 一次; c、小于等于这样的洪水正好每隔100年出现 一次; d、小于等于这样的洪水平均100年可能出现 一次;
三点适线法 通过目估法汇出与经验频率曲线点分布配合较好的理 论曲线,从曲线上选择三点,并据此以选定理论频率 曲线上三个参数
若取三点在同一曲线上,则应符合联立方程:
Q1 Q(1 1cv ) Q2 Q(1 2 cv ) Q3 Q(1 3cv )
第三章 水文统计基本原理与方法

【例3-2】掷两个骰子,计算出现点数的概率。
解:掷两个骰子,可能结果总数为36,有限的。出 现哪一面都是等可能的,故为古典概型。
2
3
B=
P(B) =
4
:
:
12
1
36 2
36
3
P( B=1 ) = 0
36
1
36
3.1.4 频率(frequency)
(概率的统计定义)
设事件A在n次试验中出现了m次,则称
P( x x X x) P( X x) P( X x x) F ( x) F ( x x)
称随机变量X出现在区间[x,x+Δx)的平均概率
F ( x) F ( x x) x
为平均概率密度。
令 Δx → 0
lim F ( x) F ( x x) lim F ( x x) F ( x) F '( x)
x0
x
x0
x
记:
f ( x) F '( x) dF( x) dx
称为概率密度函数,简称密 度函数(density function), 其图形称为密度曲线 (density curve)。
密度函数积分即为分 布函数:
F ( x) P( X x) f ( x)dx
x
(3 5)
分布函数(distribution function)的图形称为分 布曲线(density curve), 水文学中称为频率曲线 (frequency curve)。
事件(X≥x) 的概率用P(X≥x)表示,它是随随机
变量X的取值x而变化的,所以P(X≥x)是x的函数,
称为随机变量X的分布函数(distribution function),
第3部分水文学统计基本原理与方法

水文学统计基本原理与方法
3.1.3 数理统计法对水文资料的要求
检查资料的可靠性; 检查资料的一致性; 检查资料的代表性; 检查资料的随机性; 检查资料的独立性
3. 2 频率和概率
3.2.1概率和频率
(1) 频率
指在具体重复的实验中,某随机事件A出现的次数(频数)m与试验总
次数n的比值,即:
水文学统计基本原理与方法
概率的基本性质:
0 P(A) 1
1) P(A)=1,A属于必然事件;
2) P(A)=0,A属于不可能事件;
3) 0<P(A)<1,A属于随机事件;
(3)频率与概率的关系
lim W (A) P(A)
n
频率是经验值,概率是经验值; 可以通过实测样本的频率分析来推论事件总体概率特性; 样本容量越大,结果越准确; 对于水文现象,只能采用有限的多年实测水文资料组成样本系列,推
W ( A) m n
水文学统计基本原理与方法
(2)概率 概率是指随即事件在客观上出现的可能性,即该事件的发生率,亦称为
机率。根据事件出现的可能性是能够预先估计出来,可分为事先概率和事后 概率:
事先概率:试验之前某随机事件出现的可能性可以预先估计出来,如 1) 投硬币出现正面和反面的机率;
概率:2概) 率投是掷指骰随子即出事现件反某在应一客随个观机上点事出子件现的各的概种可结率能果性的。数可量分。为事先概率和事后概率。 事后概率:随机事件出现的可能性不能在试验之前预先估计出来,必 须通过大量的重复试验之后才能估计出它出现的可能性。如: 1) 河流决堤的机率; 2) 河流出现大型污染事件的机率
求频率作为概率的近似值。
水文学统计基本原理与方法
第3章-水文统计原理

P( x xp) F ( xp)
f ( x)dx
xp
桥涵水文
第三章 水文统计原理
二、累积频率和重现期
水文统计中,等于和大于某一数值的变量出现的次数
(即累积出现次数)与总次数的比值,称为该变量的累 积频率P。 工程上简称为该流ห้องสมุดไป่ตู้的频率P,以百分数表示。
桥梁水文计算时,采用的抽样方法为“年最大值法”,
第二节 几率和概率
(一) 随机事件
事件的分类: ①必然事件(每年一次最大洪峰流量) ②不可能事件 ③随机事件(具体时间和大小) 因为水文现象具有不重复性的特点,因此各水文要 素的具体数量的出现都具有偶然性,都属于随机事件。
桥涵水文
第三章 水文统计原理
(二) 随机变量
随机变量:随机事件出现的结果以数值形式表示, 这些数值即随机变量。如流量、降雨量。
桥涵水文
第三章 水文统计原理
(四)总体和样本
总体——又称母体,是统计分析中所要研究对象的全 体。分为有限总体和无限总体; 样本——从总体中抽取的部分个体的全体称为样本;
样本容量——样本中所含样品的数目称作样本容量, 容量大小关系结果的可靠性。
水文现象的总体都是无限的,实际上是无法取得的。只能
二、经验(累积)频率的计算
在水文统计法中,利用实测水文资料推算的频率,称 为经验(累积)频率,其计算公式称为经验频率公式, 目前常见的有下列三种: (一)维泊尔公式(均值公式、数学期望公式)
★
m P 100 % n 1
(二)切哥达也夫公式(中值公式) m 0 .3 P 100 % 式中:m为各随机变量 n 0 .4 (三)海森公式 m 0 .5 P 100 % n
第3章水文统计原理 123

示各组随机变量频
20 0.20
10
0.10
组距间的频率,且
各长方形面积之和 为1。
200 400 600 800 1000 1200 1400 3 ( 流量 m /s)
x
流量与频率关系的直方图
§3.2 随机变量及其概率分布 若流量资料的实测次 数无穷大,组距趋于无穷 小,直方图变成曲线,称 为::频率密度曲线。
[例] 200年一遇的特大洪水,在100年中恰好出现2次的
概率是多少?
Bm C p 1 p
m n m
n m
1 1 n 100,m 2, p ,1 p 1 200 200
B( 2) C
2 100
1 200
2
1 1 200
频率越小。
2、系列平均数附近的频率比较大。
3、存在众数xc
§3.2 随机变量及其概率分布
2. 累积频率曲线(频率分布曲线)
x
流量与累积频率:梯形折线图
流量(m3/s)
1400 1200
流量的实测次数趋于无穷大,
1000 800 600 400 200 0 20 80 60 40 累积频率(%) 100
§3.2 随机变量及其概率分布
三、随机变量的频率分布
随机变量 频率
P( X xi ) pi
一一对应关系,称为随机变量的频率分布。
§3.2 随机变量及其概率分布
1. 频率密度曲线
(参见课本表3-2)
p
30 0.30
频率密度直方图表
率的平均分布。 (Δ P/Δ x)---x 各矩形面积表示各
1、河川径流的概念、影响因素 2、河道水流的特点 3、水文现象具有随机性,搜集水文资料的方法: 水文站观测资料、洪水调查资料、文献考证资料
水文统计的基本原理与方法

二、三点试线法
从经验频率曲线上选择三 点,并据以选定理论频率 曲线上三个参数的方法
若取三点在同一曲线上,则应符合联立方程:
Q1 Q(1 1cv )
Q2 Q(1 2cv )
Q3 Q(1 3cv )
解得: Q Q31 Q13
1 3
cv
Q1 Q3
Q31 Q13
s 1 3 22 1 3
甲
x甲
5.0 10
0.50
cv乙
乙
x乙
5.0 1000
0.005
表明:甲系列的离散程度大于乙系列
我国降水量与径流量的变差系数,一般是南方小,北方 大;沿海小,内陆大;平原小,山区大。在0.2~1.5之间
(三)、偏差系数:衡量系列在均值两侧对称程度。
一般有经验关系:
cs (2 ~ 4)cv
三、皮尔逊III型曲线
试线法:由实测系列得到统计参数,根据理论频率 曲线公式算得设计流量得到的曲线与经验频率点 绘相结合选配合适理论频率曲线的方法。
包括试错试线法和三点试线法
采用假定的Cs值,适当调整
一、试错试线法:
均值和Cv值,使理论频率曲 线与经验点据很好的符合
例题:某水文站有1945~1968年共24年实测最大流量资料,见表, 试用试错试线法求合适的理论频率曲线及设计流量Q1%Q2%
解: 1、计算系列流量的经验频率Pi、Ki、Ki2见表
2、点绘经验频率曲线Pi-Ki
3、求理论频率曲线的两个参数
均值=1500m3/s、Cv=0.51 4、假定Cs=2Cv,根据公式计算见教材表10-7, 绘
制理论频率曲线(红线)
5、适线得出Cv=0.6,Cs=2.5Cv比较适合,可 以采用
第3章水文学统计基本原理与方法

水文学统计基本原理与方法
3.1.2 事件 ➢ 随机试验:对随机现象的观测; ➢ 事件:随机试验的结果。包括:
1) 必然事件:在一定能够的条件组合下,必然会发生的事情。 2) 不可能是件:在一定的条件组合下,一定不可能发生的事情。 3) 随机事件:在一定的条件组合下,可能发生也可能不发生的事件。 3.1.3 总体、样本、样本容量 ➢ 随机变量:受随机因素影响,遵循统计规律的变量。通俗地讲,指在随 机试验中测量到的数量。对于水文现象而言,指某种水文特征值,如某 地区流域出口的年径流量和洪峰流量等。分: 1) 连续性随机变量,如水位、流量; 2) 离散性随机变量,如投掷硬币的正反面。 ➢ 总体:随机变量所能取值的全体,分有限和无限总体。 ➢ 样本:从总体中随机抽取出的一组观测值。 ➢ 样本容量:样本中所汉随机变量的项数。
W ( A) m n
水文学统计基本原理与方法
(2)概率 概率是指随即事件在客观上出现的可能性,即该事件的发生率,亦称为
机率。根据事件出现的可能性是能够预先估计出来,可分为事先概率和事后 概率:
➢ 事先概率:试验之前某随机事件出现的可能性可以预先估计出来,如 1) 投硬币出现正面和反面的机率;
概率:2概) 率投是掷指骰随子即出事现件反某在应一客随个观机上点事出子件现的各的概种可结率能果性的。数可量分。为事先概率和事后概率。 ➢ 事后概率:随机事件出现的可能性不能在试验之前预先估计出来,必 须通过大量的重复试验之后才能估计出它出现的可能性。如: 1) 河流决堤的机率; 2) 河流出现大型污染事件的机率
少?
P(白)= 20 2 20 10 3
P(黑)= 10 1 20 10 3
水文学第3章 水文统计的基本原理与方法

P ( X xi ) p i
(i 1,2......)
离散型随机变量取任何可能值时,其概率都不会是负,即 pi ≥ o (i=1、2、……);
连续型随机变量,因其取某一给定值的概率等于零,在 水文上仅讨论随机变量 X 取大于、等于某 xi 值的发生概率:
p ( X xi ) p i
k 1
均值只能反映系列中各变量的平均情况,不能反映系列中各变 量相对于均值集中或离散的程度。
2.均方差
与离势系数 Cv
( xi x )
i 1
n
2
n
1 CV x x
( xi x )
i 1
n
2
n
( K i 1) 2
i 1
n
n
不同系列的均值相同时,可用 均方差比较系列的离散程度。 第一系列, 15 , 20 , 25. 4.08;
m p 100 % (2)用数学期望公式计算各项x≥xm的经验频率。 n 1
(3)在频率格纸上,以变量x为纵坐标,以其对应的经验频率为横 坐标,点绘出经验频率点,依据点群趋势绘出光滑曲线,即为经验 频率曲线(曲线不需经过所有的经验点)。 (4)有了经验频率曲线,即可在曲线上外延求得指定频率p的水文 变量值xp。 (但常用与经验曲线配合较好的理论线外延)
0 p
取标准化随机变量:
xx xCv x p x (CV P 1) p p ( p ) f ( p , cs )d
p
对于具体的Cs,就可 计算出 φ 与p的对应值。 若给定若干个Cs值,就可 制成 p 和φ (离均系数) 的关系表。见附表1。 在进行频率计算时, 由已知的Cs查表即可求得 一组p和 φ p的对应值,便 可绘出理论频率曲线。
水文学 第3章水文统计基本原理与方法

(r 1,2,...,n)
r=1时,一阶中心矩为0
r=2时, r=3时,
2 E X E ( X ) s
2
2
s Cv x
3 E X E( X )
3
3 Cs
s3
四、重现期与频率的关系 水文上常用“重现期”来代替“频率” 1 1. 当研究暴雨或洪水时(一般p≤50%) T P 例如,当某一洪水的频率为p=1%时,则T=100年,称此 洪水为百年一遇洪水,表示大于等于这样的洪水平均 100年会遇到一次。 T 1 2. 当研究枯水或年径流时(一般p≥50%) 1 P 例如,对于p=90%的枯水流量,则T=10年,称此为十年 一遇枯水流量,表示小于等于这样的流量平均10年会 遇到一次。 在频率p≥50%时,工程上习惯于把设计频率叫做设计保 证率,即来水的可靠程度。十年一遇的枯水意思是平 均十年中可能有一年来水小于此枯水年的水量,说明 具有90%的可靠性。
p
f , C s d
该式包含 Cs、P与Φp的关系,查附录3, 由已知的Cs值,查表可得不同P的 Φp值,然 后利用已知的 和Cv值,通过下式即可求出 x 与各种P相应的xp值,从而可绘出理论频率曲 线。
X X (1 cV )
如何求
x
Cv Cs,在以后介绍。
例:某站年径流系列符合pⅢ型分布,已知该系 列的R=650mm,s=162.5mm,Cs =2Cv,试结合 下表计算设计保证率p=90%的设计年径流量。
二、权函数法 当样本容量较小时,用矩法估计的参数将 产生误差,其中尤以Cs的计算误差最大,为了 提高Cs的计算精度,马秀峰(1984)提出了权 函数法。
第三章 水文统计的基本原理与方法

第三章水文统计的基本原理与方法目的:推算设计流量内容:基本理论、推算方法§3-1 概率统计理论基础*一、随机事件和随机变量*1.事件的分类:必然事件;不可能事件;随机事件(又称偶然事件)。
统计规律:大量同类随机事件的平均情况*2.随机变量随机变量:随机事件的量值*二、样本、总体、系列随机变量系列:由若干或无数个随机变量组成的系列总体:随机变量的全部称为总体样本:总体中的一部分称为样本样本的规律——推断总体的规律。
抽样误差:由样本推断总体规律带来的误差*三、机率与频率机率(又称概率):机率是事件固有的客观性质,常数,理论值。
频率:试验,经验值。
当试验次数无限增多时,频率——机率。
四、累积频率与重现期*1、累积频率:*2、重现期:将无限长远年代,某一水文现象(或量值)平均多少年出现一次PT 1§3-2 水文经验频率曲线一、经验频率曲线的概念经验累积频率:大于和等于某一数值的流量出现的次数,与年最大洪峰流量总次数之比值 经验累积频率曲线: 流量和频率曲线 流量与累积频率曲线 设计洪水频率:桥涵设计洪水频率二、频率分布及其特征 频率密度: 密度函数:累积频率曲线: *三、经验频率公式 *1.经验频率公式经验频率:在水文计算中,利用实测和调查的水文资料推算的频率 经验频率公式:按递减顺序排列 **1)数学期望公式:(均值公式)%1001⨯+=n mP 式中:P ——经验频率(序号为m 那项变量的累积频率,常以%表示); n ——有限系列的总项数;m ——系列中随机变量按递减顺序排列的序号。
**2)中值公式:%1004.03.0⨯+-=n m P 四、经验频率曲线得绘制和延长 *1、经验频牵曲线的绘制经验频率曲线:随机变量值i Q 和其累积频率i P 关系的曲线 步骤:i Q 递减排列 算出各i Q 的i Pi Q 为纵坐标,i P 为横坐标,点绘,穿线*2.经验频率曲线延长和局限性外延误差均匀分格:曲线头尾两端较陡,中间缓和平坦,呈卧S 形外延的任意性较大,推求的结果会产生很大的误差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
四、频率
设事件A在n次试验中出现了m次,则称为事件A在n次试验中
出现的频率。 W(A)=m/n 当试验次数n不大时,事件频率很不稳定,具有随机性; 当试验次数n足够大时,事件频率与概率之差会达到任意小的 程度。
五. 累计频率(P):等量和超量值的频率之和(累计)。
某桥位处测得40年最高水位资料如下表,求水位
0
225 1225 2500
0
-3375 -42875 -125000
1
0.925 0.825 0.75
0
-0.075 -0.175 -0.25
0
-0.00042187 -0.00535938 -0.015625
均值
均方差 变差系数 偏态系数
200
2790
52.8 0.264102
165750
0.10359375
≥25m时的累积频率。
解:当水位H=25m时,W=25% H=30m(大于25m)时, W=5% P=25%+5%=30% 意义:表明若水位为25m时对桥梁会有威胁,则高于25m的
水位对桥梁都会有威胁,其发生的可能性应为30%。
第三节 随机变量及其概率分布 一、随机变量
随试验结果而发生变化的变量,用 X 表示,取值用 xi 表 示 。例: 水文特征值:年径流、洪峰流量。 随机变量分类:
(1)根据实测水文资料,按从大到小的顺序排列; (2)用经验频率公式计算系列中各项的频率; (3)以水文变量X为纵坐标,以经验频率P为横坐标,
点绘经验频率点据;
(4)根据点群趋势绘出一条平滑的曲线。
例题
年份 ( 1) 1961 年最大洪峰流 量 (2) 720
序号 (3) 1 由大到小排列 (4) 2650 经验频率 ( 5) 9.1
皮尔逊Ⅲ型频率曲线绘制步骤
在统计参数
x, Cv , Cs
已知情况下,可按以下步骤绘
制皮尔逊Ⅲ型频率曲线:
(1)从
值(离散系数)表中选取若干个频率 P ; 值表得出不同 P 的 p 值;
值,通过式
(2)由Cs值,查 (3)利用
x, Cv
x p x(1 p Cv) (Kp=1+Φp*Cv) 模比系数
1030 720
72.7
81.8 90.9
2.经验频率曲线存在的问题 : 经验频率曲线计算工作量小,绘制简单,查用方 便,但受实测资料所限,往往难以满足设计上的需 要。 徒手对曲线两端外延是一种方法,但随意性很大。
二、理论频率曲线
实际工作中,常常采用数理统计中已知的频
率曲线来拟合经验点据,这种曲线人们习惯上称
2.75 1.80 1.33 0.80 -0.10 -0.72 -1.20 -1.45 -1.88
例:某站年径流系列符合P-Ⅲ型分布,已知该系列的
R=650mm, CV=0.25 ,CS=2Cv,试绘理论频率曲线。
解:当CS=2Cv 时,查附表2,得不同频率下的Kp,代入下式
求Xp:
P
Kp Xp P Kp Xp
⒋ 偏态系数(Cs):反映系列中各变量值在均值 两边的对称程度。(衡量系列不对称程度的 参数)
样本系列统计参数计算
样本 1 系列 300 (xi-x)2 10000 (xi-x)3 1000000 Ki 1.5 Ki-1 0.5 (Ki-1)3 0.125
2
3 4 5
200
185 165 150
1
1.67 1085.5 95 0.63 409.5
2
1.58 1027 99 0.52 338
例题:设某水文站, Q 1000 m 3 / s , c 0 .5, c 1 .5试 , v s 求此理论频率曲线及水文站附近某桥的设计洪峰流量 Q1
%和Q 5%。
解:按公式
Q p Q (1 c v p )
1.12 1.12
五、正态分布
自然界中许多随机变量,如:水文测量误差、抽样误
差等,都服从或近似服从正态分布。
密度函数:
密度曲线:
面积 99.7%
正态分布密度曲线三个特点:
(1)单峰;
(2)曲线关于均值对称,Cs=0
(3)曲线两端趋于±∞,并以x轴为渐近线。
六、(海森)频率格纸(几率纸)选用
正态频率曲线在普通格纸 上为一条规则的S型曲线,它 在P=50%前后的曲线方向虽 然相反,但形状完全一样。
求出于各种 P 相应的
xp
值。以 x 为纵坐标,P 为横坐
标,从而可绘出理论频率曲线。
例题
年份 ( 1) 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970
某河流年最高水位(m) ( 2) 720 880 630 950 440 420 780 660 870 650
可以是数量性质也可以是属性性质。 事件可以分为三类: (1)必然事件; (2)不可能事件; (3)随机事件。(事件)
三、概率
概率:反映随机事件出现的可能性大小的数量标准。 计算如下: P(A)=k/n (1)k为有利于随机事件A的可能结果数; (2)n为试验中所有可能出现的结果数。 概率公式只适用于古典概率事件,也就试验的所有可能结果 都是等可能的,且可能结果的总数是有限的。
入“变差系数”
⒊ 变差系数(Cv):反映系列中各变量值相对集 中或离散的程 度。 (值越小分布越集中)
例: 5, 10, 15 x=10 σ=4.08 995,1000,1005 x=1000 σ=4.08
Cv=0.48 Cv=0.0048
我国降水量与径流量的变差系数,一般是 南方小,北方大;沿海小,内陆大;平原小, 山区大。
P=1%,Cs=1.5,查表得 P = 3.33
则Q p=1000(1+0.5*3.33)=2665m3/s
按公式
Qp k p Q
P=1%,Cv=0.5, Cs=3Cv查表得 k P = 2.67 则Q p=1000*2.67=2670m3/s
三、频率与重现期的关系
水文上常用“重现期”来代替“频率”
皮尔逊Ⅲ型频率曲线计算表(实例)
频率
P(%) 1 5 10 20 50 75 90 95 99
x 666.4
Cv 0.30
Cs 2Cv
p
x Kp p
1.83 1.54 1.40 1.24 0.97 0.78 0.64 0.56 0.44
xp
1219 1025 933 826 646 520 426 373 293
F(x)= P(X≥x)
它代表随机变量X大于某一取值x的概率。
分布曲线
(频率曲线)
四、随机变量的统计参数
随机变量的分布参数(统计参数):能说明随机变量
统计规律的某些特征数字。
水文计算中常用的统计参数有:均值、均方差、变
差系数和偏态系数、矩。
⒈ 均值(x):表示随机变量系列中各变量值平 均情况。
第五节 频率曲线参数估计方法
一、矩法
用样本矩估计总体矩,并通过矩与参数之间的 关系,来估计频率曲线的参数。(无偏差估计公式)
1.离散型随机变量概率分布:
2.连续型随机变量概率分布:
对于连续型随机变量,无法研究个别的概率,只能研 究某个区间的概率,或是研究事件X ≥ x的概率(累计概 率),以及事件X ≤ x的概率。(水文统计中常用X ≥ x的 概率及其分布) 设事件X ≥ x的概率用P(X≥x)来表示,它是随机变量x 取值而变化的。 P(X≥x)是x的函数,称为随机变量x的分布 函数,记为F(x):
P=50%
正态频率曲线
累积频率
第四节 水文频率分布线型
水文频率曲线:水文分析计算中使用的概率分布曲线。
分为:经验频率曲线和理论频率曲线。
水文频率分布线型:指所采用的理论频率曲线(频率 函数)的形式,它的选择取决与大多数水文资料的经验频 率点据的配合情况。 频率计算两大内容: 1、分布线型的选择 2、 统计参数的估算
1、离散型随机变量:
2、 连续型随机变量:水文特征值属连续型随机变量。
二、总体和样本
总体:在统计数学上,把研究对象的全体称为总体。
样本:从总体中任意抽取的一部分叫做样本。
三、随机变量的概率分布
概率分布:随机变量可以取所有可能值中的任意一个值, 但是取某一可能值的机会(概率)是不同的,有的机会大, 有的机会小,随机变量的取值与其概率有一定的关系。
第三章 水文统计方法
第一节 水文统计的意义
一、水文现象的随机性
水文现象:是指地球上的水受外部作用而产生的永无休止的 运动形式,即降雨,入渗,径流,蒸发等现象的统称。 水文现象的随机性:影响水文现象的因素众多,同时各种因 素本身及其组合在时间上、变化上也是错中复杂的,这使得 水文现象在发生时间和数值上不会完全重复,具有一定的偶 尔性和不确定性特点,即随机性。
第二节 概率的基本概念
一、随机试验
随机试验(E):在概率论中,对随机现象的观测。 具有三个特点: (1)在相同条件下重复进行; (2)每次试验的可能结果不止一个,并且能事先明确试验的 所有可能结果; (3)进行一次试验,试验之前不能确定哪一个结果会出现。
二、事件
事件:指在一定的条件组合下,随机试验的结果。
1962
1963 1964
10860
1440 1420
18.2
27.3 36.4
1965 1966 1967 1968 1969 1970
1440 1420 1120 2060 1370 2650
5
6 7
1370
1250 1120
45.5
54.5 63.6
8
9 10