水文统计基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
e ( )
1 ( x ) 0
0
式中:() 为 的伽玛函数;
4 2;
Cs
_ 2 ;
xCvCs
_
2
C x (1 v )
0
Cs
2 皮尔逊III型分布
工程上的应用
求出指定概率P所对应的随机变量Xp
P P X xp
1
x a0 e xa0 dx
xp
Xp=f(P,,,0)
n
Ki 12
i 1
n 1
五、统计参数估计方法
2 适线法/配线法
概念
根据估计的频率分布曲线和样本经验点据分布配 合最佳来优选参数的方法
经验频率曲线 经验频率
P mi 100% n 1
2 适线法/配线法
步骤
将原始资料按大小次序排列; 计算经验频率(P=m/(n+1)*100%); 将x和对应的频率P点绘到概率格纸上; 计算资料的平均值;
2 随机变量的概率分布
对于连续型随机变量,通常还研究随机变量 取值大于等于某一值的概率,即研究X≥x的 概率,可表示为P(X≥x)。
显然P(X≥x)是x的函数,这个函数称为 随机变量X的分布函数,即 F( x )= P(X≥x)
举例
右图表示某雨量站年雨量的分布 曲线。若x=800mm,由分布曲 线知P(X≥800)=0.6。这表 明该站年雨量从多年平均来看, 超过800 mm的可能性为60%。
连续型随机变量:若随机变量可以取得一个有限 区间内的任何数值,则称该随机变量为连续型随 机变量。
一般用X表示随机变量,则其取值可用x1、x2、x3、、、 xn表示。
二、 随机变量的概率分布
2 随机变量的概率分布函数
随机变量可以取得所有可能值中的任何一个值,但取得某一 可能值的机会并不相同,有的机会大,有的机会小。也就是 说随机变量是以一定的概率来取某个可能值的,即随机变量 的取值与其概率之间有一定的对应关系。
n xi x' 2
i 1
n
适用于总体
n xi x' 2
i1
n 1
适用于样本
2 离散特征变量
例:甲系列:10 50 90 乙系列:49 50 51 均值都为50。 甲=40 乙=1
2 离散特征变量
例:甲地区的年雨量分布,其均值x1= 1200mm,均方差 1=360mm;乙地 区的年雨量分布,其均值x2=800mm, 均方差 2=320mm。
x
上式表示随机变量落入区间(x,x+Δ x)的 平均概率,而
lim F (x) F (x x)
x0
x
lim F
F (x x) F (x) ' (x)
x0
x
式中:F'(x) 为分布函数F(x)的一阶导数,令f (x)= F'(x) 。
2 随机变量的概率分布
函数f(x)为概率密度函数(密度函数或分布 密度函数)。密度函数f(x)的几何曲线为密 度曲线。通过密度曲线可以很方便地求出随机 变量X落在区间dx上的概率,它等于f(x)dx。
根据曲线分析该站年降水在 800-900mm之间的概率为多少?
随机变量落在(x,x+Δ x)内 的概率为:
P( x+ Δ x≥X≥ x )=
F(x)-F(x+ Δ x)
年降水量落在800-900之间的概 率为:
2 随机变量的概率分布
随机变量X落在区间(x,x+Δ x)内的概率 与区间长度Δ x为 F (x) F (x x)
一、 基本概念
投掷硬币
假如投掷了4040次,出现正面2048次,占 总次数的50.69%。则称n=4040称为事件的 总数,m=2048称为出现正面的频率。
掷币次数(n) 出现正面 的次数(m)
频率(P(A))
掷硬币试验出现正面的频率表
10
100 1000 5000 10000 12000
6
45 520 2475 5030 6019
1 正态分布
密度函数
_2
e f (x) 1
2
(xx)
2 2
( x )
_
其中: x 为平均数; 为标准差;
四、 几重常用的概率分布曲线
2 皮尔逊III型分布 皮尔逊III型
曲线是一条一端有 限一端无限的不对 称单峰曲线,
2 皮尔逊III型分布
概率密度函数
(x ) f (x)
中位数
中位数是把概率密度分布两个相等部分的数,对于离 散型随机变量,将随机变量所有的取值按大小次序排 列,中位数为位置居中的数字。对连续型随机变量, 中位数将概率密度曲线下的面积划分为各等于1/2的 两个部分。
2 离散特征变量
标准差/均方差
设系列中随机变量取值为x1,x2…xn,各值对 x’的离差为(x1-x’), (x2-x’), … (xn- x’)。则均方差为:
所以
_
n
x
xi
p i
i 1
平均数代表了随机变量的重心,可以代表随机变量的水平
三、 随机变量的分布参数
1 位置特征参数
众数
众数是表示概率密度分布峰值所对应的数,对于离散 型随机变量,当pi>pi+1,且pi>pi-1时,pi对应的值xi 就是分布的众数。对于连续性随机变量,众数就是使 得分布密度函数f(x)为极大的x值。
0.600 0.450 0.520 0.495 0.503 0.502
二、 随机变量的概率分布
1 概念
随机变量
每次试验的结果可以用一个变量的数 值来表示,这个变量的取值随偶然因 素而变化,但又遵从一定的概率分布 规律,这种变量为随机变量
1 概念
离散型随机变量:若随机变量仅能取得区间某些 间断的离散数值,则称该随机变量为离散型随机 变量。
nx
C '3 3 v
i 1
nC
3 v
n xi x' 3
n
Ki 1 3
Cs
i 1
(n
3)
x
'3C
3 v
i 1
(n
3)C
3 v
适用于总体 适用于样本
四、 几重常用的概率分布曲线
1 正态分布 自然界中有很
多随机变量,具有 一重很类似的概率 密度分布,在数学 中通常称为正态分 布
特点:单峰;对 平均数对称;曲 线两侧趋于无穷 大,并以x轴为 渐近线
水文统计基础
一、基本概念
事件/随机事件:一个随机试验的样本空 间的子集
概率:随机事件发生的可能性大小 频率:设事件A在n次试验中出现了m次,
则称W(A)= m/n为事件A在n次试验 中出现的频率。
一、 基本概念
频率与概率
当试验次数n不大时,事件的频率有明显的 随机性。但当试验次数足够大时,事件的频 率与其概率十分接近。
累积频率:随机变量大于等于Xi出现的 频率。
累积频率计算公式
设mi代表累积次数,n代表样本容量,则累 积频率
P mi 100% n
2 随机变量的概率分布
经验频率
2 随机变量的概率分布
实例:
某站测得62年降水资料,将雨量资料按大小进行分 组,计算各组出现的次数、频率、累计次数、累计 频率及组内平均频率密度。
2 随机变量的概率分布
F(x)与f(x)的关系式
F (x) P( X x)
f (x)dx
x
F(x)的几何意义就是表 示位于x轴上边的密度曲 线所包围的面积。
密度函数和分布函数从不 同角度反应了随机变量的 概率分布规律。
2 随机变量的概率分布
累积次数:随机变量大于等于Xi出现的 次数。
P(X=x1)=p1, P(X=x2)=p2 P(X=x3)=p3,P(X=x4)=p4
一般将这种对应关系称为随机变量的概率分布规律,简称 为概率分布。
二、 随机变量的概率分布
2 随机变量的概率分布
对连续性随机变量而言,由于其取值可能无 限,所以取具体某个值的概率趋于零,只能 研究某个区间的概率,即用随机变量落在某 个区间的概率来分析其概率分布规律。
2 随机变量的概率分布
•重现期:在许多试验中,某一事件重复出现的时间 间隔的平均数。
当 P 50% 时,T 1 P
当 P 50%时,T 1 1 P
频率与重现期关系表
频率( P)重现期( T)意义
1
100 平均百年一遇的多水年
10
10 平均十年一遇的多水年
50
2
平均二年一遇的中水年
90
10 平均十年一遇的少水年
2 离散特征变量
变差系数/离差系数/离势系数
1
Cv xx
Cv
1
xx
n
i 1
xi
x
2
n
n
Ki 12
i 1
适用于总体
n
n
i 1
xi
x
2
n 1
n
Ki 12
i 1
n 1
适用于样本
Ki为模比系数,Ki=xi
/
x
2 离散特征变量
偏态系数
n xi x' 3
n
Ki 1 3
Cs
i 1
2 适线法/配线法
步骤
计算各项的模比系数ki=xi/x‘; 计算( ki -1)2,并计算Cv; 选择Cs与Cv间的倍数,查表计算对应频率; 改变Cs与Cv间的倍数,使曲线与经验点距比
较一致为止
平均值、变差系数和偏态系数
2 皮尔逊III型分布
离均系数
x
x
Cv
x
P p f ,Cs d p
Kp xp x
K p pCv 1
2 皮尔逊III型分布
五、统计参数估计方法
1 矩法
x _
x
1
n
n i1 i
n xi x' 2
i1
n 1
Cv
1
xx
n
i 1
xi
x
2Βιβλιοθήκη Baidu
n 1
99
100 平均百年一遇的少水年
三、 随机变量的分布参数
1 位置特征参数
平均数
设随机变量有以p1、p2、、、pn为概率的可能值x1、
x2、、xn,其平均值为:
n
但因
_
x
x1
p 1
x2
p ..... 2
xn
p p ..... p
1
2
n
p n
xi
p i
i 1
n
p
i
i 1
n
p 1 i i 1
1 ( x ) 0
0
式中:() 为 的伽玛函数;
4 2;
Cs
_ 2 ;
xCvCs
_
2
C x (1 v )
0
Cs
2 皮尔逊III型分布
工程上的应用
求出指定概率P所对应的随机变量Xp
P P X xp
1
x a0 e xa0 dx
xp
Xp=f(P,,,0)
n
Ki 12
i 1
n 1
五、统计参数估计方法
2 适线法/配线法
概念
根据估计的频率分布曲线和样本经验点据分布配 合最佳来优选参数的方法
经验频率曲线 经验频率
P mi 100% n 1
2 适线法/配线法
步骤
将原始资料按大小次序排列; 计算经验频率(P=m/(n+1)*100%); 将x和对应的频率P点绘到概率格纸上; 计算资料的平均值;
2 随机变量的概率分布
对于连续型随机变量,通常还研究随机变量 取值大于等于某一值的概率,即研究X≥x的 概率,可表示为P(X≥x)。
显然P(X≥x)是x的函数,这个函数称为 随机变量X的分布函数,即 F( x )= P(X≥x)
举例
右图表示某雨量站年雨量的分布 曲线。若x=800mm,由分布曲 线知P(X≥800)=0.6。这表 明该站年雨量从多年平均来看, 超过800 mm的可能性为60%。
连续型随机变量:若随机变量可以取得一个有限 区间内的任何数值,则称该随机变量为连续型随 机变量。
一般用X表示随机变量,则其取值可用x1、x2、x3、、、 xn表示。
二、 随机变量的概率分布
2 随机变量的概率分布函数
随机变量可以取得所有可能值中的任何一个值,但取得某一 可能值的机会并不相同,有的机会大,有的机会小。也就是 说随机变量是以一定的概率来取某个可能值的,即随机变量 的取值与其概率之间有一定的对应关系。
n xi x' 2
i 1
n
适用于总体
n xi x' 2
i1
n 1
适用于样本
2 离散特征变量
例:甲系列:10 50 90 乙系列:49 50 51 均值都为50。 甲=40 乙=1
2 离散特征变量
例:甲地区的年雨量分布,其均值x1= 1200mm,均方差 1=360mm;乙地 区的年雨量分布,其均值x2=800mm, 均方差 2=320mm。
x
上式表示随机变量落入区间(x,x+Δ x)的 平均概率,而
lim F (x) F (x x)
x0
x
lim F
F (x x) F (x) ' (x)
x0
x
式中:F'(x) 为分布函数F(x)的一阶导数,令f (x)= F'(x) 。
2 随机变量的概率分布
函数f(x)为概率密度函数(密度函数或分布 密度函数)。密度函数f(x)的几何曲线为密 度曲线。通过密度曲线可以很方便地求出随机 变量X落在区间dx上的概率,它等于f(x)dx。
根据曲线分析该站年降水在 800-900mm之间的概率为多少?
随机变量落在(x,x+Δ x)内 的概率为:
P( x+ Δ x≥X≥ x )=
F(x)-F(x+ Δ x)
年降水量落在800-900之间的概 率为:
2 随机变量的概率分布
随机变量X落在区间(x,x+Δ x)内的概率 与区间长度Δ x为 F (x) F (x x)
一、 基本概念
投掷硬币
假如投掷了4040次,出现正面2048次,占 总次数的50.69%。则称n=4040称为事件的 总数,m=2048称为出现正面的频率。
掷币次数(n) 出现正面 的次数(m)
频率(P(A))
掷硬币试验出现正面的频率表
10
100 1000 5000 10000 12000
6
45 520 2475 5030 6019
1 正态分布
密度函数
_2
e f (x) 1
2
(xx)
2 2
( x )
_
其中: x 为平均数; 为标准差;
四、 几重常用的概率分布曲线
2 皮尔逊III型分布 皮尔逊III型
曲线是一条一端有 限一端无限的不对 称单峰曲线,
2 皮尔逊III型分布
概率密度函数
(x ) f (x)
中位数
中位数是把概率密度分布两个相等部分的数,对于离 散型随机变量,将随机变量所有的取值按大小次序排 列,中位数为位置居中的数字。对连续型随机变量, 中位数将概率密度曲线下的面积划分为各等于1/2的 两个部分。
2 离散特征变量
标准差/均方差
设系列中随机变量取值为x1,x2…xn,各值对 x’的离差为(x1-x’), (x2-x’), … (xn- x’)。则均方差为:
所以
_
n
x
xi
p i
i 1
平均数代表了随机变量的重心,可以代表随机变量的水平
三、 随机变量的分布参数
1 位置特征参数
众数
众数是表示概率密度分布峰值所对应的数,对于离散 型随机变量,当pi>pi+1,且pi>pi-1时,pi对应的值xi 就是分布的众数。对于连续性随机变量,众数就是使 得分布密度函数f(x)为极大的x值。
0.600 0.450 0.520 0.495 0.503 0.502
二、 随机变量的概率分布
1 概念
随机变量
每次试验的结果可以用一个变量的数 值来表示,这个变量的取值随偶然因 素而变化,但又遵从一定的概率分布 规律,这种变量为随机变量
1 概念
离散型随机变量:若随机变量仅能取得区间某些 间断的离散数值,则称该随机变量为离散型随机 变量。
nx
C '3 3 v
i 1
nC
3 v
n xi x' 3
n
Ki 1 3
Cs
i 1
(n
3)
x
'3C
3 v
i 1
(n
3)C
3 v
适用于总体 适用于样本
四、 几重常用的概率分布曲线
1 正态分布 自然界中有很
多随机变量,具有 一重很类似的概率 密度分布,在数学 中通常称为正态分 布
特点:单峰;对 平均数对称;曲 线两侧趋于无穷 大,并以x轴为 渐近线
水文统计基础
一、基本概念
事件/随机事件:一个随机试验的样本空 间的子集
概率:随机事件发生的可能性大小 频率:设事件A在n次试验中出现了m次,
则称W(A)= m/n为事件A在n次试验 中出现的频率。
一、 基本概念
频率与概率
当试验次数n不大时,事件的频率有明显的 随机性。但当试验次数足够大时,事件的频 率与其概率十分接近。
累积频率:随机变量大于等于Xi出现的 频率。
累积频率计算公式
设mi代表累积次数,n代表样本容量,则累 积频率
P mi 100% n
2 随机变量的概率分布
经验频率
2 随机变量的概率分布
实例:
某站测得62年降水资料,将雨量资料按大小进行分 组,计算各组出现的次数、频率、累计次数、累计 频率及组内平均频率密度。
2 随机变量的概率分布
F(x)与f(x)的关系式
F (x) P( X x)
f (x)dx
x
F(x)的几何意义就是表 示位于x轴上边的密度曲 线所包围的面积。
密度函数和分布函数从不 同角度反应了随机变量的 概率分布规律。
2 随机变量的概率分布
累积次数:随机变量大于等于Xi出现的 次数。
P(X=x1)=p1, P(X=x2)=p2 P(X=x3)=p3,P(X=x4)=p4
一般将这种对应关系称为随机变量的概率分布规律,简称 为概率分布。
二、 随机变量的概率分布
2 随机变量的概率分布
对连续性随机变量而言,由于其取值可能无 限,所以取具体某个值的概率趋于零,只能 研究某个区间的概率,即用随机变量落在某 个区间的概率来分析其概率分布规律。
2 随机变量的概率分布
•重现期:在许多试验中,某一事件重复出现的时间 间隔的平均数。
当 P 50% 时,T 1 P
当 P 50%时,T 1 1 P
频率与重现期关系表
频率( P)重现期( T)意义
1
100 平均百年一遇的多水年
10
10 平均十年一遇的多水年
50
2
平均二年一遇的中水年
90
10 平均十年一遇的少水年
2 离散特征变量
变差系数/离差系数/离势系数
1
Cv xx
Cv
1
xx
n
i 1
xi
x
2
n
n
Ki 12
i 1
适用于总体
n
n
i 1
xi
x
2
n 1
n
Ki 12
i 1
n 1
适用于样本
Ki为模比系数,Ki=xi
/
x
2 离散特征变量
偏态系数
n xi x' 3
n
Ki 1 3
Cs
i 1
2 适线法/配线法
步骤
计算各项的模比系数ki=xi/x‘; 计算( ki -1)2,并计算Cv; 选择Cs与Cv间的倍数,查表计算对应频率; 改变Cs与Cv间的倍数,使曲线与经验点距比
较一致为止
平均值、变差系数和偏态系数
2 皮尔逊III型分布
离均系数
x
x
Cv
x
P p f ,Cs d p
Kp xp x
K p pCv 1
2 皮尔逊III型分布
五、统计参数估计方法
1 矩法
x _
x
1
n
n i1 i
n xi x' 2
i1
n 1
Cv
1
xx
n
i 1
xi
x
2Βιβλιοθήκη Baidu
n 1
99
100 平均百年一遇的少水年
三、 随机变量的分布参数
1 位置特征参数
平均数
设随机变量有以p1、p2、、、pn为概率的可能值x1、
x2、、xn,其平均值为:
n
但因
_
x
x1
p 1
x2
p ..... 2
xn
p p ..... p
1
2
n
p n
xi
p i
i 1
n
p
i
i 1
n
p 1 i i 1