水文学与水文地质学2统计参数与抽样误差

合集下载

水文学水文地质学相关分析

水文学水文地质学相关分析

水文学水文地质学相关分析水文学和水文地质学是地学领域中与水相关的两个重要学科,它们在地球科学研究中起着不可替代的作用。

水文学主要研究水的分布、循环、质量、量和运动等方面的问题,而水文地质学则是研究地下水和地表水之间的相互作用以及地下水资源的形成、演化和利用等问题。

下面将分别对这两个学科进行相关分析。

首先,水文学研究水的分布、循环、质量、量和运动等方面的问题,对于认识和利用地球上的水资源具有重要的意义。

水是地球上最重要的资源之一,它对于人类的生存和发展至关重要。

水文学研究可以帮助我们了解地表水和地下水的分布情况,研究雨水如何形成、蒸发和降水,以及河流、湖泊和海洋之间的水循环过程。

通过对水资源的科学调查和研究,可以为水资源的开发利用提供科学依据,合理规划水资源的分配和利用方式,确保水资源的可持续利用。

其次,水文地质学研究地下水和地表水的相互作用以及地下水资源的形成、演化和利用等问题,对于保护地下水资源和优化地下水开发利用具有重要意义。

地下水是地球上最重要的淡水资源之一,被广泛用于农业、工业和生活供水等领域。

水文地质学通过研究地下水与地表水之间的相互关系,揭示了地下水补给与排泄的机制,进一步认识了不同地质条件下地下水资源的形成和演化过程,为地下水资源的开发利用提供了科学依据。

此外,水文地质学还研究地下水的污染与修复等问题,对于保护地下水资源的质量和可持续利用具有重要的指导意义。

综上所述,水文学和水文地质学是地学领域中与水相关的两个重要学科,它们的研究内容和方法在地球科学研究中起着不可替代的作用。

水文学研究水的分布、循环、质量、量和运动等方面的问题,为水资源的科学调查和合理利用提供了依据;水文地质学研究地下水和地表水的相互作用以及地下水资源的形成、演化和利用等问题,保护了地下水资源的质量和可持续利用。

这两个学科的研究成果为合理规划和管理水资源,促进可持续发展提供了科学依据和技术支持。

因此,水文学和水文地质学的发展对于解决水资源问题具有重大的现实意义。

水文学与水文地质学重点总结

水文学与水文地质学重点总结

水文学与水文地质学第一章1、水文学概念:水文学是研究自然界中各种水体的形成、分布、循环和与环境相互作用的一门科学。

2、水文循环(1)水的这种既无明确的“开端”,有无明确的“终了”的无休止的循环运动过程称为水文循环。

(2)水分由海洋输送到大陆又回到海洋的循环称为大循环或外循环。

水分在陆地内部或海洋内部的循环称为小循环或内循环。

为区分这两种小循环,将前者叫做陆地小循环,后者叫做海洋小循环。

(3)内因——水的三态在常温条件下的相互转化外因——太阳辐射和地心引力(4)四个环节:水分蒸发—水汽输送—凝结降水—径流3、水文循环的时空分布变化特点(简答—扩展)(1)水循环永无止境(2)水文现象在时间上既有具周期性又具有随机性(3)水文现象在地区分布上既具有相似性又具有特殊性4、水量平衡原理概念:水量平衡是指在自然水循环过程中,任意区域在一定时间内,输入水量与输出水量之差等于该区域的蓄水变化量。

第二章1、河流基本特征(看透书P15—P17、小题)(1)河流长度(L)自河源沿主河道至河口的长度。

深泓线(中泓线):河槽中沿流向各最大水深点的连线。

(2)河流的弯曲系数(Φ)河流的弯曲系数等于河流长度与河源到河口之间的直线距离之比。

(3)河槽特征1)河流的断面河流横断面河谷河槽:基本河槽洪水河槽过水断面河流的纵断面2)河流平面形态(4)河流纵比降(J)河流纵比降指任意河段首尾两端的高程差与其长度之比河段纵断面近于直线:J=(Z1-Z2)/L河段纵断面呈折线:J=[(Z0+Z1)L1+(Z1+Z2)L2+…+(Z n-1+Z n)L n-2Z0L]/L2(5)河流分段一条河流按照河段不同的特征,沿水流方向可划分为河源、上游、中游、下游和河口5段。

2、流域的概念:流域是指汇集地表径流和地下径流的区域,是相对河流的某一端面而言。

闭合流域的概念:当流域的地面分水线与地下分水线相重合,则地面和地下集水区域也相重合,相邻的流域不发生水量交换,此种流域称为闭合流域。

第三章:水文统计基本原理与方法,水文学,黄廷林,西安建筑科技大学课件

第三章:水文统计基本原理与方法,水文学,黄廷林,西安建筑科技大学课件

现象(已经观测到的水文现象),找出水文现象的统计规律性;
水文学统计基本原理与方法
3.1.2 事件 随机试验:对随机现象的观测; 事件:随机试验的结果。包括: 1) 必然事件:在一定能够的条件组合下,必然会发生的事情。 2) 不可能是件:在一定的条件组合下,一定不可能发生的事情。 3) 随机事件:在一定的条件组合下,可能发生也可能不发生的事件。 3.1.3 总体、样本、样本容量 随机变量:受随机因素影响,遵循统计规律的变量。通俗地讲,指在随 机试验中测量到的数量。对于水文现象而言,指某种水文特征值,如某 地区流域出口的年径流量和洪峰流量等。分: 1) 连续性随机变量,如水位、流量; 2) 离散性随机变量,如投掷硬币的正反面。 总体:随机变量所能取值的全体,分有限和无限总体。 样本:从总体中随机抽取出的一组观测值。 样本容量:样本中所汉随机变量的项数。
P(白)=
P(黑)=
20 2 20 10 3
10 1 20 10 3
P(白或黑)=
P(红)=
20+10 1 20 10
0 0 20 10
水文学统计基本原理与方法
概率的基本性质:
0 P( A) 1
1) P(A)=1,A属于必然事件; 2) P(A)=0,A属于不可能事件; 3) 0<P(A)<1,A属于随机事件; (3)频率与概率的关系
W ( A)
m n
水文学统计基本原理与方法
(2)概率 概率是指随即事件在客观上出现的可能性,即该事件的发生率,亦称为
机率。根据事件出现的可能性是能够预先估计出来,可分为事先概率和事后
概率: 事先概率:试验之前某随机事件出现的可能性可以预先估计出来,如
1) 投硬币出现正面和反面的机率;

第三章 水文统计基本原理与方法

第三章  水文统计基本原理与方法

的两端或一端与横轴线渐近相切。
y f ( x) ( x a0 ) a 1 e ( x a ( )
( )
——
0
)


0
t 1e t dt ,称为 的伽马函数
0
—— 曲线上点的横坐标值,待定参数 —— 特定参数
,
第三章 水文统计基础知识 → 3)水文经验频率曲线、理论曲线及参数估计
第三章 水文统计基本原理与方法 → (1) 概率统计理论基础
概率
随机事件A客观上出现的可能性,称为概率,用 P(A)表示,又称为机率、或然率等。它是描述随 机事件发生可能性大小的数值标准。 设事件A在重复的随机中共有N种结果,且每种 结果发生的可能性均等,其中事件A出现的可 能结果有f0种,按概率定义,有
曲线参数与统计参数之间的关系:
2 x CV 4 C s 2C S
a0 x(1 ) CS
第三章 水文统计基础知识 → 3)水文经验频率曲线、理论曲线及参数估计
p( ) f , C d
p p s
该式包含 Cs、P与Φp的关系,查附表2,由已 知的Cs值,查表可得不同P的 Φp值,然后利用 已知的 x 和Cv值,通过下式即可求出与各种P 相应的xp值,从而可绘出理论频率曲线。
上述累积频率是指多年平均出现的机会; 重现期则是平均若干年出现一次,而不是固定 的周期。
例4 某大城市从互不相关的三条河流中取水,各设一个 泵房.每一泵房正常运转受洪水破坏的机率为1﹪。试确 定此城市供水受破坏的机率为多大?
解:水文现象总体容量无限,所述破坏机率只能是一 种估计值。供水受破坏的情况有如下几种: (1)三个泵房运转同时破坏的机率:
•重现期

水文统计基本原理与方法

水文统计基本原理与方法

51
41 40 42
72
58 56 60
102
82 80 85
162
130 126 134
由表中可见,当n=100时,CS的误差在40~126%之间。 水文资料一般都很短(n<100),按矩法公式算得的CS值, 抽样误差太大。
3.3 经验频率曲线与理论频率曲线
一、经验频率及其计算公式 1.经验频率 用根据水文实测系列 ( 样本 ) 计算出来的 频率分布近似代替总体概率分布,这种意义 上的累积频率称为经验(累积)频率。
81 32
皮尔逊Ⅲ型分布参数矩法估计的均方误公式:
X

n
2n 1 3 2 cs 4 3 2 CS 2C V C S 4
绝 对 误 差

Cv
Cv 2n
6
2 1 2cv
Cs
n
(1
3 5 2 4 CS CS 2 16
81 33
样本参数的均方误(相对误差,%)
81 24
3.2 统计参数与抽样误差
一、统计参数 概率分布曲线完整地刻画了随机变量的变化规
律。但随机变量特别是水文随机变量,其概率分
布的确定是十分困难的。实际上,我们有时仅需
要知道它的一些数字特征即统计参数就足够了。
水文水利计算中常用离散特征参数 ( 均值、均方 差、变差系数、偏态系数等)。
81 25
古典概率表达式
k P ( A) n
古典概率满足“随机等可能,独立同分布”。 古典概率通常又叫事前概率,是指当随机事件中各种可能发 生的结果及其出现的次数都可以由演绎或外推法得知,而无 需经过任何统计试验即可计算各种可能发生结果的概率。
81 11

水文统计的基本方法

水文统计的基本方法

年份
1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973
年降水量
549 702 563 612 760 658 528 802 554 643 592 586 745
年份
1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986
第三章 水文统计的基本方法
第二节 概率、频率、重现期
第二节 概率、频率、重现期
教学内容: 一、概率 二、频率 三、重现期 教学要求:
掌握概率、频率和重现期的概念;掌握频率 和概率的联系和区别;掌握频率和重现期的关系。
第二节 概率、频率、重现期
一 、概率 (一)随机试验与随机事件
1、随机试验
①可以在相同的条件下重复进行; ②每次试验的可能结果不止一个,并且能事先知道实验所
三、重现期
1、定义:所谓重现期,是指某随机事件在长期过程中 平均是多少年比现一次,称为“多少年一遇”,用字 母T表示。
2、根据研究问题的性质不同,频率P与重现期T的关 系有两种表示方法 :
(1)在研究暴雨洪水问题时,一般设计频率P<50%,
则:
T1
(年)
P
式中:T——重现期,年; P——频率,%。
第二节 概率、频率、重现期
第三节 随机变量及其频率分布
上节内容提问
1、频率和概率的区别和联系是什么? 答:区别:概率是抽象数.是个理论值;频率是具体数, 是个经验值。联系:频率随实验次数的增多而逐渐稳 定.并趋近于概率。 2、频率P与重现期T的关系如何? 答:在研究暴雨洪水问题时,T ;1
P

3第三章 水文统计

3第三章 水文统计


相关系数r:是定量表示两种变量之间的密切程 度
r2=1: 变量之间为函数关系 r2=0: 零相关 1>r2>0:相关 r<0:负相关 r>0:正相关 相关系数r多大才算合适?
相关系数的显著性检验

相关系数r多大才能满足要求,取决于样本容 量和精度要求。用相关系数临界值来衡量。
a:显著水平,认为方程有意义时,错误判断可能发 生的概率, a:越小,说明要求越高 ra:临界相关系数 n:自由度 练习查表p74
皮尔逊Ⅲ型曲线
引入参数Φ , Φ值为离均系数
PIII模型变为
例:设某水文站, 求 Q 1000m3 / s, cv 0.5, cs 1 .5, 此理论频率曲线及水文站附近某桥的设计洪峰流量 Q1%和Q 5%。
解:按公式3-31
Qp Q(1 cv p )
P=1%,Cs=1.5,查附录B: P= 3.33
I)研究洪峰流量、洪水位、暴雨等最大值问题时
例如,某洪峰流量Qi的频率为P(Q≥Qi)=l%,那么此 洪峰流量的重现期为100年,则称为平均100年出现一 次大干或等于该洪峰流量Qi的事件.或称为百年一遇。
思考题

百年一遇洪水,是指 [________]。 a、大于等于这样的洪水每隔100年必然会出 现一次; b、大于等于这样的洪水平均100年可能出现 一次; c、小于等于这样的洪水正好每隔100年出现 一次; d、小于等于这样的洪水平均100年可能出现 一次;
三点适线法 通过目估法汇出与经验频率曲线点分布配合较好的理 论曲线,从曲线上选择三点,并据此以选定理论频率 曲线上三个参数
若取三点在同一曲线上,则应符合联立方程:
Q1 Q(1 1cv ) Q2 Q(1 2 cv ) Q3 Q(1 3cv )

水文学第3章 水文统计的基本原理与方法

水文学第3章 水文统计的基本原理与方法

3.1.5 总体与样本
事件试验各种可能结果的全体称为 总体。 很多水文现象都是 无限总体。 从总体中随机抽取一部分系列,称抽样,抽取的这部分系 列称为一个 随机样本,简称 样本。
样本系列的长短,即样本中所含的项数的多少,称为 样本 容量 或样本大小。
§3.2 随机变量的概率分布及其统计参数
3.2.1 随机变量 若随机事件的每次试验结果可用一个数值 x 来表示,x 随试验 结果取不同的数值。在每次试验中,究竟出现那一个数值则是随机 的,但取得某一数值具有一定的概率,这种变量称为 随机变量。 如果在某一随机变量相邻两数值之间,不存在中间数值,这种 随机变量称为 离散型随机变量(掷骰字)。
频率是一个抽象的数理统计术语,不易为一般人所理解。
有时用“重现期”来更直观地描述“频率”一词。所谓重现 期是事件重复出现的平均间隔时间,即平均隔多少时间出现一次, 或说多少时间遇到一次。 当研究暴雨洪水问题(所取的p< 50%)时,采用 T=1/p
T——重现期,以年计,表示大于、等于xm的随机变量平 均 T 年重现一次; p——频率,以小数或百分数计。 例:某洪水的频率为p=1%,则此洪水的重现期T=1/1%=100年 ,称此洪水为百年一遇的洪水,表示大于等于这样的洪水平均 100年出现一次。
x Cv C
S

n Cv 3 2 1 2C Cs 2Cv Cs 4 2n
2 v
6 2 5 (1 Cs2 Cs4 ) n 3 16
公式右边各项均为总体的统计参数,计算是仍用样本的统计参 数代替。抽样误差的大小,随样本的容量n、Cv、Cs的大小而变, 样本容量越大,对总体的代表性越好,其抽样误差也越小)。 当样本容量不大时直接计算Cs的误差很大(计算偏差系数Cs的 均方差公式中包含Cs的高次方)。 例:n=100,Cv=0.1∽1.0,Cs=2Cv,

第3部分水文学统计基本原理与方法

第3部分水文学统计基本原理与方法

水文学统计基本原理与方法
3.1.3 数理统计法对水文资料的要求
检查资料的可靠性; 检查资料的一致性; 检查资料的代表性; 检查资料的随机性; 检查资料的独立性
3. 2 频率和概率
3.2.1概率和频率
(1) 频率
指在具体重复的实验中,某随机事件A出现的次数(频数)m与试验总
次数n的比值,即:
水文学统计基本原理与方法
概率的基本性质:
0 P(A) 1
1) P(A)=1,A属于必然事件;
2) P(A)=0,A属于不可能事件;
3) 0<P(A)<1,A属于随机事件;
(3)频率与概率的关系
lim W (A) P(A)
n
频率是经验值,概率是经验值; 可以通过实测样本的频率分析来推论事件总体概率特性; 样本容量越大,结果越准确; 对于水文现象,只能采用有限的多年实测水文资料组成样本系列,推
W ( A) m n
水文学统计基本原理与方法
(2)概率 概率是指随即事件在客观上出现的可能性,即该事件的发生率,亦称为
机率。根据事件出现的可能性是能够预先估计出来,可分为事先概率和事后 概率:
事先概率:试验之前某随机事件出现的可能性可以预先估计出来,如 1) 投硬币出现正面和反面的机率;
概率:2概) 率投是掷指骰随子即出事现件反某在应一客随个观机上点事出子件现的各的概种可结率能果性的。数可量分。为事先概率和事后概率。 事后概率:随机事件出现的可能性不能在试验之前预先估计出来,必 须通过大量的重复试验之后才能估计出它出现的可能性。如: 1) 河流决堤的机率; 2) 河流出现大型污染事件的机率
求频率作为概率的近似值。
水文学统计基本原理与方法

水文统计知识点总结

水文统计知识点总结

水文统计知识点总结一、水文统计学的基本概念1. 水文变量:水文变量是指用以描述水文过程的各种物理量或指标,如降水量、径流量、蒸发量、地下水位等。

2. 水文数据:水文数据是对水文变量进行观测测量所得到的数据,包括观测数据、统计数据和模拟数据等。

3. 概率分布:概率分布是描述随机变量的取值与其概率之间关系的数学函数。

在水文统计学中,常见的概率分布包括正态分布、指数分布、伽马分布、威布尔分布等。

4. 参数估计:参数估计是通过样本数据推断总体参数的过程。

在水文统计学中,常用的参数估计方法包括最大似然估计法、矩估计法、贝叶斯估计法等。

5. 假设检验:假设检验是用来检验统计推断的结论是否成立的一种方法。

在水文统计学中,常用的假设检验方法包括t检验、F检验、χ²检验等。

6. 置信区间:置信区间是对参数估计结果的可信程度进行界定的一种区间估计方法。

在水文统计学中,常用的置信区间估计方法包括Z检验法、t检验法、Bootstrap法等。

二、水文数据的统计描述和分析1. 数据的收集和整理:水文数据的收集包括实地观测和监测站点数据的获取、卫星遥感数据的获取等。

数据的整理包括数据的输入、存储、清洗、筛选等工作。

2. 数据的描述统计分析:通过对水文数据进行描述统计分析,可以得到数据的中心趋势、离散程度、分布形状等信息,包括均值、方差、标准差、偏度、峰度等统计指标。

3. 数据的频率分布分析:频率分布分析是通过概率分布函数对水文数据进行描述和分析,包括经验频率分布、经验概率密度函数、经验累积分布函数等。

4. 数据的极值分析:极值分析是通过极值理论对水文数据的极值情况进行分析,包括极大值和极小值的分布、频率和概率等。

5. 数据的趋势分析:趋势分析是对水文数据的长期变化趋势进行分析,包括线性趋势、非线性趋势、周期性趋势等。

6. 数据的变异分析:变异分析是对水文数据的空间和时间变异特征进行分析,包括空间变异、时间变异、季节性变异等。

水文学-2统计方法

水文学-2统计方法

一般将这种对应关系称作随机变量的概率分布规 律,简称为分布律。可以用以下的分布图形表示:
P
X
x1 x2 x3 x4 … … xn
离散型随机变量概率分布图
对于连续型随机变量:
由于它的所有可能取值有无限个,水文学上 习惯研究随机变量的取值等于或大于某个值的概 率,表示为:
P( X x)
它是 x 的函数,称作随机变量 X 的分布函数 (Distribution function),记作F(x),即
取标准变量(离均系数) ( x x ) , 即 xCV x x(1 CV ) 代入上式,, , a0 以相应的
x , CV 和 C S 关系式表示,简化后得:
P ( P )
( x x ) 中,制成 C s ~ P ~ P 对应关系表: xCV
F(x) = P(X x)
表示随机变量X大于或等于值x的概率,其几 何曲线称作随机变量的概率分布曲线(水文学上 通常称累计频率曲线,简称频率曲线)。
年降雨量(mm)
900 500
F ( x ) P( X x )
P(X x) 0 0.2 0.4 0.6 0.8 1.0
某站年雨量概率分布曲线 由图中可知,X=900,相应的P(Xx)=0.15,说明大 于等于 900mm 降雨的可能性为 15% ;同理,大于等于 500 mm 降雨的可能性为60%
2)随机变量的概率分布
对于离散型随机变量:
随机变量的取某一可能值的机会有的大有的小, 即随机变量取值都有一定的概率与之相对应,可表 示为: P ( X x1 ) P1
P ( X x 2 ) P2 P ( X x n ) Pn
上式中P1, P2, … Pn 表示随机变量X 取值x1, x2, … xn 所对应的概率。

第二章,水文统计原理

第二章,水文统计原理

均方差----离均差平方的平均数的平方根 。反映各随机变量例均程度。
第三十九页,编辑于星期五:十七点 四十分。
变差系数(无量纲)----均方差与均值的 比值。
第四十页,编辑于星期五:十七点 四十分。
偏差系数----反映频率分布对均值的偏斜 程度。
第四十一页,编辑于星期五:十七点 四十分。
第三十四页,编辑于星期五:十七点 四十分。
二 经验频率曲线的绘制
为了表示多年水文观测系列,如 年最大洪水流量、潮汐水位等,各 项观测值的出现频率,以及观测值 的大小随频率数值的变化,可以横 坐标为频率(即经验频率)P(%),纵 坐标为水文观测值(随机变量)x,在 坐标纸上点绘各个观测值的点据分 布图,如图2-4-1.有必要时,根据点 据的分布趋势,目估连出一条光滑 曲线,这条曲线称经验频率曲线。
第四十七页,编辑于星期五:十七点 四十分。
第四十八页,编辑于星期五:十七点 四十分。
第四十九页,编辑于星期五:十七点 四十分。
课堂习题二
某水文站有10年的年最大流
第二十七页,编辑于星期五:十七点 四十分。
第二十八页,编辑于星期五:十七点 四十分。
第二十九页,编辑于星期五:十七点 四十分。
课堂习题一
某河流拟建4*20米的预应力砼简支梁桥, 通过水文站的资料查得洪水流量为: Q0.33%=3600m3/s; Q1%=3600m3/s; Q2%=3600m3/s; 该桥位二级公路上的桥梁,请选择对 应的洪水流量?
随机变量系列中,每个大小不同的随机变量, 都对应着一定的出现频率。这种大小不同的随机变 量和它出现频率之间的对应关系,称为随机变量的 频率分布。
第十八页,编辑于星期五:十七点 四十分。
频率是各组出现次数与总次数的比值, 表示每组所在区间的流量值出现的可能程 度;累计频率是各组累计出现次数与总次 数的比值,表示等于和大于该组所在区间 的流量值出现的可能程度,均以百分数计。

水文学 第3章水文统计基本原理与方法

水文学 第3章水文统计基本原理与方法
r E X E( X )r



(r 1,2,...,n)
r=1时,一阶中心矩为0
r=2时, r=3时,
2 E X E ( X ) s
2

2
s Cv x
3 E X E( X )

3

3 Cs
s3
四、重现期与频率的关系 水文上常用“重现期”来代替“频率” 1 1. 当研究暴雨或洪水时(一般p≤50%) T P 例如,当某一洪水的频率为p=1%时,则T=100年,称此 洪水为百年一遇洪水,表示大于等于这样的洪水平均 100年会遇到一次。 T 1 2. 当研究枯水或年径流时(一般p≥50%) 1 P 例如,对于p=90%的枯水流量,则T=10年,称此为十年 一遇枯水流量,表示小于等于这样的流量平均10年会 遇到一次。 在频率p≥50%时,工程上习惯于把设计频率叫做设计保 证率,即来水的可靠程度。十年一遇的枯水意思是平 均十年中可能有一年来水小于此枯水年的水量,说明 具有90%的可靠性。

p
f , C s d
该式包含 Cs、P与Φp的关系,查附录3, 由已知的Cs值,查表可得不同P的 Φp值,然 后利用已知的 和Cv值,通过下式即可求出 x 与各种P相应的xp值,从而可绘出理论频率曲 线。
X X (1 cV )
如何求
x
Cv Cs,在以后介绍。
例:某站年径流系列符合pⅢ型分布,已知该系 列的R=650mm,s=162.5mm,Cs =2Cv,试结合 下表计算设计保证率p=90%的设计年径流量。
二、权函数法 当样本容量较小时,用矩法估计的参数将 产生误差,其中尤以Cs的计算误差最大,为了 提高Cs的计算精度,马秀峰(1984)提出了权 函数法。

水文水资源教材-实用水文统计-抽样分布)

水文水资源教材-实用水文统计-抽样分布)

P(T t )
2
2 抽自二个正态总体的样本分布
(1)
Z
X
Y~N
((a1-a
2
),(
2 1
n1
2 2
n2
) ) 分布
而 U ( X Y ) (a1-a 2 )~N (0, 1)
(
2 1
2 2
)
n1 n2
2 抽自二个正态总体的样本分布
(2)若
2 1
2 2
2
,则统计量
T ( X Y ) (a1 a2 )
总体分布(或理论分布)正好体现一个随机变量的分布。 所以总体就必然与一个随机变量相联系。所谓总体已知,就 是指随机变量的概率分布已知。对于一种随机现象,所研究 的问题一经确定,则相应的总体所包含的元素及概率分布是 完全确定的,不因是否进行观测或试验而改变。
常用表示随机变量的X,Y,Z等表示总体。 通过观测或试验得到总体中的一部分元素构成的集合称 为样本。
第六章 抽样分布
◇概率论的基本知识,都是从客观物质世界的 大量随机现象中抽象出来的理论模型,揭示了 随机现象的普遍规律,
◇概率论所涉及的是一些“假想的”随机试验, 而没有与具体的随机现象发生直接联系。
◇概率论的许多问题中,概率分布通常是已知 的,或是通过某些已知条件能严格推导出来的。
◇概率论是对随机现象统计规律进行演绎研究。
第二节 样本分布与抽样分布
一 频率直方图
设 x1,x2,...,xn 为连续型随
机变量X的样本,在X的值域
[a,b]内插入许[ti,多ti1) 分点,
a t1 t2 ... ti ti1 ... tl1 b
统计样本落在区间
频率密度直方图

水文学与水文地质学2统计参数与抽样误差

水文学与水文地质学2统计参数与抽样误差
公式
1.抽样误差: 由随机抽样而引起的误差。
均方误差[标准误差]
以均值为例:
sx
m
(xi x总体 ) 2
i 1
m
(3-14)
误差分布图
2.抽样误差分布:服从正态分布
P(x总 x x x总 x ) 68.3%
误差计算公式
3.抽样误差计算公式——随机变量服从皮尔逊III型分布
▲ 随机变量 x 对中心分布 E (x) 离差的 k 次幂的数学期望 E {[x – E (x)]k},则称为随机变量 x 的 k 阶中心矩。
√ 统计参数: 均值 x称为一阶原点矩;
变差系数 Cv 称为二阶中心矩; 偏态系数 Cs 称为三阶中心矩; 各统计参数的计算公式亦称为矩法公式。
End
二. 抽样误差 (Sampling error) 1 抽样误差 2 抽样误差分布 ※ 3 抽样误差计算公式
§3-2 统计参数与抽样误差
(Statistical parameters & Sampling error )
一. 统计参数 能说明随机变量统计规律的某些特征数值,称为
统计参数,或特征参数,有时称为分布参数。
各参数
1.
位置特征参数
2. 离散程度特征参数
均值(平均数)
均方差
众值(众数) 中值(中位数)
相对误差:
s
' x

Cv n
100%

s' Cv

1 2n
1
2C
2 v

3 4
C
2 s

2C v C s
100%
s' Cs
1 Cs

水文学与水文地质学课件教学配套课件杨维第三章1基本概念

水文学与水文地质学课件教学配套课件杨维第三章1基本概念
出总体的特征。
2 概率与频率
2、概率与频率(Probability and frequency) (1) 概率:
基本性质: 0≤P(A)≤1
(3-1)
(2) 频率:
(3) 概率与频率关系: lim W ( A ) P ( A ) 0 (3-2)
n
概率 = 频率
概率分布
(4) 随机变量的概率分布:
重现期
(2)重现期(Reoccurrence period): 指某随机变量的取值在长时期内平均多少年出现 一次(多少年一遇)。
※ 重现期则是平均若干年出现一次,而不是固定的周期。
T计算公式
√重现期表示方法: ① 实测水文系列由最大值组成时,设计频率标准<50%
T1 P
或:
T(X
xi )
1 P(X
相加定理
概率相加定理:
互斥事件 A1,A2,…… An-1,An中,至少有一
个事件出现的概率等于各事件出现的概率之和。
即:
P( A1 A2 An ) P( A1 ) P( A2 ) P( An )
(3-5)
√ 互斥事件:不可能同时发生的事件。 √ 独立事件:彼此发生的概率相互无影响。
3、累积频率与重现期 (1) 累积频率(Accumulated frequency):
等量或超量值的累积频数(m)与总观测次数(n)之比。
有:
P( X
xi )
m n
(%)
(3-6)

频率
累积频率
频率特性
√ 累积频率特性:
P(X xi ) P(X xi ) ?
√累计频率分类: 年频率(P) 次频率(P’ )
1991
110.4

水文统计基本原理与方法教材

水文统计基本原理与方法教材

例1. 计算均方差并比较它们的离散程度。 序列1:5,10,15 序列2:1,10,19 例2. 计算变差系数(Cv)并比较它们的离散程度。 序列1:5,10,15 序列2 :995,1000,1005
答案:1:σ1= 4.08 2:X1=10 σ2=7.35 σ1=4.08 σ2=4.08 Cv1=0.48 Cv2=0.0048
37 81
3.3 经验频率曲线与理论频率曲线
二、经验频率曲线 1.经验频率曲线的绘制: 1)将实测水文数据列表,并由大到小,重新排序;
2)根据经验频率公式计算经验频率; 3)以实测水文变量 xi为纵坐标,经验频率 Pi 为横坐标, 在概率格纸(或普通坐标上)上点绘经验频率点,然后用 目估法过经验频率点群绘制一条光滑的曲线; 4)根据工程设计标准,在曲线上查出所对应的水文变 量值。
3.1 水文统计基本概念
二、事件与随机变量
2.随机变量
随机事件的每次试验结果可用一个变量 X 的数 值来表示,称为随机变量。可分为离散型的和连 续型的随机变量两类。
水文现象中的随机变量指水文特征值,如流量, 降雨量、水位等。
81 8
连续型随机变量——在一定的概率区间内取得任 何值。 自记水位过程 —— Z(t)~t
自记雨量过程 —— P(t)~t
离散型随机变量——在一定的概率区间内取得某
些间断值。
年降雨量X={x1},X={x2} ,… ,X={xn -1}, X={xn}
年径流量W ={W1},W ={W2},… ,W ={Wn -1} ,W={Wn}
81 9
3.1 水文统计基本概念
三、总体、个体与样本
将随机变量所能取值的全体称为总体。总体中的
第三章
水文统计基本原理与方法

水文统计课件:9-误差分析(2015)

水文统计课件:9-误差分析(2015)
由于在一定的条件下测量某一物理量时,测量的近似值 实际上是一个随机变量,因此,随机误差也是一个随机变 量。随机变量的均方差刻划了随机变量取值的分散程度, 所以在实际应用和理论研究中,还常用均方差σ来表示测量 误差,并称为均方误差或标准误差。
3、不确定度与置信概率 U=sup│△x│ —绝对误差的一个上界
(2)精确度:它是精密度和准密度综合反映。描 述了对同一被测量作多次重复测量时,所有量测结 果对其真值的接近程度和各量测结果之间的接近程 度。
第2节 粗大误差(可疑误差及其判别) 一、拉依达准则 在随机误差服从正态分布的假设下,可知
该式说明,一次测量中误差
的概率约为99.7%,反过来说,
的概率
约为0.3%,或者说,从统计上看,在1000次测
无规律性变化的系统误差
存在线性变化的系统误差
存在周期性变化的系统误差
存在变化规律复杂的系统误差
例5、恒温箱内温度测量结果如下表所示
ti(℃) 20.06 20.07 20.06 20.08 20.10
di(℃) -0.06 -0.05 -0.06 -0.04 -0.02
ti(℃) 20.12 20.14 20.18 20.10 20.21
⑶相对真值:认定精度高一个数量级的仪器的测量值 作为低精度仪器的真值,这种真值是相对比较而言的, 所以称之为相对真值或标准值。
标准值是真值的近似值,也可以将多次测量结果的平均 值作为标准值。例如,在水文测验中,用精测法测得的 流量,作为简测法流量的标准值。
二、误差的来源与分类 1、误差的来源
①原始误差:就是原始数据的误差,包括直 接观测的误差和间接观测的误差。
分布时, 的分布为
是算术平均值的标准误差。当σ为常值时,若n增大, 减小, 的精度就提高。但沁n达到一定数值后,再 增加观测次数, 的减小就很少了。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0.3
3 4 6 10 7 10 15 23 51 72 102 162
0.5
5 7 10 16 8 11 16 25 41 58 82 130
0.7
7 10 14 22 9 12 17 27 40 56 80 126
1.0
10 14 20 32 10 14 20 32 42 60 85 134
相对标准误差计算公式
总体:
n
3
xi x
n
Ki 13
CS

i 1
n 3
i1 n CV3
(3-12)
样本: Cs
(xi x)3
(n 3) 3
(Ki 1)3 (n 3)Cv3
(3-13)
Cs影响形状图
当Cs>0,密度曲线峰顶在均值的左边,叫做左偏或正偏。 当Cs<0,密度曲线峰顶在均值的右边,叫做右偏或负偏。 当Cs=0,密度曲线峰顶在均值处,叫做对称分布或正态分布。
均值图示
我国多年平均年降水量分布图(单位:mm)
Y图
湖北省部分地区多年平均年径流深等值线图(mm)
模比系数
◇ 模比系数(或称为变率):
Ki

xi x
(3-9)
据平均数的数学特性,有:
Ki n?
(Ki 1) 0
n
(Ki 1) 0?
众值
(2) 众值(众数) xˆ
概率密度曲线峰值在x坐标上相应的位置值。
Cv等值线
湖北省部分地区年径流量变差系数Cv等值线图
Cv的曲线形状影响
Cv越大,频率密度曲线矮而宽,系列数值相对 分x 布越分散。
Cv越小,频率密度曲线瘦而高,系列数值相对 x分布越集中。
Cs
3. 对称程度特征参数
偏态系数 CS
反映密度曲线的对称特征,即衡量系列在均值的两侧分布对
称或不对称(偏态)程度的系数。
Cv < 0.5, Cs = (3~4)Cv
Cv >0.5, Cs = (2~3)Cv
设计年径流量及年降水量 Cs = 2Cv √ 偏态系数依据上述关系式给定初始值。
100%
s' Cs
1 Cs
6 n
(1
3 2
C
2 s

5 16
C
4 s
)
100%

(3-16)
Xp误差公式
以 Cs = 2Cv 为例:
样本统计参数的标准误差(%)
参数 误
x
Cv
Cs
差 Cv
n 100 50 25
10
100 50 25 10 100 50
25
10
0.1
1 1 2 3 7 10 14 22 126 178 252 399
公式
1.抽样误差: 由随机抽样而引起的误差。
均方误差[标准误差]
以均值为例:
sx
m
(xi x总体 ) 2
i 1
m
(3-14)
误差分布图
2.抽样误差分布:服从正态分布
P(x总 x x x总 x ) 68.3%
误差计算公式
3.抽样误差计算公式——随机变量服从皮尔逊III型分布
§3-2 统计参数与抽样误差
(Statistical parameters & Sampling error )
一. 统计参数 能说明随机变量统计规律的某些特征数值,称为
统计参数,或特征参数,有时称为分布参数。
各参数
1.
位置特征参数
2. 离散程度特征参数
均值(平均数)
均方差
众值(众数) 中值(中位数)
▲ 随机变量 x 对中心分布 E (x) 离差的 k 次幂的数学期望 E {[x – E (x)]k},则称为随机变量 x 的 k 阶中心矩。
√ 统计参数: 均值 x称为一阶原点矩;
变差系数 Cv 称为二阶中心矩; 偏态系数 Cs 称为三阶中心矩; 各统计参数的计算公式亦称为矩法公式。
End
二. 抽样误差 (Sampling error) 1 抽样误差 2 抽样误差分布 ※ 3 抽样误差计算公式
◇ 限于比较均值相同的系列。
☆ 总体的 ☆ 样本的

(xi x)2 n 1
(3-10) Cv
(2) 变差系数(Cv)
比较两个不同均值系列的离散程度时,采用均方差与均值之比 值,用于衡量系列相对离散程度。

Cv x
(3-11)
☆ 总体的Cv ☆ 样本的Cv
◇ 对于某条河流的年径流量来说,Cv越大,其年际变化越 大;若两个河流比较,一般大河的调节作用比小河要大,所以 大河年径流分布的Cv值比小河的小。
相对误差:
s
' x

Cv n
100%

s' Cv

1 2n
1
2C
2 v

3 4
C
2 s

2C v C s
100%
s' Cs
1 Cs
6 n
(1
3 2
C
2 s

5 16
C
4 s
)
100%

Cs经验值
设计暴雨量
Cs 与 Cv 经验关系 Cs = 3.5 Cv
设计最大流量
(3)中值(中位数) x
对于连续随机变量,把概率密度曲线下的面积分为 两个相等部分所对应的 x 值为中值。即中值是该系列
频率 P=50% 时的 x 值,有 x50%.
示意图
பைடு நூலகம்
均方差
2.离散程度特征参数 (1)均方差
◇ 描述概率分布离散趋势的特征参数。随机变量分布越分散, 均方差越大;分布越集中,均方差越小。
◇ 水文现象大多属于正偏,Cs>0。
图总结
位置特征参数
离散程度特征参数
均值(平均数)
均方差
众值(众数) 中值(中位数)
对称程度特征参数 偏态系数Cs
变差系数Cv
※ 统计参数物理意义; 统计参数对频率密度曲线形状的影响。
复习:矩的概念

▲ 随机变量 x 对原点离差的 k 次幂的数学期望 E(xk),称为随机 变量 x 的 k 阶原点矩。
3. 对称程度特征参数
偏态系数Cs
变差系数Cv
无偏估计
无偏估计量: E(ˆ) 有偏估计量: E(ˆ)
▲ 对于有偏估计量,大量样本平均的结果都不等于总 体的相应参数,需要进行修正,以得到对总体的无偏估 计值公式。
均值
1.位置特征参数 (1) 均值(数学期望) x
均值表示系列的分布中心,代表随机变量系列的平均水平。 ◇ 算数平均值 ◇ 加权平均值
绝对误差:
sx


n

sCv
Cv 2n
1 2Cv2

3 4
C
2 s
2CvCs


(3-15)
sCs
6 n
(1
3 2
C
2 s

5 16
C
4 s
)


相对误差公式
相对误差:
s
' x

Cv n
100%

s' Cv

1 2n
1
2C
2 v

3 4
C
2 s

2C v C s
相关文档
最新文档