水文统计习题教学教材
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
水文统计习题
水文统计习题
水文统计是应用数理统计的方法寻求水文现象的统计规律,包括频率计算和相关分析、回归分析。
频率计算是研究和分析水文随机现象的统计变化特性,并以此为基础对水文现象未来可能的长期变化作出在概率意义下的定量预估,以满足水利水电工程规划、设计、施工和运行管理的需要。
相关分析是从数量上研究现象之间有无关系存在,以及相关关系密切程度如何的理论和方法,回归分析是对具有较高相关关系的现象,根据其相关的形态,建立一个适宜的数学模型(函数式),来近似地反映现象之间一般变化关系的一种分析方法。
相关分析和回归分析常用于展延、插补样本系列资料以提高样本的代表性,同时,也广泛应用于水文预报。
本章习题内容主要涉及:概率、频率计算,概率加法,概率乘法;随机变量及其统计参数的计算;理论频率曲线(正态分布,皮尔逊Ⅲ型分布等)、经验频率曲线的确定;频率曲线参数的初估方法(矩法,权函数法,三点法等);水文频率计算的适线法;相关分析、回归分析、相关系数、回归系数、复相关系数、均方误的计算;两变量直线相关(直线回归)、曲线相关的分析方法;复相关(多元回归)分析法。
一、概念题
(一)填空题
1.必然现象是指____________________________。
2.偶然现象是指____________________________。
3.概率是指 ____________________________。
4.频率是指____________________________。
5.两个互斥事件A、B出现的概率P(A+B)等于______________。
6.两个独立事件A、B共同出现的概率P(AB)等于______________。
7.对于一个统计系列,当C s=0时称为______________;当C s>0时称为______________;当C s<0时称为 ______________。
8.分布函数F(X)代表随机变量X______________某一取值x的概率。
9.x、y两个系列,它们的变差系数分别为C vx、C vy,已知C vx>C vy,说明系列较y系列的离散程度______________。
10.正态频率曲线中包含的两个统计参数分别是______________,______________。
11.离均系数Ф的均值为______________,标准差为______________。
12.皮尔逊Ⅲ型频率曲线中包含的三个统计参数分别是______________,______________,______________。
13.计算经验频率的数学期望公式为______________。
14.供水保证率为90%,其重现期为______________年。
15.发电年设计保证率为95%,相应重现期则为______________年。
16.重现期是指____________________________。
17.百年一遇的洪水是指______________。
18.十年一遇的枯水年是指_____________。
19.设计频率是指______________,设计保证率是指______________。
20.某水库设计洪水为百年一遇,十年内出现等于大于设计洪水的概率是_____________,十年内有连续两年出现等于大于设计洪水的概率是______________。
21.频率计算中,用样本估计总体的统计规律时必然产生______________,统计学上称之为______________。
22.水文上研究样本系列的目的是用样本的______________。
23.抽样误差是指______________。
24.在洪水频率计算中,总希望样本系列尽量长些,其原因是______________。
25.各种水文特征值也称为水文要素,是指______________,______________,______________,______________,______________等。
26.权函数法属于单参数估计,它所估算的参数为______________。
27.对于我国大多数地区,频率分析中配线时选定的线型为______________。
28.皮尔逊Ⅲ型频率曲线,当x、C s,不变,减小C v值时,则该线______________。
29.皮尔逊Ⅲ型频率曲线,当x、C v不变,减小C s,值时,则该线______________。
30.皮尔逊Ⅲ型频率曲线,当C v、C s不变,减小x值时,则该线______________。
31.频率计算中配线法的实质是______________。
32.相关分析中,两变量的关系有___________,___________和___________三种情况。
33.相关的种类通常有______________,______________和______________。
34.在水文分析计算中,相关分析的目的是______________。
35.确定y倚x的相关线的准则是______________。
36.相关分析中两变量具有幂函数(y=ax b)的曲线关系,此时回归方程中的参数一般采用______________的方法确定。
37.水文分析计算中,相关分析的先决条件是______________。
38.相关系数r表示______________。
39.利用y倚x的回归方程展延资料是以______________为自变量,展延______________。
(二) 选择题
1.水文现象是一种自然现象,它具有[ ]。
a.不可能性 b、偶然性
c、必然性
d、既具有必然性,也具有偶然性
2.水文统计的任务是研究和分析水文随机现象的[ ]。
a、必然变化特性
b、自然变化特性
c、统计变化特性
d、可能变化特性
3.在一次随机试验中可能出现也可能不出现的事件叫做[ ]。
a、必然事件
b、不可能事件
c、随机事件
d、独立事件
4.一棵骰子投掷一次,出现4点或5点的概率为[ ]。
a、1/3
b、1/4 c.1/5 d、1/6
5.一棵骰子投掷8次,2点出现3次,其概率为[ ]。
a.1/3
b.1/8
c.3/8
d.1/6
6.必然事件的概率等于[ ]。
a、1
b、0
c、0~1
d、0.5
7.一阶原点矩就是[ ]。
a、算术平均数
b、均方差
c、变差系数
d、偏态系数
8.二阶中心矩就是[ ]。
a、算术平均数
b、均方差
c、方差
d、变差系数
9.偏态系数Cs>o,说明随机变量x[ ]。
a、出现大于均值x的机会比出现小于均值x的机会多
b、出现大于均值x的机会比出现小于均值x的机会少
c、出现大于均值x的机会和出现小于均值x的机会相等
d、出现小于均值x的机会为0
10.水文现象中,大洪水出现机会比中、小洪水出现机会小,其频率密度曲线为[ ]
a、负偏
b、对称
c、正偏
d、双曲函数曲线
11.变量x的系列用模比系数K的系列表示时,其均值K等于[ ]。
a、x
b、1
c、σ
d、0
12.在水文频率计算中,我国一般选配皮尔逊Ⅲ型曲线,这是因为[ ]。
a、已从理论上证明它符合水文统计规律
b、已制成该线型的Ф值表供查用,使用方便
c、已制成该线型的Kp值表供查用,使用方便
d、经验表明该线型能与我国大多数地区水文变量的频率分布配合良好
13.正态频率曲线绘在频率格纸上为一条[ ]。
a、直线
b、S型曲线
c、对称的铃型曲线
d、不对称的铃型曲线
14.正态分布的偏态系数[ ]。
a、Cs=0
b、Cs>O
c、Cs<O
d、Cs=1
15.两参数对数正态分布的偏态系数[ ]。
a、Cs=0
b、Cs>O
c、Cs<0
d、Cs=1
16.P=5%的丰水年,其重现期T等于[ ]年。
a、5
b、50
c、20
d、95
17.P=95%的枯水年,其重现期T等于[ ]年。
a、95
b、50
c、5
d、20
18.百年一遇洪水,是指[ ]。
a、大于等于这样的洪水每隔100年必然会出现一次
b、大于等于这样的洪水平均100年可能出现一次
c、小于等于这样的洪水正好每隔100年出现一次
d、小于等于这样的洪水平均100年可能出现一次
19.重现期为一千年的洪水,其含义为[ ]
a、大于等于这一洪水的事件正好一千年出现一次
b、大于等于这一洪水的事件很长时间内平均一千年出现一次
c、小于等于这一洪水的事件正好一千年出现一次
d、小于等于这一洪水的事件很长时间内平均一千年出现一次
20.无偏估值是指[ ]。
a、由样本计算的统计参数正好等于总体的同名参数值
b、无穷多个同容量样本参数的数学期望值等于总体的同名参数值
c、抽样误差比较小的参数值
d、长系列样本计算出来的统计参数值
21.用样本的无偏估值公式计算统计参数时,则[ ]。
a、计算出的统计参数就是相应总体的统计参数
b、计算出的统计参数近似等于相应总体的统计参数
c、计算出的统计参数与相应总体的统计参数无关
d、以上三种说法都不对
22.皮尔逊Ⅲ型频率曲线的三个统计参数x、C v、C s值中,为无偏估计值的参数是[ ]。
a、x
b、Cv
c、Cs
d、Cv和Cs
23.减少抽样误差的途径是[ ]。
a、增大样本容
b、提高观测精度
c、改进测验仪器
d、提高资料的一致性
24.权函数法属于单参数估计,它所估算的参数为[ ]。
a、x
b、σ
c、Cv
d、Cs
25.图1—4—1为两条皮尔逊Ⅲ型频率密度曲线,它们的Cs为[ ]。
a、Cs1<0,Cs2>0
b、Cs1>0,Cs2<0
c、Cs1=0,Cs2=0
d、Cs1=0,Cs2>O
26.图1—4—2为不同的三条概率密度曲线,由图可知[ ]。
a、Csl>0,Cs2<0,Cs3=0
b、Csl<O,Cs2>0,Cs3=0
c、Csl=0,Cs2>0,Cs3<O
d、Cs1>0,Cs2=0,Cs3<O
27.如图1—4—3,若两频率曲线的x、C s值分别相等,则二者C v为[ ]。
a、Cvl>Cv2
b、 Cvl<Cv2
c、 Cvl=Cv2
d、Cvl=0, Cv2>0
28.如图1—4—4,绘在频率格纸上的两条皮尔逊Ⅲ型频率曲线,它们的x、C v值分别相等,则二者的C s为[ ]。
a、 Cs1>Cs2
b、 Cs1<Cs2
c、Cs1=Cs2
d、Cs1=0, Cs2<0
29.如图l —4—5,若两条频率曲线的Cv 、Cs 值分别相等,则二者的均值x 1、x 2相比较,[ ]。
a 、x l<x 2
b ,x 1>x 2
c 、x l =x 2
d 、x l =0,x 2=0
30.图1—4—6为以模比系数是绘制的皮尔逊Ⅲ型频率曲线,其Cs 值[ ]。
a 、等于2Cv
b 、小于2Cv
c 、大于2Cv
d 、等于0
31.图1—4—7为皮尔逊Ⅲ型频率曲线,其Cs 值[ ]。
a 、小于2Cv
b 、大于2Cv
c 、等于2Cv
d 、等于0
32.某水文变量频率曲线,当x 、Cv 不变,增大Cs 值
时,则该线[ ]。
a 、两端上抬、中部下降
b 、向上平移
c 、呈顺时针方向转动
d 、呈逆时针方向转动
33.某水文变量频率曲线,当x 、Cs 不变,增加Cv 值
时,则该线[ ]。
a 、将上抬
b 、将下移
c 、呈顺时针方向转动
d 、呈逆时针方向转动
34.皮尔逊Ⅲ型曲线,当Cs ≠0时,为一端有限、一端
无限的偏态曲
线,其变量的最小值a 0=x (1—2Cv /Cs)由此可知,水文系列的配线结果一般应有[ ]
a 、Cs<2Cv
b 、Cs =0
c 、Cs ≤2Cv
d 、Cs ≥2Cv
35.用配线法进行频率计算时,判断配线是否良好所遵循的原则是[ ]。
a 、抽样误差最小的原则
b 、统计参数误差最小的原则
c 、理论频率曲线与经验频率点据配合最好的原则
d 、设计值偏于安全的原则 36.已知y 倚x 的回归方程为:y=y +r x
y σσ(x-x ),则x 倚y 的回归方程为[ ]。
a 、x=y +r x y σσ(y-x ) b 、x=y +r x y
σσ(y-y )
c 、x=x +r x y σσ(y-y )
d 、x=x +r 1y x
σσ(y-y )
37.相关系数r 的取值范围是[ ]。
a 、r>O
b 、r<O
c 、r =-1~1
d 、r =0~1
38.相关分析在水文分析计算中主要用于[ ]。
a 、推求设计值
b 、推求频率曲线
c 、计算相关系数
d 、插补、延长水文系列
39.有两个水文系列y ,x ,经直线相关分析,得y 倚x 的相关系数仅为0.2,但大于临界相关系数r a ,这说明[ ]。
a 、y 与x 相关密切
b 、y 与x 不相关
c 、y 与x 直线相关关系不密切
d 、y 与x 一定是曲线相关
(三)判断题
1.由随机现象的一部分试验资料去研究总体现象的数字特征和规律的学科称为概率论。
[ ]
2.偶然现象是指事物在发展、变化中可能出现也可能不出现的现象。
[ ]
3.在每次试验中一定会出现的事件叫做随机事件。
[ ]
4.随机事件的概率介于0与1之间。
[ ]
5.x 、y 两个系列的均值相同,它们的均方差分别为σx 、σy ,已知σx>σy ,说明x 系列较y 系列的离散程度大。
[ ]
6.统计参数Cs 是表示系列离散程度的一个物理量。
[ ]
7.均方差σ是衡量系列不对称(偏态)程度的一个参数。
[ ]
8.变差系数Cv 是衡量系列相对离散程度的一个参数。
[ ]
9.我国在水文频率分析中选用皮尔逊Ⅲ型曲线,是因为已经从理论上证明皮尔逊Ⅲ型曲线符合水文系列的概率分布规律。
[ ]
10.正态频率曲线在普通格纸上是一条直线。
[ ]
11.正态分布的密度曲线与x 轴所围成的面积应等于1。
[ ]
12.皮尔逊Ⅲ型频率曲线在频率格纸上是一条规则的S 型曲线。
[ ]
13.在频率曲线上,频率P 愈大,相应的设计值x p 就愈小。
[ ]
14.重现期是指某一事件出现的平均间隔时间。
[ ]
15.百年一遇的洪水,每100年必然出现一次。
[ ]
16.改进水文测验仪器和测验方法,可以减小水文样本系列的抽样误差。
[ ]
17.由于矩法计算偏态系数Cs 的公式复杂,所以在统计参数计算中不直接用矩法公式推求Cs 值。
[ ]
18.由样本估算总体的参数,总是存在抽样误差,因而计算出的设计值也同样存在抽样误差。
[ ]
19.水文系列的总体是无限长的,它是客观存在的,但我们无法得到它。
[ ]
20.权函数法属于单参数估计,不能全面地解决皮尔逊Ⅲ型频率曲线参数估计问题。
[ ]
21.水文频率计算中配线时,增大Cv 可以使频率曲线变陡。
[ ]
22.给经验频率点据选配一条理论频率曲线,目的之一是便于频率曲线的外延。
[ ]
23.某水文变量频率曲线,当x 、Cs 不变,增加Cv 值时,则该线呈逆时针方向转动。
[ ]
24.某水文变量频率曲线,当x 、Cv 不变,增大Cs 值时,则该线两端上抬,中部下降[ ]
25.某水文变量频率曲线,当Cv ,Cs 不变,增加x 值时,则该线上抬。
[ ]
26.相关系数是表示两变量相关程度的一个量,若r =-0.95,说明两变量没有关系。
[ ]
27 y 倚x 的直线相关其相关系数r<0.4,可以肯定y 与x 关系不密切。
[ ]
28.相关系数也存在着抽样误差。
[ ]
29.y 倚x 的回归方程与x 倚y 的回归方程,两者的回归系数总是相等的。
[ ]
30.y 倚x 的回归方程与x 倚y 的回归方程,两者的相关系数总是相等的。
[ ]
31.已知y 倚x 的回归方程为y =Ax+B ,则可直接导出x 倚y 的回归方程为x =
A
B y A 1。
[ ] 32.相关系数反映的是相关变量之间的一种平均关系。
[ ]
(四)问答题
1.什么是偶然现象?有何特点? 1、答:偶然现象是指事物在发展、变化中可能出现也可能不出现的现象。
偶然现象的出现也是有一定规 律的。
这种规律与其出现的机会联系着,我们常称这种规律为统计规律。
正是因为偶然现象的规律是与
其机会分不开的,因此在数学上就称这种偶然现象为随机现
2.何谓水文统计?它在水文中一般解决什么问题?
2、答:对水文学中常用的数理统计方法有时就叫水文统计法。
水文统计的任务就是研究和分析水文随机现象的统计变化特性,并以此为基础对水文现象未来可能的长期变化作出在概率意义下的定量预估,以满足水利水电工程的规划、设计、施工以及运营期间的需要3.概率和频率有什么区别和联系?
3、答:概率是指随机变量某值在总体中的出现机会;频率是指随机变量某值在样本中的出现机会。
当样本足够大时,频率具有一定的稳定性;当样本无限增大时,频率趋于概率。
因此,频率可以作为概率的近似值。
4.两个事件之间存在什么关系?相应出现的概率为多少?
4、答:两个事件之间存在着互斥、依存、相互独立等关系。
两个互斥事件A、B 出现的概率等于这两个事件的概率的和:P(A+B)= P(A)+P(B)。
在事件A发生的前提下,事件B 发生的概率称为条件概率,记为P(B︱A),两事件积的概率等于事件A的概率乘以事件B 的条件概率:P(AB)= P(A)× P(B︱A);若A、B 为两个相互独立的事件,则两事件积的概率等于事件A的概率乘以事件B的概率:P(AB)= P(A)×P(B)
5.分布函数与密度函数有什么区别和联系?
5、答:事件X≥x 的概率P(X≥x)随随机变量取值x 而变化,所以P(X≥x)是x 的函数,这个函
数称为随机变量X 的分布函数,记为F(x),即F(x)= P(X≥x)。
分布函数导数的负值,即f(x)
= -F′(x)= −dF(x)
dx
,刻划了密度的性质,叫做概率密度函数,或简称密度函数。
因此,分
布函数F
(x)与密度函数f(x),是微分与积分的关系。
6.离散型随机变量和连续型随机变量有什么区别?
6、答:P(X≥x)表示X 大于等于取值x 的概率,称为超过制累积概率;而q(X≤x)表示X 小于等于取值x 的概率,称为不及制累积概率。
两者有如下关系:q =1-P 。
7.什么叫总体?什么叫样本?为什么能用样本的频率分布推估总体的概率分布?
7、答:数理统计中,把研究对象的个体的集合叫做总体。
从总体中随机抽取一系列个体称为总体的一个随机样本,简称样本。
样本既是总体的一部分,那么样本就在某种程度上反映和代表了总体的特征,这就是为什么能用样本的频率分布估算总体的概率分布的原因。
8.统计参数x、σ、C v,C s的含义如何?
8、答:统计参数x为平均数,它为分布的中心,代表整个随机变量的水平; C v称变差系数,为标准差之和与数学期望值之比,用于衡量分布的相对离散程度;C s为偏差系数,用
来反映分布是否对称的特征,它表征分布的不对称程度。
9.正态分布的密度曲线的特点是什么?
9、答:正态分布密度曲线有下面几个特点:(1)单峰;(2)对于均值x对称,即C s =
0,(3)曲线两端趋于无限,并以x轴为渐近线。
10. 水文计算中常用的“频率格纸”的坐标是如何划分的?
10、答:频率格纸的横坐标的分划就是按把标准正态频率曲线拉成一条直线的原理计算出来的。
这种频率格纸的纵坐标仍是普通分格,但横坐标的分划是不相等的,中间分格较密,越往两端分格越稀,其间距在P=50%的两端是对称的。
11.皮尔逊Ⅲ型概率密度曲线的特点是什么?
11、答:皮尔逊Ⅲ型密度曲线的特点是:
(1)一端有限,一端无限的不对称单峰型曲线;
(2)该曲线有α,β, a0 (它们与x 、C v、C s有关)三个参数;
v (3)C s <2C v 时,最小值为负值;C s =2C v 时,最小值为 0;C s =0 时,为正态曲线。
12. 何谓离均系数Ф?如何利用皮尔逊Ⅲ型频率曲线的离均系数Ф值表绘制频率曲线? 12、答:离均系数Φ是频率曲线上某点相对离均差 x −= x 与C 的比值,即
Φ = x − x。
在进行频率计算
x xC v
时,由已知的C s值,查Φ值表得出不同P的ΦP值,然后利用已知的x 、C v值,通过关系式x = x (1 + C v Φ)
即可求出各种P相应的x P值,从而可绘出x ~ P频率曲线。
13. 何谓经验频率?经验频率曲线如何绘制?
13、答:有一个n项水文系列X,按大小排序为:x1、x2、x3、……、x m、…… 、x n-1、
x n 。
设m表示系列
m
中等于及大于x m的项数,则P =n +1
×
100%
即为系列X等于大于x m的频率,由于是用实测资料
计算
的,因之称为经验频率。
将x m(m=1、2、……、n)及其相应的经验频率p点绘在频率格纸上,并通过点
群中间目估绘出一条光滑曲线,即得该系列X的经验频率曲线。
14. 重现期(T)与频率(P)有何关系?P=90%的枯水年,其重现期(T)为多少年?含意是什么?
14、答:对暴雨和洪水(P ≤50% ),T = 1
;对枯水(P ≥
50% ),T =
P
1
;对于P=90%的
枯
1−P
水年,重现期为T =
次。
1
=1(0
1−0.9
年),它表示小于等于P=90%的枯水流量在长时期内平均10
年出现一
15.什么叫无偏估计量?样本的无偏估计量是否就等于总体的同名参数值?为什么?
15、答:无穷多个同容量样本,若同一参数的平均值可望等于总体的同一统计参数,则这一参数成为无偏估计值,可以证明均值是无偏估计值,C v ,C s 是有偏估计值,用样本无偏估计公式计算的参数C v 和C s , 严格说,仍是有偏的,只是近似无偏,因为我们掌握的仅仅是一个样本。
16.按无偏估计量的意义,求证样本平均数的无偏估计量。
16、答: X 1、X 2、X 3 ...、X n 为从随机变量 X 中抽取的容量为 n 的样本,其均值为 x ;E(X)为原随机变 量 X 总体的数学期望: E ( x ) = E ( X 1 + X 2 + X 3 + ... + X n )
n
= 1
[E ( X n 1
) + E ( X 2 ) + ... + E ( X n )]
= 1 [nE( x)] = E (X)
n
17.权函数法为什么能提高偏态系数Cs的计算精度?
17、答:权函数法使估计C s只用到二阶矩,有降阶作用,有助于提高计算精度;采用了正态概率密度函数作为权函数,显然增加了靠近均值部位的权重,削弱了远离均值部位的权重,从而丢失端矩面积,提高C s的计算精度。
18.统计参数与矩有什么关系?
18、答:首先,由实测资料绘出经验频率曲线,在频率曲线上任取三个点,计算偏度系数S;其次,由S
查S ~ C s关系表,求得相应的C s值;最后,再求其它参数x
和C v
19.何谓抽样误差?如何减小抽样误差?
19、答:由有限的样本资料算出的统计参数,去估计总体的统计参数总会出现一定的误差,这种误差称为抽样误差。
加长样本系列可以减小抽样误差。
20在频率计算中,为什么要给经验频率曲线选配一条“理论”频率曲线?
20、答:因为样本系列一般比较短,当设计标准很稀遇的情况下,在经验频率曲线上就查不到设计值,必须将经验频率曲线外延,为避免外延的任意性,给经验频率曲线选配一条理论频率曲线,将是一种比较好的方法。
其次,一个国家用同一个线型,还便于地区之间的参数比较,也便于参数的归纳和分析
21.为什么在水文计算中广泛采用配线法?
21、答:广泛采用配线法的理由
是:
(1)用经验频率公式(数学期望公式)估算实测值频率,它在数理统计理论上有一定的依据,故可将经验频率点作为配线的依据;
(2)现行配线法有一套简便可行的计算方法
22.现行水文频率计算配线法的实质是什么?简述适线法的方法步骤。
22、答:配线法的实质认为样本的经验分布反映了总体分布的一部分,因此可用配线法推
求总体分布,其步骤如下:
(1)经过审核的实测水文资料,按变量由大到小的次序排列,以各变量的序
号m,代入
P =
m
n −1
×100% 式中,计算其经验频率值P,并将(x,p)点绘在频率格纸上;
(2)以实测资料为样本,用无偏估计值公式计算统计参数x、C v、C s,由于C s抽样误差太大,一般当样本容量不够大时,常根据经验估计C s值;
(3)选定线型,一般采用皮尔逊Ⅲ型曲线,如配合不好,可改用其他线型,如
克~闵型等;
(4)按计算的x 、C v及假定C s的几个值,组成几组方案,分别查皮尔逊Ⅲ型曲线的Φ值或K p值表,并计算出各种频率对应的x p,最后以x p为纵坐标,以P为横坐标,将几条理论频率曲线点绘在有经验点据的图上。
(5)经分析比较,选一条与经验频率点配合较好的曲线作为计算成果。
23.统计参数x、C v、C S含义及其对频率曲线的影响如何?
23、答:统计参数x 为平均数,它为分布的中心,代表整个随机变量的水平。
当C v和C s值
固定时,由于x
的不同,频率曲线的位置也就不同,x 大的频率曲线位于x 小的频率曲
线之上。
C v称变差系数,为标准差之和与数学期望值之比,用于衡量分布的相对离散程度。
当
x 和C s值固定时,C v值越大,频率曲线越陡;反之,C v值越小,频率曲线越平缓。
C s为偏差系数,用来反映分布是否对称的特征,它表征分布的不对称程度。
当x 和C v值固定时,C s愈大,频率曲线的中部愈向左偏,且上段愈陡,下段愈平缓;反之,C s愈小,频率曲线的中部愈向右偏,且上段愈平缓,下段愈陡
24.用配线法绘制频率曲线时,如何判断配线是否良好?
24、答:目估配线时,一般要求理论频率曲线要从经验频率点距中央通过,使经验频率点与理论频率配合最佳为标准。
由于是目估定线,最后结果可能是因人而异。
在计算机上配线时,现在有以纵标离差平方和为最小等定线准则。
25.何谓相关分析?如何分析两变量是否存在相关关系?
25、答:按数理统计方法建立依变量和自变量间近似关系或平均关系,称为相关分析。
变量间是否存在相关关系,首先应从物理成因上分析,看变量之间是否确有成因关系,并把变量间的对应观测值点在坐标纸上,观察点群的密集程度进行判断,也可计算出相关系数,通过相关系数的大小和检验判断。
26.怎样进行水文相关分析?它在水文上解决哪些问题?
26、答:相关分析步骤:(1)从成因上分析影响倚变量的主要因素,并结合实际选择相关变量;(2)建立相关方程(或相关图);(3)检验相关的密切程度和可靠性;(4)当相关密切及关系可靠时,其相关方程(或相关图)即可付诸使用。
相关分析一般用于插补和延展水文系列及建立水文预报方案。
27.为什么要对相关系数进行显著性检验?如何检验?
27、答:在相关分析中,相关系数是根据样本资料计算的,必然会有抽样误差,因此,为
了推断两变量之间是否真正存在相关关系,必须对相关系数做显著性检验,检验是采用数
理统计中的假设检验的方法,实际操作时,先给定信度α,用n-2(n 为系列长度)和α查出该信度α下相关系数的最低值γa ,当计算值γ> γa 时,则检验通过,否则认为总体不相关。
28.为什么相关系数能说明相关关系的密切程度?
28、答:相关系数是表示两变量相关密切程度的一个指标,因为:
29.当y 倚x 为曲线相关时,如y =ax b
,如何用实测资料确定参数a 和b?
30.什么叫回归线的均方误?它与系列的均方差有何不同?
31.什么是抽样误差?回归线的均方误是否为抽样误差?
31、答:由有限的样本资料算出的统计参数,去估计总体的统计参数总会出现一定的误差,这种误差称为抽样误差。
而回归线的均方误是由观测点与相应回归线之间的离差计算出来的。
两者从性质上讲是不 同的。
二、计 算 题
1.在1000次化学实验中,成功了50次,成功的概率各为多少?两者何关系?
2.掷一颗骰子,出现3点、4点或5点的概率是多少?
3,一颗骰子连掷2次,2次都出现6点的概率为多少?若连掷3次,3次都出现5点的概率是多少? 4.一个离散型随机变量X ,可能取值为10,3,7,2,5,9,4,并且取值是等概率的。
每一个值出现的概率为多少?大于等于5的概率为多少?
5.一个离散型随机变量X ,可能取值为10,3,7,2,5,9,4,并且取值是等概率的。
每一个值出现的概率为多少?小于等于4的概率为多少?
6.一个离散型随机变量X ,其概率分布如表1—4—1,小于等于4的概率为多少?大于等于5的概率又为多少?
7.随机变量X 系列为10,17,8,4,9,试求该系列的均值x 、模比系数k 、均方差σ、变差系数Cv ,偏态系数Cs? 表1-4-1 随机变量的分布列
8.随机变量X 系列为100,170,80,40,
90,试求该系列的均值x 、模比系数k 、均方差σ、变差系数Cv 、偏态系数Cs? 9.某站年雨量系列符合皮尔逊Ⅲ型分布,经频率计算已求得该系列的统计参数:均值P =900mm ,Cv =0.20,Cs=0.60。
试结合表1—4—2推求百年一遇年雨
量。
10.某水库,设计洪水频率为1%,设计年径流保证率为90%,分别计算其重现期?说明两者含义有何差别?
11.设有一数据系列为1、3、5、7,用无偏估值公式计算系列的均值x 、离势系数Cv 、 偏态系数。