水文水资源教材-实用水文统计-抽样分布)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

P(T t )
2
2 抽自二个正态总体的样本分布
(1)
Z
X
Y~N
((a1-a
2
),(
2 1
n1
2 2
n2
) ) 分布
而 U ( X Y ) (a1-a 2 )~N (0, 1)
(
2 1
2 2
)
n1 n2
2 抽自二个正态总体的样本分布
(2)若
2 1
2 2
2
,则统计量
T ( X Y ) (a1 a2 )
总体分布(或理论分布)正好体现一个随机变量的分布。 所以总体就必然与一个随机变量相联系。所谓总体已知,就 是指随机变量的概率分布已知。对于一种随机现象,所研究 的问题一经确定,则相应的总体所包含的元素及概率分布是 完全确定的,不因是否进行观测或试验而改变。
常用表示随机变量的X,Y,Z等表示总体。 通过观测或试验得到总体中的一部分元素构成的集合称 为样本。
第六章 抽样分布
◇概率论的基本知识,都是从客观物质世界的 大量随机现象中抽象出来的理论模型,揭示了 随机现象的普遍规律,
◇概率论所涉及的是一些“假想的”随机试验, 而没有与具体的随机现象发生直接联系。
◇概率论的许多问题中,概率分布通常是已知 的,或是通过某些已知条件能严格推导出来的。
◇概率论是对随机现象统计规律进行演绎研究。
第二节 样本分布与抽样分布
一 频率直方图
设 x1,x2,...,xn 为连续型随
机变量X的样本,在X的值域
[a,b]内插入许[ti,多ti1) 分点,
a t1 t2 ... ti ti1 ... tl1 b
统计样本落在区间
频率密度直方图
[ti,ti1)(i 1,2,......,l)
看作为某个离散型随机变量Xne的全部可能取值,它的概率
分布为
P( X ne
xi* )
1 , (i 1, 2,. ....,. n) n
,Xne的分布函
数为:
P( X ne
x)
Fn* (x)Βιβλιοθήκη 0, x k n, xk*
x1* x
xk*1, (k 1, 2,. ....,. n
1)
1, x xn*
◇数理统计和概率论一样,是研究大量随机现象 统计规律的数学理论。
◇数理统计是根据实际的观测资料研究随机现象 的概率性质。
◇人们通过对有限资料的整理和分析,去推断所 研究现象的整体性质,这种众局部到整体的推论 方法称为统计推断。
◇研究统计推断理论和方法的学科称为数理统计。
◇统计推断与演绎推理不同。
一般来说,对于一个实际的随机变量(如年径流 量,年最大洪峰流量等),很难通过分析其物理机 制来求得它的概率分布,而是只能通过大量的试验 或观测,在掌握了大量观测资料的基础上,再进行 科学的抽象和概括,然后去估计或推断那个随机变 量的概率性质。
一个具体的随机变量的概率性质需用观测资料 (样本)的统计性质来推断。
n
X a
/ n
Xi
i 1
na n
服从标准化正态分布N(0,1), 进而有 X 近似
服从 N (a, 2 ) 。
n
第三节 几种重要的抽样分布
2 抽自一个正态总体的样本分布
2
(1) X ~ N (a, ) n
(2) 2 服从自由度为(n-1)的 2 (n 1) 分布。
2
nS 2
2
n ( Xi X )2
统计推断的结论只是对未知性质的一种推论, 带有一定程度的不确定性,人们接受这种结论 要冒一定的风险。如果获取的资料的方法符合 一定的科学原理,结论的不确定性可以用概率 来计量。
演绎推理得到的结论是正确的。
数理统计的中心任务,就是研究统计推断和计量这 种推断之不确定性程度的理论和方法。
相对概率论而言,数理统计是对随机现象统计规律 进行归纳研究。
X
0
1
pi
2/5
3/5
0, 白球 X 1, 红球
抽取n次以后,即得容量为n的样本:(x1,x2,…,xn) 如:(0, 1, 0, 1, … , 1 )
即:(白球,红球,白球,红球,…,红球)
n维随机变量的样本
例1:袋中有2个白球和3个红球,现有放回地从中随机抽 球,每次抽1球,观察球的颜色,设X=0表示抽得白球, X=1表示抽得红球。则P(X=0)=0.4,P(X=1)=0.6。
第一节 总体与样本 1 统计推断 从局部到整体的推论方法称为统计推断。 研究统计推断理论和方法的学科称为数理统计。 数理统计的中心任务,就是研究统计推断和计量这 种推断之不确定性程度的理论和方法。
2 总体与样本
研究对象的全部元素构成的集合为总体。
总体中的每个元素为个体。
总体可以按其所含个体多少分为有限总体和无限总体。
i1

2 (n 1)
2 的概率密度曲线
P( 2 2 )
第三节 几种重要的抽样分布
(3) T服从自由度为n-1的t分布。
T (X a) S
n
1
(X
a) S*
n
t(n 1)
其中: S *2
1 n 1
n i1
(X
i
2
X)
2 1 n
2
S n i1 ( X i X )
t概率密度曲线
数理统计中的总体和个休和概念,只不过是概率论中基 本空间和基本事件的另外一种说法。
人们所研究的往往是对象某一特性值,如雨量的大小等, 每个数据就体表一个个体。一般来讲,不同的个体所具有的 特性值也不同,可以将特性值看成是一个随机变量。
从总体中随机抽取一个个体,所得个体的特性值就是随 机变量的一个取值。
X
0
1
pi
2/5
3/5
0, 白球 X 1, 红球
抽取n次以后,即得容量为n的样本:(x1,x2,…,xn)
定义:
Xi
0, 白球 1, 红球
Xi
0
1
pi
2/5
3/5
( x1,x2,......, xn)可以看用X的n次试验的结果,也可看作
(X1,X2,…,Xn)1次试验的结果。
n维随机变量的样本
例2:若以重复抽样方法从一个有N个元素的总体中随
n维随机变量的样本
3 多维随机变量的样本 把随机变量X(也称总体X)的作为n维随机
变量的样本记为
X ( X1, X 2 ,..., X n )
而把一个具体样本(X的可能值)记为
x (x1, x2 ,..., xn )
例、研究某河流某站年最大洪峰流量,测得1951-1985年 观测资料。
X1
……
概率保证 X a 0.1 ,当 σ2 =0.5时,样本容量n
应取多大?
第二节 样本分布与抽样分布
三 抽样分布 (一)统计量
定义:设(X1, X2,…… Xn)为随机变量X的 样本,Z=g(X1, X2,…… Xn)是 (X1, X2,…… Xn)的任意函数。若函数g中不含未 知参数,则称Z为统计量,统计量是随机变量, 其概率分布称为抽样分布。
若统计量U的精确分布无法求得,则可求出当 n 时的 极限颁布,这是用大样本进行统计推断的一般做法。
四 抽样分布的数字特征 (三)抽样分布的数字特征
统计量是随机变量,因此也有数学期望、方差 等数字特征,由于抽样分布一般都比较复杂, 除少数统计量外,很难按定义求得它们的数字 特征。
(1)样本均值的数学期望与方差
内观测值的个数,记为ki,则在
样本容量n很大时,频率 pi* ki / n 可近似地表示随机变量X 在区间 [ti,ti1) 中取值的概率pi。
第二节 样本分布与抽样分布
二 样本分布
随机变量X的总体中抽取一个样本, x1,x2,...,xn 加以排队 x1* x2* x3*,......, xn*
样本是进行统计推断的主要依据,统计量则是根据特 定的统计推断需要而对样本进行的加工和整理,是进行统 计推断的主要手段和工具。
统计量的分布的精确分布和极限颁布。
若总体X的分布已知,如对任一自然数n,都能给出统计量
U (X1,X2,...,Xn ) 的分布函数,则称此分布函数为统计 量U的精确分布为。精确分布用小样本进行统计推断的基 础和前提。
机抽取n个元素组成样本,则总共可以抽取种不同的N n
样本。这N n个样本以可形成一个新的假想总体,而一 个已观测到的具体样本就是为个总体中的一个元素。 由于抽样的随机性,在未抽样之前,我们并不知道哪 个样本会抽中。因此,容量为n的样本就是一个n维的 随机变量,而每一个具体样本都是这个n维随机变量 的一个可能值。
简单随机样本:简单随机抽样得到的样本称为简单随机 样本。
水文样本 水文样本,由于是在不能人为控
制的自然条件下观测的,需注意独立性、 一致性和代表性。
n维随机变量的样本
例1:袋中有2个白球和3个红球,现有放回地从中随机抽 球,每次抽1球,观察球的颜色,设X=0表示抽得白球, X=1表示抽得红球。则P(X=0)=0.4,P(X=1)=0.6。
11
Sw
n1 n2
~ t(n1 n2 2)
其中
Sw
n1S12
n2
S
2 2
n1 n2 2
2 抽自二个正态总体的样本分布
(3)统计量
n1S12 / n2S22
F
n1 1 n2 1
12
/
2 2
~ F (n1 1, n2 1)
其中
S1* 2
n1 n1
1
S12

S
* 2
2
n2 n2
1
S
2 2
x1881 x1916 x1951 x1986 x2021
……
X2
……
x1882 x1917 x1952 x1987 x2022
……
X3
……
x1882 x1918 x1953 x1988 x2023
……
……
…… …… …… …… …… …… ……
X35
……
x1915 x1950 x1985 x2020 x2055
……
均值
……
……
……
频率分布:
如果我们将一个有多年资料的降水观测系列(比如:72年资料,实测年雨量 最小不到1000毫米、最大不超过3000毫米),按照一定的毫米数组距(如 =200毫米)进行分组统计(1001~1200、1201~1400、…、2801~ 3000),计算各组出现的次数m,以及频率m/n,计算频率密度 。
例1 用测温仪对一物体的温度测量5次,其结果为 (oc):1250,1265,1245,1260,1275,试求 样本均值、方差、样本离势系数及偏态系数。P160
例2 设X~N(52,6.32)分布,从中随机抽取
n=16的样本,求样本均值 X 落在49.5 ~53.5之
间的概率。
例3 设总体X~N(a,σ2)分布,若要以99.7%的
(2)样本k阶原点矩的数学期望与方差
(3)样本方差的数学期望与方差
四 抽样分布的数字特征
(1)大样本时,样本的各种数字特征的数学期望等于 或近似于总体的同一数字特征。
(2)一个具体样本的某数字特征对该特征值之期望值 的离差,也就等于或近似于该样本特征值对总体同一 特征值的离差,这种离差就是用该样本特征值估计总 体特征值的误差。
(3)样本某一数字特征的均方差,刻划了用总体中所 有相同容量样本的该数字特征值估计总体此种特征值 时所产生的平均误差。
第三节 几种重要的抽样分布
1 样本均值的极限分布
定理:设X1 , X2 ,…, Xn ,来自一般总体, 且E(X)=a, D(X)=σ2,则当 n 时

n
Yn
n i 1
(Xi a)
称Xne的分布函数为样本分布函数或经验分布函数。
第二节 样本分布与抽样分布 1 当n很大时,频率密度曲线将趋近于概率密度曲线。 2 当n很大时,样本分布函数近似于总体分布函数F(t);
三 样本分布的数字特征(P160)
对于一个给定的样本 x1,x2,...,xn ,可以计算它的数字
特征,为了区别于总体的数字特征,称它们为样本数字特 征。
以雨量作横轴、频率密度作纵轴,得到频率密度直方图。每个直方柱的面积 就是该组雨量的出现频率。从图上直观可见,特大、特小的年雨量出现频率小, 接近均值的出现频率较大,直方图呈现两端低、中间高的形状。
如果观测资料无限增多、组距无限缩小,此时的频率接近概率。频率密度直 方图就成为一条铃形曲线。
它与总体相关联,成为总体的频率分布,即概率分布。
总体可以按其所含元素的多少分为有限总体和无限总体。
总体有可分为现实总体和假想总体。
水文总体中所遇到的大都是假想总体。
样本中所含元素的数目称为样本容量。
随机抽样:从总体中抽取一个元素时,总体中的每个元 素被抽中的机会,只与总体本身的概率分布有关。
简单随机抽样:各元素在各次抽样时被抽中的概率不变, 不受前次抽到的影响,则称这种抽样为简单随机抽样。
F概率密度曲线
P[F
F
2
(n1, n2 )]
2
第四节 顺序统计量及其分布
一、顺序统计量的概念
设(X1, X2,……, Xn)为X的样本,定义
X
* m
g( X1, X 2 ,......,
X n ), (m 1,2,3,..., n)
相关文档
最新文档