概率论完整第30讲PPT课件

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
引言
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值,它没有反映出这个近似值的误 差范围,使用起来把握不大. 区间估计 正好弥补了点估计的这个缺陷 .
譬如,在估计湖中鱼数的问题中,若 我们根据一个实际样本,得到鱼数N的极 大似然估计为1000条. 实际上,N的真值可能大于1000条, 也可能小于1000条.
形式: P {ˆ1ˆ2}1
则[ˆ1,ˆ2 ] 就是 的100(1 )%的置信区间.
可见,确定区间估计很关键的是要寻找
一个待估参数 和估计量T 的函数S(T, ), 且S(T, )的分布为已知, 不依赖于任何未知
参数 (这样我们才能确定一个大概率区间).
而这与总体分布有关,所以,总体分布的 形式是否已知,是怎样的类型,至关重要.
为什么 这样取?
使 P{|Xn|u2}1
对给定的置信水平1,
查正态分布表得 u 2 ,
使 P{|Xn|u2}1
从中解得
P { X n u 2 X n u 2 } 1
P{Xnu2Xnu2} 1
于是所求的 置信区间为
[X nu2, X nu2]
也可简记为
X
n u 2
从例1解题的过程,我们归纳出求置 信区间的一般步骤如下:
可见,
对参数作区间估计,就是要设法找出
两个只依赖于样本的界限(构造统计量)
ˆ1 ˆ1(X1,…Xn) ˆ2 ˆ2(X1,…Xn)
(ˆ1 ˆ2)
一旦有了样本,就把 估计在区间[ˆ1,ˆ2]
内. 这里有两个要求:
1. 要求 以很大的可能被包含在区间[ˆ1,ˆ2]
内,就是说,概率P{ˆ1ˆ2}要尽可能大.
在求置信区间时,要查表求分位数.
教材180页已经给出了概率分布的上侧分位数 (分位点)的定义,为便于应用,这里我们 再简要介绍一下.
设0<<1, 对随机变量X,称满足
P(Xx)
的点 x 为X的概率分布的上分位数.
设0<<1, 对随机变量X,称满足
P(Xx)
的点 x 为X的概率分布的上分位数.
标准正态分布的
上分位数 u
例如: u0.051.645
u0.0251.96
设0<<1, 对随机变量X,称满足
P(Xx)
的点 x 为X的概率分布的上分位数.
自由度为n的
2 分布的上
分位数
2
(n)
例如:
02.02(53)9.348
02.97(53)0.216
设0<<1, 对随机变量X,称满足
P(Xx)
的点 x 为X的概率分布的上分位数.
自由度为n1,n2的
F分布的上分
位数 F(n1,n2)
书末附有 分2 布、t 分布、F分布的上侧
分位数表,供使用. 需要注意的事项在教 材上有说明.
至于如何由标准正态分布函数表查表 求得分位数,若你对分布函数定义熟悉的 话,这个问题不难解决.
现在回到置信区间题目上来.
这里,我们主要讨论总体分布为正态 的情形. 若样本容量很大,即使总体分布 未知,应用中心极限定理,可得总体的近 似分布,于是也可以近似求得参数的区间 估计.
教材上讨论了以下几种情形:
单个正态总体均值和方差 2的区间估计.
两个正态总体均值差 1 2和方差比
的区间估计.
2 1 2 2
比例 p 的区间估计.
我们选取未知参数的某个估计量 ˆ,根
据置信水平1 ,可以找到一个正数 ,
使得 P{ˆ||}1
称 为ˆ 与之间的误差限 .
只要知道 ˆ 的概率分布,确定误差限并不难.
由不等式 |ˆ | 可以解出 :
ˆˆ
这个不等式就是我们所求的置信区间.
下面我们就来正式给出置信区间的定义, 并通过例子说明求置信区间的方法.
即要求估计尽量可靠.
2. 估计的精度要尽可能的高. 如要求区间 长度 ˆ2 ˆ1 尽可能短,或能体现该要求的其 它准则.
可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下
尽可能提高精度.
二、置信区间的求法
例1 设X1,…Xn是取自N(,2)的样本, 2已知,
求参数的置信度为 1的置信区间.
解: 选明确的问点题估,是计求为什么X 参数的寻置找信未区知间参? 数的
若我们能给出一个区间,在此区间 内我们合理地相信 N 的真值位于其中. 这样对鱼数的估计就有把握多了.
也就是说,我们希望确定一个区间,使我
们能以比较高的可靠程度相信它包含真参
数值.
湖中鱼数的真值
[ •]
这里所说的“可靠程度”是用概率来度量的, 称为置信概率,置信度或置信水平.
习惯上把置信水平记作1,这里是一个
一、 置信区间定义:
设 是 一个待估参数,给定 0,
若由样本X1,X2,…Xn确定的两个统计量
ˆ1ˆ1(X 1,X 2, ,X n),ˆ2ˆ2(X 1,X 2, ,X n)
(ˆ1 ˆ2) 满足
P {ˆ1ˆ2}1
则称区间 [ˆ1,ˆ2]是 的置信水平(置信度、
置信概率)为 1 的置信区间.
ˆ1和ˆ2 分别称为置信下限和置信上限.
下面我们举几个例子,其余部分请自己看.
休Baidu Nhomakorabea片刻继续
例2 已知某地区新生婴儿的体重X~N(,2),
, 2未知,

1. 明确问题, 是求什么参数的置信区间?
置信水平 1 是多少?
2. 寻找参数的一个良好的点估计
T (X1,X2,…Xn)
3. 寻找一个待估参数 和估计量T的函数
S(T, ),且其分布为已知.
称S(T, )为枢轴量.
4. 对于给定的置信水平1,根据S(T,)
的分布,确定常数a, b,使得
P(a ≤S(T,)≤b)= 1 5. 对“a≤S(T, )≤b”作等价变形,得到如下
很小的正数.
置信水平的大小是根据实际需要选定的.
例如,通常可取置信水平1 =0.95或0.9等.
根据一个实际样本,由给定的置信水平,我
们求出一个尽可能小的区间 [ˆ1,ˆ2],使
P {ˆ1ˆ2}1
称区间 [ˆ1,ˆ2]为 的 置信水平为1 的
置信区间.
寻找置信区间的方法,一般是从确定 误差限入手.

U
X
置信水平是多少?一个良好估计.
~N(0, 1)
n
寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.
有了分布,就可以求出 U取值于任意区间的概率.
对于给定的置信水平(大概率), 根据U的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平.
对给定的置信水平1,
查正态分布表得 u 2 ,
相关文档
最新文档