《数理统计》第7章_基于截尾样本的.
概率论与数理统计 第7章
一、基本概念 二、基于截尾样本的最大似然估计 三、小结
一、基本概念
1. 寿命分布的定义
产品寿命T 是一个随机变量,它的分布称为寿 产品寿命 是一个随机变量 它的分布称为寿 命分布. 命分布
2. 完全样本的定义
将随机抽取的 n 个产品在时间 t = 0 时, 同时 投入试验直到每个产品 都失效 . 记录每一个产 品的失效时间 , 这样得到的样本 (即由所有产品 的失效时间 0 ≤ t1 ≤ t 2 ≤ ⋯ ≤ t n 所组成的样本 )
利用这一样本估计未知 参数 θ (产品的平均寿命 ).
在时间区间 [0, t m ] 有 m 个产品失效 , 有 n − m 个产品的寿命超过 t m .
估计θ , 利用最大似然估计法来
为了确定似然函数, 观察上述结果出现的概率. 为了确定似然函数, 观察上述结果出现的概率.
产品在(ti , ti + dti ] 失效的概率近似地为 f (ti )dti = e θ dti , i = 1, 2,⋯, m. 1
又因为 E ( X ) = D( X ) + [ E ( X )] =
2 2
σ
2
n
+ µ 2,
所以 E (σ 2 ) = E ( A2 − X 2 ) = E ( A2 ) − E ( X 2 ) ˆ
n −1 2 ˆ σ ≠ σ 2 , 所以 σ 2 是有偏的. = n n 若以 乘 σ 2 , 所得到的估, 若 X 1 , X 2 ,⋯, X n 为总体 X 的一个样本,
θ ∈ Θ 是包含在总体 X 的分布中的待估参数 , (Θ 是 θ 的取值范围 )
ˆ 若估计量θ = θ( X1, X2 ,⋯, Xn ) 的数学期望 ˆ ˆ E(θ ) 存在, 且对于任意θ ∈Θ 有E(θ ) = θ , 则称 ˆ θ 是θ 的无偏估计量.
数理统计7:矩法估计(MM)、极大似然估计(MLE),定时截尾实验
数理统计7:矩法估计(MM)、极⼤似然估计(MLE),定时截尾实验在上⼀篇⽂章的最后,我们指出,参数估计是不可能穷尽讨论的,要想对各种各样的参数作出估计,就需要⼀定的参数估计⽅法。
今天我们将讨论常⽤的点估计⽅法:矩估计、极⼤似然估计,它们各有优劣,但都很重要。
由于本系列为我独⾃完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!⽬录Part 1:矩法估计矩法估计的重点就在于“矩”字,我们知道矩是概率分布的⼀种数字特征,可以分为原点矩和中⼼矩两种。
对于随机变量X⽽⾔,其k阶原点矩和k阶中⼼矩为a_k=\mathbb{E}(X^k),\quad m_k=\mathbb{E}[X-\mathbb{E}(X)]^k,特别地,⼀阶原点矩就是随机变量的期望,⼆阶中⼼矩就是随机变量的⽅差,由于\mathbb{E}(X-\mathbb{E}(X))=0,所以我们不定义⼀阶中⼼矩。
实际⽣活中,我们不可能了解X的全貌,也就不可能通过积分来求X的矩,因⽽需要通过样本(X_1,\cdots,X_n)来估计总体矩。
⼀般地,由n个样本计算出的样本k阶原点矩和样本k阶中⼼矩分别是a_{n,k}=\frac{1}{n}\sum_{j=1}^{n}X_j^k,\quad m_{n,k}=\frac{1}{n}\sum_{j=1}^{n}(X_j-\bar X)^k.显然,它们都是统计量,因为给出样本之后它们都是可计算的。
形式上,样本矩是对总体矩中元素的直接替换后求平均,因此总是⽐较容易计算的。
容易验证,a_{n,k}是a_k的⽆偏估计,但m_{n,k}则不是。
特别地,a_{n,1}=\bar X,m_{n,2}=\frac{1}{n}\sum_{j=1}^{n}(X_j-\bar X)^2=\frac{n-1}{n}S^2\xlongequal{def}S_n^2,⼀阶样本原点矩就是样本均值,⼆阶样本中⼼矩却不是样本⽅差,⽽需要经过⼀定的调整,这点务必注意。
概率论与数理统计总复习
概率论与数理统计总复习1、研究和揭示随机现象 统计规律性的科学。
随机现象:是在个别试验中结果呈现不确定性,但在大量重复试验中结果又具有统计规律性的现象。
2、互斥的或互不相容的事件:A B φ⋂=3、逆事件或对立事件:φ=⋂=⋃B A S B A 且4、德∙摩根律:B A B A ⋂=⋃,B A B A ⋃=⋂5、在相同的条件下,进行了n 次试验,在这n 次试验中,事件A 发生的次数A n 称为事件A 发生的频数,比值/A n n 称为事件A 发生的频率,并记为()n f A 。
6、概率的性质(1)非负性:(A)0P ≥; (2)规范性:(S)1P =;(3)有限可加性:设A 1,A 2,…,A n ,是n 个两两互不相容的事件,即A i A j =φ,(i ≠j), i , j =1, 2, …, n , 则有∑==ni i n A P A A P 11)()...((4)()0P φ=;(5)单调不减性:若事件A ⊂B ,则P(B)≥P(A) (6)对于任一事件A ,P(A)≤1 (7)差事件概率:对于任意两事件A 和B ,()()()P B A P B P AB -=-(8)互补性(逆事件的概率):对于任一事件A ,有 P(A )=1-P(A) (9)加法公式:P(A ⋃B)=P(A)+P(B)-P(AB))()()()()()()()(321323121321321A A A P A A P A A P A A P A P A P A P A A A P +---++=⋃⋃7、古典概型中的概率: ()()()N A P A N S =①乘法原理:设完成一件事需分两步, 第一步有n 1种方法,第二步有n 2种方法, 则完成这件事共有n 1n 2种方法。
例:从甲、乙两班各选一个代表。
②加法原理:设完成一件事可有两类方法,第一类有n 1种方法,第二类有n 2种方法,则完成这件事共有n 1+n 2种方法。
广义指数分布参数基于截尾样本在序约束下的极大似然估计
( S c i e n c eCo l l e g e 。 Li a o n i n gUn i v e r s i t yo f T e c h n o l o g y , J i n z h o u1 21 0 0 1 , Ch i n a)
o r d r e we re d i S C U s s e d , wi h t s i mu l a t i o n r e s u l t s g i v e n .
Ke y w o r d s : g e n ra e l i z e d e x p o n e n i t a l d i s t r i b ti u o n ; s i mp l e i t e r a t i v e me t h o d ; E M a l g o r i t m ; h
Ma x i m um Li k e l i h o o d Es t i ma t i o n o f Pa r a me t e r s o f Ge n e r a l i z e d Ex p o n e n ia t l Di s t r i b u i t o n Ba s e d o n Ce n s o r e d S a mp l e s u n d e r Or d e r Re s t r i c t i o n s
e s t i a t m i o s n o f p a r a e t m rs e o f k g e n e r a l i z e d e x p o n e n t i a l d i s t r i b u t i o s n b a s d e o n c e n s o r e d s a mp l e s u n d e r
概率论与数理统计-第七章
但是参数 参数估计
, 未知。希望通过抽样估计之。
点估计 —— 给出参数的估计值。
区间估计 —— 给出参数的估计范围
3
§1 参数的点估计
用样本( X1, X2, …, Xn ),对每个未知参数 θi , ( i = 1, 2, …, k) 构造出一个统计量,
作为对参数 θi 的估计。该统计量称为 θi 的估计量。
抽出样本(X1, X2, …, Xn )。求证:对任何总体分布,
证明:X1, X2, …, Xn 独立,且与X同分布
28
例10:对服从均匀分布U(0, b)的总体X,讨论参数 b 的矩估计和极大似然估计的无偏性。 解: 由前面U(a, b)分布的a和b的估计量: (1) 矩估计
令 a=0
是
无偏估计!
xi , 故的取值范围最大不超过x min x1 , x2 ,
另一方面,L , 1n e
1
, xn
xi i 1
n
n
是的增函数,取到最大值时,L达到最大。
故 X 1 min X1 , X 2 ,
dlnL 令 n 12 d
29
(2) 极大似然估计
令 a=0
不是无偏估计
30
纠偏方法
如果 满足 ,则新的估计量 , 是无偏估计!
例9中:对服从均匀分布U(0, b)的总体X,参数 b 极大似然估计 不是无偏估计。
由于
是一个修正的极大似然估计,是无偏估计。
31
2.有效性 在没有系统误差的前题下,还希望估计量的 随机误差尽量小(对给定的样本容量n)!
推荐三本概率论和数理统计的参考书: (1)《数理统计学简史》, 陈希孺 (2)《概率论札记》, 梁昌洪
7.2截尾的极大似然估计-PPT课件
d ln L ( ) 0, 解 得 d s(t m ) ˆ m 其 中 s( t m ) t1 t 2 t m ( n m )t m
概率统计
基于截尾样本的最大似然估计
0 t 1 t 2 t n, 称 为 完 全 样 本 。 二 截
尾 样 本 , ( 1 )定 时 截 t 0时 同 时 投 入 t0停止,停止时共有 随机抽取的 n
t 1 , t 2 , , t m ( 0 t 1 t 2 t m t 0 ), 进行到有 m (事先 得到样本 t1 , t 2 , ,
设产 品的 寿命 分布 是指 数分 布,其概 率密 度为 1 t / e , t0 f (t ) t0 0, 0未知 。设有 n 个产 品投 入定 时截 尾试 验,截尾 时间 为 t 0,得定 时 截尾 样本 0 t 1 t 2 t m t 0。故似 然函 数为 L ( ) 1
第二节基于截尾样本的最大似然估计
产品寿命 T 是一个随机变量,它的 为了对寿命分布进行统 寿命数据。 实验方法:一完全样本 t 0时 , 同 时 投 入 试 验 , 直 尾样本,假设将随机抽 试验,试验进行到实现 m 个产品失效,得到样本 称为定时截尾样本。 个产品在时间 规定的截尾数 ,将随机抽取的 n 个产品在时间 到样本 到每个产品都失效,得 取的 n 个产品在时间 规定的截尾时间 分布称为寿命分布。 试验,取得 计推断,则需通过寿命
( 2 )定 数 截 尾 样 本 , 假 设 将
t 0时 同 时 投 入 试 验 , 试 验 m n )个产品失效时停止,
概率论与数理统计浙大四版 第七章 第七章3讲
参数 (这样我们才能确定一个大概率区间).
而这与总体分布有关,所以,总体分布的 形式是否已知,是怎样的类型,至关重要.
这里,我们主要讨论总体分布为正态 的情形. 若样本容量很大,即使总体分布 未知,应用中心极限定理,可得总体的近 似分布,于是也可以近似求得参数的区间 估计.
第四节
区间估计
引言
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值,它没有反映出这个近似值的误 差范围,使用起来把握不大. 区间估计 正好弥补了点估计的这个缺陷 .
也就是说,我们希望确定一个区间,使我
们能以比较高的可靠程度相信它包含真参
内. 这里有两个要求:
1. 要求 以很大的可能被包含在区间[ˆ1,ˆ2]
内,就是说,概率P{ˆ1ˆ2}要尽可能大.
即要求估计尽量可靠.
2. 估计的精度要尽可能的高. 如要求区间 长度 ˆ2 ˆ1 尽可能短,或能体现该要求的其 它准则.
可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下
尽可能提高精度.
P {ˆ1ˆ2}1
称区间 [ˆ1,ˆ2]为 的 置信水平为1 的
置信区间.
寻找置信区间的方法,一般是从确定 误差限入手.
我们选取未知参数的某个估计量 ˆ,根
据置信水平1 ,可以找到一个正数 ,
使得 P{ˆ||}1
称 为ˆ 与之间的误差限 .
只要知道 ˆ 的概率分布,确定误差限并不难.
由不等式 |ˆ | 可以解出 :
S(T, ),且其分布为已知.
称S(T, )为枢轴量.
《数理统计》第7章§2基于截尾样本的最大似然估计.
第七章
参数估计
§2 基于截尾样本的最大似然估计
2/4
预先规定好试验时间 0 T 随机取 n 件产品,从 t 0 时刻开始进行试验, 到截尾 开始时间 截尾时间 时刻 t T 试验停止,依次记录下失效时间和失效个数 ,从而 获得定时截尾样本
0 t1 t 2 t m T
第七章 参数估计
s(180) 115 119 172 (50 15) 180 8550
115,119,131,138,142,147,148,155, 158,159,163,166,167,170,172
求得 的最大似然估计值为
ˆ 8550 570 (小时) 15
t
3/4
设产品寿命服从指数分布,其概率密度为
1 e ,t 0 f (t ) 0 , t0 定时截尾时间为 T . 任取 n 件产品进行寿命试验,截尾 样本为 0 t1 t m T . 试求平均寿命 的最大似然估计. 似然函数为 任一产品在时刻 (t i , t i dt ] 失效的概率近似为
1e dt (i 1, , m) L( ) n m令 T 的概率为 件产品寿命超过 t1 tm ( n m )T lnL m n m ( n m ) T t 1 0 2 e T e dt 似然函数 求得 的最大似然估计为 故截尾样本观察值出现的概率近似为 s (T ) ˆ t1 t m ( n m )T ( n m )T ti m m 1e t m 1 e m e dt1dtm C d C i 总试验时间 n n 为 . t t ( n m ) T 其中 s(T ) 1 m m i 1
概率论与数理统计第七章
13
二、最大似然估计法
是在总体类型已知条件下使用的一种参数估计方法 . 它首先是由德国数学家高斯在 1821年提出的 ,
然而,这个方法常归功于英国 统计学家费歇 . 费歇在1922年重新发现了这一 方法,并首先研究了这种方法 的一些性质 .
Gauss
Fisher
信息管理学院 徐晔
选择适当的 i , i 1,2,, m
使得样本 ( X 1, X 2 ,, X n ) 作为一个随机变量,得 到观察值 ( x1, x2 ,, xn ) 的可能性最大。
信息管理学院 徐晔
17
当总体 X 为离散型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维离散型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是联合概率事件
14
最大似然估计法的基本思想
先看一个简单例子:
某位同学与一位猎人一起外出打猎 .
一只野兔从前方窜过 .
只听一声枪响,野兔应声倒下 .
如果要你推测, 是谁打中的呢? 你会如何想呢?
信息管理学院 徐晔
15
你就会想,只发一枪便打中,猎人命中的概率 一般大于这位同学命中的概率. 看来这一枪是猎人 射中的 . 这个例子所作的推断已经体现了最大似然估计 法的基本思想 .
信息管理学院 徐晔
18
n
当总体 X 为连续型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维连续型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是值对于一个极小的 ,联合 概率事件
A ( x1 X 1 x1 , x2 X 2 x2 ,, xn X n xn )
定时截尾寿命实验与定数截尾实验下的最大似然估计法
长,由于时间和财力的限制,我们不可能得到完全样本,于是就考虑截尾寿命试验.
常用的ቤተ መጻሕፍቲ ባይዱ种截尾寿命试验:
一种是定时截尾寿命试验。假设将随机抽取的 n 个产品在时间 t=0 时同时投入试
验,试验进行到事先规定的截尾时间 t0 停止.如试验截止时共有 m 个产品失效,它们
的失效时间分别为
0 ≤ t1 ≤ t2 ≤ L ≤ tm ≤ t0 ,
应于样本 X 1 , X 2 ,L, X n 的一个样本值,则似然函数为
n
n
∏ L( p) =
n
p xi (1 −
p)1− xi
=
∑ xi p i=1 (1 −
∑ n− xi p) i=1 ,
i =1
n
n
∑ ∑ 于是 ln L( p) = xi ln p + (n − xi ) ln(1 − p) .
考虑函数
n
∏ f (xi ;θ ) dxi
i =1
n
∏ L(θ ) = L( x1, x2 ,L, xn ;θ ) = f (xi ;θ ) i =1
同样称 L(θ ) 为样本的似然函数.
最大似然估计法的方法:
固 定 样 本 观 察 值 x1, x2 ,L, xn , 在 θ 取 值 的 可 能 范 围 内 Θ 挑 选 使 似 然 函 数
这一概率随θ 的取值而变化,它是θ 的函数,称 L(θ ) 为样本的似然函数.
《概率论与数理统计》第七章
n
n
ln xi
(4)的极大似然估计量为:ˆ
n
n2 i1
lnX
i
2
i1
第七章 参数估计 ‹#›
例 9 设X~b(1,p), X1,X2,…,Xn是来自X的一个样本, 试求参数p的最大似然估计量
解: 设x1, x2,, xn,是相应于样本X1,X2,…,Xn 的一个样本值,X
的分布律为:
(3)以样本各阶矩A1, ,Ak代替总体各阶矩1,
得各参数的矩估计
ˆi gi(A1, ,Ak ), i 1, , k
, k,
第七章 参数估计 ‹#›
注意:
在实际应用时,为求解方便,也可以用
中心矩 i 代替原点矩i,相应地以样本中心矩Bi 估计 i.
(二)最大似然估计法
最(极)大似然估计的原理介绍
第七章
参数估计
目录/Contents
第1章 随机事件与 2 概率
§ 1 点估计
§3
估计量的评选标准
第七章 参数估计 ‹#›
问题的提出:
在实际进行统计时,有不少总体的(我们关心的某 确定指标)概率分布是已知的。比如
例 1 产品寿命服从的分布
X~
f
(
x)
1
x
e
x0
0
其他
但其中有参数是未知的: θ
n
似然函数 L f xi , 。 i 1
, xn ,
极大似然原理:L(ˆ( x1 ,
,
xn
))
max
L(
).
计算简化方法:
在求L 的最大值时,通常转换为求:lnL 的最大值,
lnL 称为对数似然函数.
利用
《概率论与数理统计》习题及答案 第七章
《概率论与数理统计》习题及答案第 七 章1.对某一距离进行5次测量,结果如下:2781,2836,2807,2765,2858(米). 已知测量结果服从2(,)N μσ,求参数μ和2σ的矩估计.解 μ的矩估计为ˆX μ=,2σ的矩估计为22*211ˆ()ni i X X S n σ==-=∑ 1(27812836280727652858)2809.05X =++++=,*215854.01170.845S =⨯=所以2ˆ2809,1170.8μσ== 2.设12,,,n X X X 是来自对数级数分布1(),(01,1,2,)(1)kp P X k p k lu p k==-<<=-的一个样本,求p 的矩估计.解 111111ln(1)ln(1)ln(1)1k kk k p p p p p p p μ∞∞==-==-=-⋅----∑∑ (1) 因为p 很难解出来,所以再求总体的二阶原点矩121111ln(1)ln(1)ln(1)kk k x pk k k p p kp kp x p p p μ∞∞∞-===='-⎛⎫==-=- ⎪---⎝⎭∑∑∑ 21ln(1)1ln(1)(1)x pp x p p x p p ='⎡⎤=-=-⋅⎢⎥----⎣⎦ (2) (1)÷(2)得 121p μμ=- 所以 212p μμμ-= 所以得p 的矩估计21221111n i i n i i X X X n p X n α==-==-∑∑3.设总体X 服从参数为N 和p 的二项分布,12,,,n X X X 为取自X 的样本,试求参数N 和p 的矩估计 解 122,(1)()Np Np p Np μμ⎧=⎪⎨=-+⎪⎩ 解之得1/N p μ=, 21(1)p Np μμ-+=, 即1N pμ=,22111p μμμ-=-,所以 N 和p 的矩估计为ˆX N p=,*21S p X =-. 4.设总体X 具有密度11(1)1,,(;)0,.Cx x C f x θθθθ-+⎧>⎪=⎨⎪⎩其他其中参数01,C θ<<为已知常数,且0C >,从中抽得一个样本,12,,,n X X X ,求θ的矩估计解11111111111CCEX C x dx C xθθθθμθθθ+∞--+∞===-⎰111()11C C C C θθθθ-=-⋅=--, 解出θ得11,Cθμ=-92 于是θ的矩估计为 1C Xθ=-. 5.设总体的密度为(1),01,(;)0,.x x f x ααα⎧+<<⎪=⎨⎪⎩其他试用样本12,,,n X X X 求参数α的矩估计和极大似然估计.解 先求矩估计:111210011(1),22EX x dx x ααααμααα++++==+==++⎰解出α得 1112,1μαμ-=- 所以α的矩估计为 121XX α-=-. 再求极大似然估计: 1121(,,;)(1)(1)()nn n i n i L X X x x x x ααααα==+=+∏,1ln ln(1)ln nii L n xαα==++∑,1ln ln 01nii d L nx d αα==++∑,解得α的极大似然估计: 1(1)ln nii nxα==-+∑.6.已知总体X 在12[,]θθ上服从均匀分布,1n X X 是取自X 的样本,求12,θθ的矩估计和极大似然估计.解 先求矩估计: 1212EX θθμ+==,22222211211222()()1243EX θθθθθθθθμ-+++==+=解方程组121221122223θθμθθθθμ⎧+=⎪⎪⎨++⎪=⎪⎩得11θμ=±2123(θμμμ=-注意到12θθ<,得12,θθ的矩估计为*1X θ=-,*2X θ=.再求极大似然估计 1121212111(,,;,)()nn ni L X X θθθθθθ===--∏,1122,,,n x x x θθ≤≤,由极大似然估计的定义知,12,θθ的极大似然估计为11(1)min(,,)n X X X θ==;21()max(,,)n n X X X θ==.7.设总体的密度函数如下,试利用样本12,,,n x x x ,求参数θ的极大似然估计.(1)1(),0,(;)0,.x x e x f x αθαθαθα--⎧>⎪=⎨⎪⎩其它;已知(2)||1(;),,2x f x e x θθθ--=-∞<<+∞-∞<<+∞. 解 (1)111111(,,;)()()ni i i nx x n nn i n i L X X x ex x eααθθααθθαθα=----=∑==∏111ln (;)ln ln (1)ln nnn i i i i L X X n n x x αθθααθ===++--∑∑1ln 0ni i d L nx d αθθ==-∑解似然方程1ni i nx αθ==∑,得θ的极大似然估计94 1.ni i nx αθ==∑(2)1||||1111(;)22ni i i n x x n n i L X X e eθθθ=----=∑==∏由极大似然估计的定义得θ的极大似然估计为样本中位数,即1()2()(1)22,1(),.2n n n X n X X n θ++⎧⎪⎪=⎨⎪+⎪⎩为奇数,为偶数8.设总体X 服从指数分布(),,(;)0,.x ex f x θθθ--⎧≥⎪=⎨⎪⎩其他试利用样本12,,,n X X X 求参数θ的极大似然估计.解 1()11(,,;),,1,2,,.ni i i nx n x n i i L X X eex i n θθθθ=-+--=∑==≥=∏1ln nii L n Xθ==-∑ln 0d Ln d θ=≠ 由极大似然估计的定义,θ的极大似然估计为(1)x θ= 9.设12,,,n X X X 来自几何分布1()(1),1,2,,01k P X k p p k p -==-=<<,试求未知参数p 的极大似然估计. 解 1111(,,;)(1)(1)ni i i nx nx n n i L x x p p p p p =--=∑=-=-∏,1ln ln ()ln(1),nii L n p Xn p ==+--∑1ln 0,1ni i X nd L n dp p p=-=--∑解似然方程11nii n X n p p=-+=-∑, 得p 的极大似然估计1p X=。
概率论与数理统计7
i 1
i 1
注:qˆ 为q的无偏估计,但g(qˆ )不一定是g(q)的无偏估计。 例如:若D(X)>0,ˆ X是 EX的无偏估计, E[(ˆ )2] E( X 2 ) D( X ) [E( X )]2 [E( X )]2 2. 22
二 有效性
1定义 设qˆ1,qˆ2都是参数q的无偏估计量,若 D(qˆ1) D(qˆ2)
24
三 一致性
定义 设qˆ是参数q的估计量,若对任意 0,有
lim P(| qˆ q | ) 1
即
qˆ
P
q
.
n
则称qˆ为q 一致估计量.
例 由大数定律 lim P( X ) 1 n 知样本均值 X 是总体均值的一致估计。
25
例 证明正态总体的样本方差S2是2的一致估计。
证
n1
2
解 0 , 2有反函数。由上例,ˆ 2 S2
故
ˆ S
1 n
n i 1
(Xi
X )2
注 u=u(q )为一般函数此性质也成立。
18
例 设(X1,…,Xn)是正态总体N(1,2)的样本, 求P(X<t)的极大似然估计。
解
P( X
t)
(
t
1
n) 有反函数。
又ˆ 2 S2,
故所求概率值的极大似然估计为
E(Xj) =aj(q1,…,qk)
=A n
1j Xi
n i1
j
2 方法 令 aj(q1,…,qk) =Aj
j=1,…,k
求解方程组,得到解qˆ1,,qˆk
作
为
参
数q
1,,q
的
k
矩
估
计
概率论与数理统计第七章-精品
湖南商学院信息系 数学教研室
第七章 参数估计
第一节 第二节
第三节 第四节 第五节
矩估计 极大似然估计
估计量的优良性准则 正态总体的区间估计(一) 正态总体的区间估计(二)
总体是由总体分布来刻画的.
总体分布类型的判断──在实际问题中, 我们根据问题本身的专业知识或以往的经验 或适当的统计方法,有时可以判断总体分布 的类型.
即
uX
2 2
1 n n i1
Xl2
求解得
u ˆˆ2 Xn 1i n1Xl2X2n 1i n1( XiX)2
∴均值,方差2的矩估计是:
uˆˆ 2Xn1
n
(Xi
i1
,2)两个未知参
两点说明:
1、求似然函数L( ) 的最大值点,可以应
用微积分中的技巧。由于ln(x)是x的增函
数,lnL( )与L( )在 的同一值处达到 它的最大值,假定是一实数,且lnL( ) 是 的一个可微函数。通过求解所谓“似 然方程”: dlnL() 0
d
可以得到 的MLE .
(1) 由总体分布导出样本的联合概率函数 (或联合密度);
(2) 把样本联合概率函数(或联合密度)中自变
量看成已知常数,而把参数 看作自变量, 得到似然函数L( ); (3) 求似然函数L( ) 的最大值点(常常转化 为求ln L()的最大值点) ,即 的MLE;
(4) 在最大值点的表达式中, 用样本值代入 就得参数的极大似然估计值 .
Var(X-)= 2
即 E(X)=
Var(X)= 2
即 E(X)=
Var(X)= 2
令 X
2
《概率论与数理统计》第七章 讲义
测得强度值为x1, x2 , …, x25,其均值为 x 108 (Pa),问当日生产是否正常?
Page 12
Chapter 7 假设检验
(1) 是参数估计问题吗? (2) 回答“是”还是“否”,假设检验问题。 (3) 命题“合金平均强度不低于110Pa”正确 与否仅涉及如下两个参数集合:
0 { : 110}
其二是 H 0不真(即 H1为真)但样本观测值落 在接受域中,从而接受原假设H 0,这种错误称 为第二类错误,其发生的概率称为犯第二类错 误的概率,或称受伪概率,通常记为 。
Page 22
Chapter 7 假设检验
观测数 据情况
( x1,, xn ) W
( x1 ,, xn ) W c
H0 : 110
vs
H1 : 110
Page 18
Chapter 7 假设检验
•假设检验的两个特点:
第一,假设检验采用逻辑上的反证法,即为了检验一个假设 是否成立,首先假设它是真的,然后对样本进行观察,如 果发现出现了不合理现象,则可以认为假设是不合理的, 拒绝假设。否则可以认为假设是合理的,接受假设。 第二,假设检验采用的反证法带有概率性质。所谓假设的不 合理不是绝对的,而是基于实践中广泛采用的小概率事件 几乎不可能发生的原则。至于事件的概率小到什么程度才 算是小概率事件,并没有统一的界定标准,而是必须根据 具体问题而定。如果一旦判断失误,错误地拒绝原假设会 造成巨大损失,那么拒绝原假设的概率就应定的小一些; 如果一旦判断失误,错误地接受原假设会造成巨大损失, 那么拒绝原假设的概率就应定的大一些。
Page 19
Chapter 7 假设检验
二、选择检验统计量,给出拒绝域形式
数理统计第7章
数理统计第7章第7章估计理论一(本章导学一(教学目的1 准确理解估计量、估计值,熟练掌握参数点估计的矩估计和极大似然估计。
2 理解估计量的评价标准,了解充分性与完备性,极大似然估计的性质。
3 熟练掌握区间估计的有关概念,正态总体均值与方差的区间估计。
二(内容提要主要介绍了两种点估计方法,估计量的评选标准,充分性与完备性,区间估计的基本概念和常用方法、公式。
估计理论是数理统计学的重要内容之一。
它主要分为参数估计和非参数估计,参数估计有点估计和区间估计两类问题。
本章主要研究参数估计问题。
在本章中,设是总体的一个待估参数,的一切可能取值构成的参数空间记为。
为从总体中抽取的一容量为n的样本,其观测值记为。
=,然后用去估计称在参数的点估计中,是要构造一个统计量为的点估计或估计量,或简称估计,将样本观测值代入在后便得到了的一个估计值,在不致混淆的情况均用表示。
在参数的区间估计中,是要构造两个统计量与,且<,然后以区间[,] 的形式给出未知参数的估计,事件“区间[,]含有”的概率称为置信水平。
一(矩法估计量1900年英国统计学家K.Pearson提出了一个替换原则:用样本矩去替换总体矩,后来人们就称此为矩估计。
矩估计的基本点是:用样本矩估计总体矩,用样本矩的相应函数估计总体矩的函数。
设是来自某总体ξ 的一个样本,则样本的阶原点矩为:如果总体ξ 的k阶原点矩存在,则用去估计,记为。
例1 设总体,从中获得样本,由于Eξ=p,故p的矩估计为设样本的观察值为,那么每一个不是0便是1,从而的观察值便是这便是频率。
例2 设总体ξ 具有方差,从总体中获得样本,由于那么分别用估计,从而其函数的矩估计为这便是样本的二阶中心矩,Dξ是总体的二阶中心矩,故。
一般当总体的k 阶中心矩存在时,其矩估计为样本的k阶中心矩,即:。
矩估计的优点是不要求知道总体的分布,因而矩估计获得了广泛的应用。
当总体分布类型已知时,但含有未知参数,有时也可用矩法获得未知参数的估计。
概率论与数理统计_第七章
X
2 i
■
概率论与数理统计
2、极大似然估计法
(1、极大似然估计法的思想 一位老猎人与他的徒弟一起打猎,两人同时向一 猎物射击,结果该猎物身中一弹,你认为谁打中的可能 性最大? 根据经验而断:老猎人打中猎物的可能性最大. 极大似然估计法的思想就是对固定的样本值,选 择待估参数的估计值使“样本取样本值”[离散型]或“样 本取值落在样本值附近”[连续型] 的概率最大。
因为X∼U[a,b],所以
ab
2
E(X
1
2)
E(X D(X )
) 2
[E(X )]2
,
(b a)2 12
a
2
b
2 ,
由
21
A1 A2
即
河南理工大学精品课程
概率论与数理统计
解得:Leabharlann ab X 2(ba)
2
12
(a b)2 4
1 n
n i 1
X
2 i
aˆ X
3 n
n i1
2 E( X 2 )
河南理工大学精品课程
1
2
x
2
e
|x|
dx
概率论与数理统计
1
x2
x
e dx
2
x
2ex d
x
0
0
2(3) 2 2,
由“样本二阶矩=总体二阶矩”得:
Γ函数 定义
1
n
n i 1
X
2 i
2 2 ,
于是,所求矩估计量为:
河南理工大学精品课程
ˆ
1 2n
n i 1
数p的矩估计量。
〖解〗单参数,离散型.
概率论与数理统计第七章第三节
( n 1) S ( X i X ) X i 12X 76.25
0.34 1 0.34 ( , 2.38) (0.45,2.79) 0.29 2.59 0.29
置信区间包含1,我们认为σ12, σ22两者无显著差别.
20
单侧置信区间 设 是 一个待估参数,给定 (0 1), 若由样本X1,X2,…Xn确定的统计量 ( X 1 , X 2 ,, X n ) 满足
S12 S12 1 1 ( 2 , 2 ) S2 F1 / 2 (n1 1, n2 1) S2 F / 2 (n1 1, n2 1)
n1=18,n2=13, 1-α=0.90, α/2=0.05 Fα/2(n1-1,n2-1)= F0.05(17,12)= 1/ F0.05(12,17)=1/2.38 F1-α/2(n1-1,n2-1)=F0.95(17,12)= 2.59 故σ12/ σ22的置信度为0.90 的置信区间为
1、 1 2 的区间估计
(1) 1 、 2 已知
2 2
枢轴量
X Y ( 1 2 )
2 1
n1
2 2
~ N (0,1)
n2
1- 2 的置信区间( X Y u 1 / 2
15
12
n1
2 2
n2
)
(2)
2 1
未知
2 2 2
5
枢轴量
概率论与数理统计第七章
矩估计法的具体做法如下 设总体的分布函数中含有k个未知参数 1,2, ,k 。 (1) 写出总体的前 k 阶矩μ1, μ2, , μk ,,一般是这 k 个未知参数的函数, 记为:
μi μi (θ1 , θ2 ,
θ j θ j ( μ1 , μ2 ,
(3)
, θk )
, μk )
你就会想,只发一枪便打中,猎人命中的概率一 般大于这位同学命中的概率。看来这一枪是猎人 射中的。
这个例子所作的推断已经体现了最大似然法的基 本思想 :一次试验就出现的事件有较大的概率。
718 例7.4 设总体 X 服从0-1分布, 且P {X = 1} = p, 用最大似然法求 p 的估计值。 解: 总体 X 的分布律为
以Ai分别代替上式的 可得 a , b 的矩估计量为
i , i 1, 2,
总体矩
n 3 2 2 ˆ a A 3( A A ) X ( X X ) , 1 2 1 i n i 1 n 3 ˆ 2 2 b A 3( A A ) X ( X X ) . 1 2 1 i n i 1
1. 矩估计法(简称“矩法” ) 矩法是基于一种简单的“替换”思 想建立起来的一种估计方法 。又称 数字特征法估计。 是由英国统计学家K.皮尔逊最早提出的。
1 n l 依据:(1) 样本矩 Al X i 依概率收敛于相应 n i 1 的总体矩 l , l 1, 2,.., k .
(2) 样本矩的连续函数依概率收敛于相应的总体矩 的连续函数。
解:
1
2X 1 ˆ , 由矩法, 可得α的矩估计量 1 X
矩法的优点是简单易行, 并不需要事先知道总体 是什么分布。 缺点是,当总体类型已知时,没有充分利用分布 提供的信息。一般场合下 , 矩估计量不具有唯一 性。
位置-尺度分布族基于逐次定数截尾样本的拟合优度检验的开题报告
位置-尺度分布族基于逐次定数截尾样本的拟合优度
检验的开题报告
题目:位置-尺度分布族基于逐次定数截尾样本的拟合优度检验
研究背景和意义:
随着数据收集和分析技术的发展和应用范围的扩大,位置-尺度分布族的逐步应用变得越来越广泛。
传统的拟合优度检验基于完整的数据集,对于大量缺失的数据和大量噪声数据的情况,其结果可能不准确。
而位
置-尺度分布族基于逐次定数截尾样本可以更好地处理这种情况。
研究内容和方法:
本研究计划采用位置-尺度分布族基于逐次定数截尾样本的拟合优度检验方法,对不同的位置-尺度分布族进行实证研究。
具体方法包括:
1. 选择合适的位置-尺度分布族,如Weibull分布、Gamma分布等;
2. 采用逐步定数截尾方法对数据进行修正;
3. 利用修正后的数据进行拟合优度检验,包括Kolmogorov-Smirnov 检验、卡方检验等;
4. 对比传统方法和本方法在不同情况下的表现。
预期成果和意义:
本研究预计可以得到以下成果:
1. 探究位置-尺度分布族基于逐次定数截尾样本的拟合优度检验方法的优越性;
2. 确定适用于不同情况下的位置-尺度分布族,并分析其特点;
3. 提供一种有效的数据处理和拟合优度检验方法,为实际应用提供
指导。
该研究对于提高位置-尺度分布族的应用效果和相关技术的发展具有实际意义。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
怎样根据截尾样本估计产品平均寿命
第七章 参数估计
§2 基于截尾样本的最大似然估计 3/4
设产品寿命服从指数分布,其概率密度为
定时截尾时间为
f (t) 1 et ,t 0
0 , t 0
任T.取 件产n 品进行寿命试验,截尾样本
为 0 t1 tm T. 试求平均寿命 的最大似然估计.
0
似然函数
nm)T
dt1 dtm
i 1
第七章 参数估计
§2 基于截尾样本的最大似然估计 4/4
设电池寿命服从指数分布,其概率密度为
f (t) 1 et ,t 0
0 , t 0
任取50只进行定时截尾寿命试验,截尾时间为180小时. 试验进行到规定时间时共有15只失效,其失效时间分别为
115,119,131,138,142,147,148,155, 158,159,163,166,167,170,172
§2 基于截尾样本的最大似然估计 1/4
随机取 n件产品,从 t 时 0刻开始进行试验 依次记录下失效时间,从而获得样本
0 t1 t2 tn
则产品的平均寿命估计值是
完全样本
ˆ t
1 n
n
ti
i 1
获得完全样本的时间周期较长,花费
较大,在实际中很难实现.
第七章 参数估计
§2 基于截尾样本的最大似然估计 2/4
预先规定好试验时间 0 T 随机取 件n产品,从 时t 刻0开始进行试验, 到截尾 时刻 t 试T 验停止,依次记录下失效时开间始和时失效间个数截,尾从时而间获 得定时截尾样本
0 t1 t2 tm T
预先规定好失效个数 m 随机取 n (n 件m产) 品,从 时t刻试开0验始停进止行时试验, 到出现 m个产品失效时试验停止,产依品次失记效录个下数失效时间,从而 获得定数截尾样本
单位:小时.试求电池平均寿命 的 最大似然估计值. 本题中 n 50, m 15,T 180
s(180) 115 119 172 (50 15)180 8550
求得 的最大似然估计值为 ˆ 8550 570 (小时)
15
第七章 参ቤተ መጻሕፍቲ ባይዱ估计
似任然一函产数品为在时刻 (ti,ti 失dt效] 的概率近似为
L( )
1
e
ti
dt
(i 1,, m)
求其n 得中m故令s件的(TC截产)最nm尾品大te1样寿似(n本命lm然n)观LT超估t察mm过计T值1(m1为Tne的出etˆt概现imt1dd)tt率的Tis(mn为T为概Cm)n总mt率m12试e近m(e(验n似nt1m时为)mT间)tTm.(