概率论与数理统计(浙大版)第七章第八章课件
概率论与数理统计(8)假设检验
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计第7章参数估计PPT课件
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
《概率论与数理统计》全套课件PPT(完整版)
P(B| A) P(AB) P(A)
为在事件A发生的条件下事件B发生的条件概率2.9
2. 性质: 条件概率符合概率定义中的三个条件, 即
10 对于每一个事件B, 有 1 P(B | A) 0.
20 P(S | A) 1.
30 设B1 , B2 ,两两互不相容, 则
P( Bi | A) P(B i | A).
i1
i1
此外, 条件概率具有无条件概率类似性质.例如:
(1) P( | A) 0.
(2) 设B1 ,B2 ,, Bn两两互不相容,则
n
n
P( Bi | A) P(B i | A).
30
i1
i1
(3) P(B | A) 1 P(B | A).
(4) P(B C | A) P(B | A) P(C | A) - P(BC | A).
在其中计算B发生的概率, 从而得到P(B|A). 例2. 在1, 2, 3, 4, 5这5个数码中, 每次取一个数码, 取后不放回, 连取两次, 求在第1次取到偶数的条 件下, 第2次取到奇数的概率.
32
(二) 乘法公式: 由条件概率定义, 立即可得P(A) 0, 则有 P(AB) P(A)P(B | A).
注 当A=S时, P(B|S)=P(B), 条件概率化为无 条件概率, 因此无条件概率可看成条件概率.
概率论与数理统计第八章假设检验
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
《概率论与数理统计》7
未知参数 , ,, 的函数.分别令
12
k
L(1,,k ) 0,(i 1,2,...,k)
或令
i
ln L(1,,k ) 0,(i 1,2,...,k)
i
由此方程组可解得参数 i 的极大似然估计值 ˆi.
例5 设X~b(1,p), X1, X2 , …,Xn是来自X的一个样本,
求参数 p 的最大似然估计量.
解 E( X ) ,E( X 2 ) D( X ) [E( X )]2 2 2
由矩估计法,
【注】
X
1
n
n i 1
X
2 i
2
2
ˆ X ,
ˆ
2
1 n
n i 1
(Xi
X )2
对任何总体,总体均值与方差的矩估计量都不变.
➢常见分布的参数矩估计量
(1)若总体X~b(1, p), 则未知参数 p 的矩估计量为
7-1
第七章
参数估计
统计 推断
的 基本 问题
7-2
参数估 计问题
(第七章)
点估计 区间估 计
假设检 验问题 (第八章)
什么是参数估计?
参数是刻画总体某方面概率特性的数量.
当此数量未知时,从总体抽出一个样本, 用某种方法对这个未知参数进行估计就 是参数估计.
例如,X ~N ( , 2),
若, 2未知, 通过构造样本的函数, 给出
k = k(A1, A2 , …, A k)
用i 作为i的估计量------矩估计量.
例1 设总体X服从[a,b]上的均匀分布,a,b未知,
X1, X2 , …,Xn为来自总体X的样本,试求a,b的 矩估计量.
解 E(X ) a b , D(X ) (b a)2
浙江大学概率论与数理统计第七章
点估计
一、点估计问题的提法
二、估计量的求法 三、小结
一、点估计问题的提法
设总体 X 的分布函数形式已知, 但它的一个 或多个参数为未知, 借助于总体 X 的一个样本来 估计总体未知参数的值的问题称为点估计问题. 例1
在某炸药制造厂, 一天中发生着火现象的
次数 X 是一个随机变量 , 假设它服从以 0 为参 数的泊松分布, 参数 为未知, 设有以下的样本值 , 试估计参数 .
n
(二) 取对数
n i 1
ln L( ) ln p( xi ; ) 或 ln L( ) ln f ( xi ; );
i 1
n
d ln L( ) d ln L( ) 对数似 (三) 对 求导 , 并令 0,然方程 d d ˆ. 解方程即得未知参数 的最大似然估计值
a b 2 A1 , 即 2 b a 12( A2 A1 ) .
解方程组得到a, b的矩估计量分别为
3 n 2 ( X X ) , ˆ A1 3( A2 A1 ) X a i n i 1
2
n 3 2 2 ˆ X ( X X ) . b A1 3( A2 A1 ) i n i 1
i 1 n
L( ) L( x1 , x2 ,, xn ; ) f ( xi ; ),
n
L( )称为样本的似然函数 . ˆ ) max L( x1 , x2 , , xn ; ). 若 L( x1 , x2 , , xn ;
i 1
ˆ ( x1 , x2 ,, xn ) 参数 的最大似然估计值 , ˆ ( X 1 , X 2 ,, X n ) 参数 的最大似然估计量 .
《概率论与数理统计》浙大内部课件(全套).PPT
“和”、“交”关系式
n i 1
A
n
A
Ai=A1 A2 An;
Ai
n i 1
Ai A1
A2
An;
Ai
n i 1
i 1
例:设A={ 甲来听课 },B={ 乙来听课 } ,则: A B {甲、乙至少有一人来} A B {甲、乙都来} A B AB {甲、乙都不来} A B AB {甲、乙至少有一人不来}
16
概率统计中研究的对象:随机现象的数量规律
对随机现象的观察、记录、试验统称为随机试验。 它具有以下特性: 1. 可以在相同条件下重复进行 2. 事先知道可能出现的结果 3. 进行试验前并不知道哪个试验结果会发生
例:
抛一枚硬币,观察试验结果; 对某路公交车某停靠站登记下车人数; 对某批电子产品测试其输入电压; 对听课人数进行一次登记;
4
随着18、19世纪科学的发展,人们注意到某些生物、物理 和社会现象与机会游戏相似,从而由机会游戏起源的概率 论被应用到这些领域中,同时也大大推动了概率论本身的 发展。 法国数学家拉普拉斯将古典概率论向近代概率论进行推进, 他首先明确给出了概率的古典定义,并在概率论中引入了 更有力的数学分析工具,将概率论推向一个新的发展阶段。 他还证明了“煤莫弗——拉普拉斯定理”.拉普拉斯于 1812年出版了他的著作《分析的概率理论》,这是一部继 往开来的作品。这时候人们最想知道的就是概率论是否会 有更大的应用价值?是否能有更大的发展成为严谨的学科 概率论在20世纪再度迅速地发展起来,则是由于科学技术 发展的迫切需要而产生的。1906年,俄国数学家马尔科夫 提出了所谓“马尔科夫链”的数学模型。1934年,前苏联 数学家辛钦又提出一种在时间中均匀进行着的平稳过程理有极重要的地位,现 今仍在常用的许多统计方法,就是建立在“所研 究的量具有或近似地具有正态分布”这个假定的 基础上,而经验和理论(概率论中所谓“中心极 限定理”)都表明这个假定的现实性,现实世界 许多现象看来是杂乱无章的,如不同的人有不同 的身高、体重。大批生产的产品,其质量指标各 有差异 。看来毫无规则,但它们在总体上服从正 态分布。这一点,显示在纷乱中有一种秩序存在, 提出正态分布的高斯,一生在多个领域里面有不 少重大的贡献,但在德国10马克的有高斯图像的 钞票上,单只画出了正态曲线,以此可以看出人 们对他这一贡献评价之高。
概率论与数理统计(浙大版)第七章第八章课件
解:1 矩估计
E X xk pk 2 2 3 (1 3 2) 3 5 2
X 2.2
令 E(X)=X ˆ 0.32
2 极大似然估计
L( ) ( 2)(1 3 2)( 2) (1 3 2)
1 16
3
(2
3
称 : ˆ( x1, x2,, xn )为的极大似然估计值 ˆ( X1, X2,, Xn )为的极大似然估计量
如何求 ˆ ?即求 L( ) 的最大值点问题
方法一: 若 L( )为可导函数
解方程 dL( ) 0, d
得到ˆ ˆ( X1, X2 ,, Xn )
回忆:
12
A1 A2
ˆ X
ˆ 2
1 n
n i 1
(Xi
X )2
例2:设总体X的密度为:
f
x
x 1
0
0 x 1 0为未知参数,
其他
X1,
X
,
2
,
X n 为取自X的样本,求的矩估计。
解:E X xf x dx 1 x dx
n
邻域内的概率为 f ( xi , )xi ,由极大似然原
理,最合理的
i1
的估计值
ˆ
应该是使
n
f ( xi , )xi 达到最大,由于xi是不依赖于
i1
的增量,所以我们只需求使
n
似然函数 L( ) f ( xi , ) 达到最大 i 1
求ˆ 的步骤:
(1) 写出L( ) (2) 取对数ln L( ) (3) 解方程 d ln[L( )] 0, 得到ˆ
浙大概率论与数理统计课件数理统计
假设检验
假设检验是统计学中常用的方法,用于判断总体参数是否符合某种假设。在本节,我们将学习如何根据样本数 据进行假设检验,并进行统计推断。
方差分析
方差分析用于比较两个或多个总体均值之间的差异。在本节,我们将学习如 何进行方差分析,并解释分析结果,以帮助我们做出合理的决策。
相关分析
相关分析用于研究两个变量之间的关系强度和方向。在本节,我们将学习如何计算相关系数,并解释相关分析 结果的意义。
回归分析
回归分析用于建立变量之间的函数关系。在本节,我们将学习如何进行简单线性回归和多元线性回归,并解释 回归分析的应用和预测能力。
Байду номын сангаас
浙大概率论与数理统计课 件数理统计
欢迎来到浙江大学概率论与数理统计课程!本课程将介绍常见概率分布、参 数估计、假设检验、方差分析、相关分析和回归分析等重要内容。
课程介绍与目的
通过本课程,你将深入了解概率论与数理统计的核心概念与应用。我们将讨 论统计学的基本原理和方法,以帮助你更好地理解和分析数据。无论是研究、 工作还是日常生活,都必定会涉及到概率和统计问题。
常见概率分布
在本节中,我们将学习一些常见的概率分布,如正态分布、二项分布和泊松 分布。掌握这些概率分布的特点和应用,有助于我们理解和预测不同类型的 随机现象。
参数估计
参数估计是统计学中的重要概念。通过样本数据,我们可以估计总体的参数, 如均值和方差。在本节,我们将介绍最大似然估计和置信区间等参数估计方 法。
浙江大学概率论与数理统计(盛骤第四版)——概率论部分1-90页精品文档
# 频率 反映了事件A发生的频繁程度。
15
n
Ai Ai A1 A2
n
n
An; Ai Ai=A1A2 An;
i1
i1
i1
i1
例:设A={ 甲来听课 },B={ 乙来听课 } ,则:
A B {甲、乙至少有一人来}
都不来}
A BAB{甲、乙至少有一人不来}
14
§3 频率与概率
例:
称S中的元素e为基本事件或样本点.
一枚硬币抛一次 S={正面,反面}; 记录一城市一日中发生交通事故次数
S={0,1,2,…}; 记录某地一昼夜最高温度x,最低温度y
S={(x,y)|T0≤y≤x≤T1}; 记录一批产品的寿命x S={ x|a≤x≤b }
10
(二) 随机事件
一般我们称S的子集A为E的随机事件A,当且 仅当A所包含的一个样本点发生称事件A发生。 例:观察89路公交车浙大站候车人数,S={0,1,2,…};
概率论与数理统计是研究随机现象 数量规律的一门学科。
1
第一章 概率论的基本概念
• 1.1 随机试验 • 1.2 样本空间 • 1.3 概率和频率 • 1.4 等可能概型(古典概型) • 1.5 条件概率 • 1.6 独立性
第二章 随机变量及其分布
• 2.1 随机变量 • 2.2 离散型随机变量及其分布 • 2.3 随机变量的分布函数 • 2.4 连续型随机变量及其概率密度 • 2.5 随机变量的函数的分布
记 A={至少有10人候车}={10,11,12,…} S, A为随机事件,A可能发生,也可能不发生。
如果将S亦视作事件,则每次试验S总是发生, 故又称S为必然事件。 为方便起见,记Φ 为不可能事件,Φ 不包含
《概率论与数理统计》课件 第七章 随机变量的数字特征
i 1,2, , 如果 xi pi , 则称 i 1 E( X ) xi pi 为随机变量X的数学期望; i 1
或称为该分布的数学期望,简称期望或均值.
(2)设连续随机变量X的密度函数为p( x),
如果
+
x p( x)dx ,
则称
-
E( X ) xp( x)dx 为随机变量X的数学期望.
5
例2.求二项分布B(n, p)的数学期望.
P(X
k)
n!
k!n
k !
pk
(1
p)nk ,k
1, 2,
, n.
n
解:EX kP{ X k}
k0
n
k
k0
n!
k!n
k !
pk
(1
p)nk
n
np
k 1
k
n 1! 1!n
pk1
k!
(1
p)nk
np[ p (1 p)]n1 np.
特别地,若X服从0 1分布,则EX p.
6
例3. 求泊松分布P( )的数学期望.
注:P( X k) k e , k 1, 2, .
k!
解:EX k k e e
k1
e
k1
k0 k !
k1 k 1 !
k1 k 1 !
ee
e x 1 x 1 x2 1 xn [这里,x ]
当 a 450时,平均收益EY 最大.
28
第二节 方差与标准差
29
引例
比较随机变量X、Y 的期望
X3 4 5 Y1 4 7 P 0.1 0.8 0.1 P 0.4 0.2 0.4
01 2 3 4 5 67
《概率论与数理统计教学课件》8第八章置信区间与假设检验之间的关系及p值
H0 : 0, H1 : 0 也有类似的对应关系 . 若已求得单侧置信区间 ( ( X1, X2, , Xn ), ), 则当0 ( ( x1, x2, , xn ), ) 时接受 H0;
当0 ( ( x1, x2, , xn ), ) 时拒绝 H0 . 反之, 若已求得检验问题 H0 : 0 , H1 : 0
若 0 ( , ), 则接受 H0; 若 0 ( , ), 则拒绝 H0 .
反之 ,对于任意的0 , 考虑显著性水平为 的假设检验问题:
H0 : 0, H1 : 0 .
假设它的接受域为
( x1, x2, , xn ) 0 ( x1, x2, , xn ). 即有 P0 { ( X1, X2 , , Xn ) 0 ( X1, X2 , , Xn )} 由0 的任意性,
要
拒绝H
,再
0
取
0.01也要拒绝H0,但不
能知道将再降低一些是否也要拒绝H0. 而p值法
给出了拒绝 H0的最小显著性水平 . 因此p值法比
临界值法给出了有关拒绝域的更多的信息.
二、典型例题
例2 用p值法检验本章第一节例2 的检验问题
H 0 : 0 0.545, H1 : 0 0.05 解 用Z检验法 , 现在检验统计量Z x 0 的观察
(, ( X1, X2 , , Xn ))与显著水平为 的左边检 验问题 H0 : 0, H1 : 0 有类似的对应关系. 若已求得单侧置信区间 (, ( X1 , X2 , , Xn )),
则当0 (, ( x1, x2, , xn ))时接受 H0; 当0 (, ( x1, x2, , xn ))时拒绝 H0.
那么在检验问题
H0 : 0, H1 : 0中 p值 P0 {t t0 } t0右侧尾部面积, 如图3;
浙江大学 概率论第八章课件
·右边检验 H0: µ≤µ0 ;H1:µ >µ0, 由P{T≥tα(n −1)} =α, 得水平为α的拒绝域为 T≥ tα(n−1)
α
某厂生产镍合金线,其抗拉强度的均值为10620(kg/mm2)。今 改进工艺后生产一批镍合金线,抽取10根,测得抗拉强度为 10512,10623,10668,10554,10776,10707,10557,10581,10666 ,10670。认为抗拉强度服从正态分布,取α=0.05 ,问新生产的 镍合金线的抗拉强度是否比过去生产的合金线抗拉强度要高?
解:H0:µ=112.6;H1:µ≠112.6 因为σ未知,所以用t检验。 n=7,α=0.05,拒绝域为 |t|≥t0.025(6)=2.4469 这里
x = 112.8, s = 1.135
112.8 − 112.6 | t |=| |= 0.466 < 2.4469 1.135 / 7
∴接受H0,认为间接测温无系统偏差。
H 1 : µ1 < µ 2
拒绝域为 t ≤ −tα ( n1 + n2 − 2)
比较甲,乙两种安眠药的疗效。将20名患者分成两组, 每组10人.其中10人服用甲药后延长睡眠的时数分别 为1.9, 0.8, 1.1, 0.1, -0.1, 4.4, 5.5, 1.6, 4.6, 3.4。另10人服用乙药后延长睡眠的时数分别 为0.7, -1.6, -0.2, -1.2, -0.1, 3.4, 3.7, 0.8, 0.0, 2.0。若服用两种安眠药后增加的睡眠时数服 从方差相同的正态分布.试问两种安眠药的疗效有无 显著性差异?(α=0.10) 解: 因为两个总体方差未知但相等,所以用t检验。
Q X 是µ的无偏估计。如果假设为真,
《概率论与数理统计》课件第七章 参数估计
03
若存在, 是否惟一?
添加标题
1
2
3
4
5
6
对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用标准
(1)无偏性
(3)一致性
(2)有效性
7.2 估计量的评选标准
无偏性
一致性
有效性
一 、无偏性
定义1 设 是未知参数θ的估计量
09
则称 有效.
10
比
11
例4 设 X1, X2, …, Xn 是X 的一个样本,
添加标题
问那个估计量最有效?
添加标题
解 ⑴
添加标题
由于
添加标题
验证
添加标题
都是
添加标题
的无偏估计.
都是总体均值
的无偏估计量.
故
D
C
A
B
因为
所以
更有效.
例5 设总体 X 的概率密度为
关于一致性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的一致性估计量.
是 的一致估计量.
由大数定律证明
用切比雪夫不 等式证明
似然函数为
其中
解得参数θ和μ的矩估计量为
2
时
3
令
1
当
6
,故
5
,表明L是μ的严格递增函数,又
4
第二个似然方程求不出θ的估计值,观察
添加标题
所以当
01
添加标题
从而参数θ和μ的最大似然估计值分别为
03
添加标题
时L 取到最大值
02
添加标题
概率论与数理统计第七章
估计 为1.68,这是点估计.
估计在区间[1.57, 1.84]内,这是区间估计.
一、点估计概念及讨论的问题
例1 已知某地区新生婴儿的体重X~ N(,2),
, 2未知,
…
随机抽查100个婴儿
得100个体重数据
9, 7, 6, 6.5, 5, 5.2, … 而全部信息就由这100个数组成.
求:两个参数a,b的矩估计
解: 写出方 V E 程 (X a(X )r组 ) ˆˆ2
其 中uˆˆ2Xn1in1(Xi X)2
但是
E
(
X
)
Var ( X )
a
b 2 (b a)2
12
即有
(ab2ba)2 12
X
ˆ
2
由方程组求解出a,b的矩估计:
a ˆX 3 ˆ b ˆX 3 ˆ
其中 ˆ:ˆ2 n 1i n1 ( XiX)2
(4) 在最大值点的表达式中, 用样本值代入 就得参数的极大似然估计值 .
两点说明:
1、求似然函数L( ) 的最大值点,可以应
用微积分中的技巧。由于ln(x)是x的增函
数,lnL( )与L( )在 的同一值处达到 它的最大值,假定是一实数,且lnL( ) 是 的一个可微函数。通过求解所谓“似 然方程”: dlnL() 0
E(X1m)=E(X2m)==E(Xnm)= E(Xm)=am . 根据大数定律,样本原点矩Am作为 X1m,X2m, ,Xnm的算术平均值依概率收敛到均 值am=E(Xm).即:
n 1i n1Xim pE(Xm)am
例1 设总体X的概率密度为
f(x)(1)x,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0
1
令E X X
X 1
2
ˆ X
1 X
二、 极大似然估计法 极大似然估计法是在总体的分布类型已知的
条件下所使用的一种参数估计方法. 它首先是由德国数学家
高斯在1821年提出的 . 然而,这个方法常归功于
英国统计学法,
并首先研究了这种方法的一些性质 .
再求样本矩:
A1
1 n
n i 1
Xi
X,
A2
1 n
n i 1
X
2 i
令
12
A1 A2
ˆ X
ˆ 2
1 n
n i 1
(Xi
X )2
例2:设总体X的密度为:
f
x
x 1
0
0 x 1 0为未知参数,
其他
X1,
X
,
2
,
X n 为取自X的样本,求的矩估计。
解:E X xf x dx 1 x dx
k 1,2, ,k Ak
解此方程即得1,2, ,k 的一个矩估计量 1, 2, ,ˆk
, Xn,
例1:设总体X的均值和方差 2都存在,且 2 0,, 2均未知,
X1, X 2, , X n 是取自X的一个样本,试求, 2的矩估计。
解:先求总体矩:
1 E X , 2 E X 2 D X E2 X 2 2
解方程 dL( ) 0, d
得到ˆ ˆ( X1, X2 ,, Xn )
回忆:
(1) f ( x) 0, ln[ f ( x)]单调性相同,从而最大值 点相同.
n
(2) L( ) p( xi; ) n项连乘, 求导麻烦
i1
ln[L( )] n项相加,求导简单 对数似然函数
从而,
求的 L( ) 最大值点就转为求ln[ L( )]的最大值点
f ( x1, x2 ,, xn ) f X1 ( x1 ) f X2 ( x2 ) f Xn ( xn )
n
f ( x1, ) f ( x2, ) f ( xn , ) f ( xi , ) i 1
于是,样本 ( X1, X2 ,, Xn ) 落入点( x1, x2 ,, xn )
n
邻域内的概率为 f ( xi , )xi ,由极大似然原
i1
是参数 的函数,称为似然函数,记做 L( ).
n
即 L( ) p( xi; ) i 1
结构:n 项连乘,总体分布 p(x, ) 改 p( xi , )
i 1,2,, n
P( A) L( ), 随变而变, A已经发生,由极大
似然原理, L( ) 达到最大,所以 的最合理 估计值ˆ 应满足:L(ˆ)为最大值
估计的未知参数,假定总体X的k阶原点矩E X k 存在,
则有:E X v v 1,2, ,k v 1, 2, , k, 对于样本X X1, X 2,
其v阶样本矩是:Av
1 n
n i 1
X
v i
v 1, 2,
,k
1 1,2, ,k A1
用样本矩作为总体矩的估计,即令: 2 1,2, ,k A2
Fisher
极大似然原理:一个随机试验有若干个可能结
果A,B,C,…。若在一次试验中,结果A发生,
则一般认为试验条件对A最有利,即A发生的
概率 P( A / )最大
条件
如, 甲199
红 黑,
乙199
红 黑
,
任 取1箱 从 中 任 取1球,
已知取到红球, 问最有可能从何箱取?
P(红球/甲) 0.99 P(红球/乙) 0.01
方法二:
解方程
d
ln[L(
)]
0,
得 到ˆ
d
(2)连续型总体似然函数的求法
设X为连续型总体,其概率密度为:
f ( x; ) 其中 未知
对来自总体的样本 ( X1, X2 ,, Xn ) , 其观测值
为 ( x1, x2 ,, xn ) ,作为与总体X同分布且相互
独立的n维随机变量,样本的联合概率密度为:
独立
P( X1 x1 )P( X2 x2 )P( Xn xn )
Xi与X 同分布
P( X x1 )P( X x2 )P( X xn )
p( x1, ) p( x2, ) p( xn, )
n
p( xi , )
i1
n
对给定的样本值( x1 , x2 ,..., xn ), p( xi , )
2 但参数, 2的值未知,要求估计, 2,有时还希望以一定的可靠性来 估计值是在某个范围内或者不低于某个数。
参数估计问题就是要求通过样本估计总体分布所包含的未知参数的值。
参数估计的两种方法:点估计法和区间估计法
§1 参数的点估计
点估计的问题就是根据样本 X1, X 2, , X n , 对每一个未知参数i i 1, 2, , k ,构造出一 个统计量ˆi i X1, X 2 , , X n ,作为参数i的估计,
第七章 参数估计
﹜点估计 关键词: 矩估计法 极大似然估计法 ﹜区间估计 置信区间 置信度
问题的提出:
参数估计是统计推断的基本问题之一,实际工作中碰到的总体X , 它的分布类型往往是知道的,只是不知道其中的某些参数, 例如:产品的质量指标X 服从正态分布,其概率密度为:
x 2
f x; , 2 1 e 2 2 x
称为 的估计量。
i
点估计有两种方法:矩估计法和极大似然估计法
一. 矩估计法
矩思想: 利用样本矩作为相应总体矩的估计量
1 n
n i 1
X
k i
估计
E X k (n )
矩估计法: 总体X ~ f ( x;1,,k ), 1,,k未知,
一 矩估计法:
设总体X的分布函数为F x;1,2, ,k , 1,2, ,k 是待
自然,认为从甲箱取更合理
又如,兔龟赛跑,得第一名的最有可能是谁?
极大似然估计法:
(1)X---离散型,已知 X的分布
P( X x) p( x, ), 未知
样本 ( X1, X2,, Xn ) 取到观测值( x1, x2,, xn ) 事件A
P( A) P( X1 x1, X2 x2 ,, Xn xn )
定义 对给定的样本值 x1, x2 ,, xn ,若
ˆ( x1, x2,, xn)满足
L(ˆ) max L( )
称 : ˆ( x1, x2,, xn )为的极大似然估计值 ˆ( X1, X2,, Xn )为的极大似然估计量
如何求 ˆ ?即求 L( ) 的最大值点问题
方法一: 若 L( )为可导函数