概率论与数理统计第七章
概率论与数理统计复习7章
( n − 1) S 2 ( n − 1) S 2 = 1 − α 即P 2 <σ2 < 2 χα 2 ( n − 1) χ1−α 2 ( n − 1) ( n − 1) S 2 ( n − 1) S 2 置信区间为: 2 , χα 2 ( n − 1) χ12−α 2 ( n − 1)
则有:E ( X v ) = µv (θ1 , θ 2 ,⋯ , θ k ) 其v阶样本矩是:Av = 1 ∑ X iv n i =1
n
估计的未知参数,假定总体X 的k阶原点矩E ( X k ) 存在,
µ θ , θ ,⋯ , θ = A k 1 1 1 2 µ2 θ1, θ 2 ,⋯ , θ k = A2 用样本矩作为总体矩的估计,即令: ⋮ µ θ , θ ,⋯ , θ = A k k k 1 2 ɵ ɵ ˆ 解此方程即得 (θ1 , θ 2 ,⋯ , θ k )的一个矩估计量 θ 1 , θ 2 ,⋯ , θ k
+∞
−∞
xf ( x ) dx = ∫ θ x θ dx =
1 0
令E ( X ) = X ⇒
θ +1
θ
ˆ = X ⇒θ =
( )
X 1− X
θ +1
2
θ
7.2极大似然估计法
极大似然估计法: 设总体X 的概率密度为f ( x,θ ) (或分布率p( x,θ )),θ = (θ1 ,θ 2 ,⋯ ,θ k ) 为 未知参数,θ ∈ Θ, Θ为参数空间,即θ的取值范围。设 ( x1 , x2 ,⋯ , xn ) 是 样本 ( X 1 , X 2 ,⋯ , X n )的一个观察值:
i =1 n
概率论与数理统计第7章参数估计PPT课件
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
概率论与数理统计-第七章
但是参数 参数估计
, 未知。希望通过抽样估计之。
点估计 —— 给出参数的估计值。
区间估计 —— 给出参数的估计范围
3
§1 参数的点估计
用样本( X1, X2, …, Xn ),对每个未知参数 θi , ( i = 1, 2, …, k) 构造出一个统计量,
作为对参数 θi 的估计。该统计量称为 θi 的估计量。
抽出样本(X1, X2, …, Xn )。求证:对任何总体分布,
证明:X1, X2, …, Xn 独立,且与X同分布
28
例10:对服从均匀分布U(0, b)的总体X,讨论参数 b 的矩估计和极大似然估计的无偏性。 解: 由前面U(a, b)分布的a和b的估计量: (1) 矩估计
令 a=0
是
无偏估计!
xi , 故的取值范围最大不超过x min x1 , x2 ,
另一方面,L , 1n e
1
, xn
xi i 1
n
n
是的增函数,取到最大值时,L达到最大。
故 X 1 min X1 , X 2 ,
dlnL 令 n 12 d
29
(2) 极大似然估计
令 a=0
不是无偏估计
30
纠偏方法
如果 满足 ,则新的估计量 , 是无偏估计!
例9中:对服从均匀分布U(0, b)的总体X,参数 b 极大似然估计 不是无偏估计。
由于
是一个修正的极大似然估计,是无偏估计。
31
2.有效性 在没有系统误差的前题下,还希望估计量的 随机误差尽量小(对给定的样本容量n)!
推荐三本概率论和数理统计的参考书: (1)《数理统计学简史》, 陈希孺 (2)《概率论札记》, 梁昌洪
《概率论与数理统计》第七章假设检验.
《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标:理解假设检验的基本概念⼩概率原理;掌握假设检验的⽅法和步骤。
能⼒⽬标:能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。
参数估计和假设检验是统计推断的两种形式,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。
参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。
⽽在假设检验中,则是预先对总体参数的取值提出⼀个假设,然后利⽤样本数据检验这个假设是否成⽴,如果成⽴,我们就接受这个假设,如果不成⽴就拒绝原假设。
当然由于样本的随机性,这种推断只能具有⼀定的可靠性。
本章介绍假设检验的基本概念,以及假设检验的⼀般步骤,然后重点介绍常⽤的参数检验⽅法。
由于篇幅的限制,⾮参数假设检验在这⾥就不作介绍了。
第⼀节假设检验的⼀般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误⼀、假设检验的基本概念(⼀)原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识,不妨先看下⾯的例⼦。
例7.1 某⼚⽣产⼀种⽇光灯管,其寿命X 服从正态分布)200 ,(2µN ,从过去的⽣产经验看,灯管的平均寿命为1550=µ⼩时,。
现在采⽤新⼯艺后,在所⽣产的新灯管中抽取25只,测其平均寿命为1650⼩时。
问采⽤新⼯艺后,灯管的寿命是否有显著提⾼?这是⼀个均值的检验问题。
灯管的寿命有没有显著变化呢?这有两种可能:⼀种是没有什么变化。
即新⼯艺对均值没有影响,采⽤新⼯艺后,X 仍然服从)200 ,1550(2N 。
另⼀种情况可能是,新⼯艺的确使均值发⽣了显著性变化。
这样,1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。
究竟是哪种情况与实际情况相符合,这需要作检验。
假如给定显著性⽔平05.0=α。
在上⾯的例⼦中,我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。
《概率论与数理统计》7
未知参数 , ,, 的函数.分别令
12
k
L(1,,k ) 0,(i 1,2,...,k)
或令
i
ln L(1,,k ) 0,(i 1,2,...,k)
i
由此方程组可解得参数 i 的极大似然估计值 ˆi.
例5 设X~b(1,p), X1, X2 , …,Xn是来自X的一个样本,
求参数 p 的最大似然估计量.
解 E( X ) ,E( X 2 ) D( X ) [E( X )]2 2 2
由矩估计法,
【注】
X
1
n
n i 1
X
2 i
2
2
ˆ X ,
ˆ
2
1 n
n i 1
(Xi
X )2
对任何总体,总体均值与方差的矩估计量都不变.
➢常见分布的参数矩估计量
(1)若总体X~b(1, p), 则未知参数 p 的矩估计量为
7-1
第七章
参数估计
统计 推断
的 基本 问题
7-2
参数估 计问题
(第七章)
点估计 区间估 计
假设检 验问题 (第八章)
什么是参数估计?
参数是刻画总体某方面概率特性的数量.
当此数量未知时,从总体抽出一个样本, 用某种方法对这个未知参数进行估计就 是参数估计.
例如,X ~N ( , 2),
若, 2未知, 通过构造样本的函数, 给出
k = k(A1, A2 , …, A k)
用i 作为i的估计量------矩估计量.
例1 设总体X服从[a,b]上的均匀分布,a,b未知,
X1, X2 , …,Xn为来自总体X的样本,试求a,b的 矩估计量.
解 E(X ) a b , D(X ) (b a)2
概率论与数理统计PPT课件第七章最大似然估计
• 最大似然估计的概述 • 最大似然估计的数学基础 • 最大似然估计的实现 • 最大似然估计的应用 • 最大似然估计的扩展
01
最大似然估计的概述
定义与性质
定义
最大似然估计是一种参数估计方法, 通过最大化样本数据的似然函数来估 计参数。
性质
最大似然估计是一种非线性、非参数 的统计方法,具有一致性、无偏性和 有效性等优良性质。
无偏性
在某些条件下,最大似然估计的参数估计值是无偏的,即其期望值等于真实值。
最大似然估计的优缺点
• 有效性:在某些条件下,最大似然估计具有最小方差性质, 即其方差达到最小。
最大似然估计的优缺点
非线性
01
最大似然估计是非线性估计方法,对参数的估计可能存在局部
最优解而非全局最优解。
对初值敏感
02
最大似然估计对初值的选择敏感,不同的初值可能导致不同的
04
最大似然估计的应用
在回归分析中的应用
线性回归
最大似然估计常用于线性回归模型的参数估计,通过最大化似然函 数来估计回归系数。
非线性回归
对于非线性回归模型,最大似然估计同样适用,通过将非线性模型 转换为似然函数的形式进行参数估计。
多元回归
在多元回归分析中,最大似然估计能够处理多个自变量对因变量的影 响,并给出最佳参数估计。
最大熵原理与最大似然估计在某些方面具有相似性,例如都追求最大化某种度量, 但在应用场景和约束条件上有所不同。
THANKS
感谢观看
连续型随机变量的概率密度函数
然函数
基于样本数据和假设的概率模型, 计算样本数据在该模型下的可能 性。
似然函数的性质
非负性、归一化、随着样本数据的 增加而增加。
概率论与数理统计第七章
13
二、最大似然估计法
是在总体类型已知条件下使用的一种参数估计方法 . 它首先是由德国数学家高斯在 1821年提出的 ,
然而,这个方法常归功于英国 统计学家费歇 . 费歇在1922年重新发现了这一 方法,并首先研究了这种方法 的一些性质 .
Gauss
Fisher
信息管理学院 徐晔
选择适当的 i , i 1,2,, m
使得样本 ( X 1, X 2 ,, X n ) 作为一个随机变量,得 到观察值 ( x1, x2 ,, xn ) 的可能性最大。
信息管理学院 徐晔
17
当总体 X 为离散型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维离散型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是联合概率事件
14
最大似然估计法的基本思想
先看一个简单例子:
某位同学与一位猎人一起外出打猎 .
一只野兔从前方窜过 .
只听一声枪响,野兔应声倒下 .
如果要你推测, 是谁打中的呢? 你会如何想呢?
信息管理学院 徐晔
15
你就会想,只发一枪便打中,猎人命中的概率 一般大于这位同学命中的概率. 看来这一枪是猎人 射中的 . 这个例子所作的推断已经体现了最大似然估计 法的基本思想 .
信息管理学院 徐晔
18
n
当总体 X 为连续型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维连续型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是值对于一个极小的 ,联合 概率事件
A ( x1 X 1 x1 , x2 X 2 x2 ,, xn X n xn )
浙江大学概率论与数理统计第七章
点估计
一、点估计问题的提法
二、估计量的求法 三、小结
一、点估计问题的提法
设总体 X 的分布函数形式已知, 但它的一个 或多个参数为未知, 借助于总体 X 的一个样本来 估计总体未知参数的值的问题称为点估计问题. 例1
在某炸药制造厂, 一天中发生着火现象的
次数 X 是一个随机变量 , 假设它服从以 0 为参 数的泊松分布, 参数 为未知, 设有以下的样本值 , 试估计参数 .
n
(二) 取对数
n i 1
ln L( ) ln p( xi ; ) 或 ln L( ) ln f ( xi ; );
i 1
n
d ln L( ) d ln L( ) 对数似 (三) 对 求导 , 并令 0,然方程 d d ˆ. 解方程即得未知参数 的最大似然估计值
a b 2 A1 , 即 2 b a 12( A2 A1 ) .
解方程组得到a, b的矩估计量分别为
3 n 2 ( X X ) , ˆ A1 3( A2 A1 ) X a i n i 1
2
n 3 2 2 ˆ X ( X X ) . b A1 3( A2 A1 ) i n i 1
i 1 n
L( ) L( x1 , x2 ,, xn ; ) f ( xi ; ),
n
L( )称为样本的似然函数 . ˆ ) max L( x1 , x2 , , xn ; ). 若 L( x1 , x2 , , xn ;
i 1
ˆ ( x1 , x2 ,, xn ) 参数 的最大似然估计值 , ˆ ( X 1 , X 2 ,, X n ) 参数 的最大似然估计量 .
概率论与数理统计-第七章
2
= (2π ) (σ ) exp[−
2
2
−
n 2
−
n 2
1 2σ 2
( xi − µ ) 2 ] ∑
i =1
n
n
设总体X~U[a,b],其中 ,b是 例3. 设总体 ,其中a, 是 未知参数。试求a, 的矩估计量 的矩估计量。 未知参数。试求 ,b的矩估计量。 解:E(X)=(a+b)/2, D(X)=(b-a)2/12.
1 n 1 ∑Xi = E(X) = 2 (a +b) n i=1 1 n 2 Xi = E(X 2 ) = D(X) +[E(X)]2 ∑ n i=1 1 1 2 = (b − a) + (a +b)2 12 4
解:白球所占比例p=1/4或3/4. 白球所占比例 或 X:任取 个球中白球的个数,X~B(3, p) 任取3个球中白球的个数 任取 个球中白球的个数,
P( X = 2) = C p (1− p) = 3p (1− p)
2 3 2 2
1 9 , p = 4时 P(X = 2) = 64 p = 3时 P(X = 2) = 27 , 4 64
1 n ˆ (1)µ = X = ∑Xi是 体 值 的 偏 计 ; 总 均 µ 无 估 量 n i=1 1 n ˆ (2)σ 2 = S2 = ( Xi − X )2是 体 差 2的 总 方 σ ∑ n −1 i=1 无 估 量. 偏 计
n −1 2 D(X) = S n 即可解出未知参数的估计量。 即可解出未知参数的估计量。
概率论与数理统计第七章
样本矩
2
从中解得 ˆ 2X 1 , 即为 的矩估计.
1 X
例2 设X1,X2,…Xn是取自总体X的一个样本
X
~
f
(
x)
1
e (
x
)
,
x
, 为未知参数
0,
其它
其中 >0,求 , 的矩估计.
解: 由密度函数知
X 具有均值为 的指数分布
故 E(X- )= 即 E(X)=
Var(X- )= 2
n xi e e n
i1 xi !
i1
n
xi !
i 1
log
L( )
n
1
n
xi
i 1
0
得解 :
*
1 n
n
xi
i 1
x
2
2
log
L( )
1
2
n
xi
i 1
0
* x
是logL()的最大值点. ∴ 的极大似然估计量是
* X
例 4 总体均匀分布 X ∼ U(a,b). 求:两个参数a,b的极大似然估计
步骤一、 我们把总体X的m阶原点矩E(Xm)记 为 am , m=1,2, ,k
一般地,am (m=1,2, ,k)是总体分布中 的参数 1,2,,k的函数. 故应该把am
(m= 1,2, ,k)记之为:
am (1,2,,k) (m=1,2, ,k)
步骤二、 算出m阶样本原点矩:
Am
1 n
组成 . 设这5个数是: 1.65 1.67 1.68 1.78 1.69
估计 为1.68,这是点估计.
估计 在区间[1.57, 1.84]内,这是区间估计.
《概率论与数理统计》课件 第七章 随机变量的数字特征
i 1,2, , 如果 xi pi , 则称 i 1 E( X ) xi pi 为随机变量X的数学期望; i 1
或称为该分布的数学期望,简称期望或均值.
(2)设连续随机变量X的密度函数为p( x),
如果
+
x p( x)dx ,
则称
-
E( X ) xp( x)dx 为随机变量X的数学期望.
5
例2.求二项分布B(n, p)的数学期望.
P(X
k)
n!
k!n
k !
pk
(1
p)nk ,k
1, 2,
, n.
n
解:EX kP{ X k}
k0
n
k
k0
n!
k!n
k !
pk
(1
p)nk
n
np
k 1
k
n 1! 1!n
pk1
k!
(1
p)nk
np[ p (1 p)]n1 np.
特别地,若X服从0 1分布,则EX p.
6
例3. 求泊松分布P( )的数学期望.
注:P( X k) k e , k 1, 2, .
k!
解:EX k k e e
k1
e
k1
k0 k !
k1 k 1 !
k1 k 1 !
ee
e x 1 x 1 x2 1 xn [这里,x ]
当 a 450时,平均收益EY 最大.
28
第二节 方差与标准差
29
引例
比较随机变量X、Y 的期望
X3 4 5 Y1 4 7 P 0.1 0.8 0.1 P 0.4 0.2 0.4
01 2 3 4 5 67
概率论与数理统计第七章
第七章 参数估计1. 样本均值74.002X =样本方差822611() 6.8571081i i S X X -==-=⨯-∑ 样本二阶中心矩 822611()6108ii S X X -==-=⨯∑ 均值与方差的矩估计值分别为: 2674.002610μσ-= =⨯ 2.(1)矩估计(1)()1cccE X x c xdx c x dx θθθθθθθθ+∞+∞-+-===-⎰⎰ 令1c X θθ=-,得θ的估计量为 X X c θ=-,θ的估计值为 1111ni i ni i x n x c n θ===-∑∑ (2)极大似然估计(1)(1)(1)11()()()n n n L c x c x c x x θθθθθθθθθθ-+-+-+==1ln ()ln()(1)ln ni i L n c x θθθθ==-+∑令1ln ln ln 0ni i L n n c x θθ=∂=+-=∂∑得θ的估计值为 1ln ln nii nx n cθ==-∑,θ的估计量为 1ln ln nii nXn cθ==-∑3.(1) 矩估计121433X ++== 22()122(1)3(1)32E X θθθθθ=⨯+⨯-+⨯-=-令()E X X = 得θ的估计值为 56θ= 极大似然估计2256112233()()()()2(1)22L P X x P X x P X x θθθθθθθ=====⨯-⨯=-令ln 5101L θθθ∂=-=∂-,得θ的估计值为 56θ=(2)矩估计量11ni i X X n λ===∑极大似然估计1111211()()()...()...!!!...!inx x x nn n n n e e L P X x P X x P X x ex x x x λλλλλλλ---∑======令ln ()0i x L n λθλ∂=-+=∂∑,得λ的似然估计值为 i x nλ=∑, 从而λ的似然估计量为11ni i X X n λ===∑。
同济大学概率论与数理统计第七章ppt课件
例 15.设 X 与Y 的联合概率
函数为
XY 1 0 2
-1 1 0 1
6
6
0 0 11
66
1 1 10
66
求Cov(X,Y)
E(X)=0, E(Y)=1, E(XY)=-1/3, 可以推出 Cov(X,Y)
=-1/3
定理 4 (协方差性质)设 k 、 l 、 c 都是常数。
(1) cov X,Y covY, X ;
方差性质
定理 3 设 k 与 c 都是常数。
(1) Dc 0 ;反之,如果某个随机变量 X 的方 差为 0,那么, P X c 1,其中 c EX ;
(2) DkX c k2D X ;
D X Y D X DY
(3) 2E X EX Y EY ;
求D(X+Y),E(X2Y2). 解: D(X+Y)= D(X)+ D(Y) = 3/4 + 1/4= 1
由X,Y相互独立可推得X2,Y2相互独 立,
因此 E(X2Y2)= E(X2) E(Y2)
= {D(X) + [E(X)]2 } {D(Y)+ [E(Y)]2 }
={ 3/4 + 9/4 } { 1/4 +1/4 }= 3/2
例 17. 求例 14、15 中 X 与Y 的相关系数。
注:(1) X ,Y E X Y
(2)
D aX bY a2D X b2D Y
。
2ab X ,Y DXDY
定理 5 (相关系数的性质) 当 DX 0 , DY 0 时,
E(XY) xy f x, ydxdy
《概率论与数理统计》课件第七章 参数估计
03
若存在, 是否惟一?
添加标题
1
2
3
4
5
6
对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用标准
(1)无偏性
(3)一致性
(2)有效性
7.2 估计量的评选标准
无偏性
一致性
有效性
一 、无偏性
定义1 设 是未知参数θ的估计量
09
则称 有效.
10
比
11
例4 设 X1, X2, …, Xn 是X 的一个样本,
添加标题
问那个估计量最有效?
添加标题
解 ⑴
添加标题
由于
添加标题
验证
添加标题
都是
添加标题
的无偏估计.
都是总体均值
的无偏估计量.
故
D
C
A
B
因为
所以
更有效.
例5 设总体 X 的概率密度为
关于一致性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的一致性估计量.
是 的一致估计量.
由大数定律证明
用切比雪夫不 等式证明
似然函数为
其中
解得参数θ和μ的矩估计量为
2
时
3
令
1
当
6
,故
5
,表明L是μ的严格递增函数,又
4
第二个似然方程求不出θ的估计值,观察
添加标题
所以当
01
添加标题
从而参数θ和μ的最大似然估计值分别为
03
添加标题
时L 取到最大值
02
添加标题
《概率论与数理统计》第七章 讲义
测得强度值为x1, x2 , …, x25,其均值为 x 108 (Pa),问当日生产是否正常?
Page 12
Chapter 7 假设检验
(1) 是参数估计问题吗? (2) 回答“是”还是“否”,假设检验问题。 (3) 命题“合金平均强度不低于110Pa”正确 与否仅涉及如下两个参数集合:
0 { : 110}
其二是 H 0不真(即 H1为真)但样本观测值落 在接受域中,从而接受原假设H 0,这种错误称 为第二类错误,其发生的概率称为犯第二类错 误的概率,或称受伪概率,通常记为 。
Page 22
Chapter 7 假设检验
观测数 据情况
( x1,, xn ) W
( x1 ,, xn ) W c
H0 : 110
vs
H1 : 110
Page 18
Chapter 7 假设检验
•假设检验的两个特点:
第一,假设检验采用逻辑上的反证法,即为了检验一个假设 是否成立,首先假设它是真的,然后对样本进行观察,如 果发现出现了不合理现象,则可以认为假设是不合理的, 拒绝假设。否则可以认为假设是合理的,接受假设。 第二,假设检验采用的反证法带有概率性质。所谓假设的不 合理不是绝对的,而是基于实践中广泛采用的小概率事件 几乎不可能发生的原则。至于事件的概率小到什么程度才 算是小概率事件,并没有统一的界定标准,而是必须根据 具体问题而定。如果一旦判断失误,错误地拒绝原假设会 造成巨大损失,那么拒绝原假设的概率就应定的小一些; 如果一旦判断失误,错误地接受原假设会造成巨大损失, 那么拒绝原假设的概率就应定的大一些。
Page 19
Chapter 7 假设检验
二、选择检验统计量,给出拒绝域形式
吴赣昌编 概率论与数理统计 第7章(new)
0
n
k 成立的样本值(x1,x2,…,xn)为
检验的接受域,记为W0。
2、检验的两类错误
当H0为真时,作出拒绝H0的判断,称这类错误为第一类错
误或弃真错误; 当H0不真时,作出接受H0的判断,称这类错误为第二类错 误或取伪错误。 记α=P{拒绝H0| H0真};β=P{接受H0| H0假} 对于给定的一对H0和H1,总可找出许多临界域W, 人们自然希望找到这种临界域W,使得犯两类错误的概率都 很小。 奈曼—皮尔逊(Neyman—Pearson)提出了一个原则: “在控制犯第一类错误的概率不超过指定值的条件下,尽 量使犯第二类错误小”,按这种法则做出的检验称为“显 著性检验”,称为显著性水平或检验水平。
x 21 S 2 12.5 (4)由题意,计算得到样本均值和样本方差分别为 x 0 21 18 2.55 计算统计量观察值 t S n 12.5 9 (5)由于 t 2.55 t (n 1) 2.3060 所以拒绝原假设H0,而接受H1,
2
即能以95%的把握推断该地区青少年犯罪的平均年龄不是18岁。
2
(5)结论 u 1.258 u 1.96
2
接受原假设H0
即不能否定这批产品该项指标为1600。
例7.5 完成生产线上某件工作的平均时间不少于15.5分钟,标准 差为3分钟。对随机抽取的9名职工讲授一种新方法,训练期结束 后,9名职工完成此项工作的平均时间为13.5分钟。这个结果是 否说明用新方法所需时间比用老方法所需时间短?设α=0.05,并 假定完成这件工作的时间服从正态分布。 解(单边检验问题)(1)提出原假设H0:μ≥15.5,H1μ<15.5;
1、检验方法 总体X~N(μ,σ2) ,要检验μ是否为μ0,而μ是未知的.我们知道μ X 的无偏估计是 ,样本均值X 的大小在一定程度上反映了 μ的大小,因此,当H0为真时,即μ=μ0时, X 的观察值 x | 与μ0的偏差 | x 0 一般不应太大。如果 | x 0 | 过分大, 我们就应怀疑假设H0的正确性并拒绝H0,而| x 0 | 的大小, | X 0 | 可归结为统计量 的大小。 0 n X 0 ~ N (0,1) 当H0为真时,统计量 U 0 n
概率论与数理统计第七章
矩估计法的具体做法如下 设总体的分布函数中含有k个未知参数 1,2, ,k 。 (1) 写出总体的前 k 阶矩μ1, μ2, , μk ,,一般是这 k 个未知参数的函数, 记为:
μi μi (θ1 , θ2 ,
θ j θ j ( μ1 , μ2 ,
(3)
, θk )
, μk )
你就会想,只发一枪便打中,猎人命中的概率一 般大于这位同学命中的概率。看来这一枪是猎人 射中的。
这个例子所作的推断已经体现了最大似然法的基 本思想 :一次试验就出现的事件有较大的概率。
718 例7.4 设总体 X 服从0-1分布, 且P {X = 1} = p, 用最大似然法求 p 的估计值。 解: 总体 X 的分布律为
以Ai分别代替上式的 可得 a , b 的矩估计量为
i , i 1, 2,
总体矩
n 3 2 2 ˆ a A 3( A A ) X ( X X ) , 1 2 1 i n i 1 n 3 ˆ 2 2 b A 3( A A ) X ( X X ) . 1 2 1 i n i 1
1. 矩估计法(简称“矩法” ) 矩法是基于一种简单的“替换”思 想建立起来的一种估计方法 。又称 数字特征法估计。 是由英国统计学家K.皮尔逊最早提出的。
1 n l 依据:(1) 样本矩 Al X i 依概率收敛于相应 n i 1 的总体矩 l , l 1, 2,.., k .
(2) 样本矩的连续函数依概率收敛于相应的总体矩 的连续函数。
解:
1
2X 1 ˆ , 由矩法, 可得α的矩估计量 1 X
矩法的优点是简单易行, 并不需要事先知道总体 是什么分布。 缺点是,当总体类型已知时,没有充分利用分布 提供的信息。一般场合下 , 矩估计量不具有唯一 性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理统计学: 运用概率论的基础知识,对要研究的随机现 象进行多次观察或试验,研究如何合理地获得数 据资料,建立有效的数学方法,根据所获得的数 据资料,对所关心的问题作出估计与检验。
§1总体、个体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。
总体可以是具体事物的集合,如一批产品。
2
3150 8
2
3450 5
3750 2
2 2 2
i 1
2
m ix i 2 2550 3 2850 8 3150 5 3450 2 3750
2
=204390000
s 1 19
2
( 2 0 4 3 9 0 0 0 0 2 0 3 1 8 0 ) 1 1 2 7 3 6 .8 4
2
1 n
2
i 1
n
2
故
X N , n
标准化可得
X n
sx 300
2 2
=3180
1 19
2 3 .8 =112736.84
§4 几个常用统计量的分布
数 理 统 计 中 , 较 多 使 用 正 态 总 体 , 其 样 本 X 1 , ..., X n的 统 计 量 X与 S 及 其 函 数 的 分 布 很 重 要 。
2
定 理 1 设 X 1 , ..., X n 相 互 独 立 , X i 服 从 正 态 分 布 N ( i , i ),
通常有两种抽样方式: (1)不重复抽样(不放回) (2)重复抽样(放回) 重复抽样所得的样本,称为简单随机样本。 对总体进行n次独立试验或n次独立观察, 即是从总体中抽取容量为n的样本,
以 随 机 变 量 X 1 ,...,X n 代 表 每 个 X i应 与 总 体 有 相 同 的 分 布 。
2
则它们的线性函数
i 1
n
a i X i ( a i 不 全 为 零 )也 服 从 正 态 分
布,且
E
i 1
n
a i i , D
i 1
n
ai i .
2 2
推论
设 X 1 , ..., X n 是 取 自 正 态 总 体 N ( , )的 样 本 , 则
2 2
(三)样本平均值与样本方差的简单公式 设(x1,…,xn)为样本的n个观察值 对任意常数a及非零常数c
记 zi = (xi -a) c i 1, ..., n
即 x i cz i a
x
(cz n
i 1
1
n
i
a) c
2
n
1
n
zi a cz a
n
i 1
当 n 时 ,
Fn ( x )的 极 限 为 总 体 分 布 函 数 F ( x )
称Fn(x)为样本分布函数或经验分布函数。
例 2 随 机 观 察 总 体 , 得 10个 数 据 如 下 : 3 .2, 2 .5, 4, 2 .5, 0, 3, 2, 2 .5, 4 , 2 求 样 本 分 布 函 数 F1 0 ( x ) .
其中频率是频数除以总频数。
累积频率是指相应的组频率之和。 为了直观,一般用直方图表示:
频率直方图:
1 第 i个 长 方 形 高 度 为 频 率 的 k 倍 , 为 组 距 。 k
频数(%)
1 300
50Βιβλιοθήκη 24003900体重
累积频率直方图: 第i个长方形的面积表示累积频率。
1 300 100
也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
例如: 总体 一批产品 一批灯泡 一年的日平均气温 数轴上某一线段 一批彩票 个体 每件产品 每个灯泡 每天日平均气温 线段中每一点 每张彩票 特征 等级 寿命 度数 坐标 号码
将上述数据分成五组:
分组编号 组限 组中值 组频数 组 频 率 (%) 累 积 频 率 (%) 1 2400-2700 2550 2 10 10 2 2700-3000 2850 3 15 25 3 3000-3300 3150 8 40 65 4 3300-3600 3450 5 25 90 5 3600-3900 3750 2 10 100
组中值 组频数 2550 2 2850 3 3150 8 3450 5 3750 2
则
x
1 20
(2 2550 3 2850 8 3150 5 3450 2 3750)
3180
(二)样本方差 对于样本(X1,…,Xn)
样本方差为 S
2
1 n 1
i 1
2550 2 2
2850 1 3
3150 0 8
3450 1 5
3750 2 2
mizi z i2 mizi2
故 z 1 20 2
-4 4 8 =0.1
-3 1 3
sz
2
0 0 0
1 19
5 1 5
4 4 8
2
( 2 4 2 0 0 .1 )
1 19
2 3 .8
x 300 0.1 3150
(1) X N ( , ( 2 )( X ) n
n
) N ( 0 ,1)
这 是 因 为 X 是 X 1 , ..., X n的 线 性 函 数
故 X是 正 态 分 布
EX
n
1 n
2
1
n
EX i
n
i 1
n
i 1
1
n
n
2
DX
i 1
D X i
人们感兴趣的是总体的某一个或几个数量指标的分布 情况。每个个体所取的值不同,但它按一定规律分布。
以 随 机 变 量 代 表 总 体 的 特 征 。
当总体数量很大时,只能从中抽取部分个体进行研究。 从总体中取出的若干个体,称为样本。 样本中所含个体的个数,称为样本容量。 选取样本是为了从样本的特征对总体特征做出估计和推断。 抽样必须尽可能多地反映总体的特征。 要求随机抽取: (1)独立性:抽样时互不影响。 (2)代表性:样本的分布与总体相同。
1 300
10
0
2400
3900
体重
(二)样本分布函数
总 体 是 一 个 随 机 变 量 , 的 分 布 就 是 总 体 的 分 布 。 的 分 布 函 数 F(x)是 总 体 分 布 函 数 。
设 ( x 1 , ..., x n ) 是 总 体 的 一 个 样 本 观 察 值 , 按 大 小 排 列 为 : x 1 x 2 ... x n
§3 样本分布的数字特征
(一)样本平均值 对于样本(X1,…,Xn)
样本平均值为 X 1
n
n
Xi
x 1 n
i 1
对于具体样本值(x1,…,xn),
i 1
n
xi
若样本观察值已整理成分组数据,分成k组。
属 于 同 一 组 的 数 据 以 组 中 值 x i代 表 , 组 频 数 为 m i
1
k
如观察值为 5,6.5,7,4,5.4,6.3,5.8,6.9
8
i 1
2
x
2
i
5 6 .5 ... 6 .9
2 2
2
=282.35
2
s
1 7
( 2 8 2 .3 5 8 5 .8 6 2 5 ) 1.057
又如婴儿体重
组中值 组频数
5
2550 2
2850 3
2
或
s
2 ( 2 5 5 0 3 1 8 0 ) 3( 2 8 5 0 3 1 8 0 ) 8 (3 1 5 0 3 1 8 0 ) 19
2 2
1
2
5 (3 4 5 0 3 1 8 0 ) 2 (3 7 5 0 3 1 8 0 )
2 2
=112736.84
* * *
X k的 取 值 为 x k X 1 m in{X 1 , ..., X n }称 为 最 小 项 统 计 量 。
*
*
*
X n m ax{X 1 , ..., X n } 称 为 最 大 项 统 计 量 。
*
D n X n X1
* *
*
反映了观察值的波动幅度。
例 1 对 样 本 X 1 , ..., X 5 做 了 三 次 观 察 。
1
2 2 Xi nX n 1 i 1
1
n
若(x1,…,xn)为样本观察值
2 2 s xi nx n 1 i 1 2
1
n
若数据已分成k组
2 ' 2 s m i (x i ) n x n 1 i 1 2
解:将数据由小到大排列为 -4<0<2=2<2.5=2.5=2.5<3<3.2<4
0 1 10 2 10 4 其样本分布函数为:1 0 ( x ) 1 0 F 7 10 8 10 9 10 1 当 x 4 当4 x 0 当0 x 2 当 2 x 2 .5 当 2 .5 x 3 当 3 x 3 .2 当 3 .2 x 4 当x 4