概率论第七章
概率论第七章2014
M1
= 1 1050 +1100 +1080 +1120 +1200 10
+1250 +1040 +1130 +1300 +1200]
=1147
以 作为总体期望值 E 的估计
广 东 工 业 大 学
上页 下页 返回
书例2 已知一批元件的长度测量误差
N( , 2 ) 其中
为未知参数,现从总体 中抽取容量为6的样本值:
= 1 2.99=0.498
2
6
广
东
工
S~ 2
业 大
学
上页 下页 返回
书例3 求总体 的服从参数为 的指数分布,求的未知参数 矩估计.
解 (1)列出矩估计式
1 1E
(2)求解方程得
1
1
(3)求出矩估计
11 M1
广
东
工
S~ 2
业 大
学
上页 下页 返回
书例4 设总体 U a,b,求未知参数 a,b的 矩估计.
1n2
n i1
1 n n i1
22
xi x
(xi x)2
(xi 1
1
222
)
i
2
1
2 2
0
n
(xi
1
n i 1
1 )
(
2
xi
0
1
)
2
广 东 工 业
D( ˆ ) D(2 ) 4D( ) 4 D( ).
n
由于E 2
x2
6x 3(
0
x)dx
6x3 2 dx
0
6x4 3 dx
0
概率论 第七章 参数估计
L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数
…
…
参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本
概率论第七章_课件1_
根据大数定律, 样本原点矩Ar作为 X1r,X2r, ,Xnr的算术平均值依概率收敛到均
值 r=E(Xr), 即:
1
n
n i 1
X
r i
P
E(X
r)
r
7-13
例3 设总体 X ~ N ( , 2 ), X1, X2,…, Xn为总体的
P(X x) p(x, ), x u1, u2, ,
X1, X2,…, Xn为总体 X 的样本, x1, x2,…, xn为总体 X 的样本值,
则X1, X2,…, Xn的联合概率分布为:
P( X1 x1, X2 x2 , , Xn xn )
p( x1, ) p( x2 , ) p( xn , )
7-1
第七章
统计 推断
DE 基本 问题
参数估 计问题
7-2
点估计 区间估 计
假设检 验问题
什么是参数估计?
参数是刻画总体某方面的概率特性的数量.
当这个数量是未知的时候,从总体抽出一个 样本,用某种方法对这个未知参数进行估计 就是参数估计.
例如,X ~N ( , 2), 若, 2未知,通过构造样本的函数, 给出它
ˆ1 ˆ1(x1, x2 , , xn )
ˆ2 ˆ2 (x1, x2 , , xn )
——未知参数1,2, ,k
的矩估计值
ˆk ˆk (x1, x2 , , xn )
矩方法的原理解释
∵ X1, X2 , , Xn 是独立同分布的. ∴ X1r,X2r, ,Xnr也是独立同分布的. 于是有:
概率论与数理统计第七章
13
二、最大似然估计法
是在总体类型已知条件下使用的一种参数估计方法 . 它首先是由德国数学家高斯在 1821年提出的 ,
然而,这个方法常归功于英国 统计学家费歇 . 费歇在1922年重新发现了这一 方法,并首先研究了这种方法 的一些性质 .
Gauss
Fisher
信息管理学院 徐晔
选择适当的 i , i 1,2,, m
使得样本 ( X 1, X 2 ,, X n ) 作为一个随机变量,得 到观察值 ( x1, x2 ,, xn ) 的可能性最大。
信息管理学院 徐晔
17
当总体 X 为离散型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维离散型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是联合概率事件
14
最大似然估计法的基本思想
先看一个简单例子:
某位同学与一位猎人一起外出打猎 .
一只野兔从前方窜过 .
只听一声枪响,野兔应声倒下 .
如果要你推测, 是谁打中的呢? 你会如何想呢?
信息管理学院 徐晔
15
你就会想,只发一枪便打中,猎人命中的概率 一般大于这位同学命中的概率. 看来这一枪是猎人 射中的 . 这个例子所作的推断已经体现了最大似然估计 法的基本思想 .
信息管理学院 徐晔
18
n
当总体 X 为连续型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维连续型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是值对于一个极小的 ,联合 概率事件
A ( x1 X 1 x1 , x2 X 2 x2 ,, xn X n xn )
概率论第七章
例 8.求例 2、3 中 X 与 Y 的协方差。
相关系数定义
定义 5 设 ( X , Y ) 是一个随机向量,当 DX > 0 ,
DY > 0 时,称
X − EX Y − EY ρ ( X ,Y ) = E DX DY
为 X 与 Y 的相关系数。
注: (1) ρ ( X , Y ) = E ( X Y
∗
∗
)
。
(2)
D ( X ± Y ) = D ( X ) + D (Y ) ±2 ρ ( X , Y ) DXDY
例 9.求例 2、3 中 X 与 Y 的相关系数。
相关系数的性质) 定理 5 (相关系数的性质 相关系数的性质 当 DX > 0 , DY > 0 时, (1) ρ ( X , Y ) = ρ (Y , X ) ; (2) ρ ( X , Y ) ≤ 1 ;
例 18.设 X ∼ N ( 0,1) , 1)求 P ( X < 2 ) ; ( (2)估计 P ( X < 2 ) 的下界。
定理 9
柯西-许瓦兹不等式:设 ( X , Y )
是任意一个二维随机变量,则
( E ( XY ) )
2
≤ E(X
2
) E (Y ) 。
2
五、中心极限定理
• 大数定律 • 中心极限定理
(b − a ) DX =
12
1
2
5.指数分布 E ( λ ) : DX =
6.正态分布 N ( µ , σ 2 ) : DX = σ 2
λ2
方差性质
定理 3 设 k 与 c 都是常数。 (1) D ( c ) = 0 ;反之,如果某个随机变量 X 的方 差为 0,那么, P ( X = c ) = 1 ,其中 c = EX ; (2) D ( kX + c ) = k 2 D ( X ) ; (3)
概率论第七章
即得 的矩估计量为 ˆ 2 X
设总体 X 的概率密度函数为 1 ( x ) / ,x e f ( x) 0 , 其它 其中 0 , , 是未知参数,( X 1 ,, X n )是总体 X 的样本,求 , 的矩估计量.
当总体 X 是连续型时,它是样本 ( X 1 , X 2 ,, X n ) 的 联合概率密度函数在( x1 , x2 ,, xn )的值,可以看成是
( X 1 , X 2 ,, X n ) 取可能值( x1 , x 2 ,, xn )的概率的“密
度” (在一个单位量纲上的概率).总之,它是与试验结 果相联系的概率有关.
1 2 n 1 2 n
H 取值的可能范围○内与 的真值“看起来最像”(这正 是“极大似然”这四个字在字面上的意思)的那个值, ˆ 因此,一个自然的想法就是用 ( x1 , x 2 ,, x n ) 作为 的
估计值.
定义 设 L( ) L( ; x1 , x2 ,, xn ) 是似然函数,若存 ˆ ˆ 在 ( x , x ,, x ) 使得
是 0 的估计量,称 T ( x1 , x2 ,, xn ) 是 0 的估计值.
注释 1
为了简单起见,我们将不再区分“流动”
的 参 数 及 真 值 0 , 即 统 一 地 都 说 成 , 并 称
T T ( X 1 , X 2 ,, X n ) 是 的估计量.上述定义明
1 n k P Ak X i k . 即有 n i 1 也就是说,当样本的容量趋于无穷时,样本 k 阶矩依概 率收敛于相应的总体 k 阶矩.
因此当样本容量n较大时可以用样本的r阶矩来作为总 体的r阶矩的一个估计,这时所得到的估计就是矩法估计.
概率论第七章 习题解答
第七章 假设检验I 教学基本要求1、了解假设检验的相关概念及基本思想,掌握假设检验的基本步骤,知道犯两类错误的概率的含义;2、掌握单正态总体均值和方差的假设检验;3、掌握两个正态总体均值差与方差比的假设检验;4、了解分布的假设检验.II 习题解答A 组1、某企业生产铜丝,而折断力的大小是铜丝的主要质量指标.从过去的资料来看,可认为折断力2(570,8)X N ~(单位:千克力),现更换了一批原材料,测得10个样品的折断力如下:578 572 570 568 572 570 570 572 596 584 从性能上看,折断力的方差不会有什么变化,试问折断力的大小与原先有无差异(0.05)α=?解:若折断力的大小与原先无差异,则总体均值μ应为570,因此,提出假设如下:0H :570μ= vs 1H :570μ≠由0.05α=,查附表得临界值0.975 1.96u =,根据样本观测值求得575.2x =于是,检验统计量U 的值2.055U ==由于0.975||U u ≥,所以,在显著性水平0.05α=下拒绝原假设0H ,即认为折断力与原先有差异.2、某工厂生产的电子元件平均使用寿命2(,)X N μσ~,现抽测15个元件,得到18000x =、5200s =(单位:小时),试问该工厂生产的电子元件的平均使用寿命是否为20000(0.05)α=?解:若该工厂生产的电子元件的平均使用寿命为20000,则总体均值μ应为20000,因此,提出假设如下:0H :20000μ= vs 1H :20000μ≠由0.05α=,查附表得临界值0.975(14) 2.145t =,由已知数据求得检验统计量T 的值0.149T ==-由于0.975||(14)T t <,所以,在显著性水平0.05α=下接受原假设0H ,即认为该工厂生产的电子元件的平均使用寿命是20000小时.3、用热敏电阻测温仪间接测量地热勘探井底温度,重复测量6次,测得温度(C )为:111.0112.4110.2111.0113.5111.9假定测量的温度服从正态分布,且井底温度的真实值为111.6C ,试问用热敏电阻测温仪间接测温是否准确(0.05)α=?解:若用热敏电阻测温仪间接测温是准确的,则总体均值μ应为111.6,因此,提出假设如下:0H :111.6μ= vs 1H :111.6μ≠由0.05α=,查附表得临界值0.975(5) 2.571t =,根据样本观测值求得111.67x =、2 1.399s =于是,检验统计量T 的值0.145T ==由于0.975||(5)T t <,所以,在显著性水平0.05α=下接受原假设0H ,即认为用热敏电阻测温仪间接测温是准确的.4、设考生在某次考试中的成绩服从正态分布,从中随机地抽取36位考生的成绩,得到平均成绩为66.5分、标准差为15分,问是否可以认为这次考试全体考生的平均成绩为70分(0.05)α=?解:若这次考试全体考生的平均成绩为70分,则总体均值μ应为70,因此,提出假设如下:0H :70μ= vs 1H :70μ≠由0.05α=,查附表得临界值0.975(35) 2.0301t =,由已知数据求得检验统计量T 的值1.4T ==-由于0.975||(35)T t <,所以,在显著性水平0.05α=下接受原假设0H ,即认为这次考试全体考生的平均成绩为70分.5、某化肥厂用自动包装机包装化肥,每包质量服从正态分布2(50,)N σ,某日开工后,随机抽取8包化肥,测得质量(单位:kg )如下:49.249.850.350.849.749.650.550.1问该天包装的化肥质量的方差是否为1.3(0.05)α=?解:若该天包装的化肥质量的方差是1.3,则21.3σ=,因此,提出假设如下:0H :2 1.3σ= vs 1H :2 1.3σ≠由0.05α=,查附表得临界值20.025(8) 2.1797χ=、20.975(8)17.5345χ=,根据样本观测值求得21()2.192nii x μ=-=∑于是,检验统计量2χ的值2 2.1921.6861.3χ== 由于220.025(8)χχ≤,所以,在显著性水平0.05α=下拒绝原假设0H ,即认为该天包装的化肥质量的方差不是1.3.6、设某化纤厂生产的维尼纶的纤度在正常情况下服从方差为20.05的正态分布,现随机抽取6根,测得其纤度为1.33 1.351.541.451.371.53问维尼纶纤度的方差是否正常(0.10)α=?解:若维尼纶纤度的方差正常,则220.05σ=,因此,提出假设如下:0H :220.05σ= vs 1H :220.05σ≠由0.10α=,查附表得临界值20.05(5) 1.146χ=、20.95(5)11.07χ=,根据样本观测值求得1.43x =、20.0085s =于是,检验统计量2χ的值22(61)0.00851.70.05χ-⨯==由于2220.050.95(5)(5)χχχ<<,所以,在显著性水平0.10α=下接受原假设0H ,即认为维尼纶纤度的方差是正常的.7、生产某种产品可用两种操作方法.用第一种操作方法生产的产品抗折强度21(,7)X N μ~;用第二种操作方法生产的产品抗折强度22(,9)Y N μ~(单位:千克),现从第一种操作方法生产的产品中随机抽取13件,得到42x =,从第二种操作方法生产的产品中随机抽取17件,测得36y =,问这两种操作方法生产的产品的平均抗折强度是否有显著差异(0.05)α=?解:若这两种操作方法生产的产品的平均抗折强度无显著差异,则12μμ=,因此,提出假设如下:0H :12μμ= vs 1H :12μμ≠由0.05α=,查附表得临界值0.975 1.96u =,由已知数据求得检验统计量U 的值2.054U ==由于0.975||U u ≥,所以,在显著性水平0.05α=下拒绝原假设0H ,即认为这两种操作方法生产的产品的平均抗折强度有显著差异.8、某种物品在处理前与处理后分别抽样分析其含脂率,测得数据如下:假设处理前后的含脂率都服从正态分布,且方差不变,问该物品处理前后含脂率的均值是否有显著差异(0.01)α=?解:若该物品处理前后含脂率的均值无显著差异,则12μμ=,因此,提出假设如下:0H :12μμ= vs 1H :12μμ≠由0.01α=,查附表得临界值0.995(13) 3.012t =,根据样本观测值求得0.23x =、0.18y =、20.0094x s =、20.0045ys =、0.0822w s = 于是,检验统计量T 的值2.273T==由于0.995||(13)T t<,所以,在显著性水平0.01α=下接受原假设H,即认为该物品处理前后含脂率的均值无显著差异.9、有甲、乙两台机床加工同样的产品,现从这两台机床加工的产品中随机地抽取若干产品,测得产品直径(单位:)为:问甲乙两台机床加工的精度是否有显著差异(0.05)α=?解:若甲乙两台机床加工的精度无显著差异,则它们的方差相同,因此,提出假设如下:0H:2212σσ=vs1H:2212σσ≠由0.05α=,查附表得临界值0.0250.97511(7,6)0.1953(6,7) 5.12FF===、0.975(7,6) 5.70F=,根据样本观测值求得19x=、19y=、20.1029xs=、20.3967ys=于是,检验统计量F的值0.10290.25940.3967F==由于0.0250.975(7,6)(7,6)F F F<<,所以,在显著性水平0.05α=下接受原假设H,即认为甲乙两台机床加工的精度无显著差异.10、某车床生产滚珠,现随机抽取了50个产品,测得它们的直径(单位:mm)为:15.0 15.8 15.2 15.1 15.9 14.7 14.8 15.5 15.6 15.315.1 15.3 15.0 15.6 15.7 14.8 14.5 14.2 14.9 14.915.2 15.0 15.3 15.6 15.1 14.9 14.2 14.6 15.8 15.215.9 15.2 15.0 14.9 14.8 14.5 15.1 15.5 15.5 15.115.1 15.0 15.3 14.7 14.5 15.5 15.0 14.7 14.6 14.2问滚珠直径是否服从正态分布(0.05)α=?解:若滚珠直径服从正态分布,则2(,)X Nμσ~,因此,提出假设如下:0H:2(,)X Nμσ~由于μ、2σ未知,因而用它们的最大似然估计值ˆ15.1xμ==、222ˆ0.4325sσ==代替得到分布2(15.1,0.4325)N,为了求统计量2χ的值,取14.05a=、16.15ka=,将0[,]k a a 等分为7个小区间,列表计算得:于是,检验统计量2χ的值221() 3.062ki i i i n np np χ=-==∑再由0.05α=,查附表得临界值20.95(4)9.488χ=,由于220.95(4)χχ<,所以,在显著性水平0.05α=下接受原假设0H ,即认为滚珠直径服从正态分布.B 组1、随机地从一批直径服从正态分布的滚珠中抽取7个,测得其直径(单位:mm )为: 13.70 14.21 13.90 13.91 14.32 14.32 14.10假设滚珠直径总体分布的方差为0.05,问这批滚珠的平均直径是否小于等于14.25(0.05)α=?解:若这批滚珠的平均直径是小于等于14.25,则14.25μ≤,因此,提出假设如下:0H :14.25μ≤ vs 1H :14.25μ>由0.05α=,查附表得临界值0.95 1.65u =,根据样本观测值求得14.07x =于是,检验统计量U 的值2.118U ==-由于0.95U u <,所以,在显著性水平0.05α=下接受原假设0H ,即认为这批滚珠的平均直径小于等于14.25.2、设1x 、2x 、…、n x 是取自正态总体2(,)N μσ的样本,记11ni i x x n ==∑、221()ni i Q x x ==-∑,试在此记号下求检验假设0H :0μ=的检验统计量?解:该问题是单正态总体方差未知时关于期望μ的假设检验问题,检验统计量应选为x T =由于222111()11n ii s x x Q n n ==-=--∑,即s =,从而检验统计量为x T ==3、某种导线要求其电阻的标准差不超过0.004欧姆,现从生产的一批导线中随机抽取8根,得到220.006s =,若该导线的电阻服从正态分布,问能否认为这批导线的标准差偏小(0.05)α=?解:若这批导线的标准差偏小,则220.004σ≤,因此,提出假设如下:0H :220.004σ≤ vs 1H :220.004σ>由0.05α=,查附表得临界值20.95(7)14.067χ=,由已知数据求得检验统计量2χ的值222(81)0.00615.750.004χ-⨯== 由于220.95(7)χχ≥,所以,在显著性水平0.05α=下拒绝原假设0H ,即认为这批导线的标准差偏大.4、下面是某两种型号的电器充电后所能使用的时间(单位:小时)的观测值 型号A 5.5 5.6 6.3 4.6 5.3 5.0 6.2 5.8 5.1 5.2 5.9 型号B 3.8 4.3 4.2 4.0 4.9 4.5 5.2 4.8 4.5 3.9 3.7 4.6设两样本独立且抽样的两个正态总体方差相等,试问能否认为型号A 比型号B 平均使用的时间更短(0.01)α=?解:若型号A 比型号B 平均使用的时间更短,则12μμ≤,因此,提出假设如下:0H :12μμ≤ vs 1H :12μμ>由0.01α=,查附表得临界值0.99(21) 2.5176t =,根据样本观测值求得5.5x =、 4.3667y =、20.274x s =、20.2188ys =、0.4951w s =于是,检验统计量T的值5.4837T==由于0.99(21)T t≥,所以,在显著性水平0.01α=下拒绝原假设H,即认为型号A比型号B平均使用的时间更长.5、某药厂生产一种新的止痛片,厂方希望验证服用新药片后到开始起作用的时间间隔较原有止痛片至少缩短一半,因此厂方提出检验假设H:122μμ=vs1H:122μμ>其中1μ、2μ分别是服用原有止痛片和服用新止痛片后到开始起作用的时间间隔的总体均值,若这两个总体均服从正态分布,且方差21σ、22σ已知,现分别从两个总体中抽取两个独立样本1x、2x、…、mx和1y、2y、…、ny,试给出上述假设检验问题的检验统计量及拒绝域?解:设X为服用原有止痛片后到开始起作用的时间间隔,Y为服用新止痛片后到开始起作用的时间间隔,则211(,)X Nμσ~、222(,)Y Nμσ~,于是22121242(2,)x y Nm nσσμμ-~-+()~(0,1)x yU N⇒=当H成立,有~(0,1)x yU N=所以,可选取检验统计量x yU=对于给定的显著性水平α,检验的拒绝域为1{|}W U U uα-=≥.6、有两箱来自不同厂家的功能相同的金属部件,从第一箱中抽取60个,从第二箱中抽取40个,得到部件重量()mg的样本方差分别为215.46xs=、29.66ys=.若两样本相互独立且服从正态分布,试问第一箱重量的总体方差是否比第二箱重量的总体方差小(0.05)α=?解:若第一箱重量的总体方差比第二箱重量的总体方差小,则2212σσ≤,因此,提出假设如下:0H :2212σσ≤ vs 1H :2212σσ> 由0.05α=,查附表得临界值0.95(59,39) 1.64F =,根据已知数据求得检验统计量F 的值15.461.609.66F == 由于0.95(59,39)F F <,所以,在显著性水平0.05α=下接受原假设0H ,即认为第一箱重量的总体方差比第二箱重量的总体方差小.7A B 设两批电子器件的电阻分别服从211(,)N μσ、222(,)N μσ,试问能否认为两个总体服从相同的正态分布(0.05)α=?解:(1) 先检验两个总体方差相同.若两个总体方差相同,则2212σσ=,因此,提出假设如下: 0H :2212σσ= vs 1H :2212σσ≠ 由0.05α=,查附表得临界值0.0250.97511(5,5)0.140(5,5)7.15F F ===、0.975(5,5)7.15F =,根据样本观测值求得0.141x =、0.139y =、20.0000078x s =、20.0000071ys = 于是,检验统计量F 的值0.00000781.10.0000071F ==由于0.0250.975(5,5)(5,5)F F F <<,所以,在显著性水平0.05α=下接受原假设0H ,即认为两个总体方差相同;(2) 在(1)的基础上检验两个总体均值相同.若两个总体均值相同,则12μμ=,因此,提出假设如下:0H :12μμ= vs 1H :12μμ≠由0.05α=,查附表得临界值0.975(10) 2.2281t =,根据样本观测值求得20.0000074w s =于是,检验统计量T 的值1.267T ==由于0.975||(10)T t <,因而在显著性水平0.05α=下接受原假设0H ,即认为两个总体均值相同;所以,可认为两个总体服从相同的正态分布.8、在一批灯泡中抽取300只进行寿命测试,试验结果如下:试检验假设:0H :灯泡寿命服从指数分布0.0050.0050()00te tf t t -⎧>=⎨≤⎩(0.05)α=?解:根据题意提出假设0H :(0.005)X E ~为了求统计量2χ的值,将(0,)+∞分为4个小区间(0,100]、(100,200]、(200,300]、(300,)+∞,列表计算得:于是,检验统计量2χ的值221() 1.8393ki i i in np np χ=-==∑再由0.05α=,查附表得临界值20.95(3)7.8147χ=,由于220.95(3)χχ<,所以,在显著性水平0.05α=下接受原假设0H ,即认为该批灯泡寿命服从参数为0.005的指数分布.。
概率论第七章
L
2
n
z
/2
最短。
例1 已知幼儿身高服从正态分布,现从5~6岁的幼
儿中随机地抽查了9人,其高度分别为:115, 120 131, 115, 109, 115, 115, 105, 110 cm; 假设标准差
0 7,置信度为95%; 试求总体均值μ的置信区间 解 已知 0 7, n 9, 0.05. 由样本值算得:
⑵ 方差 2未知,估计均值μ
因为 S 2是 2 的无偏估计。
可用样本方差:S 2
1 n
1
n i 1
(Xi
X
)2
而选取样本函数 t X ~ t(n 1)
S/ n
对于给定的1, 查 t 分布表,得临界值 1 , 2
使 P{ 1 t 2 } 1 我们取对称区间
即P{t / 2
第三节 区间估计
第七章
一 、置信区间
二 、正态总体均值与方差的区间估计
三 、两个正态总体均值与方差 的区间估计
引言
前面,我们讨论了参数点估计. 它是用样本算 得的一个值去估计未知参数. 但是,点估计值仅仅 是未知参数的一个近似值,它没有反映出这个近似 值的误差范围,使用起来把握不大. 区间估计正好 弥补了点估计的这个缺陷 .
n
z /2 ] 简记为 [ X
n
z / 2 ]
例 若取 0.05 ,1 0.95 , 1, n 16
查表得 z /2 z0.025 1.96 ,若由一个样本
值算得样本均值的观察值 x 5.20 则得到一个置信度为0.95的μ的置信区间 (5.20 0.49) (4.71, 5.69)
可靠度与精度是一对矛盾,一般是 在保证可靠度的条件下尽可能提高 精度.
概率论第7章
第7章 参数估计内容 提要 本章主要讲述点估计(矩法估计,极大似然估计);估计量的评价准则(无 偏性,最小方差性和有效性,其它几个准则);区间估计(区间估计的一般步骤, 单个正态总体参数的区间估计,双正态总体参数的区间估计,非正态总体参数的 区间估计)等内容.重点 分析 1、理解点估计的概念,掌握矩估计法(一阶、二阶)。
了解极大似然估计法。
2、了解估计量的评选标准(无偏性、有效性、一致性)。
3、理解区间估计的概念,会求单个正态总体的均值与方差的置信区间,会求两个正态总体的均值差与方差比的置信区间。
难点 分析1、矩法估计,极大似然估计。
2、估计量的评价准则。
3、正态总体参数的区间估计。
教 学 内 容第七章 参数估计(Parameter Estimation)§7.1 点估计(Point Estimation )一、 矩估计法(Square Estimation )如上所述,例 5.4 中我们所做的对该地区农户的平均收入水平和贫富悬殊程度做出推断这一工作,用数理统计的 话说,实质上是对总体 ) , ( ~ 2s m N X 的未知参数期望值m 与方差值 2s 进行估计。
我们当时是分别用样本均值 X 和 样本方差 2S 来反映这两个量的,那么这样做是否合理?直观来看这样做是合理的,从概率论的观点看也是合理的。
事 实上,若总体 X 的期望存在, n X X X X E , , , , ) ( 2 1 L m = 是出自 X 的样本,则由柯尔莫哥洛夫强大数定律,以概率为 1地成立å = ¥ ® = ni i n X n 11 lim m 而上式左边极限号内正是样本均值 X ,因此,我们常用 X 作为m 的估计值。
不仅如此,若 X 的k 阶矩存在, k k a EX = ,则同样由柯尔莫哥洛夫强大数定律得出 å = = n i kki a X n 11 lim 以概率为1成立。
概率论第七章
例 X ~ N ( , 2 ), , 2 未知, 即得 , 2 的矩估计量 n 1 2 2 ˆ X, ˆ ( Xi X ) . n i 1 一般地, 1 n 用样本均值X X i作为总体X的均值的矩估计, n i 1 n
注. 1 定义中选用的是原点矩,也可以用中心矩, 只要给定总体矩,采用相应的样本矩就可以。
令:
P x ,
i 1
n
n
i
离散.
L x 1 , x 2 , x n ,
2 Sn ˆ 1 p X 即 2 X X n ˆ 2 ˆ p X S n
(5)
X~P(), E(X)=D(X)=
ˆX 故
或
2 ˆ Sn
注: 由此例可知, 矩估计量不唯一。
例2.5
设总体X的概率密度为 ( 1) x 0 x 1 f ( x; ) ( 1) 0 其它 X1,X2,…,Xn是来自总体X的样本。0.1,0.2,0.9,0.8,0.7,0.7为一 个样本观察值,试求 的矩估计值。
解:E ( X ) xf ( x; )dx x ( 1) x dx ( 1) x 1dx
0 0 1 1
( 1)
令
2X 1 ˆ 解之得的矩估计 1 X 由样本值 0.1,0.2,0.9,0.8,0.7,0.7计算得 x 0.5667
解: (1)
因为X ~ N ( , 2 ),E ( X ) ,D( X ) 2
故有 X,
( 2)
2 S n2
1
X ~ E ( ),E ( X ) 1 ˆ 故 X,即 X 1
概率论与数理统计第七章
第七章 参数估计1. 样本均值74.002X =样本方差822611() 6.8571081i i S X X -==-=⨯-∑ 样本二阶中心矩 822611()6108ii S X X -==-=⨯∑ 均值与方差的矩估计值分别为: 2674.002610μσ-= =⨯ 2.(1)矩估计(1)()1cccE X x c xdx c x dx θθθθθθθθ+∞+∞-+-===-⎰⎰ 令1c X θθ=-,得θ的估计量为 X X c θ=-,θ的估计值为 1111ni i ni i x n x c n θ===-∑∑ (2)极大似然估计(1)(1)(1)11()()()n n n L c x c x c x x θθθθθθθθθθ-+-+-+==1ln ()ln()(1)ln ni i L n c x θθθθ==-+∑令1ln ln ln 0ni i L n n c x θθ=∂=+-=∂∑得θ的估计值为 1ln ln nii nx n cθ==-∑,θ的估计量为 1ln ln nii nXn cθ==-∑3.(1) 矩估计121433X ++== 22()122(1)3(1)32E X θθθθθ=⨯+⨯-+⨯-=-令()E X X = 得θ的估计值为 56θ= 极大似然估计2256112233()()()()2(1)22L P X x P X x P X x θθθθθθθ=====⨯-⨯=-令ln 5101L θθθ∂=-=∂-,得θ的估计值为 56θ=(2)矩估计量11ni i X X n λ===∑极大似然估计1111211()()()...()...!!!...!inx x x nn n n n e e L P X x P X x P X x ex x x x λλλλλλλ---∑======令ln ()0i x L n λθλ∂=-+=∂∑,得λ的似然估计值为 i x nλ=∑, 从而λ的似然估计量为11ni i X X n λ===∑。
概率论第七章参数估计
概率论第七章参数估计参数估计是概率论中的一个重要概念,用于根据样本数据推断总体参数的未知值。
本文将介绍参数估计的概念、常见的估计方法以及对估计结果的评估。
一、参数估计的概念参数估计是指根据样本数据来推断总体参数的未知值。
总体是指要研究的对象的全体,参数是总体分布的特征数值,例如总体均值、总体方差等。
参数估计可以分为点估计和区间估计两种。
点估计是根据样本数据得到一个参数值的估计方法。
常见的点估计方法有最大似然估计法和矩估计法。
最大似然估计法是根据已知的样本数据,选择使得基于样本数据构建的似然函数取得最大值的参数值作为参数的估计值。
矩估计法是根据已知的样本数据,选择使得样本矩与总体矩之间的差距最小的参数值作为参数的估计值。
区间估计是指根据样本数据得到参数的一个区间估计,给出了参数取值范围的上下限。
常见的区间估计方法有置信区间法和预测区间法。
置信区间法是根据样本数据,给出参数估计值的上下限,使得该参数值落在这个区间的概率达到预先规定的置信水平。
预测区间法是根据样本数据,给出新观测值的一个区间估计,使得新观测值落在这个区间的概率达到预先规定的置信水平。
二、常见的估计方法最大似然估计法是参数估计中最常用的方法。
它是在已知样本数据的情况下,选择使得样本数据出现的概率最大的参数值作为参数的估计值。
最大似然估计法的优点是估计结果具有良好的渐进性质,但是对样本数据的要求较高,需要满足一定的充分统计条件。
矩估计法是一种简单的参数估计方法。
它是在已知样本数据的情况下,选择使得样本矩与总体矩之间的差距最小的参数值作为参数的估计值。
矩估计法的优点是计算简单,但是在一些情况下可能存在多个参数估计值。
置信区间法是一种常用的区间估计方法。
它是在已知样本数据的情况下,给出一个区间,使得参数的真值落在这个区间的概率达到预先规定的置信水平。
置信区间法的优点是提供了参数取值范围的上下限,对参数的估计结果具有一定的可信度。
预测区间法是一种用于预测新观测值的区间估计方法。
《概率论与数理统计》第七章 讲义
测得强度值为x1, x2 , …, x25,其均值为 x 108 (Pa),问当日生产是否正常?
Page 12
Chapter 7 假设检验
(1) 是参数估计问题吗? (2) 回答“是”还是“否”,假设检验问题。 (3) 命题“合金平均强度不低于110Pa”正确 与否仅涉及如下两个参数集合:
0 { : 110}
其二是 H 0不真(即 H1为真)但样本观测值落 在接受域中,从而接受原假设H 0,这种错误称 为第二类错误,其发生的概率称为犯第二类错 误的概率,或称受伪概率,通常记为 。
Page 22
Chapter 7 假设检验
观测数 据情况
( x1,, xn ) W
( x1 ,, xn ) W c
H0 : 110
vs
H1 : 110
Page 18
Chapter 7 假设检验
•假设检验的两个特点:
第一,假设检验采用逻辑上的反证法,即为了检验一个假设 是否成立,首先假设它是真的,然后对样本进行观察,如 果发现出现了不合理现象,则可以认为假设是不合理的, 拒绝假设。否则可以认为假设是合理的,接受假设。 第二,假设检验采用的反证法带有概率性质。所谓假设的不 合理不是绝对的,而是基于实践中广泛采用的小概率事件 几乎不可能发生的原则。至于事件的概率小到什么程度才 算是小概率事件,并没有统一的界定标准,而是必须根据 具体问题而定。如果一旦判断失误,错误地拒绝原假设会 造成巨大损失,那么拒绝原假设的概率就应定的小一些; 如果一旦判断失误,错误地接受原假设会造成巨大损失, 那么拒绝原假设的概率就应定的大一些。
Page 19
Chapter 7 假设检验
二、选择检验统计量,给出拒绝域形式
概率论与数理统计第七章
估计 为1.68,这是点估计.
估计在区间[1.57, 1.84]内,这是区间估计.
一、点估计概念及讨论的问题
例1 已知某地区新生婴儿的体重X~ N(,2),
, 2未知,
…
随机抽查100个婴儿
得100个体重数据
9, 7, 6, 6.5, 5, 5.2, … 而全部信息就由这100个数组成.
求:两个参数a,b的矩估计
解: 写出方 V E 程 (X a(X )r组 ) ˆˆ2
其 中uˆˆ2Xn1in1(Xi X)2
但是
E
(
X
)
Var ( X )
a
b 2 (b a)2
12
即有
(ab2ba)2 12
X
ˆ
2
由方程组求解出a,b的矩估计:
a ˆX 3 ˆ b ˆX 3 ˆ
其中 ˆ:ˆ2 n 1i n1 ( XiX)2
(4) 在最大值点的表达式中, 用样本值代入 就得参数的极大似然估计值 .
两点说明:
1、求似然函数L( ) 的最大值点,可以应
用微积分中的技巧。由于ln(x)是x的增函
数,lnL( )与L( )在 的同一值处达到 它的最大值,假定是一实数,且lnL( ) 是 的一个可微函数。通过求解所谓“似 然方程”: dlnL() 0
E(X1m)=E(X2m)==E(Xnm)= E(Xm)=am . 根据大数定律,样本原点矩Am作为 X1m,X2m, ,Xnm的算术平均值依概率收敛到均 值am=E(Xm).即:
n 1i n1Xim pE(Xm)am
例1 设总体X的概率密度为
f(x)(1)x,
概率论第7章
X1, ... ,Xn是来自总体X的独立同分布样本,分布
律或概率密度函数是f(x,q),其中q∈Q是参数,Q已知, 是q的取值范围.f (x,q)的形式已知,则有统计模型
f ( x1,θ) f ( xn ,θ) θ Q
例1 某种型号的产品N个,其合格率q未知,从中随机
抽取n个(n<<N),设Xi 是第i次抽到的样品,正品Xi=1, 否则 Xi =0,则 X1,X2,…,Xn 就是样本.总体分布为两点
分布B(0,1),参数空间为q=(0,1),则可得统计模型
n
n
xi
n xi
θ i1 (1 θ) i1
用矩估计法估计λ的值。
解 设X为灯管寿命,则
1 n
x n i1 xi 130.55
μ1
E
X
=
1 λ
μ1 m1
μ1
E
X
=
1 λ
X
λˆ 1 0.0077 X
例2 设总体X的均值μ和方差σ2 >0都存在,μ,σ2未知.
X1,…,Xn是来自 X 的样本,试求μ, σ2的矩估计量 .
矩估计量的观察值称为矩估计值 .
总体k阶中心矩 样本k阶中心矩
Vk
Bk
E[ X 1n
n i1
E( X )]k; ( Xi X )k .
例1. 设有一批灯管,其寿命服从参数为λ的指数分 布,今随机从中抽取11只,测得其寿命数据如下:
110, 184, 145, 122, 165, 143, 78, 129, 62, 130, 168
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7.1.4 最大似然估计法
1、 最大似然估计的原理 设x1, x2 , , xn是取自总体X的一个样本观察值,分布函数为
F( x1, x2 , , xn; ), 如果当未知参数 取ˆ 时, x1, x2 , , xn 被取到的概率最大,则称 ˆ为的最大似然估计.
广 东 工 业 大 学
1、原理
设X为总体,X1, X2 , , Xn为样本,X 为样本均值,则有
大数定律
lim P{| X EX | } 1
n
即当n 很大时,样本均值 X 就很接近于总体均值EX 。
因此,当n 很大时,用样本均值X来估计总体均值EX是
比较合理的。
此依据推而广之:
用样本的k 阶中心矩来估计总体k 阶中心矩。
2、估计值
用样本的一组观察值 x1, x2 , , xn 得到估计量ˆ 的值 ˆ( x1 , x2 , , xn ), 则称为 的估计值.
为方便起见,估计量与估计值不加区别,统称为估计。
3、点估计
广 东
用构造一个统计量ˆ 对参数 作定值的估计称为参数的点
工 业
大
估计。
学
上页 下页 返回
7.1.2 矩估计法
的函数
i gi (a1,a2 , ,ak ) i 1,2, , k
(3) 求出矩估计.
即用样本矩 M t
1 n
n i 1
X
t i
代替总体相应的矩
at
EX t 得到
广
未知参数的矩估计为
东
工
ˆi gi (aˆ1 , aˆ2 , , aˆk ) i 1,2, , k
业 大
学
上页 下页 返回
例1 求总体X的均值EX与方差DX的矩估计.
3、连续型: L( ) f ( xi ;1,2 , ,k ) i 1
使L( )达到最大的ˆ 即为的最大似然估计.
4、估计步骤:
n
a.写出似然函数 L( ) f ( xi ;1,2 , ,k ) i 1
b.求出使 L( )达到最大的 ˆ1 ,ˆ2 , ,ˆk .
c.用ˆ1 ,ˆ2 , ,ˆk 作为1,2 , ,k的估计量,用ˆ1 ,ˆ2 , ,ˆk
广 东 工
的函数作为 1,2 , ,k的同一函数的估计量。
业 大
学
上页 下页 返回
5、解题具体步骤:
n
a.写出似然函数 L( ) f ( xi ;1,2 , ,k ) i 1
b.求对数似然函数ln L( ).
c.求导并令其导数等于0
ln L( ) 0 1
ln L( ) 0 ln L( ) 0
解(1)列出矩估计式
a1 EX a2 E( X 2 ) DX (EX )2
(2)求解方程组得
EX a1 DX a2 a12
(3)求出矩估计
用M1
1 n
n i 1
Xi , M2
1 n
n i 1
X
2 i
分别代替a1 ,a2
即得矩估计:
广
EX M1 X
东 工
DX M2 M12
上页 下页 返回
2、离散型:
设总体X的概率分布为
P{ X xi } p( xi ;1,2 , .k )
则样本( X1, X2 ,的, 联Xn合) 概率分布为
n
P( X1 x1, X 2 x2 , , X k xk ;1,2 , ,k ) p( xi ;1,2 , ,k ) i 1
称为似然函数 L( ).
n
即
L( ) p( xi ;1 ,2 , ,k )
i 1
使L( )达到最大的ˆ 即为的最大似然估计.
广 东
工
业
大
学
上页 下页 返回
3、连续型:
设总体X的密度函数为f ( x;1,2 , ,k ), 1,2 , ,k
是待估计参数。 X1, X2 , , Xn 是取自X的一个样本。则 ( X1, X2 , , Xn ) 的联合密度函数为
广 东
即用 M k
1 n
n i 1
X
k i
来估计E( X k )
。
矩估计法
工 业
大
学
上页 下页 返回
2、矩法估计的步骤:
(1) 列出矩估计式.求总体 F( X;1,2 , ,k ) 的前k阶矩
ai EX i
xi f ( x)dx
i 1,2, , k
(2) 解上述方程组.将未知参数1,2 , ,k表示为a1,a2 , ,ak
(1)求 的矩估计量ˆ ;
(2)求ˆ的方差 D(ˆ.)
广 东 工 业 大 学
上页 下页 返回
例4(97) 设总体X的概率密度函数为
f
(
x,
)
(
1) x
0
0 x1 其它
其中 1是未知参数。X1, X2 , , Xn 是取自X的一个样本。 分别用矩法估计和最大似然估计法求 的估计量.
广 东 工 业 大 学
上页 下页 返回
例5(02)设总体X的概率分布为
X
0
1
2
3
P
2 2 (1 ) 2
1 2
其中 (0 是 未1)知参数,利用总体X的如下样本值
2 3,1,3,0,3,1,2,3,
求 的矩估计值和最大似然估计值。
广 东 工 业 大 学
上页 下页 返回
7.1.3 顺序统计量法
广 东 工 业 大 学
第一节 点估计
7.1.1 点估计概念 7.1.2 矩估计法 7.1.3 顺序统计量 7.1.4 最大似然估计法
返回
7.1.1 点估计概念
1、估计量
设总体X的分布中含有未知参数 , X1, X2 , , Xn 为总体的 一个样本.用这个样本构造的统计量 ˆ( X1, X 2 , , X n ) 来估计 , 则称ˆ 为 估计量.
2
k
d.解上述方程组。
广
其唯一解ˆ1 ,ˆ2 , ,ˆk 即为1,2 , ,k 的最大似然估计。
东 工 业
大
学
上页 下页 返回
例1 离散型随机变量X 服从0 1分布,从X中抽得容量为n的样本 X1, X2 , , Xn 的一组观察值 x1, x2 , , xn ( xi 0或1;i 1,2, , n), 求参数 p 的最大似然估计,其中 p P{ X 1},1 p P{ X 0}.
1 n
n i 1
X
2 i
X2
1 n
n i 1
(Xi
X
)2
S~ 2
业 大 学
上页 下页 返回
例2 设总体X的服从参数为 的指数分布,求该未知参数 的矩估计.
广 东 工 业 大 学
上页 下页 返回
例3(99) 设总体X的概率密度函数为
f
( x,
)
6 x
3
(
x)
0 x
0
其它
X1, X2 , , Xn是取自的X的一个样本.
n
f ( x1, x2 , , xn;1,2 , ,k ) f ( xi ;1 ,2 , ,k ) i 1
称为似然函数L( )
n
即
L( ) f ( xi ;1 ,2 , ,k )
i 1
使L( )达到最大的ˆ 即为的最大似然估计.
广 东
工
业
大
学
上页 下页 返回
n
2、离散型: L( ) p( xi ;1 ,2 , ,k ) i 1 n