概率论第七章5-7
概率论第七章讲解
7.1
一.点估计
设总体X的分布函数为 F(x; Ө ), 其中Ө为未知参数 (Ө可以是向量) . 现从该总体抽样,得到样本X1,X2,…,Xn
从样本出发构造适当的统计量
T T (X1,, Xn )
作为参数 Ө的估计量,即点估计。 将x1,…,xn 代入估计量,得到Ө的估计值
T (x1,, xn )
2 i
i 1
例6. 设总体X的概率密度如下,其中θ>0 为未知参数,试求θ的矩估计量。
f (x; )
1
x
e , x
2
解:
E(X )
x
1
x
e dx 0
2
E(X 2)
x2
1
x
e
dx
1
x2
x
e
dx
2
2
2
0
2 2
1 n
n i 1
X
ቤተ መጻሕፍቲ ባይዱ2 i
ˆ
1 2n
n i 1
X
2 i
例1. 设总体X的分布律如下,其中θ为 未知参数,试求θ的矩估计量。
X1
2
3
P 2 2 (1 ) (1 )2
解:E(X ) 1 2 2 2 (1 ) 3(1 )2 3 2
E(X ) 3 2
1 n
n i 1
Xi
X
ˆ 3 X
2
例2. 设总体X~B(n,p),其中n已知。 试求p的矩估计量。
(假定身高服从正态分布 N (,0.12 ) )
现从该总体选取容量为5的样本,我们 的任务是要根据选出的样本(5个数)求出
总体均值 的估计. 而全部信息就由这5个数
概率论与数理统计 第7章.ppt
即 S 2是 2 的无偏估计,故通常取S 2作 2的估计量.
例3 设总体 X 服从参数为 的指数分布, 概率密度
x 1 e , f ( x; ) 0,
x 0, 其他.
其中参数 0, 又设 X 1 , X 2 ,, X n 是来自总体 X 的 样本, 试证 X 和 nZ n[min( X 1 , X 2 ,, X n )] 都是 的无偏估计.
行到其中有15只失效时结束试验, 测得失效时 间(小时)为115, 119, 131, 138, 142, 147, 148, 155,
158, 159, 163, 166, 167, 170, 172.
试求电池的平均寿命 的最大似然估计值 .
解
n 50, m 15,
s( t15 ) 115 119 170 172 (50 15) 172
总体 X 的 k 阶矩 k E ( X k )的相合估计量, 进而若待估参数 g( 1 , 2 ,, n ), 其中g 为连续 ˆ g( 函数, 则 的矩估计量 ˆ1 , ˆ 2 , , ˆ n ) g( A1 , A2 ,
, An ) 是 的相合估计量.
第三节
估计量的评选标准
一、问题的提出
二、无偏性 三、有效性 四、相合性 五、小结
一、问题的提出
从前一节可以看到, 对于同一个参数, 用不 同的估计方法求出的估计量可能不相同. 而且, 很明显, 原则上任何统计量都可以作为未知参数 的估计量. 问题 (1)对于同一个参数究竟采用哪一个估计量好? (2)评价估计量的标准是什么? 下面介绍几个常用标准.
如果不能得到完全样本, 就考虑截尾寿命试验.
3. 两种常见的截尾寿命试验
概率论与数理统计第7章参数估计PPT课件
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
概率论与数理统计-第七章
但是参数 参数估计
, 未知。希望通过抽样估计之。
点估计 —— 给出参数的估计值。
区间估计 —— 给出参数的估计范围
3
§1 参数的点估计
用样本( X1, X2, …, Xn ),对每个未知参数 θi , ( i = 1, 2, …, k) 构造出一个统计量,
作为对参数 θi 的估计。该统计量称为 θi 的估计量。
抽出样本(X1, X2, …, Xn )。求证:对任何总体分布,
证明:X1, X2, …, Xn 独立,且与X同分布
28
例10:对服从均匀分布U(0, b)的总体X,讨论参数 b 的矩估计和极大似然估计的无偏性。 解: 由前面U(a, b)分布的a和b的估计量: (1) 矩估计
令 a=0
是
无偏估计!
xi , 故的取值范围最大不超过x min x1 , x2 ,
另一方面,L , 1n e
1
, xn
xi i 1
n
n
是的增函数,取到最大值时,L达到最大。
故 X 1 min X1 , X 2 ,
dlnL 令 n 12 d
29
(2) 极大似然估计
令 a=0
不是无偏估计
30
纠偏方法
如果 满足 ,则新的估计量 , 是无偏估计!
例9中:对服从均匀分布U(0, b)的总体X,参数 b 极大似然估计 不是无偏估计。
由于
是一个修正的极大似然估计,是无偏估计。
31
2.有效性 在没有系统误差的前题下,还希望估计量的 随机误差尽量小(对给定的样本容量n)!
推荐三本概率论和数理统计的参考书: (1)《数理统计学简史》, 陈希孺 (2)《概率论札记》, 梁昌洪
概率论与数理统计第七章
13
二、最大似然估计法
是在总体类型已知条件下使用的一种参数估计方法 . 它首先是由德国数学家高斯在 1821年提出的 ,
然而,这个方法常归功于英国 统计学家费歇 . 费歇在1922年重新发现了这一 方法,并首先研究了这种方法 的一些性质 .
Gauss
Fisher
信息管理学院 徐晔
选择适当的 i , i 1,2,, m
使得样本 ( X 1, X 2 ,, X n ) 作为一个随机变量,得 到观察值 ( x1, x2 ,, xn ) 的可能性最大。
信息管理学院 徐晔
17
当总体 X 为离散型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维离散型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是联合概率事件
14
最大似然估计法的基本思想
先看一个简单例子:
某位同学与一位猎人一起外出打猎 .
一只野兔从前方窜过 .
只听一声枪响,野兔应声倒下 .
如果要你推测, 是谁打中的呢? 你会如何想呢?
信息管理学院 徐晔
15
你就会想,只发一枪便打中,猎人命中的概率 一般大于这位同学命中的概率. 看来这一枪是猎人 射中的 . 这个例子所作的推断已经体现了最大似然估计 法的基本思想 .
信息管理学院 徐晔
18
n
当总体 X 为连续型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维连续型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是值对于一个极小的 ,联合 概率事件
A ( x1 X 1 x1 , x2 X 2 x2 ,, xn X n xn )
概率论第七章
例 8.求例 2、3 中 X 与 Y 的协方差。
相关系数定义
定义 5 设 ( X , Y ) 是一个随机向量,当 DX > 0 ,
DY > 0 时,称
X − EX Y − EY ρ ( X ,Y ) = E DX DY
为 X 与 Y 的相关系数。
注: (1) ρ ( X , Y ) = E ( X Y
∗
∗
)
。
(2)
D ( X ± Y ) = D ( X ) + D (Y ) ±2 ρ ( X , Y ) DXDY
例 9.求例 2、3 中 X 与 Y 的相关系数。
相关系数的性质) 定理 5 (相关系数的性质 相关系数的性质 当 DX > 0 , DY > 0 时, (1) ρ ( X , Y ) = ρ (Y , X ) ; (2) ρ ( X , Y ) ≤ 1 ;
例 18.设 X ∼ N ( 0,1) , 1)求 P ( X < 2 ) ; ( (2)估计 P ( X < 2 ) 的下界。
定理 9
柯西-许瓦兹不等式:设 ( X , Y )
是任意一个二维随机变量,则
( E ( XY ) )
2
≤ E(X
2
) E (Y ) 。
2
五、中心极限定理
• 大数定律 • 中心极限定理
(b − a ) DX =
12
1
2
5.指数分布 E ( λ ) : DX =
6.正态分布 N ( µ , σ 2 ) : DX = σ 2
λ2
方差性质
定理 3 设 k 与 c 都是常数。 (1) D ( c ) = 0 ;反之,如果某个随机变量 X 的方 差为 0,那么, P ( X = c ) = 1 ,其中 c = EX ; (2) D ( kX + c ) = k 2 D ( X ) ; (3)
概率论第七章课件
小概率事件在 一次试验中基 本上不会发生 .
19
得否定域
W: |t |>4.0322
第四步:
将样本值代入算出统计量 t 的实测值, | t |=2.997<4.0322
没有落入 拒绝域
故不能拒绝H0 .
这并不意味着H0一定对,只是差异 还不够显著, 不足以否定H0 .
2
假设检验的内容
参数检验 非参数检验 总体均值, 均值差的检验 总体分布已知, 检验关于未知 总体方差, 方差比的检验 参数的某个假设 分布拟合检验 总体分布未知时的 符号检验 假设检验问题 秩和检验
假设检验的理论依据
假设检验所以可行,其理论背景为 实际推断原理,即“小概率原理”
3
罐装可乐的容量按标准应在 350毫升和360毫升之间. 生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢? 把每一罐都打开倒入量 杯, 看看容量是否合于标准? 这样做 显然不行!
1 0.083 0.04 12
若不采用假设检验, 按理不能够出厂.
28
例4某厂生产的螺钉,按标准强度为68/mm2, 而实际生产的强度X 服N(,3.62 ).若E(X) ==68,则认为这批螺钉符合要求,否则认为 不符合要求. 现从生产的螺钉中抽取容量 为36的样本,其均值为 x 68.5 ,问原假设 是否正确?
解 假设
H0 : = 68
H1 : 68
29
3.6 若原假设正确, 则 X ~ N (68 , ) 36
2
因而 E ( X ) 68 ,即 X 偏离68不应该太远, 偏离较远是小概率事件,由于
概率论第7章
频率分布直方图
步骤如下: (1)决定组距与组数
选取起点与终点。起点a选得比最小值略小些, 终点b选得比最大值略大些,确定组距:d=(b-a)/m
将[a,b]进行等分,即在[a,b]内插入 m-1个分点:
a x1' x2' xm' 1 b
把[a,b]分成m个组(即小区间)。 通常在试验数据较多(即样本容量n较大)
时,可分成10~20组,数据在100以内可分成 5~12组。这里的起点、终点、组距、组数可视 具体情况来定。
(2)数出频数,列出分组频率分布 数出样本值x1,x2,…,xn 落在每个组的数目,
计算每个组的频数与频率。
(3)绘出频率分布直方图 以样本值为横轴,以(频率÷组距)为纵轴,
在横轴上标出各分组的点,以各组的组距为底, 画出高度等于(频率÷组距)的小矩形。整个图 形称为频率分布直方图,简称为直方图。
F n1
n2
服从第一自由度为n1、第二自由度为n2的F分布。 记为F~F(n1,n2)。
如F~F(n1,n2),则其密度函数为
f
(x)
( n1
n2 2
)
(
n1 2
)(
n2 2
)
(
n1
)
n1 2
n2
n1 1
x 2 (1
n1 n2
n1 n2
x) 2
0
x0 x0
下图描绘了F(10,50),F(10,10),F(10,4)的密度曲线。
数理统计研究的是:一个随机变量所服从的分布是 未知的,或者知其分布而不知其中所含的参数,需 要确定这个随机变量的分布或参数。 数理统计的研究方法是归纳法,同概率论相反。
例如,通过检查某厂家一批产品中的100个产品, 从而设法估计这批产品的合格率。
概率论第七章
即得 的矩估计量为 ˆ 2 X
设总体 X 的概率密度函数为 1 ( x ) / ,x e f ( x) 0 , 其它 其中 0 , , 是未知参数,( X 1 ,, X n )是总体 X 的样本,求 , 的矩估计量.
当总体 X 是连续型时,它是样本 ( X 1 , X 2 ,, X n ) 的 联合概率密度函数在( x1 , x2 ,, xn )的值,可以看成是
( X 1 , X 2 ,, X n ) 取可能值( x1 , x 2 ,, xn )的概率的“密
度” (在一个单位量纲上的概率).总之,它是与试验结 果相联系的概率有关.
1 2 n 1 2 n
H 取值的可能范围○内与 的真值“看起来最像”(这正 是“极大似然”这四个字在字面上的意思)的那个值, ˆ 因此,一个自然的想法就是用 ( x1 , x 2 ,, x n ) 作为 的
估计值.
定义 设 L( ) L( ; x1 , x2 ,, xn ) 是似然函数,若存 ˆ ˆ 在 ( x , x ,, x ) 使得
是 0 的估计量,称 T ( x1 , x2 ,, xn ) 是 0 的估计值.
注释 1
为了简单起见,我们将不再区分“流动”
的 参 数 及 真 值 0 , 即 统 一 地 都 说 成 , 并 称
T T ( X 1 , X 2 ,, X n ) 是 的估计量.上述定义明
1 n k P Ak X i k . 即有 n i 1 也就是说,当样本的容量趋于无穷时,样本 k 阶矩依概 率收敛于相应的总体 k 阶矩.
因此当样本容量n较大时可以用样本的r阶矩来作为总 体的r阶矩的一个估计,这时所得到的估计就是矩法估计.
概率论与数理统计教程(茆诗松)第7章
第七章 假设检验
第18页
对单侧检验 H0 : 0 vs H1 : 0是类似的, 只是拒绝域变为: W {u u1 } 其势函数为 g n 0 u 对双侧检验问题(7.2.3),拒绝域为 W { u u1 2} 其势函数为
5(c 110) g (110) 0.05 4
成立即可。这给出c 的值为 c 110 0.8u0.05 110 0.8 1.645=108.684 检验的拒绝域为 W {x 108.684}
16 July 2013
华东师范大学
第七章 假设检验
第七章 假设检验
第1页
第七章 假设检验
§7.1 §7.2 §7.3 §7.4 假设检验的基本思想与概念 正态总体参数假设检验 其它分布参数的假设检验 分布拟合检验
16 July 2013
华东师范大学
第七章 假设检验
第2页
§7.1
假设检验的基本思想与概念
7.1.1 假设检验问题
例7.1.1 某厂生产的合金强度服从 N ( ,16),其中 的设计值 为不低于110(Pa)。为保证质量,该 厂每天都要对生产情况做例行检查,以判断生 产是否正常进行,即该合金的平均强度不低于 110(Pa)。某天从生产中随机抽取25块合金,
x 0 u / n
三种假设的拒绝域形式分别见下图:
16 July 2013
华东师范大学
第七章 假设检验
第15页
W {u c}
W {u c} W {u c1 或 u c2}
(a) H1 : 0
16 July 2013
(b) H1 : 0
概率论与数理统计教程第七章答案
.第七章假设检验7.1设总体J〜N(4Q2),其中参数4, /为未知,试指出下面统计假设中哪些是简洁假设,哪些是复合假设:(1) W o: // = 0, σ = 1 ;(2) W o√∕ = O, σ>l5(3) ∕70:// <3, σ = 1 ;(4) % :0< 〃 <3 ;(5)W o :// = 0.解:(1)是简洁假设,其余位复合假设7.2设配么,…,25取自正态总体息(19),其中参数〃未知,无是子样均值,如对检验问题“0 :〃 = 〃o, M :4工从)取检验的拒绝域:c = {(x1,x2,∙∙∙,x25)r∣x-χ∕0∖≥c},试打算常数c ,使检验的显著性水平为0. 05_ Q解:由于J〜N(〃,9),故J~N(",二)在打。
成立的条件下,一/3 5cP o(∖ξ-^∖≥c) = P(∖ξ-μJ^∖≥-)=2 1-Φ(y) =0.05Φ(-) = 0.975,-= 1.96,所以c=L176°3 37. 3 设子样。
,乙,…,25取自正态总体,cr:已知,对假设检验%邛=μ0, H2> /J。
,取临界域c = {(X[,w,…,4):片>9)},(1)求此检验犯第一类错误概率为α时,犯其次类错误的概率夕,并争论它们之间的关系;(2)设〃o=0∙05, σ~=0. 004, a =0.05, n=9,求"=0.65 时不犯其次类错误的概率。
解:(1)在儿成立的条件下,F~N(∕o,军),此时a = P^ξ≥c^ = P0< σo σo )所以,包二为册=4_,,由此式解出c°=窄4f+为% ∖∣n在H∣成立的条件下,W ~ N",啊 ,此时nS = %<c°) = AI。
气L =①(^^~品)二①匹%=①(2δξ^历σoA∣-σ+A)-A-------------- y∕n)。
概率论第七章 习题解答
第七章 假设检验I 教学基本要求1、了解假设检验的相关概念及基本思想,掌握假设检验的基本步骤,知道犯两类错误的概率的含义;2、掌握单正态总体均值和方差的假设检验;3、掌握两个正态总体均值差与方差比的假设检验;4、了解分布的假设检验.II 习题解答A 组1、某企业生产铜丝,而折断力的大小是铜丝的主要质量指标.从过去的资料来看,可认为折断力2(570,8)X N ~(单位:千克力),现更换了一批原材料,测得10个样品的折断力如下:578 572 570 568 572 570 570 572 596 584 从性能上看,折断力的方差不会有什么变化,试问折断力的大小与原先有无差异(0.05)α=?解:若折断力的大小与原先无差异,则总体均值μ应为570,因此,提出假设如下:0H :570μ= vs 1H :570μ≠由0.05α=,查附表得临界值0.975 1.96u =,根据样本观测值求得575.2x =于是,检验统计量U 的值2.055U ==由于0.975||U u ≥,所以,在显著性水平0.05α=下拒绝原假设0H ,即认为折断力与原先有差异.2、某工厂生产的电子元件平均使用寿命2(,)X N μσ~,现抽测15个元件,得到18000x =、5200s =(单位:小时),试问该工厂生产的电子元件的平均使用寿命是否为20000(0.05)α=?解:若该工厂生产的电子元件的平均使用寿命为20000,则总体均值μ应为20000,因此,提出假设如下:0H :20000μ= vs 1H :20000μ≠由0.05α=,查附表得临界值0.975(14) 2.145t =,由已知数据求得检验统计量T 的值0.149T ==-由于0.975||(14)T t <,所以,在显著性水平0.05α=下接受原假设0H ,即认为该工厂生产的电子元件的平均使用寿命是20000小时.3、用热敏电阻测温仪间接测量地热勘探井底温度,重复测量6次,测得温度(C )为:111.0112.4110.2111.0113.5111.9假定测量的温度服从正态分布,且井底温度的真实值为111.6C ,试问用热敏电阻测温仪间接测温是否准确(0.05)α=?解:若用热敏电阻测温仪间接测温是准确的,则总体均值μ应为111.6,因此,提出假设如下:0H :111.6μ= vs 1H :111.6μ≠由0.05α=,查附表得临界值0.975(5) 2.571t =,根据样本观测值求得111.67x =、2 1.399s =于是,检验统计量T 的值0.145T ==由于0.975||(5)T t <,所以,在显著性水平0.05α=下接受原假设0H ,即认为用热敏电阻测温仪间接测温是准确的.4、设考生在某次考试中的成绩服从正态分布,从中随机地抽取36位考生的成绩,得到平均成绩为66.5分、标准差为15分,问是否可以认为这次考试全体考生的平均成绩为70分(0.05)α=?解:若这次考试全体考生的平均成绩为70分,则总体均值μ应为70,因此,提出假设如下:0H :70μ= vs 1H :70μ≠由0.05α=,查附表得临界值0.975(35) 2.0301t =,由已知数据求得检验统计量T 的值1.4T ==-由于0.975||(35)T t <,所以,在显著性水平0.05α=下接受原假设0H ,即认为这次考试全体考生的平均成绩为70分.5、某化肥厂用自动包装机包装化肥,每包质量服从正态分布2(50,)N σ,某日开工后,随机抽取8包化肥,测得质量(单位:kg )如下:49.249.850.350.849.749.650.550.1问该天包装的化肥质量的方差是否为1.3(0.05)α=?解:若该天包装的化肥质量的方差是1.3,则21.3σ=,因此,提出假设如下:0H :2 1.3σ= vs 1H :2 1.3σ≠由0.05α=,查附表得临界值20.025(8) 2.1797χ=、20.975(8)17.5345χ=,根据样本观测值求得21()2.192nii x μ=-=∑于是,检验统计量2χ的值2 2.1921.6861.3χ== 由于220.025(8)χχ≤,所以,在显著性水平0.05α=下拒绝原假设0H ,即认为该天包装的化肥质量的方差不是1.3.6、设某化纤厂生产的维尼纶的纤度在正常情况下服从方差为20.05的正态分布,现随机抽取6根,测得其纤度为1.33 1.351.541.451.371.53问维尼纶纤度的方差是否正常(0.10)α=?解:若维尼纶纤度的方差正常,则220.05σ=,因此,提出假设如下:0H :220.05σ= vs 1H :220.05σ≠由0.10α=,查附表得临界值20.05(5) 1.146χ=、20.95(5)11.07χ=,根据样本观测值求得1.43x =、20.0085s =于是,检验统计量2χ的值22(61)0.00851.70.05χ-⨯==由于2220.050.95(5)(5)χχχ<<,所以,在显著性水平0.10α=下接受原假设0H ,即认为维尼纶纤度的方差是正常的.7、生产某种产品可用两种操作方法.用第一种操作方法生产的产品抗折强度21(,7)X N μ~;用第二种操作方法生产的产品抗折强度22(,9)Y N μ~(单位:千克),现从第一种操作方法生产的产品中随机抽取13件,得到42x =,从第二种操作方法生产的产品中随机抽取17件,测得36y =,问这两种操作方法生产的产品的平均抗折强度是否有显著差异(0.05)α=?解:若这两种操作方法生产的产品的平均抗折强度无显著差异,则12μμ=,因此,提出假设如下:0H :12μμ= vs 1H :12μμ≠由0.05α=,查附表得临界值0.975 1.96u =,由已知数据求得检验统计量U 的值2.054U ==由于0.975||U u ≥,所以,在显著性水平0.05α=下拒绝原假设0H ,即认为这两种操作方法生产的产品的平均抗折强度有显著差异.8、某种物品在处理前与处理后分别抽样分析其含脂率,测得数据如下:假设处理前后的含脂率都服从正态分布,且方差不变,问该物品处理前后含脂率的均值是否有显著差异(0.01)α=?解:若该物品处理前后含脂率的均值无显著差异,则12μμ=,因此,提出假设如下:0H :12μμ= vs 1H :12μμ≠由0.01α=,查附表得临界值0.995(13) 3.012t =,根据样本观测值求得0.23x =、0.18y =、20.0094x s =、20.0045ys =、0.0822w s = 于是,检验统计量T 的值2.273T==由于0.995||(13)T t<,所以,在显著性水平0.01α=下接受原假设H,即认为该物品处理前后含脂率的均值无显著差异.9、有甲、乙两台机床加工同样的产品,现从这两台机床加工的产品中随机地抽取若干产品,测得产品直径(单位:)为:问甲乙两台机床加工的精度是否有显著差异(0.05)α=?解:若甲乙两台机床加工的精度无显著差异,则它们的方差相同,因此,提出假设如下:0H:2212σσ=vs1H:2212σσ≠由0.05α=,查附表得临界值0.0250.97511(7,6)0.1953(6,7) 5.12FF===、0.975(7,6) 5.70F=,根据样本观测值求得19x=、19y=、20.1029xs=、20.3967ys=于是,检验统计量F的值0.10290.25940.3967F==由于0.0250.975(7,6)(7,6)F F F<<,所以,在显著性水平0.05α=下接受原假设H,即认为甲乙两台机床加工的精度无显著差异.10、某车床生产滚珠,现随机抽取了50个产品,测得它们的直径(单位:mm)为:15.0 15.8 15.2 15.1 15.9 14.7 14.8 15.5 15.6 15.315.1 15.3 15.0 15.6 15.7 14.8 14.5 14.2 14.9 14.915.2 15.0 15.3 15.6 15.1 14.9 14.2 14.6 15.8 15.215.9 15.2 15.0 14.9 14.8 14.5 15.1 15.5 15.5 15.115.1 15.0 15.3 14.7 14.5 15.5 15.0 14.7 14.6 14.2问滚珠直径是否服从正态分布(0.05)α=?解:若滚珠直径服从正态分布,则2(,)X Nμσ~,因此,提出假设如下:0H:2(,)X Nμσ~由于μ、2σ未知,因而用它们的最大似然估计值ˆ15.1xμ==、222ˆ0.4325sσ==代替得到分布2(15.1,0.4325)N,为了求统计量2χ的值,取14.05a=、16.15ka=,将0[,]k a a 等分为7个小区间,列表计算得:于是,检验统计量2χ的值221() 3.062ki i i i n np np χ=-==∑再由0.05α=,查附表得临界值20.95(4)9.488χ=,由于220.95(4)χχ<,所以,在显著性水平0.05α=下接受原假设0H ,即认为滚珠直径服从正态分布.B 组1、随机地从一批直径服从正态分布的滚珠中抽取7个,测得其直径(单位:mm )为: 13.70 14.21 13.90 13.91 14.32 14.32 14.10假设滚珠直径总体分布的方差为0.05,问这批滚珠的平均直径是否小于等于14.25(0.05)α=?解:若这批滚珠的平均直径是小于等于14.25,则14.25μ≤,因此,提出假设如下:0H :14.25μ≤ vs 1H :14.25μ>由0.05α=,查附表得临界值0.95 1.65u =,根据样本观测值求得14.07x =于是,检验统计量U 的值2.118U ==-由于0.95U u <,所以,在显著性水平0.05α=下接受原假设0H ,即认为这批滚珠的平均直径小于等于14.25.2、设1x 、2x 、…、n x 是取自正态总体2(,)N μσ的样本,记11ni i x x n ==∑、221()ni i Q x x ==-∑,试在此记号下求检验假设0H :0μ=的检验统计量?解:该问题是单正态总体方差未知时关于期望μ的假设检验问题,检验统计量应选为x T =由于222111()11n ii s x x Q n n ==-=--∑,即s =,从而检验统计量为x T ==3、某种导线要求其电阻的标准差不超过0.004欧姆,现从生产的一批导线中随机抽取8根,得到220.006s =,若该导线的电阻服从正态分布,问能否认为这批导线的标准差偏小(0.05)α=?解:若这批导线的标准差偏小,则220.004σ≤,因此,提出假设如下:0H :220.004σ≤ vs 1H :220.004σ>由0.05α=,查附表得临界值20.95(7)14.067χ=,由已知数据求得检验统计量2χ的值222(81)0.00615.750.004χ-⨯== 由于220.95(7)χχ≥,所以,在显著性水平0.05α=下拒绝原假设0H ,即认为这批导线的标准差偏大.4、下面是某两种型号的电器充电后所能使用的时间(单位:小时)的观测值 型号A 5.5 5.6 6.3 4.6 5.3 5.0 6.2 5.8 5.1 5.2 5.9 型号B 3.8 4.3 4.2 4.0 4.9 4.5 5.2 4.8 4.5 3.9 3.7 4.6设两样本独立且抽样的两个正态总体方差相等,试问能否认为型号A 比型号B 平均使用的时间更短(0.01)α=?解:若型号A 比型号B 平均使用的时间更短,则12μμ≤,因此,提出假设如下:0H :12μμ≤ vs 1H :12μμ>由0.01α=,查附表得临界值0.99(21) 2.5176t =,根据样本观测值求得5.5x =、 4.3667y =、20.274x s =、20.2188ys =、0.4951w s =于是,检验统计量T的值5.4837T==由于0.99(21)T t≥,所以,在显著性水平0.01α=下拒绝原假设H,即认为型号A比型号B平均使用的时间更长.5、某药厂生产一种新的止痛片,厂方希望验证服用新药片后到开始起作用的时间间隔较原有止痛片至少缩短一半,因此厂方提出检验假设H:122μμ=vs1H:122μμ>其中1μ、2μ分别是服用原有止痛片和服用新止痛片后到开始起作用的时间间隔的总体均值,若这两个总体均服从正态分布,且方差21σ、22σ已知,现分别从两个总体中抽取两个独立样本1x、2x、…、mx和1y、2y、…、ny,试给出上述假设检验问题的检验统计量及拒绝域?解:设X为服用原有止痛片后到开始起作用的时间间隔,Y为服用新止痛片后到开始起作用的时间间隔,则211(,)X Nμσ~、222(,)Y Nμσ~,于是22121242(2,)x y Nm nσσμμ-~-+()~(0,1)x yU N⇒=当H成立,有~(0,1)x yU N=所以,可选取检验统计量x yU=对于给定的显著性水平α,检验的拒绝域为1{|}W U U uα-=≥.6、有两箱来自不同厂家的功能相同的金属部件,从第一箱中抽取60个,从第二箱中抽取40个,得到部件重量()mg的样本方差分别为215.46xs=、29.66ys=.若两样本相互独立且服从正态分布,试问第一箱重量的总体方差是否比第二箱重量的总体方差小(0.05)α=?解:若第一箱重量的总体方差比第二箱重量的总体方差小,则2212σσ≤,因此,提出假设如下:0H :2212σσ≤ vs 1H :2212σσ> 由0.05α=,查附表得临界值0.95(59,39) 1.64F =,根据已知数据求得检验统计量F 的值15.461.609.66F == 由于0.95(59,39)F F <,所以,在显著性水平0.05α=下接受原假设0H ,即认为第一箱重量的总体方差比第二箱重量的总体方差小.7A B 设两批电子器件的电阻分别服从211(,)N μσ、222(,)N μσ,试问能否认为两个总体服从相同的正态分布(0.05)α=?解:(1) 先检验两个总体方差相同.若两个总体方差相同,则2212σσ=,因此,提出假设如下: 0H :2212σσ= vs 1H :2212σσ≠ 由0.05α=,查附表得临界值0.0250.97511(5,5)0.140(5,5)7.15F F ===、0.975(5,5)7.15F =,根据样本观测值求得0.141x =、0.139y =、20.0000078x s =、20.0000071ys = 于是,检验统计量F 的值0.00000781.10.0000071F ==由于0.0250.975(5,5)(5,5)F F F <<,所以,在显著性水平0.05α=下接受原假设0H ,即认为两个总体方差相同;(2) 在(1)的基础上检验两个总体均值相同.若两个总体均值相同,则12μμ=,因此,提出假设如下:0H :12μμ= vs 1H :12μμ≠由0.05α=,查附表得临界值0.975(10) 2.2281t =,根据样本观测值求得20.0000074w s =于是,检验统计量T 的值1.267T ==由于0.975||(10)T t <,因而在显著性水平0.05α=下接受原假设0H ,即认为两个总体均值相同;所以,可认为两个总体服从相同的正态分布.8、在一批灯泡中抽取300只进行寿命测试,试验结果如下:试检验假设:0H :灯泡寿命服从指数分布0.0050.0050()00te tf t t -⎧>=⎨≤⎩(0.05)α=?解:根据题意提出假设0H :(0.005)X E ~为了求统计量2χ的值,将(0,)+∞分为4个小区间(0,100]、(100,200]、(200,300]、(300,)+∞,列表计算得:于是,检验统计量2χ的值221() 1.8393ki i i in np np χ=-==∑再由0.05α=,查附表得临界值20.95(3)7.8147χ=,由于220.95(3)χχ<,所以,在显著性水平0.05α=下接受原假设0H ,即认为该批灯泡寿命服从参数为0.005的指数分布.。
概率论第7章
第7章 参数估计内容 提要 本章主要讲述点估计(矩法估计,极大似然估计);估计量的评价准则(无 偏性,最小方差性和有效性,其它几个准则);区间估计(区间估计的一般步骤, 单个正态总体参数的区间估计,双正态总体参数的区间估计,非正态总体参数的 区间估计)等内容.重点 分析 1、理解点估计的概念,掌握矩估计法(一阶、二阶)。
了解极大似然估计法。
2、了解估计量的评选标准(无偏性、有效性、一致性)。
3、理解区间估计的概念,会求单个正态总体的均值与方差的置信区间,会求两个正态总体的均值差与方差比的置信区间。
难点 分析1、矩法估计,极大似然估计。
2、估计量的评价准则。
3、正态总体参数的区间估计。
教 学 内 容第七章 参数估计(Parameter Estimation)§7.1 点估计(Point Estimation )一、 矩估计法(Square Estimation )如上所述,例 5.4 中我们所做的对该地区农户的平均收入水平和贫富悬殊程度做出推断这一工作,用数理统计的 话说,实质上是对总体 ) , ( ~ 2s m N X 的未知参数期望值m 与方差值 2s 进行估计。
我们当时是分别用样本均值 X 和 样本方差 2S 来反映这两个量的,那么这样做是否合理?直观来看这样做是合理的,从概率论的观点看也是合理的。
事 实上,若总体 X 的期望存在, n X X X X E , , , , ) ( 2 1 L m = 是出自 X 的样本,则由柯尔莫哥洛夫强大数定律,以概率为 1地成立å = ¥ ® = ni i n X n 11 lim m 而上式左边极限号内正是样本均值 X ,因此,我们常用 X 作为m 的估计值。
不仅如此,若 X 的k 阶矩存在, k k a EX = ,则同样由柯尔莫哥洛夫强大数定律得出 å = = n i kki a X n 11 lim 以概率为1成立。
概率论第七章
例 X ~ N ( , 2 ), , 2 未知, 即得 , 2 的矩估计量 n 1 2 2 ˆ X, ˆ ( Xi X ) . n i 1 一般地, 1 n 用样本均值X X i作为总体X的均值的矩估计, n i 1 n
注. 1 定义中选用的是原点矩,也可以用中心矩, 只要给定总体矩,采用相应的样本矩就可以。
令:
P x ,
i 1
n
n
i
离散.
L x 1 , x 2 , x n ,
2 Sn ˆ 1 p X 即 2 X X n ˆ 2 ˆ p X S n
(5)
X~P(), E(X)=D(X)=
ˆX 故
或
2 ˆ Sn
注: 由此例可知, 矩估计量不唯一。
例2.5
设总体X的概率密度为 ( 1) x 0 x 1 f ( x; ) ( 1) 0 其它 X1,X2,…,Xn是来自总体X的样本。0.1,0.2,0.9,0.8,0.7,0.7为一 个样本观察值,试求 的矩估计值。
解:E ( X ) xf ( x; )dx x ( 1) x dx ( 1) x 1dx
0 0 1 1
( 1)
令
2X 1 ˆ 解之得的矩估计 1 X 由样本值 0.1,0.2,0.9,0.8,0.7,0.7计算得 x 0.5667
解: (1)
因为X ~ N ( , 2 ),E ( X ) ,D( X ) 2
故有 X,
( 2)
2 S n2
1
X ~ E ( ),E ( X ) 1 ˆ 故 X,即 X 1
概率论与数理统计第七章-精品
i1
n
1
(xi )2
e 22 (2
n ) e 2
1
22
n
(xi
i1
)2
i1 2
lo L (,g 2 ) n 2 lo 2 ) g n 2 l( o 2 ) g 2 1 2 i ( n 1 ( x i ) 2
似然方程组为
例3 均值,方差2的矩估计
设总体的均值为,方差为2 ,于是
a a 1 2(( ,, 2 2)) E E ((X X )2) u V(X a ) [rE (X )2] 22
由此列出方程组:
aa12((
, 2 ) , 2 )
A1 A2
若是向量,上述方程必须用似然方程
组代替 .
两点说明:
2、用上述求导方法求参数的MLE有时 行不通,这时要用极大似然原则来求 .
下面举例说明如何求极大似然估计
例1 设X1,X2,…Xn是取自总体 X~B(1, p) 的 一个样本,求参数p的极大似然估计.
解:似然函数为:
L(p)= f (X1,X2,…Xn; p )
它是极大值点.
由 L ( ,
2)(2
n ) e 2
2 12i n 1(xi)2
lim L(,2)0
lim L(,2)0 lim L(,2)0
2
2 0
*x
2*n 1i n 1(xix)2
是L(,2)的最大值点. ∴ 和2的极大似然估
n 1i n1Xim pE(Xm)am
例1 设总体X的概率密度为
f(x)(1)x,
0,
0x1 其它
其中 1
是未知参数,
概率论与数理统计第七章
点估计 区间估计
参数估计的类型
点估计 —— 估计未知参数的值
区间估计—— 估计未知参数的取值范围, 并使此范围包含未知参数 真值的概率为给定的值。
§7.1 点估计
要求: (1) 理解参数的点估计、估计量和估计值的概念。 (2)掌握矩估计法和最大似然估计法。
第七章 参数估计
总体是由总体分布来刻画的。
总体分布类型的判断──在实际问题中,我们根据 问题本身的专业知识或以往的经验或适当的统计 方法,有时可以判断总体分布的类型。
总体分布的未知参数的估计──总体分布的参数往 往是未知的,需要通过样本来估计。通过样本来 估计总体的参数。称为参数估计,它是统计推断 的一种重要形式。
例如
(1)为了研究人们的市场消费行为,我们要 先搞清楚人们的收入状况。
假设某城市人均年收入X∼N(, 2)。但参数 和 2 的具体值并不知道,需要通过样本来估计。
(2)假定某城市在单位时间(譬如一个月)内
交通事故发生次数 X ∼ p()。
参数未知,需要从样本来估计。
点估计
参数估计 区间估计
例如, X∼N(, 2), 若, 2未知, 通过构造样本的函数,给出它
矩估计法的具体做法如下
设总体的分布函数中含有k个未知参数1,2, ,k 。
(1) 写出总体的前k阶矩μ1, μ2, , μk ,一般是这 k 个 未知参数的函数, 记为:
μi μi (θ1,θ2 , ,θk ) i=1, 2, … , k
(2)从这 k 个方程中解出
θ j θ j ( μ1, μ2 , , μk ) j=1, 2, …, k
(3) 那么用诸 μi 的估计量 Ai 分别代替上式中的诸 μi,
概率论与数理统计第七章参数估计
例1. 设总体X的数学期望和方差分别是μ,
σ2 ,求μ , σ2的矩估计量。
E(X )
E( X 2 ) D( X ) [EX ]2 2 2
(3) 写出方程 ln L 0
i1
若方程有解,
求出L(θ)的最大值点 ˆ(x1,x2,..x.n,)
于 是 ˆ ˆ ( X 1 , X 2 , . . . , X n ) 即 为 的 极 大 似 然 估 计 量
例2. 设总体X服从参数λ>0的泊松分布,求 参数λ的极大似然估计量。
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
ˆ(x1,x2,..x.n,),使得
L (ˆ) m a x L (), (或 L (ˆ) s u p L ())
则 称 ˆ ( x 1 ,x 2 , . . . ,x n ) 为 的 极 大 似 然 估 计 值
称 ˆ ( X 1 ,X 2 ,...,X n ) 为 极 大 似 然 估 计 量
第7章 参数估计
总体所服从的分布类型已知/未知
抽样
参数 估计
估计总体中未知的参数
参数估计 参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数. 估计新生儿的体重
估计废品率
估计湖中鱼数
§7.1
点估计
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 (可以是向量) .
概率论第7章
X1, ... ,Xn是来自总体X的独立同分布样本,分布
律或概率密度函数是f(x,q),其中q∈Q是参数,Q已知, 是q的取值范围.f (x,q)的形式已知,则有统计模型
f ( x1,θ) f ( xn ,θ) θ Q
例1 某种型号的产品N个,其合格率q未知,从中随机
抽取n个(n<<N),设Xi 是第i次抽到的样品,正品Xi=1, 否则 Xi =0,则 X1,X2,…,Xn 就是样本.总体分布为两点
分布B(0,1),参数空间为q=(0,1),则可得统计模型
n
n
xi
n xi
θ i1 (1 θ) i1
用矩估计法估计λ的值。
解 设X为灯管寿命,则
1 n
x n i1 xi 130.55
μ1
E
X
=
1 λ
μ1 m1
μ1
E
X
=
1 λ
X
λˆ 1 0.0077 X
例2 设总体X的均值μ和方差σ2 >0都存在,μ,σ2未知.
X1,…,Xn是来自 X 的样本,试求μ, σ2的矩估计量 .
矩估计量的观察值称为矩估计值 .
总体k阶中心矩 样本k阶中心矩
Vk
Bk
E[ X 1n
n i1
E( X )]k; ( Xi X )k .
例1. 设有一批灯管,其寿命服从参数为λ的指数分 布,今随机从中抽取11只,测得其寿命数据如下:
110, 184, 145, 122, 165, 143, 78, 129, 62, 130, 168
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§5 正态总体均值与方差的区间估计
一、复习正态总体的样本均值与样本方差的分布 1、(对一个正态总体)
设X 1,…,X n 是来自总体2~(,)X N μσ的样本, 则
(1) ~(0,1)X N μ−
~(1)X t n μ−−
(3)
2
2
2
(1)~(1)n S
n σ
χ−−
2、(对两个正态总体) 设
,,,n X X X 112L 是来自总体211~(,)X N μσ的样本, ,,,n Y Y Y 212L 是来自总体222
~(,)Y N μσ的样本,
且两个样本相互独立, 则有
()()
~(0,1)X Y N μμ−−−
(2) 当222
1
2
σσσ==时
12()()~(2)X Y t n n μμ−−+−−
(3)
221222
1221
~(1,1)S
S
F n n σσ
−−
二、正态总体均值、方差的置信区间 (置信水平为α−1)
一个正态总体均值与方差的置信区间
例1-2(P164) 有一大批糖果. 现从中随机取16袋, 称得重量(以克计)如下: 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496
设袋装糖果的重量近似服从正态分布, 试求总体均值μ与总体标准差σ的置信水平为0.95的置信区间.
两个正态总体均值差与方差比的置信区间
例3(P 166) 为比较I, II 两种型号步枪子弹的枪口速度, 随机地取I 型子弹10发, 得到枪口速度的平均值1500(/)x m s =, 标准差s 1=1.10(m/s), 随机地取II 型子弹20发, 得到枪口速度的平均值2496(/)x m s =, 标准差s 2=1.20(m/s). 假设两总体都可认为近似地服从正态分布, 且由生产过程可认为方差相等. 求两总体均值差12μμ−的一个置信水平为0.95的置信区间.
例4(P 166) 为提高某一化学生产过程的得率, 试图采用一种新的催化剂. 为慎重起见, 在实验工厂先进行试验. 设采用原来的催化剂进行了
n 1=8次试验, 得到得率的平均值191.73x =, 样本方差21 3.89s =; 又采用新的催化剂进行了n 2=8次试验, 得到得率的均值293.75x =, 样本方差
22
4.02s =. 假设两总体都可认为服从正态分布, 且方差相等, 两样本
独立. 试求两总体均值差的置信水平为0.95的置信区间.
例5(P 167) 研究由机器A 和机器B 生产的钢管的内径, 随机抽取机器A 生产的管子18只, 测得样本方差22
1
0.34()s mm =; 抽取机器B 生产的管
子13只, 测得样本方差22
2
0.29()s mm =. 设两样本相互独立, 且设由机
器A, 机器B 生产的管子内径分别服从211
(,)N μσ, 222
(,)N μσ, 这里
2,(1,2)i i
i μσ=均未知. 试求方差比σσ221
2
的置信水平为0.90的置信区间.
§7 单侧置信区间
一、定义: 设总体~(;)X F x θ, θ∈Θ是未知参数, 对给定的()αα<<01, 若统计量(,,,)n X X X θθ=L 12满足: 对任意θ∈Θ有
α−1——为置信水平;
随机区间(,)θ+∞——θ的置信水平为α−1的单侧置信区间;
θ——置信水平为α−1的单侧置信下限.
同理定义单侧置信区间(,)θ−∞与单侧置信上限θ. 二、单侧置信区间的求法:
1、寻找枢轴量(,,,;)n W W X X X θ=L 12:
W 的分布不依赖于θ以及其它未知参数. 2、确定a 或b , 使{}P W a α>≥−1或{}P W b α<≥−1:
对置信水平α−1, 由W 的分布确定出常数a 或b , 使{}P W a α>≥−1 或{}P W b α<≥−1成立.
3、反解求θθ或, 使{}P θθα>≥−1或{}P θθα<≥−1成立.
例(P 169) 若正态总体~(,)X N μσ2
且μ与σ2
未知, 设X 1, X 2,…,X n 是一个
样本, 分别求:
(1) 均值μ的置信水平为α−1的单侧置信下限; (2) 方差σ2
的置信水平为α−1的单侧置信上限.
例(P 170) 从一批灯泡中随机取5只作寿命试验, 测得寿命(以小时计)为
1050 1100 1120 1250 1280
设灯泡寿命服从正态分布, 求灯泡寿命平均值的置信水平0.95的单侧置信下限.
小结:
课堂练习:
(P175-176) 19(1)
第七章 参数估计
§5 正态总体均值与方差的区间估计 §7 单侧置信区间
作业:
(P175-176) 16(2)、18、22、23
11。