统计推断包括参数估计和假设检验,即通过样本统计量来估...精品PPT课件
合集下载
第五章 统计推断 《试验设计与统计分析》PPT课件
则( x1 x 2 ) ~ N ( ( x1 x2 ) , ......
2 ( x1 x 2 )
)。
统计推断
总体 ——从样本到总体
样本
通过一个或多个样本统计数推断总体相应参数
第一节 统计推断的含义和内容
一、统计推断的概念
按照一定的抽样方法,从所研究的总体中,随机抽 出一个样本或一系列样本,并研究样本的特征,然后根 据对样本特征的研究结果去推断总体的特征 。
拿 3棵 拿 4棵 拿 5棵
推断:一次就猜对5棵的概率是0.03125,概率很小, 亦即猜100次只有5次能把5棵麦苗属何品种全猜对, 在一次试验中几乎不可能发生,所以,他若能一次 就说对,不是凭猜的,是确有鉴别能力。
这里有一个概率标准的问题,这个概率标准
称为显著水平(a)一般为0.05或0.01。 我们是依据“小概率实际不可能性原理”进 行推断的。这个原理是说:概率很小的事件, 在一次试验中几乎不可能发生或可以认为不 可能发生。如果我们假设了一些条件,并在 假设的条件下能够准确地算出事件A出现的 概率很小,但在一次试验中,事件A竟出现 了,那么,我们就可以认为这个假设不正确, 从而否定这个假设。
四、统计假设检验的两类错误
1、第一类错误(first kind error)或I型错误(type I error)。––如果H0是真实的,我们通过检验却否定 了它,就犯了一个否定真实假设的错误。第一类错
误只有在否定H0时才会发生。由于规定显著水平为
a ,故H0为真而被否定的概率最多为a ;因而这类
实际上包括了 0 (或1 2 )和 0 (或1 2 )两种情况, 要在 a显著水平否定无效假设 H 0 : 0 (或1 2 ), 必须 否定区,分别位于 水平 a u ua 或u ua,因而这种检验有两个 表示的概率在曲线两尾
《chap5统计推断》PPT课件
6
假设检验
假设检验的定义
假定原假设正确,检验某个样本是否来自某个总体, 它可以使研究者把根据样本得出的结果推广到总体
反证法: 假定原假设正确,研究其发生的概率
根据样本进行的假设检验有两种结果
拒绝H0,因为发现其是错误的 不能拒绝H0,因为没有足够的证据使我们拒绝它
原假设和备择假设总是互斥,而且包括了所有的可能,
5
统计假设
原假设(null hypothesis, H0)通常为不变情况的假设。 备择假设(alternative hypothesis, HA)则通常声明一种改变的状态,如
两个群体间存在差异。 研究假设可以为两种可能之一,即没有差异和有差异。通常情况下,备择假
设和研究假设相同,因此,原假设与研究者的期望相反。
20
显著水平的选择
如果接受H0,则或者得出正确结论,或者犯概率为的第二类错误 如果结论为拒绝H0,则可能得出正确结论,也可能犯概率为 的第一类错误。 当假设检验结果为拒绝H0时,我们知道犯第一类错误的概率,因此我们进行
假设检验时,总是希望结论为拒绝H0 推荐的显著水平为0.05?为什么
21
<-无效假设H0: y=0 <-要分析的变量为y
45
结果
P=0.3434>0.05,接受H0,即抽测结果的平均数是否与总体平均数114天一致
46
第三节
两个样本平均数差异的假设检验
47
一、两独立样本
平均数差异的假设检验
48
前言
两样本独立指两样本 为分别独立地从两个总体抽取的,两个样本间相互独立 在动物科学中,利用完全随机设计(completely randomized design, CRD)
假设检验
假设检验的定义
假定原假设正确,检验某个样本是否来自某个总体, 它可以使研究者把根据样本得出的结果推广到总体
反证法: 假定原假设正确,研究其发生的概率
根据样本进行的假设检验有两种结果
拒绝H0,因为发现其是错误的 不能拒绝H0,因为没有足够的证据使我们拒绝它
原假设和备择假设总是互斥,而且包括了所有的可能,
5
统计假设
原假设(null hypothesis, H0)通常为不变情况的假设。 备择假设(alternative hypothesis, HA)则通常声明一种改变的状态,如
两个群体间存在差异。 研究假设可以为两种可能之一,即没有差异和有差异。通常情况下,备择假
设和研究假设相同,因此,原假设与研究者的期望相反。
20
显著水平的选择
如果接受H0,则或者得出正确结论,或者犯概率为的第二类错误 如果结论为拒绝H0,则可能得出正确结论,也可能犯概率为 的第一类错误。 当假设检验结果为拒绝H0时,我们知道犯第一类错误的概率,因此我们进行
假设检验时,总是希望结论为拒绝H0 推荐的显著水平为0.05?为什么
21
<-无效假设H0: y=0 <-要分析的变量为y
45
结果
P=0.3434>0.05,接受H0,即抽测结果的平均数是否与总体平均数114天一致
46
第三节
两个样本平均数差异的假设检验
47
一、两独立样本
平均数差异的假设检验
48
前言
两样本独立指两样本 为分别独立地从两个总体抽取的,两个样本间相互独立 在动物科学中,利用完全随机设计(completely randomized design, CRD)
统计推断包括参数估计和假设检验(精)
试验中发生的概率,则对于任意的 0,
有lim P{ m p } 1
n n
这个定理说明了:当观察次数n很大时,用 某随机现象在大量观察中发生的实际频率来 代替该现象发生的真实概率差别是很小的。
定理6.3:设X
1
,
X
2
.
.
..
.
..X.
是独立同分布变量,
n
且每个随机变量服从正态分布N (, 2 ).
若有:E[(1 )2]<E[(2 )2]
1 比2 好
1为无偏估计量,3的方差最小, ˆ3的抽样分布
但MSE(ˆ2 )最小
(Var(ˆ3 )最小)
ˆ2的抽样分布
(有偏的估计量)
ˆ1的抽样分布
(无偏估计量)
E(ˆ1)E(ˆ2)
Bias(ˆ3 )
估计量
E(ˆ3)
n i 1
E( X i )
1 n
nE( X )
E( X )
E(S 2 )
E( 1 n 1
n i 1
(Xi
X
)2 )
1 [E n 1
n i 1
(Xi
X
)2]
D(X )
如果统计量为Sn2
1 n
n i1
(Xi
X
)2 , 则E(Sn2 )
D( X
)
此时,E(Sn2
我们把被观察对象的全体称作总体,把从总 体中按照随机原则抽出的个体组成的小群体 称为样本,而样本中所包含的个体数称为样 本容量。
1.总体和样本
设X是一个随机变量,X1,X2 ,......,Xn是一组相互独立与X 具有相同分布的随机变量,称X为总体.X1,X2 ,......,Xn为 来自总体的简单随机样本,简称样本,n为样本容量, 称样本观察值为样本值。
有lim P{ m p } 1
n n
这个定理说明了:当观察次数n很大时,用 某随机现象在大量观察中发生的实际频率来 代替该现象发生的真实概率差别是很小的。
定理6.3:设X
1
,
X
2
.
.
..
.
..X.
是独立同分布变量,
n
且每个随机变量服从正态分布N (, 2 ).
若有:E[(1 )2]<E[(2 )2]
1 比2 好
1为无偏估计量,3的方差最小, ˆ3的抽样分布
但MSE(ˆ2 )最小
(Var(ˆ3 )最小)
ˆ2的抽样分布
(有偏的估计量)
ˆ1的抽样分布
(无偏估计量)
E(ˆ1)E(ˆ2)
Bias(ˆ3 )
估计量
E(ˆ3)
n i 1
E( X i )
1 n
nE( X )
E( X )
E(S 2 )
E( 1 n 1
n i 1
(Xi
X
)2 )
1 [E n 1
n i 1
(Xi
X
)2]
D(X )
如果统计量为Sn2
1 n
n i1
(Xi
X
)2 , 则E(Sn2 )
D( X
)
此时,E(Sn2
我们把被观察对象的全体称作总体,把从总 体中按照随机原则抽出的个体组成的小群体 称为样本,而样本中所包含的个体数称为样 本容量。
1.总体和样本
设X是一个随机变量,X1,X2 ,......,Xn是一组相互独立与X 具有相同分布的随机变量,称X为总体.X1,X2 ,......,Xn为 来自总体的简单随机样本,简称样本,n为样本容量, 称样本观察值为样本值。
统计推断PPT精品课件
22
第二节 总体参数的区间估计
四.总体比率区间估计
(一)单总体比率的区间估计
由中心极限定理(正态逼近定理),一个随机变量X 服从B(n,p)的分布,当n充分大时(通常n﹥30)时, 可以用正态分布来近似。因此百分比的估计p∧的分布 也可以用正态分布N( p,p(1- p)/ n)来近似。
p p
X ~ t(n 1)
S/ n n 2
(x s t (n 1))
(公式7.2.2)
10
第二节 总体参数的区间估计
例6(P73)由调查知6家公司自用汽车每年维 修费用的样本均值(万元)为x- =340,s=60, 设维修费用服从正态分布,求置信水平为95% 的平均维修费用的区间估计。
11
第二节 总体参数的区间估计
第七章 统计推断
第一节 统计推断的基本概念 第二节 总体参数的区间估计 第三节 总体参数的假设检验
第四节 2 检验
1
第一节 统计推断的基本概念
一.什么是统计推断 统计推断包括统计估计和统计检验;统计估
计包括参数估计和非参数估计;统计检验包 括参数假设检验和非参数假设检验。 参数统计方法是在已知总体分布的条件下, 对相应分布的参数进行估计和检验。 非参数统计方法,研究目标总体的分布是否 与已知理论分布相同,或者各样本所在总体 的分布位置/形状是否相同。
例7(P73)一工厂有两条生产线A和B,每小时生产情 况如下:求两条生产线平均产量差的区间估计。(假
设X、Y服从N( μ,σ2 )且 σ21 = σ22)(取
α=0.05)
A
B
抽取小时数
12
18
样本均值
111
106
样本标准差
4.4
第二节 总体参数的区间估计
四.总体比率区间估计
(一)单总体比率的区间估计
由中心极限定理(正态逼近定理),一个随机变量X 服从B(n,p)的分布,当n充分大时(通常n﹥30)时, 可以用正态分布来近似。因此百分比的估计p∧的分布 也可以用正态分布N( p,p(1- p)/ n)来近似。
p p
X ~ t(n 1)
S/ n n 2
(x s t (n 1))
(公式7.2.2)
10
第二节 总体参数的区间估计
例6(P73)由调查知6家公司自用汽车每年维 修费用的样本均值(万元)为x- =340,s=60, 设维修费用服从正态分布,求置信水平为95% 的平均维修费用的区间估计。
11
第二节 总体参数的区间估计
第七章 统计推断
第一节 统计推断的基本概念 第二节 总体参数的区间估计 第三节 总体参数的假设检验
第四节 2 检验
1
第一节 统计推断的基本概念
一.什么是统计推断 统计推断包括统计估计和统计检验;统计估
计包括参数估计和非参数估计;统计检验包 括参数假设检验和非参数假设检验。 参数统计方法是在已知总体分布的条件下, 对相应分布的参数进行估计和检验。 非参数统计方法,研究目标总体的分布是否 与已知理论分布相同,或者各样本所在总体 的分布位置/形状是否相同。
例7(P73)一工厂有两条生产线A和B,每小时生产情 况如下:求两条生产线平均产量差的区间估计。(假
设X、Y服从N( μ,σ2 )且 σ21 = σ22)(取
α=0.05)
A
B
抽取小时数
12
18
样本均值
111
106
样本标准差
4.4
第二章-统计推断-1ppt课件
• 根据上述原理所建立起来的检验方法称为显著性 检验(significance test)。究竟概率小到什么程 度算是小概率,要根据实际情况或实验要求而定, 生物统计工作中,通常规定5%或1%以下为小概 率。 5%或 1%(或其他的值)称为显著性水平 (significance level),记为“α”。上述的统计量 称为u检验统计量(test statistic)。下面几种统 计假设检验中还会遇到统计量 t,统计量 X2以及 统计量F,它们都称为检验统计量。
.
.
2.1.4 显著性检验的基本程序如下:
• (l)假设:零假设是假设检验的基础。它可能有以下 几个来源:①根据以往的经验或者是根据某些实验结果; ②依据某种理论或某种模型;③根据预先所做的某种规定 而提出来的。
• 与零假设对立的是备择假设。备择假设是总体参数除去 零假设以外的某些值。它可能有以下几个来源:①除零假 设以外可能的值;②担心会出现的值;③希望出现的值; ④有重要经济意义或其它意义的值。
• 与零假设相对立的假设称为备择假设 (alternative hypothesis)。从备择假设的名 称上就可以看出,它是在拒绝的情况下, 可供选择的假设。备择假设记HA。例如, HA: μ>μ0、HA: μ<μ0 及HA:μ≠>μ0。
.
• 2.1.2小概率原理
• 它的基本内容是:小概率的事件,在一次试验 中,几乎是不会发生的。若根据一定的假设条件 计算出来该事件发生的概率很小,而在一次试验 中,它竟然发生了,则可以认为假设的条件不正 确。因此,否定假设。
• 关于正态总体的μ和σ的检验中,平均数(μ)的 检验有u检验和t检验,若σ已知,则用u检验,否 则用t检验。方差(σ)的检验用X2检验。
.
.
2.1.4 显著性检验的基本程序如下:
• (l)假设:零假设是假设检验的基础。它可能有以下 几个来源:①根据以往的经验或者是根据某些实验结果; ②依据某种理论或某种模型;③根据预先所做的某种规定 而提出来的。
• 与零假设对立的是备择假设。备择假设是总体参数除去 零假设以外的某些值。它可能有以下几个来源:①除零假 设以外可能的值;②担心会出现的值;③希望出现的值; ④有重要经济意义或其它意义的值。
• 与零假设相对立的假设称为备择假设 (alternative hypothesis)。从备择假设的名 称上就可以看出,它是在拒绝的情况下, 可供选择的假设。备择假设记HA。例如, HA: μ>μ0、HA: μ<μ0 及HA:μ≠>μ0。
.
• 2.1.2小概率原理
• 它的基本内容是:小概率的事件,在一次试验 中,几乎是不会发生的。若根据一定的假设条件 计算出来该事件发生的概率很小,而在一次试验 中,它竟然发生了,则可以认为假设的条件不正 确。因此,否定假设。
• 关于正态总体的μ和σ的检验中,平均数(μ)的 检验有u检验和t检验,若σ已知,则用u检验,否 则用t检验。方差(σ)的检验用X2检验。
第五章 统计推断 《统计学》 ppt课件
必要抽样数目愈多;值愈小,必要抽样数目愈少。 (2)允许误差(极限误差)Δ,即Δ的数值。Δ值大可以
少抽些样本单位,Δ值小则要多抽一些样本单位。Δ是调查 前规定的,是根据调查目的确定的。 (3)概率度t 。t值愈大,要求把握程度愈高,则要多抽 些单位;t值愈小,要求把握程度低,则可少抽些单位。把 握程度也是在抽样之前根据抽样的目的和要求来规定的。 (4)抽样方法。在同等条件下,重置抽样需要多抽一些单 位,不重置抽样可少抽一些样本单位。 (5)抽样的组织方式。简单随机抽样,类型随机抽样, 等距随机抽样,整群随机抽样,阶段随机抽样等都是抽样 的组织方式,由于采用的组织方式不同,必要抽样数目也 不相同。
二、统计推断的几个基本概念
1.总体和样本 在统计推断中存在全及总体和样本总体。
全及总体也叫母体,简称总体,是所要认识的研究对象的 全体,它由具有某种共同性质或特征的单位组成。全及总 体的单位数用N表示。
全及总体按其各单位标志的性质不同可分为变量总体和 属性总体。
样本总体又叫抽样总体、子样,简称样本,是从全及总 体中随机抽选出来的单位所组成的小总体。
样本平均数的抽样分布是由样本平均数的可能取值和与 之相应的概率组成。
例5.3
在不重复抽样时,样本平均数的抽样分布有数学期望
E(x) a
即样本平均数的平均数等于总体平均数
X
在不重复简单随机抽样时,样本平均数的抽样分布有方 差,即
2 x
2
n
(
N N
n) 1
在不重复抽样条件下,用
x
表示抽样平均误差(也称抽样标准误差),则
(
方差σ2 )。
设总体N个单位中,有N1个单位具有某种属性,N0个单 位不具有某种属性,且N1十N0=N ,则: P N1 N
少抽些样本单位,Δ值小则要多抽一些样本单位。Δ是调查 前规定的,是根据调查目的确定的。 (3)概率度t 。t值愈大,要求把握程度愈高,则要多抽 些单位;t值愈小,要求把握程度低,则可少抽些单位。把 握程度也是在抽样之前根据抽样的目的和要求来规定的。 (4)抽样方法。在同等条件下,重置抽样需要多抽一些单 位,不重置抽样可少抽一些样本单位。 (5)抽样的组织方式。简单随机抽样,类型随机抽样, 等距随机抽样,整群随机抽样,阶段随机抽样等都是抽样 的组织方式,由于采用的组织方式不同,必要抽样数目也 不相同。
二、统计推断的几个基本概念
1.总体和样本 在统计推断中存在全及总体和样本总体。
全及总体也叫母体,简称总体,是所要认识的研究对象的 全体,它由具有某种共同性质或特征的单位组成。全及总 体的单位数用N表示。
全及总体按其各单位标志的性质不同可分为变量总体和 属性总体。
样本总体又叫抽样总体、子样,简称样本,是从全及总 体中随机抽选出来的单位所组成的小总体。
样本平均数的抽样分布是由样本平均数的可能取值和与 之相应的概率组成。
例5.3
在不重复抽样时,样本平均数的抽样分布有数学期望
E(x) a
即样本平均数的平均数等于总体平均数
X
在不重复简单随机抽样时,样本平均数的抽样分布有方 差,即
2 x
2
n
(
N N
n) 1
在不重复抽样条件下,用
x
表示抽样平均误差(也称抽样标准误差),则
(
方差σ2 )。
设总体N个单位中,有N1个单位具有某种属性,N0个单 位不具有某种属性,且N1十N0=N ,则: P N1 N
《统计假设检验》PPT课件
两均数差异越大,β值越小。
精选ppt
18
如何选择合适的α值
若一个试验耗费大,可靠性要求高,不允许反复,那么α值 应取小些;当一个试验结论的使用事关重大,容易产 生严重后果,如药物的毒性试验,α值亦应取小些。
对于一些试验条件不易控制,试验误差较大的试验,可将α 值放宽到0.1,甚至放宽到0.25。
在提高显著水平,即减小α值时,为了减否定小域犯Ⅱ型错误的概 否率定,域可适当增大接样受本域含量。增大样本含量可以同时降 低犯两类错误的可能性。
精选ppt
17
意两 图类
错 误 示
两类错误间的关系:
如图所示,图中左边曲线是H0为真时,x1 x2的分布密度曲
线;右边曲线是HA为真时,x1 的x2分布密度曲线( 1) 2
犯Ⅱ型错误可能性β的大小与α取值的大小、两均数差 异大小等因素有关:
当α值变小时, β值变大;反之亦然,也就是说Ⅰ型 错误α的降低必然伴随着Ⅱ型错误β的升高 ;
精选ppt
3
第一节 显著性检验的基本原理
一、显著性检验的意义
二、两种假设
三、显著水平与两类错误
四、双侧检验与单侧检验
五、显著性检验的基本步骤
精选ppt
4
一、显著性检验的意义
(一)为什么要进行显著性检验? 例1
某实验要求实验动物平均体重μ=10.00g, 现有
实验动物10只,平均体重 =x 10.23g, 已知总体
n
10
4.∵ HA: μ≠μ0,当∣u∣ >u0.025时拒绝H0 查正态分布表得,u0.025=1.96。 5. 做出推断及生物学解释:
∵ ∣u∣ <u0.025 ,P>0.05, ∴接受H0:μ=μ0 ,即可以认为这10只动物抽自总
第四章 统计推断3PPT课件
u x
x
其中平均数标准误为:
x
n
由于假设H0:μ=μ0,故:
x
u
0
x
由于总体标准差不易求得,若为大样本, 可以用样本标准差估计总体标准差,则样 本平均数的标准误及u值为:
sx
s n
x
u
0
sx
如果实得 u u ,则否定H0,接受HA。当
时 u u ,接受H0。
大样本平均数的检验
❖ 例4.1 ❖ 解题思路:总体标准差已知,故采用u双尾检
本例利U分 用布 了来|u估 |2.5计 6的 2 尾区概率, u检所 验以 。称
ux0 称为检验统计量。 / n
3 双侧检验与单侧检验
在例一里,HA 备 :择 0。 假 HA实 设际 是上包 0含 或 0这两种情水 况平 ,的 此拒 时 ( , 绝 u/域 2] 为
和 [u/2,)。
这种利用两的 个检 尾验 部称 进作 行 双 双侧 侧检 检验 验的 。
首先对样本所 作在 一的 假总 设体 。假 药设 剂喷 的洒 玉了 米单
总体平与 均原 数来的玉米 体单 平穗 均 0之重 数 间总 没有真实 即=0。也就是说表 x面 0)差 是异 由( 抽样误 。差造成
0被称为零假设 设或 ,无 记 H0效 :为 假 0.
所谓“零”就是指处理(药剂) 没有效果
H0是待检验的假 可设 能, 被它 接有 受, 被也 否有 定可 。 因此,需要设 立定 的一 假个 设对 ,称 设为 。备择假
验 ❖ 检验步骤: ❖ 无效假设H0:1=2.即新育苗方法与常规育
苗方法所育鱼苗体长相同 ❖ 备择假设HA:12即新育苗方法与常规育
苗方法所育鱼苗体长不相同
❖ 选取显著水平α=0.05
统计推断包括参数估计和假设检验(1).ppt
nn
n
D( X )= n
1 n2
D(X)=
1 n2
nP(1 -
P)=
1 n
P(1 -
P)
N很大时,即np>5且nq>5时,可用正态分布近似求 解.
即:X ~N(P,1 P(1- P))
n
n
当试验足够多次时,有样本比例p
Z = pˆ - p ~ N 0, 1 p 1 - p
n
▪ 可以得到总体比例的置信区间
pˆ Z 2
P(1 n
P)
,
pˆ
Z
2
P(1 P) n
▪ 由于在估计总体比例时,总体比例P是未知数,可 以用样本比例代替。
例6.15 某电视台希望了解每日“晚间新闻”栏目的 收视率,随机抽取了400人进行调查,结果表明了有 71.2%的人观看了此节目,试估计该栏目收视率具有 90%可靠性的置信区间。
的点估计量,有E(X1
-
X2 )=μ1
-μ2 ,D(X1
-
X
2
)
=
σ12 n1
+σ22 n2
则(X1 - X2 )-(μ1 -μ2)~N(0,1) σ12 +σ22 n1 n2
μ1 -μ2置信区间为:
X1 - X2 - Zα
2
σ12 n1
+σ22 n2
,X1
-
X2
+
Zα 2
σ12 n1
+σ22 n2
设x1 , ...., xn是抽自密度为f ( x; )的一个样本, 对给定的0 1, 如能求得统计量和, 使P( )=1 , 则称 , 为的置信度为1 的置信区间。 和 均是样本估计量 的函数,被称为 的 置信下限和置信上限,1 为置信度, 表示区间估计的可靠程度,为显著性水平。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
E(X )
E(
Xi
i 1
n
)
1 n
n i 1
E( X i )
1 n
nE( X )
E( X )
E(S 2 )
E( 1 n 1
n i 1
(Xi
X
)2 )
1 [E n 1
n i 1
(Xi
X
)2 ]
D(X )
如果统计量为Sn2
1 n
n i1
(Xi
X
)2,则E(Sn2 )
D( X
)
此时,E
(Sn2
D( ) 2[E( )-E( )][E( )- ] [E( )- ]2
具有最小的均方误差的估计量是最优的估计量
E[( )2] D( ) [E( )- ]2
D( ) [Bias(ˆ)]2
如果E(1)= ,E(2 ) ,但D(1)>D(ˆ2 )
若有:E[(1 )2]<E[(2 )2]
1 比 2 好
试验中发生的概率,则对于任意的 0,
有 lim P{ m p } 1
n n
这个定理说明了:当观察次数n很大时,用 某随机现象在大量观察中发生的实际频率来 代替该现象发生的真实概率差别是很小的。
定理6.3:设X
1
,
X
2
........
X
是独立同分布变量,
n
且每个随机变量服从正态分布N (, 2 ).
)=
n
1 n
D(
X
)
2.有效性: 若参数θ1,θ2都是参数θ的无偏估计量, 但有关系式E(θ1-θ)2 ≤ E(θ2-θ)2,则称θ1比θ2有效。
θ1比θ2更紧密地分布在总体参数周围,θ1比θ2有效.
θˆ1抽样分布
估计量
θˆ2抽样分布
总体参数
E(ˆ1) E(ˆ2 )
评价估计量好坏的标准 ▪ 无偏比有偏好 ▪ 方差小的好
由于按随机原则取样,在试验之前,人们无法预言试验的结 果,所以X1,X2 ,...Xn是一组随机变量, 而在试验之后,得到X1,X2 ,...Xn的一组观察值x1,x2 ,.....xn , 则为一组确定的数值。
2.抽样分布有关的几个定理:
定这理个6.(1定切理比说雪明夫了大:数从定总律体)中设抽X取1,的X 2简,..单..X随n是独立
同机分样布本的得随到机的变统量计,量且有X相,同其的抽有样限分的布的数 数学学期期望望等和于方总差体:分布的数学期望。
E( X i ) , D( X i ) 2 (i 1,2,.....) 则对任意的 0,有
1
lim P{ n n
n i 1
Xi
}1
定理6.(2 贝努里大数定律)设m是n次 试验中事件A发生的次数,p是事件A在每次
如果E(θ1)=θ,E(θ2 )≠θ,但D(θ1)> D(θˆ2 ) 怎么办?
如果E(θ1)=θ,E(θ2 )≠θ,但D(θ1)> D(θˆ2 ),这时可以用 估计量的均方误差(MSE)为评价准则。
3.最小均方误差MSE
MSE( )=E[( )2] =E{[ -E( )]+[E( )- ]}2
最小均方误差
统计推断包括参数估计和假设检验,即通过 样本统计量来估计和检验总体的参数。统计推断 的目的在于认识未知的总体参数及其分布特征。
第六章 参数估计与假设检验
▪ 6.1 ▪ 6.2 ▪ 6.3 ▪ 6.4 ▪ 6.5
样本及其分布 点估计 参数的区间估计 样本容量的确定 假设检验
6.1 样本及其分布
▪ 参数估计的主要内容是研究如何通过样本提 供的信息估计总体的数字特征。
1为无偏估计量,3 的方差最小, 但MSE(ˆ2 )最小
ˆ2的抽样分布
(有偏的估计量)
ˆ3的抽样分布 (Var(ˆ3 )最小)
ˆ1的抽样分布
(无偏估计量)
E(ˆ1)E(ˆ2)
Bias(ˆ3 )
估计量
E(ˆ3)
总体参数
4.一致性
当样本容量趋于无穷大时,若估计量ˆ 依概率收敛于待估参数,即对任意 0, 有 lim P{ˆ } 1
1
lim n
P
n
i
Xi
E(X i
D(X ) i
)
x
x
n
1
t2
e 2 dt
2
6.2 点估计
一、点估计量的评价准则 无偏性、有效性、最小均方误差、一致性
1.无偏性 若参数θ的估计量θˆ 满足E(θˆ )=θ, 则称θˆ 是θ的无偏估计。
简单随机样本的样本均值是总体期望的无偏估计.
简单随机样本的样本方差是总体方差的无偏估计
解方程即得未知参数 的最大似然估计值 ˆ.
最大似然估计法也适用于分布中含有多个 未知参数的情况. 此时只需令
x
则称ˆ为的一致估计量。
二、点估计方法
▪ 如果在参数的估计中直接用样本估计量之数值作为 待估总体参数的估计量,就是参数的点估计。
▪ 点估计方法:
(1)极大似然估计(MLE)
(2)矩估计法
极大似然估计法是由费舍尔引进的.
求极大似然估计量的步骤:
(一) 写出似然函数
n
L( ) L( x1, x2 ,, xn; ) p( xi; )
n
n i
EX i
1n
1n
n 2 2
D( X )
D( n
i 1
Xi)
n2
D(
i 1
Xi)
n2
D( Xi )
i 1
n2
n
定理6.4(Lindeberg-Levy中心极限定理)
设X1, X 2,...X n ,...是独立同分布的随机变量, 而且E(Xi )、D(Xi)存在,D(Xi) 0,则对一切x有
i 1
n
或 L( ) L( x1, x2 ,, xn; ) f ( xi; );
(二) 取对数
i 1
n
n
ln L( ) ln p( xi; ) 或 ln L( ) ln f ( xi; );
i 1
i 1
(三) 对 求导 d ln L( ) , d
并令
d
ln L( d
)
0,
对数似 然方程
▪ 我们把被观察对象的全体称作总体,把从总 体中按照随机原则抽出的个体组成的小群体 称为样本,而样本中所包含的个体数称为样 本容量。
1.总体和样本
设X是一个随机变量,X1,X2 ,......,Xn是一组相互独立与X 具有相同分布的随机变量,称X为总体.X1,X2 ,......,Xn为 来自总体的简单随机样本,简称样本,n为样本容量, 称样本观察值为样本值。
则其均值X
1 n
n i 1
X
i
,服从参数为(
,
2
n
)的
正态分布。即X~N(, 2 )
n
这个定理说明了:对于n个独立的且都服从相 同的正态分布的随机变量而言,它们的均值仍 然服从正态分布,所改变的只是分布的参数。
▪ 定理6.3得出
1 n
1
n
1
E(X )
E( n
i 1
Xi )
n
E(
i 1
Xi )