第17讲 区间估计(课堂PPT)
合集下载
数理统计之区间估计(ppt 50页)
很小的正数.
置信水平的大小是根据实际需要选定的.
例如,通常可取置信水平1 =0.95或0.9等.
根据一个实际样本,由给定的置信水平,我
们求出一个尽可能小的区间 [ˆ1,ˆ2],使
P {ˆ1ˆ2}1
称区间 [ˆ1,ˆ2]为 的 置信水平为1 的
置信区间.
寻找置信区间的方法,一般是从确定 误差限入手.
教材上讨论了以下几种情形:
单个正态总体均值和方差 2的区间估计.
两个正态总体均值差 1 2和方差比
的区间估计.
2 1 2 2
比例 p 的区间估计.
下面我们举几个例子,其余部分请自己看.
休息片刻继续
例2 已知某地区新生婴儿的体重X~N(,2),
, 2未知,
…
随机抽查100个婴儿 得100个体重数据 X1,X2,…,X100
相应的置信区间平均长度越长.
也就是说,要想得到的区间估计可靠 度高,区间长度就长,估计的精度就差. 这是一对矛盾.
实用中应在保证足够可靠的前提下, 尽量使得区间的长度短一些 .
例3 某单位要估计平均每天职工的总医疗费, 观察了30天,其总金额的平均值是170元,标准 差为30元,试决定职工每天总医疗费用平均值 的区间估计(置信水平为0.95).
(ˆ1 ˆ2) 满足
P {ˆ1ˆ2}1
则称区间 [ˆ1,ˆ2]是 的置信水平(置信度、
置信概率)为 1 的置信区间.
ˆ1和ˆ2 分别称为置信下限和置信上限.
可见,
对参数 作区间估计,就是要设法找出
两个只依赖于样本的界限(构造统计量)
ˆ1 ˆ1(X1,…Xn) ˆ2 ˆ2(X1,…Xn)
下面我们就来正式给出置信区间的定义, 并通过例子说明求置信区间的方法.
置信水平的大小是根据实际需要选定的.
例如,通常可取置信水平1 =0.95或0.9等.
根据一个实际样本,由给定的置信水平,我
们求出一个尽可能小的区间 [ˆ1,ˆ2],使
P {ˆ1ˆ2}1
称区间 [ˆ1,ˆ2]为 的 置信水平为1 的
置信区间.
寻找置信区间的方法,一般是从确定 误差限入手.
教材上讨论了以下几种情形:
单个正态总体均值和方差 2的区间估计.
两个正态总体均值差 1 2和方差比
的区间估计.
2 1 2 2
比例 p 的区间估计.
下面我们举几个例子,其余部分请自己看.
休息片刻继续
例2 已知某地区新生婴儿的体重X~N(,2),
, 2未知,
…
随机抽查100个婴儿 得100个体重数据 X1,X2,…,X100
相应的置信区间平均长度越长.
也就是说,要想得到的区间估计可靠 度高,区间长度就长,估计的精度就差. 这是一对矛盾.
实用中应在保证足够可靠的前提下, 尽量使得区间的长度短一些 .
例3 某单位要估计平均每天职工的总医疗费, 观察了30天,其总金额的平均值是170元,标准 差为30元,试决定职工每天总医疗费用平均值 的区间估计(置信水平为0.95).
(ˆ1 ˆ2) 满足
P {ˆ1ˆ2}1
则称区间 [ˆ1,ˆ2]是 的置信水平(置信度、
置信概率)为 1 的置信区间.
ˆ1和ˆ2 分别称为置信下限和置信上限.
可见,
对参数 作区间估计,就是要设法找出
两个只依赖于样本的界限(构造统计量)
ˆ1 ˆ1(X1,…Xn) ˆ2 ˆ2(X1,…Xn)
下面我们就来正式给出置信区间的定义, 并通过例子说明求置信区间的方法.
区间估计ppt课件
极端值处理问题
剔除极端值
在数据分析前,对极端值进行识别和处理,如采用箱线图、Zscore等方法剔除异常值。
转换数据
对数据进行适当的转换,如对数转换、平方根转换等,使极端值的 影响减小。
使用稳健统计量
采用对极端值不敏感的稳健统计量进行区间估计,如中位数、截尾 均值等。
多重比较问题
控制比较次数
在实验设计和数据分析阶段,合理控制比较次数,避免不必要的 多重比较。
02
抽样分布与中心极限定理
抽样分布概念及类型
抽样分布概念
从总体中随机抽取一定数量的样本,统计量的分布称为抽样分布。
常见抽样分布类型
正态分布、t分布、F分布、卡方分布等。
中心极限定理内容及应用
中心极限定理内容
当样本量足够大时,无论总体分布如何,样本均值的分布将近似于正态分布。
中心极限定理应用
在统计学中,中心极限定理是推断统计的理论基础,常用于区间估计、假设检验 等。
构造方法
根据样本均值、标准差和样本量,结 合正态分布或t分布的性质,可以构造 出总体均值的置信区间。
比例p置信区间构建方法
二项分布与比例估计
01
当总体服从二项分布时,样本比例是总体比例的一个良好估计
量。
置信区间的构造
02
利用样本比例、样本量和二项分布的性质,可以构造出总体比
例的置信区间。
注意事项
03
配对样本t检验原理及应用
原理
配对样本t检验是通过比较同一组样本在不同条件下的均值差异来检验两个总体均值是否存在显著差 异的方法。其原假设为两个总体均值相等,备择假设为两个总体均值不等或大于/小于另一个总体均 值。
应用
配对样本t检验适用于前后测量、两种处理方法等配对设计的数据分析。例如,在医学领域,可以通过 配对样本t检验来比较同一种药物在不同剂量下的疗效差异;在教育领域,可以通过配对样本t检验来 比较同一种教学方法在不同班级中的教学效果差异。
概率论区间估计(课堂PPT)
14.6,15.1,14.9,14.8,15.2,15.1 (1)试求该天产品的平均直径EX的点估计; (2)若已知方差为0.06,试求该天平均直径EX的置信
区间:=0.05;=0.01。
解 (1)由矩法估计得EX的点估计值为
E ¶ X x 1 1 4 .6 1 5 .1 1 4 .9 1 4 .8 1 5 .2 1 5 .1 1 4 .9 5
由抽取的9个样本,可得 S 0 .1 8x 2 1 .4n 9
由 10.95得 0.05 查表得 t0.025(8)2.306
t2(8)Sn2.3060.1 980.13836
全部口杯的平均重量的置信区间为(21.26,21.54)
11
P127例5与P126例3的比较:
解 由题设可知:平均消费额X~N(,2)
1( X1,X2,…,Xn ), 2( X1,X2,…,Xn ), 使得P{1 << 2}=1- ,则称随机区间( 1 , 2 )为 参数的置信度(或置信水平)为1- 的置信区间。
1——置信下限 2——置信上限
4
几点说明
1、参数的置信水平为1-的置信区间( 1, 2) 表示该区间有100(1-)%的可能性包含总体参 数的真值。
1
区间估计的思想
点估计总是有误差的,但没有衡量偏差程度的量, 区间估计则是按一定的可靠性程度对待估参数给出一个 区间范围。
引例 设某厂生产的灯泡使用寿命X~N(,1002),现 随机抽取5只,测量其寿命如下:1455,1502,1370, 1610,1430,则该厂灯泡的平均使用寿命的点估计值为
x 1 1 4 5 5 1 5 0 2 1 3 7 0 1 6 1 0 1 4 3 0 1 4 7 3 .4
区间:=0.05;=0.01。
解 (1)由矩法估计得EX的点估计值为
E ¶ X x 1 1 4 .6 1 5 .1 1 4 .9 1 4 .8 1 5 .2 1 5 .1 1 4 .9 5
由抽取的9个样本,可得 S 0 .1 8x 2 1 .4n 9
由 10.95得 0.05 查表得 t0.025(8)2.306
t2(8)Sn2.3060.1 980.13836
全部口杯的平均重量的置信区间为(21.26,21.54)
11
P127例5与P126例3的比较:
解 由题设可知:平均消费额X~N(,2)
1( X1,X2,…,Xn ), 2( X1,X2,…,Xn ), 使得P{1 << 2}=1- ,则称随机区间( 1 , 2 )为 参数的置信度(或置信水平)为1- 的置信区间。
1——置信下限 2——置信上限
4
几点说明
1、参数的置信水平为1-的置信区间( 1, 2) 表示该区间有100(1-)%的可能性包含总体参 数的真值。
1
区间估计的思想
点估计总是有误差的,但没有衡量偏差程度的量, 区间估计则是按一定的可靠性程度对待估参数给出一个 区间范围。
引例 设某厂生产的灯泡使用寿命X~N(,1002),现 随机抽取5只,测量其寿命如下:1455,1502,1370, 1610,1430,则该厂灯泡的平均使用寿命的点估计值为
x 1 1 4 5 5 1 5 0 2 1 3 7 0 1 6 1 0 1 4 3 0 1 4 7 3 .4
§6.2区间估计精品PPT课件
§6.2 区间估计
前面,我们讨论了参数点估计. 它是用 样本算得的一个值去估计未知参数.
点估计的缺点:
1.没有指出误差; 2没有指出产生误差的概率. 区间估计正好弥补了点估计的这个缺陷 .
一、 置信区间定义:
设 是 一个待估参数,给定 0,
若由样本X1,X2,…Xn确定的两个统计量
ˆ1 ˆ1( X1, X2,, Xn ),ˆ2 ˆ2 ( X1, X2,, Xn )
n
n
(Xi )2
(Xi )2
P{ i1 2 (n) 2
2
i 1
2 1
2
(n)
} 1
(2)μ未知:
取 2
nS
2 n
2
~
2 (n 1)
P{12 2 (n 1)Βιβλιοθήκη nS2 n2
2 (n 1)} 1 2
P{
2
nSn2 (n
1)
2
2
nS
2 n
2 1
2
(n
} 1
1)
2.两个总体方差比的置信区间:
信区间.
三、总体均值的置信区间
1.单个总体均值的置信区间 设X1,…Xn是取自X~N(μ,σ2) 的样本, 求参数 μ
的置信度为 1-α的置信区间.
(1)σ2 已知:
取 U X ~ N (0,1) n
P{|
X
n
|
u
2} 1
P{X
n
u
2
X
n
u
2}
1
例1 设X~N(μ,1.52),样本为11,9,14,10,12,7,13,11,12, 求参数μ的置信度为 95%的置信区间.
的置信度为 1-α的置信区间.
前面,我们讨论了参数点估计. 它是用 样本算得的一个值去估计未知参数.
点估计的缺点:
1.没有指出误差; 2没有指出产生误差的概率. 区间估计正好弥补了点估计的这个缺陷 .
一、 置信区间定义:
设 是 一个待估参数,给定 0,
若由样本X1,X2,…Xn确定的两个统计量
ˆ1 ˆ1( X1, X2,, Xn ),ˆ2 ˆ2 ( X1, X2,, Xn )
n
n
(Xi )2
(Xi )2
P{ i1 2 (n) 2
2
i 1
2 1
2
(n)
} 1
(2)μ未知:
取 2
nS
2 n
2
~
2 (n 1)
P{12 2 (n 1)Βιβλιοθήκη nS2 n2
2 (n 1)} 1 2
P{
2
nSn2 (n
1)
2
2
nS
2 n
2 1
2
(n
} 1
1)
2.两个总体方差比的置信区间:
信区间.
三、总体均值的置信区间
1.单个总体均值的置信区间 设X1,…Xn是取自X~N(μ,σ2) 的样本, 求参数 μ
的置信度为 1-α的置信区间.
(1)σ2 已知:
取 U X ~ N (0,1) n
P{|
X
n
|
u
2} 1
P{X
n
u
2
X
n
u
2}
1
例1 设X~N(μ,1.52),样本为11,9,14,10,12,7,13,11,12, 求参数μ的置信度为 95%的置信区间.
的置信度为 1-α的置信区间.
《点估计与区间估计》课件
间。
区间估计在假设检验中的应用
在假设检验中,我们通常使用区间估计来确定样本数据是 否支持原假设或备择假设。
点估计与区间估计在回归分析中的应用
点估计在回归分析中的应用
在回归分析中,我们通常使用最小二乘法等统计方法来得到参数的点估计值,并以此为 基础进行预测和推断。
区间估计在回归分析中的应用
除了点估计外,我们还可以使用区间估计来评估模型参数的可能取值范围,从而更全面 地了解模型的预测精度和不确定性。
适用场景
适用于已知概率分布模型的情况,广泛应用于统 计学、机器学习等领域。
最小二乘法
总结词
基于误差平方和最小的点估 计方法
详细描述
最小二乘法是一种基于误差 平方和最小的点估计方法。 它通过最小化观测值与预测 值之间的误差平方和来估计 参数。这种方法在回归分析 、时间序列分析等领域广泛 应用。
数学公式
计算方法
根据样本数据和适当的统计量,通过计算得到参数的 置信下限和置信上限。
应用场景
当需要了解某一参数的可能取值范围时,可以使用双 侧置信区间。
置信区间与置信概率
定义
置信区间是指在一定置信概率下 ,某一参数的可能取值范围。而 置信概率是指对参数取值范围的 信任程度。
关系
置信概率越高,则对应的置信区 间越窄,说明对参数的估计越精 确。
应用场景
在统计推断中,经常需要根据样 本数据和适当的统计量,计算某 一参数的置信区间和对应的置信 概率,以评估对参数的估计精度 和信任程度。
05
点估计与区间估计
的应用场景
点估计在统计推断中的应用
总体参数的点估计
点估计是对总体参数的一个具体的数值估计, 例如,使用样本均值来估计总体均值。
区间估计在假设检验中的应用
在假设检验中,我们通常使用区间估计来确定样本数据是 否支持原假设或备择假设。
点估计与区间估计在回归分析中的应用
点估计在回归分析中的应用
在回归分析中,我们通常使用最小二乘法等统计方法来得到参数的点估计值,并以此为 基础进行预测和推断。
区间估计在回归分析中的应用
除了点估计外,我们还可以使用区间估计来评估模型参数的可能取值范围,从而更全面 地了解模型的预测精度和不确定性。
适用场景
适用于已知概率分布模型的情况,广泛应用于统 计学、机器学习等领域。
最小二乘法
总结词
基于误差平方和最小的点估 计方法
详细描述
最小二乘法是一种基于误差 平方和最小的点估计方法。 它通过最小化观测值与预测 值之间的误差平方和来估计 参数。这种方法在回归分析 、时间序列分析等领域广泛 应用。
数学公式
计算方法
根据样本数据和适当的统计量,通过计算得到参数的 置信下限和置信上限。
应用场景
当需要了解某一参数的可能取值范围时,可以使用双 侧置信区间。
置信区间与置信概率
定义
置信区间是指在一定置信概率下 ,某一参数的可能取值范围。而 置信概率是指对参数取值范围的 信任程度。
关系
置信概率越高,则对应的置信区 间越窄,说明对参数的估计越精 确。
应用场景
在统计推断中,经常需要根据样 本数据和适当的统计量,计算某 一参数的置信区间和对应的置信 概率,以评估对参数的估计精度 和信任程度。
05
点估计与区间估计
的应用场景
点估计在统计推断中的应用
总体参数的点估计
点估计是对总体参数的一个具体的数值估计, 例如,使用样本均值来估计总体均值。
参数的点估计及区间估计PPT46页
参数的点估计及区间估计
1、合法而稳定的权力在使用得当时很 少遇到 抵抗。 ——塞 ·约翰 逊 2、权最大限度地行使权力总是令人反感 ;权力 不易确 定之处 始终存 在着危 险。— —塞·约翰逊 4、权力会奴化一切。——塔西佗
5、虽然权力是一头固执的熊,可是金 子可以 拉着它 的鼻子 走。— —莎士 比
46、我们若已接受最坏的,就再没有什么损失。——卡耐基 47、书到用时方恨少、事非经过不知难。——陆游 48、书籍把我们引入最美好的社会,使我们认识各个时代的伟大智者。——史美尔斯 49、熟读唐诗三百首,不会作诗也会吟。——孙洙 50、谁和我一样用功,谁就会和我一样成功。——莫扎特
1、合法而稳定的权力在使用得当时很 少遇到 抵抗。 ——塞 ·约翰 逊 2、权最大限度地行使权力总是令人反感 ;权力 不易确 定之处 始终存 在着危 险。— —塞·约翰逊 4、权力会奴化一切。——塔西佗
5、虽然权力是一头固执的熊,可是金 子可以 拉着它 的鼻子 走。— —莎士 比
46、我们若已接受最坏的,就再没有什么损失。——卡耐基 47、书到用时方恨少、事非经过不知难。——陆游 48、书籍把我们引入最美好的社会,使我们认识各个时代的伟大智者。——史美尔斯 49、熟读唐诗三百首,不会作诗也会吟。——孙洙 50、谁和我一样用功,谁就会和我一样成功。——莫扎特
02-区间估计原理PPT
无偏性(unbiasedness):估计量的数学期望
等于被估计的总体参数
P(ˆ)
无偏
A
有偏
B
ˆ
有效性
(efficiency)
பைடு நூலகம்
有效性:对同一总体参数的两个无偏点估计
量,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
ˆ2的抽样分布
A
ˆ
一致性
(consistency)
• 一致性:随着样本量的增大,估计量的
区间中的一个,但它也可能是少数几个不包含参数真
值的区间中的一个
总体参数以一定的概率落在这一区间的表述是错误的。
置信区间
(95%的置信区间)解释:假设共可抽取20个可能样本
点估计值
重复构造出的20个置信区间:其中5%(即1
个)个区间不含真值,95%个区间含真值
3.点估计量
(评价点估计量的标准)
ҧ
+1.65 x
90%的样本
95% 的样本
99% 的样本
+2.58x
+1.96x
x
•
ҧ
P{|−
|≤
·ҧഥ
}=1- ⟹ ҧ- ·ҧ ≤ u ≤ ҧ+
2
2
2
3.点估计与区间估计联系
比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量
21.区间估计原理
一、估计量与估计值
(estimator & estimated value)
我们进行估计的目的是什
么?为什么?
1. 估计量:用于估计总体参数的随机变量
等于被估计的总体参数
P(ˆ)
无偏
A
有偏
B
ˆ
有效性
(efficiency)
பைடு நூலகம்
有效性:对同一总体参数的两个无偏点估计
量,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
ˆ2的抽样分布
A
ˆ
一致性
(consistency)
• 一致性:随着样本量的增大,估计量的
区间中的一个,但它也可能是少数几个不包含参数真
值的区间中的一个
总体参数以一定的概率落在这一区间的表述是错误的。
置信区间
(95%的置信区间)解释:假设共可抽取20个可能样本
点估计值
重复构造出的20个置信区间:其中5%(即1
个)个区间不含真值,95%个区间含真值
3.点估计量
(评价点估计量的标准)
ҧ
+1.65 x
90%的样本
95% 的样本
99% 的样本
+2.58x
+1.96x
x
•
ҧ
P{|−
|≤
·ҧഥ
}=1- ⟹ ҧ- ·ҧ ≤ u ≤ ҧ+
2
2
2
3.点估计与区间估计联系
比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量
21.区间估计原理
一、估计量与估计值
(estimator & estimated value)
我们进行估计的目的是什
么?为什么?
1. 估计量:用于估计总体参数的随机变量
统计学原理(区间估计).PPT
置信下限和置信上限 置信水平。 置信下限 置信上限,1置信水平 θ1 及θ2分别称为置信下限 置信上限 α称为置信水平 说明:(1)式表示( θ 1 , θ 2)包含未知参数θ的真值概率为1-α,如
θ 则称随机区间(θ , )是θ置信区间 置信区间, 置信区间
如何求未知参数的置信区间呢?下面通过一个例子阐述其方法。
σ/ n
S / n
~ N (0, 1)
~ t ( n 1)
上页
结束
2 、 σ2未知,的1- α置信区间
X n
X P < t α (n 1) = 1 α 故对给定的置信概率1-α,有 S/ n 2 S S P X t α (n 1) < < X + t α (n 1) = 1α n n 2 2
下页
结束
二、两个正态总体均值差及方差比的1-α置信区间 设总体 X ~ N (1,σ12) Y ~ N (2,σ2 2) 相互独立
X 1 , X 2 ,L , X n1 和Y1 , Y2 ,L , Yn2 分别是来自总体X和Y的样本
(n 1)s2 2 2 Pχ α (n 1) < < χα (n 1) =1α σ2 12 2
σ2 的1-α置信区间为:
n ( xi ) 2 ∑ i =1 , 2 χ α (n) 2
首页
∑ ( xi ) i =1 χ 2 α (n) 1 2
n 2
1 ( x2i ) 2 ~ χ 2 (n) σn 1)S (2 ∑ (n 1)S2 2 i=1 2 , 2 n ( 1) 1 2 (χαn2S ) ~χχα (n 1)) 1 (n 1 2 2σ
n
上页
下页
例2. 从车床加工的一批零件中随机抽取16个进行试验,测得零件 长度如下(单位:cm) 2.15 2.10 2.12 2.10 2.14 2.11 2.15 2.13 2.13 2.11 2.14 2.13 2.12 2.13 2.10 2.14
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6
(1)式的含义为:若反复抽样多次(各次得到的样本的容量相
等, 都是n), 每个样本值确定一个区间(q ,`q), 每个这样的区 间要么包含q的真值, 要么不包含q的真值, 按大数定律, 包含 q真值的约占100(1-a)%, 不包含q真值的约占100a%, 例如, 若a=0.01, 反复抽样1000次, 则得到的1000个区间中不包含q
按标准正态分布的上a分位点的定义, 有
P X
s
-m
n
za
/
2
1-a
,
(3)
a/2
-za/2
0
a/2
za/2
9
PσX
-μ n
zα
/
2
1 -α,
(3)
PX
-
σ n
zα /2
μ
X
σ n
zα
/
2
1 -α.(4)
这样就得到了m的一个置信水平为1-a的置信区间
X
-
σ n
zα / 2,X
σ n
一、区间估计的方法与步骤 二、正态总体均值的区间估计 三、正态总体方差的区间估计 四、两个正态总体均值差的区间估计 五、两个正态总体方差比的区间估计
3
一、区间估计的方法与步骤 对一个未知量, 人们在测量或计算时, 常不以得到近似值为满足,
还需估计误差, 即要求知道近似值的精确程度(亦即所求真值所在
释, 在这么多的区间中, 包含m的约占95%, 不包含m的约仅占 5%. 现在抽样得到区间(4.71,5.69), 则该区间属于那些包含m 的区间的可信程度为95%, 或"该区间包含m"这一陈述的可信
度为95%.
12
然而, 置信水平为1-a的置信区间并不是惟一的. 以上例
来说, 若给定a=0.05, 则又有
(1)寻求一个样本X1,X2,...,Xn的函数:
W=W(X1,X2,...,Xn;q), 它包含待估的参数q, 而不含其它未知参数, 并且W的分布已知 且不依赖于任何未知参数(当然不依赖于待估参数q);
15
(2) 对于给定的置信水平1-a, 定出两个常数a,b, 使 P{a<W(X1,X2,...,Xn;q)<b)1-a; (3) 若能从a<W(X1,X2,...,Xn;q)<b得到等价的不等式q < q <`q, 其中q=q(X1,X2,...,Xn), `q =`q(X1,X2,...,Xn)都是统计量, 那么(q,`q)就是q的一个置信水 平为1-a的置信区间. 函数W(X1,X2,...,Xn;q)的构造, 通常可以从q的点估计着手考虑.
真值的约仅为10个.
7
例 设总体X~N(m,s2), s2为已知, m为未知, 设X1,X2,...,Xn是 来自X的样本, 求m的置信水平为1-a的置信区间. 解 我们知道X是μ的无偏估计,且有
X - m ~ N( 0,1). sn
X - m 所服从的分布N(0,1)不依赖于任何未知参数 sn
8
σ n
z0 . 0 4
前者的区间长度为3.92 σ ,后者的区间长度 n
为4.08 σ ,比前者要大. n
14
易知, 象N(0,1)分布那样其概率密度的图形是单峰且对称的情 况, 当n固定时, 以形如(5)那样的区间其长度为最短. 我们自然 选用它.
通过上例, 可看到求未知参数q的置信区间的具体做法如下
❖ 了解正态总体的某些常用统计量的分布。 ❖ 理解点估计的概念。 ❖ 掌握矩估计法和极大似然估计法。 ❖ 了解估计量的评选标准(无偏性、有效性、一致性)。 ❖ 理解区间估计的概念。 ❖ 会求单个正态总体的均值和方差的置信区间。 ❖ 了解两个正态总体的均值差和方差比的置信区间。
2
第七章 参数估计
第四节 区间估计
P
z0.04
X
σ
-μ nz0.01 Nhomakorabea0.95,
PX
-
σ n
z0.01
μ
X
σ n
z0.04
0.95.
故
X
-
σ n
z0.01,X
σ n
z0.04
(8)
也是置信水平为0.95的置信区间.
13
而比较两个置信区间
X
-
σ n
z0.025,X
σ n
z0 . 0 2 5
和 X
-
σ n
z0 . 0 1,X
zα/2 .
(5)
常写成
X
σ n
zα/2 .
(6)
10
X
σ n
zα/2 .
(6)
如果取a=0.05, 即1-a=0.95, 又若s=1, n=16, 查表得
za/2=z0.025=1.96. 于是得到一个置信水平为0.95的置信区间
X 1 1.96,即(X 0.49). (7)
的范围). 类似地, 对于未知参数q, 除了求出它的点估计 外, 还希
望估计qˆ出一个范围, 并希望知道这个范围包含参数q真值的可信
程度. 这样的范围通常以区间的形式给出, 同时还给出此区间包
含参数q真值的可信程度. 这种形式的估计称为区间估计.
4
置信区间 设总体X的分布函数F(x;q)含有一个未知参数q, q(是q的可能取值范围), 对于给定值a(0<a<1), 若由样本 X1,X2,...,Xn确定的两个统计量q = q(X1,X2,...,Xn)和 `q =`q(X1,X2,...,Xn)(q <`q), 对于任意q 满足
16
再者, 若由一个观察值算得样本均值的观察值`x =5.20, 则得到 一个区间(5.200.49), 即 (4.71, 5.69)
11
最后得到的区间(4.71,5.69)已经不是随机区间了, 但我们 仍称它为置信水平为0.95的置信区间. 其含义是: 若反复抽样 多次, 每个样本值(n=16)按(4.7)式确定一个区间, 按上面的解
高等院校非数学类本科数学课程
大 学 数 学(四)
—— 概率论与数理统计
第17讲 区间估计
脚本编写:肖庆丰
教案制作:肖庆丰
1
第七章 参数估计
❖ 理解总体、个体、简单随机样本和统计量的概念,掌握 样本均值、样本方差及样本矩的计算。
❖ 了解卡方分布、t分布和F分布的定义及性质,了解分布 分位数的概念并会查表计算。
P{q(X1,X2,...,Xn) < q <`q(X1,X2,...,Xn)}1-a (1) 则称随机区间(q ,`q)是q的置信水平为1-a的置信区间, q 和 `q分别称为置信水平为1-a的双侧置信区间的置信下限和置
信上限.
5
当X是连续型随机变量时, 对于给定的a, 总是按要 求P(q < q <`q)=1-a求出置信区间, 而当X是离散型 随机变量时, 对于给定的a, 常常找不到区间(q ,`q) 使得P(q < q <`q)恰为1-a. 此时去找区间(q ,`q)使 得P(q < q <`q)至少为1-a, 且尽可能地接近1-a.
(1)式的含义为:若反复抽样多次(各次得到的样本的容量相
等, 都是n), 每个样本值确定一个区间(q ,`q), 每个这样的区 间要么包含q的真值, 要么不包含q的真值, 按大数定律, 包含 q真值的约占100(1-a)%, 不包含q真值的约占100a%, 例如, 若a=0.01, 反复抽样1000次, 则得到的1000个区间中不包含q
按标准正态分布的上a分位点的定义, 有
P X
s
-m
n
za
/
2
1-a
,
(3)
a/2
-za/2
0
a/2
za/2
9
PσX
-μ n
zα
/
2
1 -α,
(3)
PX
-
σ n
zα /2
μ
X
σ n
zα
/
2
1 -α.(4)
这样就得到了m的一个置信水平为1-a的置信区间
X
-
σ n
zα / 2,X
σ n
一、区间估计的方法与步骤 二、正态总体均值的区间估计 三、正态总体方差的区间估计 四、两个正态总体均值差的区间估计 五、两个正态总体方差比的区间估计
3
一、区间估计的方法与步骤 对一个未知量, 人们在测量或计算时, 常不以得到近似值为满足,
还需估计误差, 即要求知道近似值的精确程度(亦即所求真值所在
释, 在这么多的区间中, 包含m的约占95%, 不包含m的约仅占 5%. 现在抽样得到区间(4.71,5.69), 则该区间属于那些包含m 的区间的可信程度为95%, 或"该区间包含m"这一陈述的可信
度为95%.
12
然而, 置信水平为1-a的置信区间并不是惟一的. 以上例
来说, 若给定a=0.05, 则又有
(1)寻求一个样本X1,X2,...,Xn的函数:
W=W(X1,X2,...,Xn;q), 它包含待估的参数q, 而不含其它未知参数, 并且W的分布已知 且不依赖于任何未知参数(当然不依赖于待估参数q);
15
(2) 对于给定的置信水平1-a, 定出两个常数a,b, 使 P{a<W(X1,X2,...,Xn;q)<b)1-a; (3) 若能从a<W(X1,X2,...,Xn;q)<b得到等价的不等式q < q <`q, 其中q=q(X1,X2,...,Xn), `q =`q(X1,X2,...,Xn)都是统计量, 那么(q,`q)就是q的一个置信水 平为1-a的置信区间. 函数W(X1,X2,...,Xn;q)的构造, 通常可以从q的点估计着手考虑.
真值的约仅为10个.
7
例 设总体X~N(m,s2), s2为已知, m为未知, 设X1,X2,...,Xn是 来自X的样本, 求m的置信水平为1-a的置信区间. 解 我们知道X是μ的无偏估计,且有
X - m ~ N( 0,1). sn
X - m 所服从的分布N(0,1)不依赖于任何未知参数 sn
8
σ n
z0 . 0 4
前者的区间长度为3.92 σ ,后者的区间长度 n
为4.08 σ ,比前者要大. n
14
易知, 象N(0,1)分布那样其概率密度的图形是单峰且对称的情 况, 当n固定时, 以形如(5)那样的区间其长度为最短. 我们自然 选用它.
通过上例, 可看到求未知参数q的置信区间的具体做法如下
❖ 了解正态总体的某些常用统计量的分布。 ❖ 理解点估计的概念。 ❖ 掌握矩估计法和极大似然估计法。 ❖ 了解估计量的评选标准(无偏性、有效性、一致性)。 ❖ 理解区间估计的概念。 ❖ 会求单个正态总体的均值和方差的置信区间。 ❖ 了解两个正态总体的均值差和方差比的置信区间。
2
第七章 参数估计
第四节 区间估计
P
z0.04
X
σ
-μ nz0.01 Nhomakorabea0.95,
PX
-
σ n
z0.01
μ
X
σ n
z0.04
0.95.
故
X
-
σ n
z0.01,X
σ n
z0.04
(8)
也是置信水平为0.95的置信区间.
13
而比较两个置信区间
X
-
σ n
z0.025,X
σ n
z0 . 0 2 5
和 X
-
σ n
z0 . 0 1,X
zα/2 .
(5)
常写成
X
σ n
zα/2 .
(6)
10
X
σ n
zα/2 .
(6)
如果取a=0.05, 即1-a=0.95, 又若s=1, n=16, 查表得
za/2=z0.025=1.96. 于是得到一个置信水平为0.95的置信区间
X 1 1.96,即(X 0.49). (7)
的范围). 类似地, 对于未知参数q, 除了求出它的点估计 外, 还希
望估计qˆ出一个范围, 并希望知道这个范围包含参数q真值的可信
程度. 这样的范围通常以区间的形式给出, 同时还给出此区间包
含参数q真值的可信程度. 这种形式的估计称为区间估计.
4
置信区间 设总体X的分布函数F(x;q)含有一个未知参数q, q(是q的可能取值范围), 对于给定值a(0<a<1), 若由样本 X1,X2,...,Xn确定的两个统计量q = q(X1,X2,...,Xn)和 `q =`q(X1,X2,...,Xn)(q <`q), 对于任意q 满足
16
再者, 若由一个观察值算得样本均值的观察值`x =5.20, 则得到 一个区间(5.200.49), 即 (4.71, 5.69)
11
最后得到的区间(4.71,5.69)已经不是随机区间了, 但我们 仍称它为置信水平为0.95的置信区间. 其含义是: 若反复抽样 多次, 每个样本值(n=16)按(4.7)式确定一个区间, 按上面的解
高等院校非数学类本科数学课程
大 学 数 学(四)
—— 概率论与数理统计
第17讲 区间估计
脚本编写:肖庆丰
教案制作:肖庆丰
1
第七章 参数估计
❖ 理解总体、个体、简单随机样本和统计量的概念,掌握 样本均值、样本方差及样本矩的计算。
❖ 了解卡方分布、t分布和F分布的定义及性质,了解分布 分位数的概念并会查表计算。
P{q(X1,X2,...,Xn) < q <`q(X1,X2,...,Xn)}1-a (1) 则称随机区间(q ,`q)是q的置信水平为1-a的置信区间, q 和 `q分别称为置信水平为1-a的双侧置信区间的置信下限和置
信上限.
5
当X是连续型随机变量时, 对于给定的a, 总是按要 求P(q < q <`q)=1-a求出置信区间, 而当X是离散型 随机变量时, 对于给定的a, 常常找不到区间(q ,`q) 使得P(q < q <`q)恰为1-a. 此时去找区间(q ,`q)使 得P(q < q <`q)至少为1-a, 且尽可能地接近1-a.