【VIP专享】6-5区间估计
6区间估计
2 2 σ1 σ 2 σ 2 , σ 2 已知 2
( X Y ) ( μ1 μ2 ) t ( n1 n2 2) 1 1 Sω n1 n2
2 其中 Sω Sω , S 2 ( n1 1) S ( n2 1) S . ω n1 n2 2
2. 两个总体成数差 p1 p2 的置信区间
ˆ ˆ ( P1 P2 ) ( p1 p2 ) n1 , n2充分大时, p (1 p ) p (1 p ) N (0,1) 1 1 2 2 n1 n2
ˆ ˆ 用 P1 , P2 代替 p1 , p2 .
于是得到 p1 p2 的置信水平为 1 α 的置信区间为
速度 ,随机地取 I 型子弹 10 发 ,得到枪口速度的平
2 均值 为 x1 500( m s ) , 标准差 s1 1.10( m s ) ,随 机地取 Ⅱ 型子弹 20 发 ,得到枪口速度的平均值为 2 x2 496( m s ) , 标准差 s2 1.20( m s ) . 假设两总
1. 两个总体均值差 μ1 μ2 的置信区间
2 2 σ1 , σ 2 已知 1
( X Y ) ( μ1 μ2 )
2 2 σ1 σ 2 n1 n2
N (0,1)
于是得到 μ1 μ2 的置信水平为 1 α 的置信区间为
[ X Y Zα 2
2 2 2 2 σ1 σ 2 σ1 σ 2 , X Y Zα 2 ] n1 n2 n1 n2
解:
这里 1 α 0.95, α 2 0.025, n 1 15,
t0.025 (15) 2.1315.
1 16 x xi 503.75 , 16 i 1
概率论与数理统计-第6章-第4讲-区间估计
本讲内容
01 置信区间定义 02 求置信区间的步骤 03 几点说明
02 求置信区间的步骤
例 设X1,…Xn 是取自 N (, 2 ) 的样本, 2已知,
求参数 的置信水平为 1 的置信区间.
明确问题:求什么参数的置信区间?置信水平是多少?
解 选 的点估计为 X
寻找未知参数的
取 U X N (0,1) 一个良好估计 n
u
2} 1
1
为什么 这样取?
u
u
2
2
8
02 求置信区间的步骤
从中解得
P{|
X
n
|u2}源自1P{Xn u 2
X
n
u
2}
1
于是所求 的 置信区间为
[X
n u 2 ,
X
n u
2]
也可简记为 X n u 2
从例题的过程,我们归纳出求置信区间的
一般步骤如下:
1
u
u
2
2
9
02 求置信区间的步骤
求置信区间的步骤
10
本讲内容
01 置信区间定义 02 求置信区间的步骤 03 几点说明
03 几点说明
1. 要求 θ 以很大的可能被包含在 [θˆ1, θˆ2 ]
内,P(ˆ1 ˆ2 ) 1 要尽可能大.
即要求估计尽量可靠. 2. 估计的精度要尽可能的高. 如要求区间
长度 θˆ2 θˆ1 尽可能短.
置信度与精度是一对矛盾,当样本容 量固定时,置信度越高,则精度越差.
u
u
2
2
区间的长度为 2u —— 达到最短
2n
14
03 几点说明
特别说明
即使在概率密度不对称的情形,如
区间估计的基本概念
05
区间估计正好弥补了点估计的这个缺陷 .
06
1
2
3
4
5
6
也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值. 湖中鱼数的真值 [ ] 这里所说的“可靠程度”是用概率来度量的, 习惯上 这里α是一个很小的正数. 称为置信概率,置信度或置信水平. 置信水平记作1-α,
我们选取未知参数的某个估计量 ,
只要知道 的概率分布,确定误差限并不难.
称δ为 与θ之间的误差限.
由不等式
*
可以解出θ :
下面我们就来正式给出置信区间的定义, 这个不等式就是我们所求的置信区间. 并通过例子说明求置信区间的方法.
置信区间定义:
*
满足
设θ是一个待估参数,给定α>0,
例1 从一批灯泡中随机抽取5只作寿命试验,测得寿命X(单位:小时)如下:
1050,1100,1120,1250,1280
由于方差 未知,取样本函数
解: 的点估计取为样本均值
使
01
即
02
对给定的置信度1-α,确定分位数
03
得均值μ的置信水平为1-α的单侧置信区间为
04
将样本值代入得
*
若由样本X1,X2,…Xn确定的两个统计量
分别称为置信下限和置信上限.
则称区间
是θ的置信水平(置信度、置信概率)
为1-α的置信区间.
可见,
*
内.
对参数θ作区间估计,就是要设法找出两个 只依赖于样本的界限(构造统计量)
这里有两个要求:
2. 估计的精度要尽可能的高. 就是说,概率 要尽可能大. 即要求估计尽量可靠. 可靠度与精度是一对矛盾, 1. 要求θ以很大的可能被包含在区间 内. 尽可能短, 如要求区间长度 或能体现该要求的其它准则. 一般是在保证可靠度的条件下尽可能提高精度.
§6.5 区间估计 演示文稿1
2
2 Y 2, m
2
1 2 X Y 1 2 , n m
2 2
U=
X Y (1 2 )
1
n
2
2 2
0 ,1
U
X
/
N ( 0 , 1)
n
按 照 给 定 的 置 信 度 1 0.9 5 , 可 查 正 态 分 布 表 得
P (|U |< 1 .9 6 ) = 0 .9 5
即 P( |
X
把上式括号内的不等式变形得:
/
| 1.9 6 ) 0 .9 5
n
P X 1.9 6
n
2
X + 1.9 6
0 .9 5 n
2
由 置 信 区 间 的 定 义 可 看 出 : 区 间 [ X 1.9 6 内 环 高 度 的 置 信 度 为 0 .9 5 的 置 信 区 间 。
n
2
, X + 1.9 6
n
2
]就 是
下面把样本观察值代入
x 1.9 6
二、正态总体期望和方差的置信区间
1、已知方差,求期望的置信区间 因为样本均值是期望的无偏估计量,所以要构造的样本 函数必须含有样本均值和数学期望
由经验可知: U X
/
N ( 0 , 1)
U 1 - /2, 使 得
n
按 给 定 的 置 信 度 1 - , 查 正 态 分 布 表 得
§6.5 区间估计
一、基本概念和方法
6-5 两个正态总体均值及方差比的置信区间
6.5 两个正态总体均值差及 方差比的置信区间
1. 两正态总体均值差 µ1 − µ 2的置信区间
2 σ1 2. 两个总体方差比 2 的置信区间 σ2
3. 小结
设给定置信度为1 − α , 并设 X 1 , X 2 ,⋯, X n 为 第一个总体 N ( µ1 ,σ 1 )的样本 , Y1 ,Y2 ,⋯,Yn 为第二
要点回顾
无偏性 1. 估计量的评选的三个标准 有效性 相合性 2. 置信区间是一个随机区 (θ , θ ), 它覆盖未知参 间 ( 数具有预先给定的概率置信水平) , 即对于任
意的θ ∈Θ, 有 P{θ < θ < θ } ≥ 1−α. 求置信区间的一般步骤(分三步 分三步). 求置信区间的一般步骤 分三步
例4 分别由工人和机器人操作钻孔机在纲部件 上钻孔,今测得所钻的孔的深度(以cm计)如下 上钻孔,今测得所钻的孔的深度( 计
工人 操作 机器人 操作 4.02 3.64 4.03 4.02 3.95 4.06 4.00 4.01 4.03 4.02 4.01 4.00 3.99 4.02 4.00
2 σ1 , 由 X , Y 的独立性及 X ~ N µ1 , n1 2 2 σ1 σ 2 , + 可知 X − Y ~ N µ1 − µ 2 , n1 n2
2 σ2 , Y ~ N µ2 , n2
或
( X − Y ) − (µ1 − µ 2 ) ~ N (0, 1),
2 s1 s12 1 1 2 , 2 s F (6,7) s F (6,7) = ( 2.87,46.81). 0.95 2 2 0.05
这个区间的下限大于1,在实际中, 这个区间的下限大于 ,在实际中,我们就认为
区间估计
引例 已知 X ~ N ( ,1), x1,x2,…,xn 是一组样本值
的无偏、有效点估计为 X
常数 随机变量
不同的样本值算得的 的估计值不同, 因此除了给出未知参数的点估计外, 还希望 根据所给的样本确定一个随机区间,使其包 含参数真值的概率达到指定的要求.
如引例中,若要找一个区间,使其包含 的真 值的概率为0.95. ( 设 n = 5 )
~ N (0,1)
n
X 由 P z1 n
解
2
X
确定
2
z
1
2
n
z1
得 的置信度为 1 的置信区间为
( X z1
0
2
n
,
X z1
0
2
n
)
(2) 方差 2未知 , 的置信区间
S S X t1 (n 1) , X t1 (n 1) (2) n n
为什么要取 z1 / 2 ?
当置信区间为 ( X z1 区间的长度为 2 z
1
2
1 , X z 1 5
2
1 ) 时 5
1
2
5
——— 达到最短
0.4 0.3 0.2 0.1
取 = 0.05
-2
z
2
-1
0.4 0.3 0.2 0.1
1
z1
2 2
z1 z 1.96 (1.96)
14.95 1.96 0.1 )
X ~ t (5) 查表得 t (2) 取 T (5) 2.5706 S 10.025 6
区间估计资料
1-91
37
对给定的置信水平 使
,确定分位数
即
于是得到 的置信水平为 信区间为
的单侧置
1-91
38
即 的置信水平为 的单侧置信下限为
将样本值代入得 的置信水平为0.95的单侧置信下限是 1065小时
1-91
39
例5 为估计制造某种产品所需要的单件平均工时 (单位:小时),现制造5件,记录每件所需工时如 下 10.5 11.0 11.2 12.5 12.8 假设制造单位产品所需工时 试求平均工时的置信水平为0.95的单侧置信上限.
解 已知
由样本值算得:
查正态分布表得
得置信区间:
1-91
13
注意:置信区间并不是唯一的。 同样给定
置信区间越短,估计精度越高
1-91
14
(2) 未知方差,估计均值
可用样本方差:
构造统计量:
对于给定 的使 我们取对称区间
即:
查 分布表,得临界值 使
1-91
15
由 分布表
查 分布表
找出
其中, 是样本容量
第五讲 区间估计
在估计湖中鱼数的问题中,若我们根 据一个实际样本,得到鱼数 N 的极大似 然估计为1000条.
实际上,N的真值可能大于1000条, 也可能小于1000 条.
若我们能给出一个区间,在此区间内我们合理 地相信 N 的真值位于其中.这样对鱼数的估计就 有把握多了.
1-91
1
也就是说,我们希望确定一个区间,使我们能以 比较高的可靠程度相信它包含真参数值.
28
经计算得 X 6.0, (n1 1)S12 0.64 Y 5.7, (n2 1)S22 0.24
查表得t0.0025 (18) 2.1009, SW 0.2211
6.5 区间估计
n 1
2 2 ( x x ) 是 的无偏估计。 i
18 July 2014
第六章 参数估计
第25页
例6.5.5 假设轮胎的寿命服从正态分布。为估计某 种轮胎的平均寿命,现随机地抽12只轮胎试用, 测得它们的寿命(单位:万公里)如下: 4.68 4.85 4.32 4.85 4.61 5.02 5.20 4.60 4.58 4.72 4.38 4.70 此处正态总体标准差未知,可使用t分布求均值 的置信区间。经计算有 x =4.7092,s2=0.0615。取 =0.05,查表知t0.975(11)=2.2010,于是平均寿命 的0.95置信区间为(单位:万公里)
取 查表得
0.05
z / 2 1.96
18 July 2014
第六章 参数估计
第4页
这说明
X P 1.96 0.05 1 5
即
P X 1.96 15 X 1.96 15 0.95
X 1.96 15 , X 1.96 15
4.7092 2.2010 0.0615 / 12 [4.5516, 4.8668]
第六章 参数估计
第1页
第六章 参数估计
§6.1 §6.2 §6.3 §6.4 §6.5 点估计的几种方法 点估计的评价标准 最小方差无偏估计 贝叶斯估计 区间估计
18 July 2014
第六章 参数估计
第2页
§6.5 区间估计
引例 已知 X ~ N ( ,1),
的无偏、有效点估计为 X
常数 随机变量
称随机区间
为未知参数 的置信度为0.95的置信区间.
区间估计
S 12 S 12 1 1 2, 2 F1 α (m 1, n 1) S 2 Fα (m 1, n 1) S 2 2 2
由样本观测值
n1 = 18 , n2 = 13 ,
2 s1 = 0.34 , 2 s2 = 0.29 ,
又由 1 α = 0.90 ,得 1 α = 0.95 , α = 0.05 2 2 查表, 查表,得 Fα (m 1, n 1) = F0.05 (17, 12) = 2.59
1 1 n 2 1 n
置信区间与置信度的意义
95 如 :( , 为未知参数 的置信度为 % 的置信区间 θ θ) θ
若重复抽样 次 , 则在得到的 个区间中包含 100 100 个左右, θ 真值的有95个左右 , 不包含 真值的有5个左右. θ
θ真值落在每个区间的概 率是95%
求置信区间的步骤
不是随机区间
x ( 样本观察值为 = 5.2, 则得到区间 4.71,5.69)
若反复抽样多次, 若反复抽样多次,每个 这些区间中, 这些区间中,包含 样本值确定一个区间, 样本值确定一个区间,
%,不包含 的约占 95%,不包含 的约占 5%, 95%”
5 “( 4 . 71,. 69)属于那些包含 的区间的可信程度为
两样本相互独立。 X 分别为两样本的均值, 两样本相互独立 。 设 , Y 分别为两样本的均值 ,
2 S12 , S 2 分别为两样本的方差
σ1 求
2
σ2
2
1 的置信水平为 -α的置信区间
若1, 2未知
构造统计量
σ
2 S 12 S 2 2 1
σ
2 2
~ F ( n1 1, n 2 1 )
2 S 12 S 2 P F1α 2 ( n1 1, n2 1) < 2 2 < Fα 2 ( n1 1, n2 1) = 1 α σ1 σ2
统计学6区间估计
根据表1的数据,质检科估计出该天生产的食品每袋的平均 重量在101.38~109.34克之间,其中,估计的可信程度为95%, 估计误差不超过4克。产品的合格率在96.07%~73.93%之间,其 中,估计的可信程度为95,企业高层领导人提出几点意见:一是抽
总体标准差(未知)
STAT 样本标准差
s
误差边际
( x x)
n 1
2
7.77
s 7.77 x Z 2 Z 2 1.645* 2.13 n n 36
即(37.37,41.63)岁。
(3)90%的置信区间为39.5 ±2.13
注意
(1)置信系数一般在抽样之前确定,根据样本所建立的区间能 包含总体参数的概率为
x Z 2 x 1.96 x 1.96* 2 3.92
此时抽样误差的意义可表述为:以样本均值为中心的±3.92 的区间包含总体均值的概率是95%,或者说,样本均值产生的抽 样误差是3.92或更小的概率是0.95。 常用的置信度还有90%,95.45%,99.73%,他们对应的临 界值分别为1.645,2和3,可以分别反映各自的估计区间所对应 的精确程度和把握程度。
78.08,85.92
由于,从一个总体中抽取到的样本具有随机性,在一次偶然的 抽样中,根据样本均值计算所的区间并不总是可以包含总体均 值,它是与一定的 、x2 、x3 位置的样本均值建立的区间
STAT
所以我们有95%的把握说总体平均数u介于6例2:对某打土方 的工人作抽样调查,随机抽查144个工人, 据此求得每人每天平均完成工作量为5.25立方米。已知总体 服从正态分布,其标准差为1.5立方米,试用0.9545概率保 证,推断其全部工人每人每天平均完成工作量介于多少立 方米之间? 解:已知X—N( ,1.5)即总体服从正态分布。 z2=2 X=5.25 n=144
区间估计及假设检验算法实现方法详解
区间估计及假设检验算法实现方法详解随着数学、统计学等学科的发展,计算机技术在数学、统计学中扮演着越来越重要的角色。
在实际应用中,人们往往需要对各种数据进行分析处理以满足不同的需求,如何快速准确地进行数据分析,是一个非常重要的问题。
其中,区间估计和假设检验是数据分析中常用的两种方法。
本文将详细介绍这两种方法的实现方式。
一、区间估计区间估计是以样本统计量为基础,通过分析样本的信息来推断总体参数的取值范围,同时限定一定程度的误差。
通常,我们通过样本估计总体的平均数、标准差等参数,并对其进行区间估计。
常见的区间估计有置信区间、预测区间等。
1. 置信区间置信区间是指在给定的置信水平下,估计总体参数的取值范围。
在实际中,一个置信水平通常取95%或99%,即我们希望在95%或99%的数据中,总体参数的真实值可以被估计出来。
例如我们要估计一个总体的均值,使用样本均值计算出来一个估计值,并使用标准误和置信系数得到置信区间,那么这个置信区间的含义就是,我们认为有95%的置信度,总体均值在这个置信区间之内。
2. 预测区间预测区间是指在给定的置信水平下,预测一个新的数据值的取值范围。
通常,我们需要根据给定的样本数据来估计总体参数,并通过置信水平和误差限制得到一个预测区间。
例如,我们要预测未来一家公司的利润,使用以前几年公司利润值的样本数据,得到一组样本均值、标准误和置信系数等参数,根据置信系数和置信区间计算得到预测区间,那么这个预测区间的含义就是,在一定置信水平下,公司未来的利润值会在这个预测区间之内。
在实际进行区间估计的过程中,通常会使用计算机进行计算。
例如,在R语言中,我们可以使用以下代码实现置信区间的计算:```# 假设有一个样本数据data# 想要计算一个均值的置信区间result <- t.test(data, conf.level = 0.95)# 得到result$conf.int即为置信区间```我们可以看到,R语言中的t.test函数就可以方便地实现置信区间的计算,而不需要手动进行计算。
区间估计定义和计算
在一定条件下,W 通常具有经典分布(主要
有正态、2 、T、F分布);
4. 根据W的分布,对置信水平1-α查上侧分 位数,使
P{w1 2 W w 2 } 1
或类似的概率式成立.
电子科技大学
区间估计
5. 改写不等式得
P{A B} 1
May-20
其中A、B是不含未知参数的统计量.
电子科技大学
区间估计
May-20
称随机区间 [ˆ1为,ˆθ2的] 置信度为1-α
的区间估计(置信区间).
1-α又称置信水平或置信概率 α称显著性水平,通常取值为0.1,0.05.
思考:应如何理解概率式
P{ˆ1( X1 ,..., X n ) ˆ2 ( X1 ,..., X n )} 1
以较大概率包 含待估参数
上面过程的关键是构造枢轴变量W,并以它 为轴心,由a≤W≤b 旋转出所需不等式
A≤θ≤B.
电子科技大学
区间估计
三、正态总体的区间估计
May-20
单个正态总体:X~N(, 2)
1.的估计 1) 已知 =0:
U X ~ N (0,1) 0 n
P{ u
2
X
0
n
u
2}
1
[X
0
两稻种产量的期望差的置信区间
问题:能否用另外的方法求1-2的区间估计?
分析:当 n1=n2 时(成对抽样),
记 Zi X i Yi , i 1,2, , n;
1) 已知12 和22
枢轴变量取
电子科技大学
区间估计
May-20
U ( X Y ) (1 2 ) ~ N (0,1)
2 1
2 2
【VIP专享】6-5区间估计
从两条流水线上抽取了容量分别为13与17的两个相互独
立的样本
则由
P(
2
2
(n 1)S 2
2
2
2 1
)
1
2
0.15 0.125
0.1 0.075
2
得 2 的置信区间为
(n 1)S 2
2 1
2
(n
1)
,
(n 1)S 2
2
(
n
1)
2
0.05
2 • 0.025
-2
2
4
•
6
8 10
2
2 1
2
2
(3)′当 已知时, 方差 2 的 置信区间(这种情况在实际中很少)
(5)
]
[14.71,
15.187]
③
2 的置信区间为
(n 1) s2
[
,
2 1
2
(n
1)
(n 1) s2
]
2
(n
1)
2
具体计算得: s2 0.051.
查表得
2 1
2
(n
1)
2 0.975
(5)
12.833,
2 2
(n
1)
2 0.025
(5)
0.831
所以 2 的置信区间为
5s2
[
,
5 s2 ] [0.0199, 0.3069 ]
抽取 6 件, 测得直径为 15.1 , 14.8 , 15.2 , 14.9 , 14.6 , 15.1
① 若 2=0.06, 求 的置信区间 ② 若 2未知,求 的置信区间 ③ 求方差 2的置信区间.
置信度 均为0.95
6-5非正态总体参数的区间估计
2 a n u ,
2
2 b (2nX u ) ,
2
总体服从指数分布 未知参数 的置信水平为1 的置信区间是 1 1 1 1 ˆ ˆ ( 1 , 2 ) ( (1 u ) , (1 u ) ).
X n
2
c nX 2 .
X
n
2
概率论与数理统计教程(第四版)
[例2] 从一批电子元件中,抽取 50个样品,测得它们 设电子元件的使用寿命 的使用寿命的均值为1200小时, 服从指数分布e( ) , 求未知参数 的置信水平为 0.99 的置信区间.
解:由题设有 n 50 , x 1200. 已给置信水平1 0.99 ,
0.01 , 查附表得 u2 u0.005 t0.005 () 2.58. 由此得
目录
上一页
下一页
返回
结束
[例1]从一批产品中抽取 200个样品, 发现其中 9 个次品, 求这批产品的次品率 p 的置信水平为90%的置信区间. 解: 设随机变量 0 , 若取得正品; X 1 , 若取得次品. p ( x ; p ) p x (1 p )1 x , 概率函数为 则 X 服从 "0 1" 分布, x 0或1, 其中 p 是这批产品的次品率. 按题意, 样本容量 n 200 ,样本观测值 x1 , x2 ,, x200 中恰有 9 个 1 与 191个 0 , 所以 1 200 9 x xi 200 0.045. 200 i 1
则未知参数 p 的置信水平为1 的置信区间是
b b 2 4ac b b 2 4ac ( p1 , p2 ) ( ˆ ˆ , ). 2a 2a
05区间估计
0.05 0.10 6.314 2.920 2.353 2.132 2.015 1.660 1.653 1.648 1.646 1.6449
例4.2
• n=120>100,标准正态分布代替t分布,u0.10=1.64 ,标准正态分布代替 分布 分布,
X − u 0.10 × s X = 142.67 − 1.64 × 0.5477 = 141.77(cm) X + u 0.10 × s X = 142.67 + 1.64 × 0.5477 = 143.57(cm)
附表2 附表 t 界值表
自由度
-t
0
t
ν
1 2 3 4 5 11 12 13 14 15
单侧 双侧
概 率,P 0.25 0.20 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619 0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599 0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924 0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 0.697 0.876 1.363 1.796 2.201 2.718 3.106 3.497 0.695 0.873 1.356 1.782 2.179 2.681 3.055 3.428 0.694 0.870 1.350 1.771 2.160 2.650 3.012 3.372 0.692 0.868 1.345 1.761 2.145 2.624 2.977 3.326 0.691 0.866 1.341 1.753 2.131 2.602 2.947 3.286 7.173 5.893 4.025 3.930 3.852 3.787 3.733 8.610 6.869 4.437 4.318 4.221 4.140 4.073
区间估计知识点
区间估计知识点1. 什么是区间估计?区间估计是统计学中一种常见的推断方法。
在统计学中,我们通常不会完全准确地知道总体参数的真实值,而是通过从总体中抽取一部分样本来估计总体参数。
区间估计通过给出一个范围,来估计总体参数的可能取值范围。
2. 区间估计的基本原理区间估计的基本原理是利用样本统计量来估计总体参数,并给出一个置信区间作为总体参数真实值的估计范围。
其中,置信区间是总体参数的一个范围,使得在一定置信水平下,总体参数的真实值有一定的概率落在该范围内。
3. 区间估计的步骤进行区间估计的一般步骤如下:步骤1: 确定总体分布类型在进行区间估计之前,需要先确定总体分布的类型。
常见的总体分布类型包括正态分布、t分布、F分布等。
根据总体分布的类型,选择相应的统计方法进行区间估计。
步骤2: 收集样本数据从总体中随机抽取一部分样本,收集样本数据。
样本数据应该具有代表性,以确保估计结果的准确性和可靠性。
步骤3: 计算样本统计量利用收集到的样本数据,计算相应的样本统计量。
常见的样本统计量包括样本均值、样本方差等。
步骤4: 确定置信水平选择合适的置信水平,通常使用95%或99%。
置信水平表示我们对置信区间的信心程度,例如95%的置信水平意味着在100次重复采样中,大约有95次的置信区间会包含总体参数的真实值。
步骤5: 计算置信区间根据样本统计量、总体分布类型和置信水平,计算置信区间。
置信区间由下限和上限组成,表示总体参数可能的取值范围。
步骤6: 解释和应用结果最后,解释和应用计算得到的置信区间结果。
置信区间提供了总体参数的估计范围,可以用于进行决策、判断统计显著性等。
4. 区间估计的意义和应用区间估计在实际应用中具有广泛的意义和应用。
它可以用于:•预测未来事件的发生概率和范围;•评估统计结果的可靠性和显著性;•进行质量控制和质量改进;•判断两个或多个总体参数之间是否存在差异;•设定产品或服务指标范围等。
总之,区间估计是统计学中一种重要的推断方法,能够提供总体参数的估计范围,帮助人们进行决策和判断。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p(x)
G ~ 2(n)
α/2 α/2
2 2 (n)
2 1
2 (n)
x
单个正态总体置信区间常用公式
(1) 方差 2已知, 的置信区间
[
x
u1
2
n
,
x
u1
2
] LLL n
(1)
(2) 方差 2未知 , 的置信区间
x
t1
2
(n
1)
S, n
x
t1
2
(n
1)
S n
LLL
(2)
(3) 当 未知时, 方差 2 的置信区间
对任意的θΘ,有 P($L ) 1 则θ称Θ成ˆL立是,则θ称的置信为水ˆθL平的为1-1α- α的的(单(单侧侧)同)置等信置下信限下.若限等. 号对一切 任定则切意义θ称的4ΘˆθU:成设是Θ立,θθ有$,U的则置称θ$信UP水((x为平1,ˆULθ为的1ˆ,U-x1)αn-的是)α1的(统单(计单侧量侧)置,)若同信对等上给置限定信. 若的上等α限(号0.<对α<一1),对
(n 1)S 2
,
(n
1)S
2
LLL
(3)
2
1
2
(n
1)
2
2
(n
1)
(2)推导
选取枢轴量
T
x
S
~
t(n 1)
n
由
P
x
S n
t1
2
(n
1)
1
确定 t1 (n 1) 2
故 的置信区间为
注2: 要求θ以很大的可能被包含在区间 [ˆL ,ˆU ]
内,即概率 P($L ˆU ) 要尽可能大 .也就
是要求估计尽量可靠.
估计的精度要尽可能的高. 即要求区间长度
ˆU $L 尽可能短.
可靠度与精度是一对矛盾,一般是在保证可靠度 的条件下尽可能提高精度.
注3: 置信水平 1 的频率解释: 在大数次的区间 估计的观测值中, 至少有100(1 )%次包含θ.
p( x)
0.04
0.01
由 P(-1.75≤G≤2.33)=0.95
x
1.75
2.33
得到均值μ的置信水平为1-α=0.95的置信区间为
[x 1.75 n , x 2.33 n]这个区间比前面一个要长一些.
类似地,可得到若干个不同的置信区间.
任意两个数c和d,只要它们的纵标包含p(x)下 95%的面积,就确定一个95%的置信区间.
二、置信区间的求法 — 枢轴量法
在求同等置信区间时最常用的方法是枢轴量法. 步骤如下:
1、设法构造一个样本和θ的函数G=G(x1,….xn ,θ), 使得G的分布为 已知(即不依赖于未知参数). 称G为枢轴量.
2、适当地选择两个常数c、d, 使对给定的α(0< α<1), 有
P(c G d) 1 α ,
p(x)
0.95
c
dx
c
0.95
d
x
c
0.95
0d
x
c =-d
注2: 实际中, 选平均长度最短的c, d很难实现. 因此常选 择这样的c,d, 使得两个尾部概率各为α/2, 即:
P(G c) P(G d ) α / 2 ,
这样的置信区间称为等尾置信区间. 这是在G的分布为 偏态分布场合常采用的方法. 如 2分布、F分布
(参见P316页,例6.5.1)
上述定义在实际中常用的都是等式:
定义2: 沿用定义1的记号,若对给定的 (0< <1),对任意的
θΘ,有
则称[ˆL
,ˆUP]是($θL 的 1-α的ˆU )同等1置信区间.
有时在实际中常用的还有单侧置信区间: 定义3: 设θ$L θ$L( x1,L , xn )是统计量, 若对给定的α(0<α <1)
3、将 c G d进行不等式变形化为 $L $U ,则有 P($L ˆU ) 1
最后的 [ˆL ,ˆU ] 就是θ的1- α的同等置信区间.
三、单个正态总体的置信区间
例如: 设x1,…,xn是取自 N (, 2 ) 的样本, 2已知,
求参数 的置信度为 1 的置信区间.
解: 选 的点估计为x ,
由此,可以得到未知参数的的任何置信水平小于 1 的置信区间,并且置信水平越高,相应的置信区间平均 长度越长.
我们总是希望置信区间尽可能短.
实用中应在保证足够可靠的前提下,尽量使得区间 的长度短一些 .
注1: 满足置信度要求的c,d通常不唯一.若有可能, 应选择平 均长度 E(ˆU $L ) 达到最短的c与d , 这在G的分布为单峰 且对称分布通常容易实现. 如正态分布、t分布.
第五节 区间估计
一、置信区间的定义 二、置信区间的求法 三、单个正态总体参数的置信区间 四、大样本置信区间 五、两个正态总体下的置信区间
一、 区间估计的定义
定义1: 设θ是 一个待估参数,其参数空间为Θ。对给
定的 (0< <1)若由样本 x1, x2,…, xn 确定的两个统计量
θ$L θ$L( x1,L , xn ) θ$U θ$U ( x1,L , xn )
构造许多置信区间.
上例中, 取置信水平为1- α=0.95
G
x
n
~
N(0,
1)
由标准正态分布表, 满足P(c<G<d)=0.95的c、d 有很多.
比如,由 P(-1.96≤G≤1.96)=0.95
p(x) 0.025
0.95
1.96
x
1.96
ቤተ መጻሕፍቲ ባይዱ
可得到均值μ的置信水平为1-α=0.95的置信区间为
[x 1.96 n , x 1.96 n]
取值于该区间的概率为置信水平.
对给定的置信水平1- α,查正态分布表得 u1 2 ,
使
P
x
n
u1 2
1
5、变形可得 未知参数的置 信区间.
变形为
P
x
n
u1
2
x
n
u1
2
1
于是所求μ的置信度为1-α的置信区间为
x
n u1
2,
x
n u1
2
也可简记为
x
m
σ n
u1α
2
给定样本,给定置信水平 ,置信区间不是唯一的.对同一个参数,我们可以
满足 P $L ˆU 1
则称区间[ˆL ,ˆU ]是θ的置信水平(置信度)为 1 的
(双侧)置信区间.
注1: 对ˆL 和参数ˆUθ分作别区称间为估(计双,侧就)置是信要下设限法和找置出信两上个限. 只依赖于样本的界限(构造统计量) ˆL 和ˆU
一旦有了样本,就把θ估计在区间 [ˆL ,ˆU 内] .
取枢轴量G x ~ N(0, 1) n
3、寻找一个待估参数和 样本的函数,要求其
1、明确问题,是求哪个参数的 置信区间?置信水平是多少?
0.4
0.3
2、寻找未知
0.2
参数的一个良
0.1
好估计.
分布为已知.
u-2
1
2
-1
u 1 12 2
4、对于给定的置信水平, 根据G的分布,确定一个区间, 使得G