参数的区间估计
总体参数的区间估计必须具备的三个要素
一、概述总体参数的区间估计是统计学中一个重要的概念,在实际应用中具有广泛的应用。
区间估计的目的是利用样本数据对总体参数进行估计,以确定参数的取值范围。
在进行区间估计时,需要考虑三个重要的要素,以确保估计结果的准确性和可靠性。
二、总体参数的定义在统计学中,总体参数指的是对整个总体的某一特征进行描述的指标。
例如总体均值、总体比例等。
总体参数通常是未知的,需要通过样本数据来进行估计。
区间估计就是利用样本数据对总体参数进行估计,给出一个区间,以确定参数的取值范围。
三、区间估计的三个要素1. 置信水平置信水平是区间估计中非常重要的一个要素。
它指的是对总体参数估计的准确程度的度量,通常用1-α来表示,其中α称为显著性水平,通常取0.05或0.01。
置信水平越高,说明对总体参数的估计越可信。
在实际应用中,常用的置信水平为95或99。
2. 样本容量样本容量是另一个影响区间估计结果的重要要素。
样本容量的大小直接影响了估计结果的精确度。
通常来说,样本容量越大,估计结果越精确。
在进行区间估计时,一般需要根据置信水平和总体参数的方差来确定合适的样本容量。
3. 统计分布在进行区间估计时,需要考虑所使用的统计分布。
常用的统计分布包括正态分布、t分布、F分布等。
选择合适的统计分布对区间估计的结果具有重要影响。
通常在实际应用中,根据样本容量和总体参数的分布情况来选择合适的统计分布。
四、区间估计的计算方法区间估计的计算方法通常包括以下几个步骤:1. 确定置信水平,通常取95或99。
2. 根据置信水平和总体参数的分布情况,选择合适的统计分布。
3. 根据样本数据计算得到统计量的值。
比如样本均值、样本比例等。
4. 根据统计量的值,计算得到区间估计的上限和下限。
通常使用公式:点估计值±临界值×标准误差。
五、实际应用区间估计在实际应用中具有广泛的应用,比如医学研究、市场调研、经济预测等领域。
在这些领域中,通常需要对总体参数进行估计,以确定参数的取值范围。
参数区间估计
则 就是 的100( )%的置信区间.
单击此处添加标题
而这与总体分布有关,所以,总体分布的形式是否已知,是怎样的类型,至关重要.
(这样我们才能确定一个大概率区间).
可见,确定区间估计很关键的是要寻找一个待估参数 和估计量T 的函数S(T, ), 且S(T, )的分布为已知, 不依赖于任何未知参数
的置信水平为0.95的置信区间是 [ 159.27, 180.74]
将 =170,S=30, =1.96,n=30代入得,
三、单侧置信区间
上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向的界限.
添加标题
这时,可将置信上限取为+∞,而只着眼于置信下限,这样求得的置信区间叫单侧置信区间.
分布是由正态分布派生出来的一种分布.
来定义.
其中伽玛函数 通过积分
分布的密度函数为
2、t 分布
3、F分布
定义: 设 X与Y相互独立,则称统计量
服从自由度为n1及 n2 的F分布,n1称为第一自由度,n2称为第二自由度,记作 F~F(n1,n2) .
在求置信区间时,要查表求分位数.
教材已经给出了概率分布的上侧分位数(分位点)的定义,为便于应用,这里我们再简要介绍一下.
设0< <1, 对随机变量X,称满足
例如:
的点 为X的概率分布的上 分位数.
标准正态分布的 上 分位数
设0< <1, 对随机变量X,称满足
2
因方差未知,取
添加标题
3
对给定的置信度 ,确定分位数
添加标题
4
使
添加标题
5
即
添加标题
7.8 两个正态总体参数的区间估计
2 1
2 2
)
1
nm
因此,均值差1−2的置信水平1−α的置信区间为
(( X Y ) z 2
2 1
n
2 2
m
,(X
Y
)
z
2
2 1
2 2
)
nm
两个正态总体参数的区间估计
2.均值差1−2的置信区间 (方差12 =22 = 2,但 2 未知情形)
易知 ( X Y ) (1 2 ) ( X Y ) (1 2 ) ~ N (0,1)
枢轴量 T X Y (1 2 ) ~ t(n m 2)
S 1 n 1 m
根据 t分布的性质,取分位数tα/2 (n+m−2) 有
P{|
X Y (1 2 )
S 1 n 1 m
|
t
2(n
m
2)}
1
因此,均值差1−2的置信水平1−α置信区间为
2
(2n)=
2 0.05
(18)=28.869,12
2 (2n)
2 0.95
(18)
9.39
计算得:2nX 1062 1/λ 的置信水平为0.90的置信区间为 ( 1062 , 1062) (36.787,113.099)
28.869 9.39
两个正态总体参数的区间估计
2
,
2 2
m
)
由正态分布的性质可得
X
Y
~
N (1
2
,
2 1
总体参数的区间估计
三、总体参数的区间估计
图5-10 “探索”对话框
图5-11 “探索:统计量”对话框
三、总体参数的区间估计
单击“统计量”按钮,弹出“探索:统计量”对话框,如图5-11所示。 该对话框中有如下四个复选框: (1)描述性:输出均值、中位数、众数、标准误、方差、标准差、极小值 、极大值、全距、四分位距、峰度系数和偏度系数的标准误差等。此处能够设 置置信区间,默认为90%(α=0.1),可根据需要进行调整。 (2)M 最大似然确定数。 (3)界外值:输出五个最大值和五个最小值。 (4)百分位数:输出第5%、10%、25%、50%、75%、90%、95%位数 。
三、总体参数的区间估计
【例5-17】 某餐馆随机抽查了50位顾客的消费额(单位:元)为 18 27 38 26 30 45 22 31 27 26 35 46 20 35 24 26 34 48 19 28 46 19 32 36 44 24 32 45 36 21 47 26 28 31 42 45 36 24 28 27 32 36 47 53 22 24 32 46 26 27 在90%的概率保证下,采用点估计和区间估计的方法推断餐馆顾客的平均消 费额。 解:执行“分析”→“描述统计”→“探索”命令,打开“探索”对话框。由于本例只 有消费额一个变量,且需要对消费额进行探索性分析,故选中左侧列表框中的“消 费额”选项,将其移入“因变量列表”框中,如图5-10所示。
解:已知n=31,α=0.01,=10.2;σ=2.4,z0.005=2.58,由于总 体方差已知,为大样本,可以利用式(5-23)来进行计算。
即(9.088,11.312 该学生每天的伙食费在显著性水平为99%时的置信区间为( 9.088,11.312)。
参数估计之点估计和区间估计
作者 | CDA数据分析师参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。
人们常常需要根据手中的数据,分析或推断数据反映的本质规律。
即根据样本数据如何选择统计量去推断总体的分布或数字特征等。
统计推断是数理统计研究的核心问题。
所谓统计推断是指根据样本对总体分布或分布的数字特征等作出合理的推断。
它是统计推断的一种基本形式,分为点估计和区间估计两部分。
一、点估计点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。
简单的来说,指直接以样本指标来估计总体指标,也叫定值估计。
通常它们是总体的某个特征值,如数学期望、方差和相关系数等。
点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。
构造点估计常用的方法是:①矩估计法,用样本矩估计总体矩②最大似然估计法。
利用样本分布密度构造似然函数来求出参数的最大似然估计。
③最小二乘法。
主要用于线性统计模型中的参数估计问题。
④贝叶斯估计法。
可以用来估计未知参数的估计量很多,于是产生了怎样选择一个优良估计量的问题。
首先必须对优良性定出准则,这种准则是不唯一的,可以根据实际问题和理论研究的方便进行选择。
优良性准则有两大类:一类是小样本准则,即在样本大小固定时的优良性准则;另一类是大样本准则,即在样本大小趋于无穷时的优良性准则。
最重要的小样本优良性准则是无偏性及与此相关的一致最小方差无偏估计,其次有容许性准则,最小化最大准则,最优同变准则等。
大样本优良性准则有相合性、最优渐近正态估计和渐近有效估计等。
下面介绍一下最常用的矩估计法和最大似然估计法。
1、矩估计法矩估计法也称“矩法估计”,就是利用样本矩来估计总体中相应的参数。
它是由英国统计学家皮尔逊Pearson于1894年提出的,也是最古老的一种估计法之一。
对于随机变量来说,矩是其最广泛,最常用的数字特征,主要有中心矩和原点矩。
由辛钦大数定律知,简单随机样本的原点矩依概率收敛到相应的总体原点矩,这就启发我们想到用样本矩替换总体矩,进而找出未知参数的估计,基于这种思想求估计量的方法称为矩法。
6.5参数的区间估计
附表3-2
查 t ( n 1) 分布表可知:
t0.025 (11) 3.201,
于是
s
* n
12.35 t1 /2 (n 1) 3.201 11.41, n 12
得的置信度为95%的置信区间(491.51, 514.33)
附加 4:设有一批胡椒粉,每袋净重 X(单位:克) 服从正态分布.从中任取8袋,测得净重分别为:
试求该批零件长度的置信度为 0.95 置信区间.
解
0.06
n6
经计算可得
x 14.95
查表得
u1 /2 u0.975 1.96, 故所求置信区间为
14.75, 15.15
从 x u1 /2 14.95 0.06 1.96 14.75 n 6 而
1 于是得 2 的一个置信度为 0.90的置信区间 2
2
0.34 0.34 1 , 2.38] [0.45, 2.79]. [ 0.29 2.59 0.29
又x 32.3, 0.4, n 20, 算得
x u1 /2
x u1 /2
0.4 32.3 1.96 32.12 n 20
32.3 1.96 0.4 32.48 20
n
所以的一个置信度为 %的置信区间为32.12,32.48) 95 (
解 已知 0 7, n 9, 0.05. 由样本值算得 1 x (115 120 110) 115. 9 查正态分布表得临界值 1.96,由此得置信区间:
(1151.96 7 / 9 , 1151.96 7 / 9 ) (110.43 , 119.57)
参数的区间估计
参数的区间估计1. 参数的概念参数是指一种描述总体特性的量,通常用符号表示。
以样本均值为例,我们通常用$\bar{x}$表示样本均值,用$\mu$表示总体均值,$\bar{x}$就是关于$\mu$的一个参数。
2. 区间估计的基本思想区间估计是通过样本的统计量来估计总体的参数,因为样本数据毕竟是有限的,所以估计值与真实值之间必然存在误差。
为了消除这种误差,我们采用确定一个区间的方法,即“置信区间”。
置信区间是指用样本数据计算出来的一个范围,其含义是真实的总体参数值有一定的置信水平(置信度)落在这个区间内。
①确定信赖水平(置信度)$1-\alpha$,$\alpha$称为显著性水平。
②根据样本均值选择合适的经验公式或理论公式来计算样本估计量的标准误差。
③根据置信度$1-\alpha$,查找$t$分布表或正态分布表,得到置信水平为$1-\alpha$的$t$值或$z$值。
④根据样本容量和总体方差是否已知,确定区间估计公式。
⑤根据置信度和样本数据计算出置信区间。
下面具体介绍区间估计的步骤:A. 确定总体所服从的概率分布总体可以服从正态分布、泊松分布、二项分布等概率分布,其中正态分布是最为常用的一种分布。
B. 确定样本容量$n$样本容量$n$的大小直接影响到置信区间的精度,当样本容量越大,置信区间的长度就越短。
一般观测数据越多,则样本容量越大。
C. 确定置信度$1-\alpha$置信度是指总体参数落在某一特定区间内的概率,一般取$95\%$或$99\%$。
D. 求出样本均值$\bar{x}$样本均值$\bar{x}$是样本中所有元素值的总和除以样本容量$n$,即$\bar{x}=\frac{\sum_{i=1}^nx_i}{n}$E. 求出样本方差$s^2$若总体标准差未知,用样本标准差$s$代替,$S(\bar{x})=\frac{s}{\sqrt{n}}$G. 选择合适的分布当总体服从正态分布,$\frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}}$服从标准正态分布;当总体未知且样本容量$n$较小($n<30$),$\frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}$服从$t$分布。
第四章 参数的区间估计(Confidence Interval Estimation)
Chap 4-34
PHStat用于解决此类问题
PHStat | confidence intervals | estimate for the population total Excel spreadsheet for the voucher example
第四章 参数的区间估计 (Confidence Interval Estimation)
阅读教材:第7章
Chap 4-1
本章概要
估计的步骤(Estimation process) 点估计(Point estimates) 区间估计(Interval estimates) 均值的置信区间( 已知) 样本容量的确定(Determining sample size) 均值的置信区间 ( 未知) 比例的置信区间
n
) 1
Chap 4-9
区间估计的要素
置信度
区间内包含未知总体参数的确定程度 与未知参数的接近程度 获得容量为 n 的样本所需付出的代价
精度
成本
Chap 4-10
置信度
以 100 1 %表示,如:90%,95%,99% 相对频率意义上的解释
从长期来看, 所构建的所有置信区间中,100 1 % 的置信区间都将含有未知参数,即未知参数落入区间的 概率;
n
( z 2 ) (1 )
2
E2
其中: E z 2
(1 )
n
2. 3.
E的取值一般小于0.1 (=p) 未知时,可取最大值0.5
概率论15区间估计与假设检验
,X , S 2分别是 样本均值和样本方差,
则有
X
S
X S
~
t n 1
n 1
n
(2)方差 2 的区间估计
10 已 知
1
2
n
(Xi
i1
)2
~ 2(n)
2的置信度为1α的置信区间是
n (Xi )2
n (Xi )2
i1
2
(n)
2
,
i 1
12
2
(n)
20 未知
(n 1)S2
解 该问题是方差未知, 对正态总体均值进行估计.
(X t (n 1) S
2
n
,
X t (n 1) S
2
) n
x 3056.67 s* 375.31 n 12 t0.025 (11) 2.201
所求区间估计为(2812.21, 3295.13).
设 X1, X 2,, X n 是总体X ~ N , 2 的样本
即 X 0 0
Z 是 衡 量H0 真 伪 的 标 准 . 2
n
如 例1中, 0.005 Z 1.96 n 6
2
0 1 x 19.503 0 20
x 0 0
0.7351.96
n
故认为 机床生产正常,即该天加工的零件直径
平均是20mm.
综述假设检验方法的基本思想是:由 样本出发,在 H 0 为真的前提下通过对被 检参数的点估计量,结合统计量的分布,构 造统计量(枢轴函数),由此结合实际,并利 用上α分位点确定小概率事件,便得检验
其中例1为参数检验,例2为非参 数检验.
二 假设检验的基本思想
例1 用机床加工圆形零件,正常情况下 零件的直径X服从正态分布N(20,1)(单 位:mm), 某日开工后为检查机床是否 正常,随机抽取6个,测得直径分别为
概率论第七章参数估计2区间估计
2 / 2 ( n 1)
即
置信区间:
标准差σ的一个置信水平为 1 的置信区间
2 (n 1) S , 2 (n 1) 2
(n 1) S 2 1 (n 1) 2
2
注意:在密度函数不对称时,如 2分布和F 分布,
置信度 1 下,来确定 的置信区间[ , ]
⑴ 已知方差 ,估计均值μ
2
n 1 2 设已知方差 2 0 ,且 X X i 是 的 n i 1 一个无偏点估计,
又
X ~ N (0 , 1) 0 / n
且 对于给定的置信度 查正态分布表,找出
临界值
使得:
2 1 2 2
一个无偏估计, 因为X与Y 相互独立,所以
X Y ~ N ( 1 2 ,
X Y ( 1 2 )
2 1
n1
2 2
n2
)
2 1
n1 n2 所以 1 2 的置信水平为1-α的置信区间为
2 2
~ N (0,1)
( X Y z / 2
已知
由样本值算得:
查表 t0.025 (6) 2.447
得区间:
对某种型号飞机的飞行速度进行15次试验, 测 例 5: 得最大飞行速度(单位: 米/秒)为 422.2, 417.2, 425.6 420.3, 425.8, 423.1, 418.7, 438.3, 434.0, 412.3, 431.5 413.5, 441.3, 423.0, 428.2, 根据长期经验, 可以认为 最大飞行速度服从正态分布. 求飞机最大飞行速度
第三节 区间估计 譬如,在估计湖中鱼数的问题中,若 我们根据一个实际样本,得到鱼数 N 的极 大似然估计为1000条.
参数的区间估计
P{ ( X1, X 2 ,..., X n ) ( X1, X 2 ,..., X n )} 1 则称区间( , )为参数的置信度为1 的置信区 间,和分别称为置信度为1 的置信下限和 置信上限, 称为置信水平.
参数的区间估计的意义可以解释为:随机 区间[( X1, X 2,...,X n ),( X1, X 2,...,X n )]包含参数 的真值的概率为1 ,因此若认为"区间[,]包 含着参数的真值",则犯错误的概率为.
从而
x
s n
t
/
2
(n
1)
12.15
0.04 0.4995 11.90 8
x
s n
t
/
2
(n
1)
12.15
0.04 0.4995 12.40 8
所以μ的置信度为0.99置信区间是 11.90, 12.40
例5.初生婴儿的体重X近似服从正态分布 N( , 2 )
从某地区随机抽取12名新生儿,测得 x 3056.67 克, S 359.36克,求平均体重u的置信度为95%的置信区间.
第三节 参数的区间估计
正态总体均值μ的区间估计 正态总体方差的区间估计 两个正态总体均值差的区间估计 两个正态总体方差之比的区间估计
• 定义 : 设总体X 具有概率函数p(x, ), 为未知
参数, ( X1, X 2 ,..., X n )为取自这个总体X的一个样
本,若对于事先给定的 , 0 1, 存在两个统计
由于这时
2
(n 1)S 2
2
~
2 (n 1)
对于给定的置信度1 ,查 2分布表得两个分位点
2 / 2 (n 1)和12 / 2 (n 1),使得 P{12 / 2 (n 1) 2 2 / 2 (n 1)} 1
双正态总体参数的区间估计
双正态总体参数的区间估计双正态总体参数的区间估计是统计学中的一种方法,用于估计由两个正态分布组成的总体的参数。
这种方法适用于当我们需要估计两个总体的平均值或比例时,且这两个总体可以被假定为来自两个不同的正态分布。
下面我们将详细介绍双正态总体参数的区间估计的原理和步骤。
双正态总体参数的区间估计可以分为两种情况:一种是当我们需要估计两个总体的平均值,另一种是当我们需要估计两个总体的比例。
首先,假设我们需要估计两个总体的平均值。
我们可以用样本平均值来估计总体平均值,并通过计算标准误差来构建置信区间。
如果我们假设两个总体的方差相等,则可以使用统计学中的配对t检验方法来进行推断。
具体步骤如下:1.收集样本数据。
从每个总体中随机抽取一定数量的样本,并记录下每个样本的观测值。
2.计算样本平均值。
对于每个总体,计算对应样本的平均值。
3.计算差值。
对于每个配对样本,计算它们的差值。
如果我们关注的是总体平均值的差异,则用两个总体对应样本的平均值之差来作为差值。
4.计算标准差。
计算差值样本的标准差,用来估计差值的标准误差。
5.确定置信水平。
选择一个置信水平,通常为95%。
这意味着我们希望有95%的置信度认为估计的区间包含真实的总体差异。
6.计算临界值。
确定配对t检验的自由度,并使用自由度和置信水平来查找相应的t临界值。
7.构建置信区间。
使用差值平均值±t临界值*标准误差来构建置信区间,这个区间将包含真实的总体差异。
另一种情况是当我们需要估计两个总体的比例。
在这种情况下,我们可以使用两个样本中的比例差异来估计总体的比例差异。
具体步骤如下:1.收集样本数据。
从每个总体中随机抽取一定数量的样本,并记录下每个样本中的成功次数和总次数。
2.计算样本比例。
对于每个总体,计算对应样本的比例,即成功次数除以总次数。
3.计算差异。
对于每个配对样本,计算它们的比例之差。
4.计算标准误差。
计算比例差异样本的标准误差,用来估计比例差异的标准误差。
第二章 参数估计2-3 区间估计
I=0.814
上页 下页 返回
钢厂铁水含碳量X 例3. 钢厂铁水含碳量 ~ N(µ,0.1082), 现在随机测定 该厂9炉铁水得 炉铁水得X=4.484,求在置信度为 求在置信度为0.95 的条件 该厂 炉铁水得 求在置信度为 下铁水平均含碳量的置信区间。 下铁水平均含碳量的置信区间。 解
置信区间为
上页
下页
返回
联合方差
上页
下页
返回
1、 µ1 - µ2的1-α置信区间 、 α (1)、 σ12 、σ22已知 、
由于 X −Y ~ N(µ1 − µ2 ,
选取
2 2 σ1 σ2
n1
+
n2
)
因此置信度为1-α 因此置信度为 α的µ1 - µ2置信区间可为
上页
下页
返回
(2)、σ12 、σ22未知,且n1,n2较大 如大于 、 未知, 较大(如大于 如大于50)
=27.5, ,
=6.26, ,
上页
下页
返回
测量一批铅锭的比重,设铅锭的比重X 例6. 测量一批铅锭的比重,设铅锭的比重 ~ N(µ, 现进行16次检测得铅锭的比重有 σ2),现进行 次检测得铅锭的比重有 现进行 次检测得铅锭的比重有X=2.705, , S2=0.0292,试求总体 的均值µ和方差 σ2置信度为 求总体X的均值 0.95 的置信区间。 的置信区间。 解 (1)求µ的置信区间 σ2未知 n=16,α=0.05. 求 的置信区间, 未知, α 选取 查表得 置信区间为
(二)、总体X数学期望 (二)、总体X数学期望µ未知 数学期望µ 样本X 的无偏估计. 样本 1,X2, • • • , Xn, 且S2是σ2的无偏估计
选取样本函数
参数估计-区间估计
2 σ 12 σ 2
25 36 + = + = 5.5 ≈ 2.345 m n 10 12
从而由(2-43)式得 µ1 − µ 2 的置信度为 0.90 的置 信区间是
(19.8 − 24.0 ± 1.645 × 2.345) = ( −8.06, − 0.34)
2 (2)σ 12 = σ 2 = σ 2 ,但σ 2 未知,可构造样本函数
解:依题意取样本函数 T =
X −µ S
2
~ t ( n − 1)
对于给定的α =0.05,由
n
0.05 = 0.025 P{T > λ} = α / 2 = 2 又 n = 15 ,经计算 查 t (14) 分布表,求得 λ =2.145。
1 15 X = ∑ xi = 425.047 15 i =1
时);随机抽取 B 型号的灯泡 7 只,测得平均寿 命为 X B = 980(小时) , 标准离差为 S B = 32(小
时)。设两总体都服从正态分布,并且由生产 过程知,它们的方差相等,求两正态总体均值 差 µ A − µ B 的 0.99 的置信区间。
解:取样本函数 X − Y − ( µ1 − µ 2 ) T= ~ t ( m + n − 2) 1 1 + Sw m n 又由 1 − α = 0.99 , 得 α = 0.01, 查 m + n − 2 = 10, 表得 λ = 3.1693 ,经计算 2 2 ( m − 1 ) S + ( n − 1 ) S 2 A B SW = = 928 m+n−2
信区间是 15 .06 + 0.18) = (14 .88, 15 .24 ) ( 15 .06 − 0.18,
应用数理统计第二章参数估计(3)区间估计
例1 有一大批月饼,现从中随机地取16袋,称得重量(以克 计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 ,设袋装月饼的重量近似地服从正态 分布,试求总体均值的置信度为0.95的置信区间。 解: 2未知, 1-=0.95, /2=0.025,n-1=15, t0.975 (15) 2.1315 由已知的数据算得 x 503.75, S* 6.2022
n1 (n2 1) S12 12 n1 (n2 1) S12 P F (n 1, n1 1) 2 F (n 1, n1 1) 1 2 /2 2 2 1 / 2 2 2 n2 (n1 1) S2 n2 (n1 1) S2
10
得所求的标准差的置信区间为 (4.58, 9.60)
2.4.3 两个正态总体参数的区间估计
在实际中常遇到下面的问题:已知产品的某一质量指标 服从正态分布,但由于原料、设备条件、操作人员不同,或 工艺过程的改变等因素,引起总体均值、总体方差有所改变, 我们需要知道这些变化有多大,这就需要考虑两个正态总体 均值差或方差比的估计问题。
ˆ a ˆ b} {g(a) T ( X , X ,..., X ; ) g(b)} { 1 2 n
其中g ( x )为可逆的已知函数, T ( X 1 , X 2 ,..., X n ; 况
设总体X~N(,2),X1, X2, …,Xn是总体X的样本,求,2 /2 /2 的置信水平为(1)的置信区间.
求得 的置信水平为(1)的置信区间: ( 2未知)
S S* t1 2 (n 1) or X t1 2 (n 1) X n1 n
第4节正态总体参数的区间估计
3
, 给定 ,0 1 , 定义 设是总体的一个未知参数
确定两个统计量
ˆ , ˆ 分别称为置信下限和置信上限. 区间. 1 2
ˆ , ˆ ]为 的 置信水平为 1 的 置信 则称区间 [ 1 2
1.75 1.96 1.96 0.49, n 50
所以 的置信区间为
(4.10 0.49, 4.10 0.49 ) (3.61, 4.59 ) .
10
例3 在上例中 , 为使 的置信水平是 0.95 的置信区间
的长度 L 1.5, 求样本容量 .
, u0.025 1.96, 1.75, 解 0.05
u / 2
x
X | | u / 2 X u / 2 X u / 2 / n n n
于是所求 的置信区间为 ( X u 有时简记为 ( X u / 2
2
n
, X u 2 ), n n
7
).
2 某厂生产滚珠,直径 X 服从正态分布 N ( , ). 例1 为了估计 , 抽检 6 个滚珠, 测得直径为 ( mm) : 14.70, 15.21,14.90,14.91,15.32,15.32,
对给定的置信水平 1 ,
按标准正态分布的 水平双侧分位数的定义,
查正态分布表得 u 2 ,
6
1.
已知时 的置信区间
2
/2
( x)
X U ~ N (0,1) , / n
1
O
/2
X P{ | | u 2 } 1 , n
2参数的区间估计实验报告
参数的区间估计实验报告姓名: 班级: 学号(后3位):2016年12 月06 日00:00至24:00提交到邮箱:longsheng63@一.实验名称:参数的区间估计 二.实验性质:综合性实验 三.实验目的及要求:1.了解【活动表】的编制方法;2.掌握【单个正态总体均值Z 估计活动表】的使用方法. 3.掌握【单个正态总体均值t 估计活动表】的使用方法. 4.掌握【单个正态总体方差卡方估计活动表】的使用方法. 5.掌握【两个正态总体均值Z 估计活动表】的使用方法. 6.掌握【两个正态总体均值t 估计活动表】的使用方法. 7.掌握【两个正态总体方差卡方估计活动表】的使用方法. 8.掌握单个正态总体和两个正态总体参数的区间估计方法. 四.实验内容、实验操作关键步骤及实验主要结果1.某厂生产的化纤强度2~(,0.85)X N μ,现抽取一个容量为25n =的样本,测定其强度,得样本均值 2.25x =,试求这批化纤平均强度的置信水平为0.95的置信区间. 实验操作关键步骤及实验主要结果由于应选用样本函数 TINV 、SQRT 求μ的置信区间,所以,要选用【 单个正态总体均值t 估计活动表】,得到如下表的实验结果.因此,这批化纤平均强度的置信水平为0.95的置信区间为 (1.899137245,2.600862755) .单个正态总体均值t 估计活动表 置信水平 0.95 样本容量 25 样本均值 2.25 样本标准差 0.85标准误差 0.17t 分位数(单) 1.71088208 t 分位数(双) 2.063898562单侧置信下限 1.959150046 单侧置信上限 2.540849954 区间估计估计下限 1.899137245 估计上限2.6008627552.已知某种材料的抗压强度2~(,)X N μσ,现随机抽取10个试件进行抗压试验,测得数据如下:482,493,457,471,510,446,435,418,394,469.(1)求平均抗压强度μ的置信水平为0.95的置信区间. (2)求2σ的置信水平为0.95的置信区间. 实验操作关键步骤及实验主要结果(1)由于应选用样本函数 TINV 、SQRT 求μ的置信区间,所以,要选用【 单个正态总体均值t 估计活动表】,得到如下表的实验结果.因此,平均抗压强度μ的置信水平为0.95的置信区间为 (432.3068626,482.6931374) .单个正态总体均值t 估计活动表 抗压强度 抗压强度 482 置信水平 0.95 493 平均 457.5 样本容量 10 457 标准差 35.21757768样本均值 457.5 471 方差 1240.27777 样本标准差 35.21757768 510446 标准误差11.13677591435 t 分位数(单) 1.833112933 418 t 分位数(双) 2.262157163 394469 单侧置信下限 437.085032 单侧置信上限 477.914968 区间估计估计下限 432.3068626 估计上限482.6931374(2)由于应选用样本函数 CHIINV 求2σ的置信区间,所以,要选用【 单个正态总体方差卡方 估计活动表】,得到如下表的实验结果.因此,2σ的置信水平为0.95的置信区间为 (586.7969434,4133.663681) .单个正态方差卡方估计活动表 抗压强度 抗压强度 482 置信水平 0.95 493 平均 457.5 样本容量 10 457 标准差 35.21757768 样本均值 457.5 471 方差 1240.27777 样本方差 1240.278 510446 卡方下分位数(单) 3.325112843 435 卡方上分位数(单) 16.9189776 418 卡方下分位数(双) 2.7003895 394 卡方上分位数(双) 19.0227678 469单侧置信下限 659.7622067 单侧置信上限 3357.029529 区间估计估计下限 586.7969434 估计上限 4133.6636813.用一个仪表测量某一物理量9次,得样本均值56.32x =,样本标准差0.22s =. (1)测量标准差σ的大小反映了仪表的精度,试求σ的置信水平为0.95的置信区间. (2)求该物理量真值的置信水平为0.99的置信区间. 实验操作关键步骤及实验主要结果(1)由于应选用样本函数 CHIINV 求σ的置信区间,所以,要选用【 单个正态标准差卡方 估计活动表】,得到如下表的实验结果.因此,σ的置信水平为0.95的置信区间为 (0.100373285,0.807439177) .单个正态标准差卡方估计活动表 置信水平 0.95 样本容量 9 样本均值 56.32 样本标准差0.22卡方下分位数(单) 2.732636793 卡方上分位数(单) 15.50731306 卡方下分位数(双) 2.179730747 卡方上分位数(双) 17.53454614单侧置信下限 0.113494839 单侧置信上限 0.644066568 区间估计估计下限 0.100373285 估计上限0.807439177(2)由于应选用样本函数 TINV 、SQRT 求μ的置信区间,所以,要选用【 单个正态总体均值t 估计活动表】,得到如下表的实验结果.因此,该物理量真值的置信水平为0.99的置信区间为 (56.07393826,56.56606174) .单个正态总体均值t 估计活动表 置信水平 0.99 样本容量 9 样本均值 56.32 样本标准差 0.22标准误差 0.073333333 t 分位数(单) 2.896459448t 分位数(双) 3.355387331单侧置信下限 56.10759297 单侧置信上限 56.53240703 区间估计估计下限 56.07393826 估计上限56.566061744.设从总体211~(,)X N μσ和总体222~(,)Y N μσ中分别抽取容量为110n =,215n =的独立样本,经计算得82x =,256.5x s =,76y =,252.4ys =. (1)若已知2164σ=,2249σ=,求12μμ-的置信水平为0.95的置信区间. (2)若已知2212σσ=,求12μμ-的置信水平为0.95的置信区间.(3)求2122σσ的置信水平为0.95的置信区间.实验操作关键步骤及实验主要结果(1)由于应选用样本函数 NORMSINV 、SQRT 求12μμ-的置信区间,所以,要选用【 两个正态总体均值差Z 估计活动表】,得到如下表的实验结果.因此,12μμ-的置信水平为0.95的置信区间为 (-0.093775671,12.09377567) .两个正态总体均值差Z 估计活动表 置信水平 0.95 样本1容量 10 样本1均值 82 总体1方差 64样本2容量 15 样本2均值 76 总体2方差 49标准误差 3.109126351 Z 分位数(单) 1.644853627Z 分位数(双) 1.959963985单侧置信下限 0.885942245 单侧置信上限 11.11405776 区间估计估计下限 -0.093775671 估计上限12.09377567(2)由于应选用样本函数 TINV 、SQRT 求12μμ-的置信区间,所以,要选用【 两个正态总体均值差t 估计活动表】,得到如下表的实验结果.因此,12μμ-的置信水平为0.95的置信区间为 (-0.206222664,12.20622266) .两个正态总体均值差t估计活动表置信水平0.95样本1容量10样本1均值82样本1方差56.5样本2容量15样本2均值76样本2方差52.4总方差54.00434783t分位数(单) 1.713871528t分位数(双) 2.06865761单侧置信下限0.858178432单侧置信上限11.14182157区间估计估计下限-0.206222664估计上限12.20622266(3)由于应选用样本函数 FINV 求2122σσ的置信区间,所以,要选用【两个正态总体方差比F 估计活动表】,得到如下表的实验结果.因此,2122σσ的置信水平为0.95的置信区间为(0.335974873,4.09512052).两个正态总体均方差比F估计活动表置信区间0.95样本1容量10样本1方差56.5样本2容量15样本2方差52.4F下分位数(单) 2.645790735F上分位数(单)0.33052686F下分位数(双) 3.209300341F 上分位数(双) 0.263299766单侧置信下限 0.407531956 单侧置信上限 3.262198644 区间估计估计下限 0.335974873 估计上限4.095120525.设滚珠直径服从正态分布,现从甲、乙两台机床生产同一型号的滚珠中,分别抽取8个和9个样品,测得其直径(单位:mm )如下:(1)求2122σσ的置信水平为0.95的置信区间.(2)若已知2212σσ=,求12μμ-的置信水平为0.95的置信区间.实验操作关键步骤及实验主要结果(1)由于应选用样本函数 FINV 求2122σσ的置信区间,所以,要选用【 两个正态总体方差比F 估计活动表】,得到如下表的实验结果.因此,2122σσ的置信水平为0.95的置信区间为 (0.807941784,17.925779) .两个正态总体均方差比F 估计活动表 甲台 乙台 15 15.2 置信区间 0.95 14.5 15 样本1容量 815.2 14.8 样本1方差 0.09553571 15.5 15.214.8 15 样本2容量 915.1 15 样本2方差 0.02611111 15.2 14.814.8 15.1 F 下分位数(单) 3.500463855 14.8 F 上分位数(单) 0.268404113 F 下分位数(双) 4.528562147 甲台 乙台 F 上分位数(双) 0.204109098平均 15.0125 平均 14.98888889 单侧置信下限 1.045237069 标准差 0.309088522 标准差 0.161589329 单侧置信上限 13.63173812 方差 0.09553571 方差 0.02611111 区间估计估计下限 0.807941784 估计上限17.925779(2)由于应选用样本函数 TINV 求12μμ-的置信区间,所以,要选用【 两个正态总体均值差t 估计活动表】,得到如下表的实验结果.因此,12μμ-的置信水平为0.95的置信区间为 (-0.226910711,0.274132931) .两个正态总体均值差t 估计活动表 甲台 乙台 15 15.2 置信水平 0.95 14.5 15 样本1容量 8 15.2 14.8 样本1均值 15.0125 15.5 15.2 样本1方差 0.09553571 14.8 1515.1 15 样本2容量 915.2 14.8 样本2均值 14.98888889 14.8 15.1 样本2方差 0.02611111 14.8总方差0.058509257甲台 乙台 t 分位数(单) 1.753050356t 分位数(双) 2.131449546 平均 15.0125平均14.98888889标准差 0.309088522 标准差 0.161589329 单侧置信下限 -0.182435225 方差 0.09553571 方差 0.02611111 单侧置信上限 0.229657445 区间估计估计下限 -0.226910711 估计上限0.274132931。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n2
n2
( 3 ) 未 知 时 , 求 2的 置 信 区 间
选用
2
=
(n
1)S 2
2
:
2( n - 1 )
对 给 定 的 1-
由
P
{
1
2
2
(
n
1)
2
2(n
2
1)}
1
得 ( (n 1)S 2 , (n 1)S 2 )
2 (n 1)
2
1
2
2
(n
1
例 :随 机 地 从 一 批 钉 子 中 抽 取 6枚 ,测 得 长度为 2.14 2.10 2.15 2.10 2.13 2.12
2
2
得 ( X 0 Z ,X 0 Z )
n2
n2
(2) 2未 知 时 ,求 的 置 信 区 间
选 用 T= X : T(n-1) S/ n
对 给 定 的 1-
由 P{ t (n 1) T t (n 1)} 1
2
2
得 ( X S t (n 1),X S t (n 1) )
如 果 取 0.05有 Z 1.96,于 是 有 P {1 0 .7 2 < a <1 2 .4 8} = 0 .9 5
这 就 是 说 ,我 们 有 95%的 把 握 认 为 a在 区 间 (10.72 , 12.48) 内 .
定 义 :设 总 体 X 的 分 布 中 含 有 未 知 参 数 , 是 任 意 给 定 的 正 数 (0< <1),如 果 能 从 样 本 出 发 确 定 出 两 个 统 计 量 ˆ1 ( X 1 , X 2 ,L , X n ), ˆ2 ( X 1 , X 2 ,L , X n ), 使 得
置信区间为(2.106, 2.140)
注:两种不同的条件,得到两种不同的结果.
其可靠性相同,而精度却不同,已知时的 估计精度比未知时的估计精度差.但一般
情况下,给定的信息越多,估计越精确,而本例 能说明什么问题呢?
二 .两 个 正 态 总 体 中 参 数 的 区 间 估 计 :
(
1)2 1,22
(
-
1
2
)
:
t(m
n 2)
SW
1 1 mn
对 给 定 的 1-
由 P{ t (m n 2) T t (m n 2)} 1
2
2
得
( X Y SW
1 m
1
n
t
2
(
m
n
2 ),
11
X Y SW
m
n
t
2
(
m
n
2))
11
X Y SW
m
n
t
2
(
m
n
2
(3)
1, 2未
知
时
并 设 总 体 X : N(, 2 ),试 求 下 列 情 况 下 的
90%的 置 信 区 间.
(1) 2 0.01; (2) 2未 知 ;
解 :容 易 求 出 x=2.123,
( 1 ) = 0 0 .1已 知 时 , 选 取
U= X : N(0,1) 0 n
置信区间为(
X
0
Z ,X
P { ˆ1 ˆ2 } 1 成 立,我 们 称1 为 置 信 度 或 置 信 概 率 ,区 间 ( ˆ1 ,ˆ2 )为 参 数 的 置 信 度 为1 的 置 信 区 间 .分 别 称 ˆ1 ,ˆ2为 置 信 上 限 和 置 信 下 限 .
• 需要指出:
区间估计中的精确性与可靠性是相互矛盾的.
当样本容量一定时,提高估计的可靠度,将降低 估计的精度,相反,提高估计的精度,将降低 估计的可靠度.
区间估计的一般步骤: (1)选 取 一 个 合 适 的 随 机 变 量 T,这 个 随 机 变 量 一 方 面 包 括 了 待 估 参 数 ,另 一 方 面 , 它的分布是已知的; (2)根 据 实 际 需 要 ,选 取 合 适 的 置 信 度 1-; (3)根 据 相 应 分 布 的 分 位 数 概 念 ,写 出 如 下 形式的概率表达式
0
Z)
n2
n2
这 里 ,Z0.05 1.645, n 6, 代 入 得 的 90%的
置 信 区 间 为 (2.056, 2.190)
(2) 未知时,选取
T= X : t(n-1)
Sn
置信区间为(
X
S
t(n-1),X
S
t (n-1)
n2
n2
这里,t0.05 (5) 2.015, 代入得的90%的
,求
2 1 2 2
的
置
信
区
间
选用
S
2 X
F=
2 1
S
2 Y
2 2
: F (m 1, n 1)
对 给 定 的 1-
由
P
{
F1
2
(
m
1, n
1)
F
F (m
2
1, n
1))}
1
得
(
S
2 X
1n 于 是 对 给 定 的 一 个 正 数 (0 1),有
P{
X 1
a n
<z }=1-
即
P{X
1 n
z <a<X
1 n
z
}=1-
由 于 aˆ = X 是 一 个 随 机 变 量 , 它 有 自 己 的 分 布
X : N (a, 1 ) n
因 此 , U X a : N (0,1) 1n
已
知
时
,
求
1
-
的
2
置
信
区
间
选用
U= (X Y ) (1-2) : N(0,1)
12 22
mn
对 给 定 的 1-
由 P{ Z U Z } 1
2
2
得
( X Y
12 m
22 n
Z
2
,X
Y
2 1
m
2 2
n
Z )
2
(2)
2 1
22 =
2
未
知
时
,求
1-
的
2
置
信
区
间
选用
T=
(X
Y
)
• 区间估计的定义与一般步骤 点估计方法有两个缺陷: (1)不能说明估计值与真值的偏差到底有多大(精 确性); (2)不能说明这个估计有多大的可信度(可靠性);
e
• 例:设有一批电子元件的寿命X~N(a,1),现 从中抽取容量为5的一组样本,算得其样本均 值为5000小时,试估计a.
• 解:由点估计,a的估计值为aˆ 5000 .
实际上a的值是非真是5000呢?显然,不同的
抽样,可得到不同的 a ˆ aˆ
值,故5000与a会有差
异.这种差异有多大呢?
我们从另一个角度考虑
由 于 aˆ = X 是 一 个 随 机 变 量 , 它 有 自 己 的 分 布 X : N (a, 1 )
n 因 此 , U X a : N (0,1)
P { T1 T T 2 } 1
(4)将上式表达式变形为P{ˆ1 ˆ2}1 (5)写出参数的置信区间(ˆ1,ˆ2)
一 .正 态 分 布 中 参 数 的 区 间 估 计 :
(1)
2=
2 0
已 知 时 ,求 的 置 信 区 间
选用
U= X : N(0,1)
0/ n
对 给 定 的 1-
由 P{ Z U Z } 1