参数的区间估计
总体参数的区间估计必须具备的三个要素
![总体参数的区间估计必须具备的三个要素](https://img.taocdn.com/s3/m/937f929485254b35eefdc8d376eeaeaad1f316e6.png)
一、概述总体参数的区间估计是统计学中一个重要的概念,在实际应用中具有广泛的应用。
区间估计的目的是利用样本数据对总体参数进行估计,以确定参数的取值范围。
在进行区间估计时,需要考虑三个重要的要素,以确保估计结果的准确性和可靠性。
二、总体参数的定义在统计学中,总体参数指的是对整个总体的某一特征进行描述的指标。
例如总体均值、总体比例等。
总体参数通常是未知的,需要通过样本数据来进行估计。
区间估计就是利用样本数据对总体参数进行估计,给出一个区间,以确定参数的取值范围。
三、区间估计的三个要素1. 置信水平置信水平是区间估计中非常重要的一个要素。
它指的是对总体参数估计的准确程度的度量,通常用1-α来表示,其中α称为显著性水平,通常取0.05或0.01。
置信水平越高,说明对总体参数的估计越可信。
在实际应用中,常用的置信水平为95或99。
2. 样本容量样本容量是另一个影响区间估计结果的重要要素。
样本容量的大小直接影响了估计结果的精确度。
通常来说,样本容量越大,估计结果越精确。
在进行区间估计时,一般需要根据置信水平和总体参数的方差来确定合适的样本容量。
3. 统计分布在进行区间估计时,需要考虑所使用的统计分布。
常用的统计分布包括正态分布、t分布、F分布等。
选择合适的统计分布对区间估计的结果具有重要影响。
通常在实际应用中,根据样本容量和总体参数的分布情况来选择合适的统计分布。
四、区间估计的计算方法区间估计的计算方法通常包括以下几个步骤:1. 确定置信水平,通常取95或99。
2. 根据置信水平和总体参数的分布情况,选择合适的统计分布。
3. 根据样本数据计算得到统计量的值。
比如样本均值、样本比例等。
4. 根据统计量的值,计算得到区间估计的上限和下限。
通常使用公式:点估计值±临界值×标准误差。
五、实际应用区间估计在实际应用中具有广泛的应用,比如医学研究、市场调研、经济预测等领域。
在这些领域中,通常需要对总体参数进行估计,以确定参数的取值范围。
参数区间估计
![参数区间估计](https://img.taocdn.com/s3/m/d7b96242abea998fcc22bcd126fff705cc175c94.png)
则 就是 的100( )%的置信区间.
单击此处添加标题
而这与总体分布有关,所以,总体分布的形式是否已知,是怎样的类型,至关重要.
(这样我们才能确定一个大概率区间).
可见,确定区间估计很关键的是要寻找一个待估参数 和估计量T 的函数S(T, ), 且S(T, )的分布为已知, 不依赖于任何未知参数
的置信水平为0.95的置信区间是 [ 159.27, 180.74]
将 =170,S=30, =1.96,n=30代入得,
三、单侧置信区间
上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向的界限.
添加标题
这时,可将置信上限取为+∞,而只着眼于置信下限,这样求得的置信区间叫单侧置信区间.
分布是由正态分布派生出来的一种分布.
来定义.
其中伽玛函数 通过积分
分布的密度函数为
2、t 分布
3、F分布
定义: 设 X与Y相互独立,则称统计量
服从自由度为n1及 n2 的F分布,n1称为第一自由度,n2称为第二自由度,记作 F~F(n1,n2) .
在求置信区间时,要查表求分位数.
教材已经给出了概率分布的上侧分位数(分位点)的定义,为便于应用,这里我们再简要介绍一下.
设0< <1, 对随机变量X,称满足
例如:
的点 为X的概率分布的上 分位数.
标准正态分布的 上 分位数
设0< <1, 对随机变量X,称满足
2
因方差未知,取
添加标题
3
对给定的置信度 ,确定分位数
添加标题
4
使
添加标题
5
即
添加标题
7.8 两个正态总体参数的区间估计
![7.8 两个正态总体参数的区间估计](https://img.taocdn.com/s3/m/c7a4897d79563c1ec5da7193.png)
2 1
2 2
)
1
nm
因此,均值差1−2的置信水平1−α的置信区间为
(( X Y ) z 2
2 1
n
2 2
m
,(X
Y
)
z
2
2 1
2 2
)
nm
两个正态总体参数的区间估计
2.均值差1−2的置信区间 (方差12 =22 = 2,但 2 未知情形)
易知 ( X Y ) (1 2 ) ( X Y ) (1 2 ) ~ N (0,1)
枢轴量 T X Y (1 2 ) ~ t(n m 2)
S 1 n 1 m
根据 t分布的性质,取分位数tα/2 (n+m−2) 有
P{|
X Y (1 2 )
S 1 n 1 m
|
t
2(n
m
2)}
1
因此,均值差1−2的置信水平1−α置信区间为
2
(2n)=
2 0.05
(18)=28.869,12
2 (2n)
2 0.95
(18)
9.39
计算得:2nX 1062 1/λ 的置信水平为0.90的置信区间为 ( 1062 , 1062) (36.787,113.099)
28.869 9.39
两个正态总体参数的区间估计
2
,
2 2
m
)
由正态分布的性质可得
X
Y
~
N (1
2
,
2 1
总体参数的区间估计
![总体参数的区间估计](https://img.taocdn.com/s3/m/85bca66d5a8102d277a22f3d.png)
三、总体参数的区间估计
图5-10 “探索”对话框
图5-11 “探索:统计量”对话框
三、总体参数的区间估计
单击“统计量”按钮,弹出“探索:统计量”对话框,如图5-11所示。 该对话框中有如下四个复选框: (1)描述性:输出均值、中位数、众数、标准误、方差、标准差、极小值 、极大值、全距、四分位距、峰度系数和偏度系数的标准误差等。此处能够设 置置信区间,默认为90%(α=0.1),可根据需要进行调整。 (2)M 最大似然确定数。 (3)界外值:输出五个最大值和五个最小值。 (4)百分位数:输出第5%、10%、25%、50%、75%、90%、95%位数 。
三、总体参数的区间估计
【例5-17】 某餐馆随机抽查了50位顾客的消费额(单位:元)为 18 27 38 26 30 45 22 31 27 26 35 46 20 35 24 26 34 48 19 28 46 19 32 36 44 24 32 45 36 21 47 26 28 31 42 45 36 24 28 27 32 36 47 53 22 24 32 46 26 27 在90%的概率保证下,采用点估计和区间估计的方法推断餐馆顾客的平均消 费额。 解:执行“分析”→“描述统计”→“探索”命令,打开“探索”对话框。由于本例只 有消费额一个变量,且需要对消费额进行探索性分析,故选中左侧列表框中的“消 费额”选项,将其移入“因变量列表”框中,如图5-10所示。
解:已知n=31,α=0.01,=10.2;σ=2.4,z0.005=2.58,由于总 体方差已知,为大样本,可以利用式(5-23)来进行计算。
即(9.088,11.312 该学生每天的伙食费在显著性水平为99%时的置信区间为( 9.088,11.312)。
参数估计之点估计和区间估计
![参数估计之点估计和区间估计](https://img.taocdn.com/s3/m/6e5b553c69eae009581becd6.png)
作者 | CDA数据分析师参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。
人们常常需要根据手中的数据,分析或推断数据反映的本质规律。
即根据样本数据如何选择统计量去推断总体的分布或数字特征等。
统计推断是数理统计研究的核心问题。
所谓统计推断是指根据样本对总体分布或分布的数字特征等作出合理的推断。
它是统计推断的一种基本形式,分为点估计和区间估计两部分。
一、点估计点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。
简单的来说,指直接以样本指标来估计总体指标,也叫定值估计。
通常它们是总体的某个特征值,如数学期望、方差和相关系数等。
点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。
构造点估计常用的方法是:①矩估计法,用样本矩估计总体矩②最大似然估计法。
利用样本分布密度构造似然函数来求出参数的最大似然估计。
③最小二乘法。
主要用于线性统计模型中的参数估计问题。
④贝叶斯估计法。
可以用来估计未知参数的估计量很多,于是产生了怎样选择一个优良估计量的问题。
首先必须对优良性定出准则,这种准则是不唯一的,可以根据实际问题和理论研究的方便进行选择。
优良性准则有两大类:一类是小样本准则,即在样本大小固定时的优良性准则;另一类是大样本准则,即在样本大小趋于无穷时的优良性准则。
最重要的小样本优良性准则是无偏性及与此相关的一致最小方差无偏估计,其次有容许性准则,最小化最大准则,最优同变准则等。
大样本优良性准则有相合性、最优渐近正态估计和渐近有效估计等。
下面介绍一下最常用的矩估计法和最大似然估计法。
1、矩估计法矩估计法也称“矩法估计”,就是利用样本矩来估计总体中相应的参数。
它是由英国统计学家皮尔逊Pearson于1894年提出的,也是最古老的一种估计法之一。
对于随机变量来说,矩是其最广泛,最常用的数字特征,主要有中心矩和原点矩。
由辛钦大数定律知,简单随机样本的原点矩依概率收敛到相应的总体原点矩,这就启发我们想到用样本矩替换总体矩,进而找出未知参数的估计,基于这种思想求估计量的方法称为矩法。
6.5参数的区间估计
![6.5参数的区间估计](https://img.taocdn.com/s3/m/60999cda49649b6648d74723.png)
附表3-2
查 t ( n 1) 分布表可知:
t0.025 (11) 3.201,
于是
s
* n
12.35 t1 /2 (n 1) 3.201 11.41, n 12
得的置信度为95%的置信区间(491.51, 514.33)
附加 4:设有一批胡椒粉,每袋净重 X(单位:克) 服从正态分布.从中任取8袋,测得净重分别为:
试求该批零件长度的置信度为 0.95 置信区间.
解
0.06
n6
经计算可得
x 14.95
查表得
u1 /2 u0.975 1.96, 故所求置信区间为
14.75, 15.15
从 x u1 /2 14.95 0.06 1.96 14.75 n 6 而
1 于是得 2 的一个置信度为 0.90的置信区间 2
2
0.34 0.34 1 , 2.38] [0.45, 2.79]. [ 0.29 2.59 0.29
又x 32.3, 0.4, n 20, 算得
x u1 /2
x u1 /2
0.4 32.3 1.96 32.12 n 20
32.3 1.96 0.4 32.48 20
n
所以的一个置信度为 %的置信区间为32.12,32.48) 95 (
解 已知 0 7, n 9, 0.05. 由样本值算得 1 x (115 120 110) 115. 9 查正态分布表得临界值 1.96,由此得置信区间:
(1151.96 7 / 9 , 1151.96 7 / 9 ) (110.43 , 119.57)
参数的区间估计
![参数的区间估计](https://img.taocdn.com/s3/m/b862f27568eae009581b6bd97f1922791688bef0.png)
参数的区间估计1. 参数的概念参数是指一种描述总体特性的量,通常用符号表示。
以样本均值为例,我们通常用$\bar{x}$表示样本均值,用$\mu$表示总体均值,$\bar{x}$就是关于$\mu$的一个参数。
2. 区间估计的基本思想区间估计是通过样本的统计量来估计总体的参数,因为样本数据毕竟是有限的,所以估计值与真实值之间必然存在误差。
为了消除这种误差,我们采用确定一个区间的方法,即“置信区间”。
置信区间是指用样本数据计算出来的一个范围,其含义是真实的总体参数值有一定的置信水平(置信度)落在这个区间内。
①确定信赖水平(置信度)$1-\alpha$,$\alpha$称为显著性水平。
②根据样本均值选择合适的经验公式或理论公式来计算样本估计量的标准误差。
③根据置信度$1-\alpha$,查找$t$分布表或正态分布表,得到置信水平为$1-\alpha$的$t$值或$z$值。
④根据样本容量和总体方差是否已知,确定区间估计公式。
⑤根据置信度和样本数据计算出置信区间。
下面具体介绍区间估计的步骤:A. 确定总体所服从的概率分布总体可以服从正态分布、泊松分布、二项分布等概率分布,其中正态分布是最为常用的一种分布。
B. 确定样本容量$n$样本容量$n$的大小直接影响到置信区间的精度,当样本容量越大,置信区间的长度就越短。
一般观测数据越多,则样本容量越大。
C. 确定置信度$1-\alpha$置信度是指总体参数落在某一特定区间内的概率,一般取$95\%$或$99\%$。
D. 求出样本均值$\bar{x}$样本均值$\bar{x}$是样本中所有元素值的总和除以样本容量$n$,即$\bar{x}=\frac{\sum_{i=1}^nx_i}{n}$E. 求出样本方差$s^2$若总体标准差未知,用样本标准差$s$代替,$S(\bar{x})=\frac{s}{\sqrt{n}}$G. 选择合适的分布当总体服从正态分布,$\frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}}$服从标准正态分布;当总体未知且样本容量$n$较小($n<30$),$\frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}$服从$t$分布。
第四章 参数的区间估计(Confidence Interval Estimation)
![第四章 参数的区间估计(Confidence Interval Estimation)](https://img.taocdn.com/s3/m/495150f1fab069dc5022014f.png)
Chap 4-34
PHStat用于解决此类问题
PHStat | confidence intervals | estimate for the population total Excel spreadsheet for the voucher example
第四章 参数的区间估计 (Confidence Interval Estimation)
阅读教材:第7章
Chap 4-1
本章概要
估计的步骤(Estimation process) 点估计(Point estimates) 区间估计(Interval estimates) 均值的置信区间( 已知) 样本容量的确定(Determining sample size) 均值的置信区间 ( 未知) 比例的置信区间
n
) 1
Chap 4-9
区间估计的要素
置信度
区间内包含未知总体参数的确定程度 与未知参数的接近程度 获得容量为 n 的样本所需付出的代价
精度
成本
Chap 4-10
置信度
以 100 1 %表示,如:90%,95%,99% 相对频率意义上的解释
从长期来看, 所构建的所有置信区间中,100 1 % 的置信区间都将含有未知参数,即未知参数落入区间的 概率;
n
( z 2 ) (1 )
2
E2
其中: E z 2
(1 )
n
2. 3.
E的取值一般小于0.1 (=p) 未知时,可取最大值0.5
参数的区间估计
![参数的区间估计](https://img.taocdn.com/s3/m/10993cba79563c1ec5da71d6.png)
P{ ( X1, X 2 ,..., X n ) ( X1, X 2 ,..., X n )} 1 则称区间( , )为参数的置信度为1 的置信区 间,和分别称为置信度为1 的置信下限和 置信上限, 称为置信水平.
参数的区间估计的意义可以解释为:随机 区间[( X1, X 2,...,X n ),( X1, X 2,...,X n )]包含参数 的真值的概率为1 ,因此若认为"区间[,]包 含着参数的真值",则犯错误的概率为.
从而
x
s n
t
/
2
(n
1)
12.15
0.04 0.4995 11.90 8
x
s n
t
/
2
(n
1)
12.15
0.04 0.4995 12.40 8
所以μ的置信度为0.99置信区间是 11.90, 12.40
例5.初生婴儿的体重X近似服从正态分布 N( , 2 )
从某地区随机抽取12名新生儿,测得 x 3056.67 克, S 359.36克,求平均体重u的置信度为95%的置信区间.
第三节 参数的区间估计
正态总体均值μ的区间估计 正态总体方差的区间估计 两个正态总体均值差的区间估计 两个正态总体方差之比的区间估计
• 定义 : 设总体X 具有概率函数p(x, ), 为未知
参数, ( X1, X 2 ,..., X n )为取自这个总体X的一个样
本,若对于事先给定的 , 0 1, 存在两个统计
由于这时
2
(n 1)S 2
2
~
2 (n 1)
对于给定的置信度1 ,查 2分布表得两个分位点
2 / 2 (n 1)和12 / 2 (n 1),使得 P{12 / 2 (n 1) 2 2 / 2 (n 1)} 1
第二章 参数估计2-3 区间估计
![第二章 参数估计2-3 区间估计](https://img.taocdn.com/s3/m/7e96af3183c4bb4cf7ecd13e.png)
I=0.814
上页 下页 返回
钢厂铁水含碳量X 例3. 钢厂铁水含碳量 ~ N(µ,0.1082), 现在随机测定 该厂9炉铁水得 炉铁水得X=4.484,求在置信度为 求在置信度为0.95 的条件 该厂 炉铁水得 求在置信度为 下铁水平均含碳量的置信区间。 下铁水平均含碳量的置信区间。 解
置信区间为
上页
下页
返回
联合方差
上页
下页
返回
1、 µ1 - µ2的1-α置信区间 、 α (1)、 σ12 、σ22已知 、
由于 X −Y ~ N(µ1 − µ2 ,
选取
2 2 σ1 σ2
n1
+
n2
)
因此置信度为1-α 因此置信度为 α的µ1 - µ2置信区间可为
上页
下页
返回
(2)、σ12 、σ22未知,且n1,n2较大 如大于 、 未知, 较大(如大于 如大于50)
=27.5, ,
=6.26, ,
上页
下页
返回
测量一批铅锭的比重,设铅锭的比重X 例6. 测量一批铅锭的比重,设铅锭的比重 ~ N(µ, 现进行16次检测得铅锭的比重有 σ2),现进行 次检测得铅锭的比重有 现进行 次检测得铅锭的比重有X=2.705, , S2=0.0292,试求总体 的均值µ和方差 σ2置信度为 求总体X的均值 0.95 的置信区间。 的置信区间。 解 (1)求µ的置信区间 σ2未知 n=16,α=0.05. 求 的置信区间, 未知, α 选取 查表得 置信区间为
(二)、总体X数学期望 (二)、总体X数学期望µ未知 数学期望µ 样本X 的无偏估计. 样本 1,X2, • • • , Xn, 且S2是σ2的无偏估计
选取样本函数
参数估计-区间估计
![参数估计-区间估计](https://img.taocdn.com/s3/m/7dc86c8ab9d528ea81c77997.png)
2 σ 12 σ 2
25 36 + = + = 5.5 ≈ 2.345 m n 10 12
从而由(2-43)式得 µ1 − µ 2 的置信度为 0.90 的置 信区间是
(19.8 − 24.0 ± 1.645 × 2.345) = ( −8.06, − 0.34)
2 (2)σ 12 = σ 2 = σ 2 ,但σ 2 未知,可构造样本函数
解:依题意取样本函数 T =
X −µ S
2
~ t ( n − 1)
对于给定的α =0.05,由
n
0.05 = 0.025 P{T > λ} = α / 2 = 2 又 n = 15 ,经计算 查 t (14) 分布表,求得 λ =2.145。
1 15 X = ∑ xi = 425.047 15 i =1
时);随机抽取 B 型号的灯泡 7 只,测得平均寿 命为 X B = 980(小时) , 标准离差为 S B = 32(小
时)。设两总体都服从正态分布,并且由生产 过程知,它们的方差相等,求两正态总体均值 差 µ A − µ B 的 0.99 的置信区间。
解:取样本函数 X − Y − ( µ1 − µ 2 ) T= ~ t ( m + n − 2) 1 1 + Sw m n 又由 1 − α = 0.99 , 得 α = 0.01, 查 m + n − 2 = 10, 表得 λ = 3.1693 ,经计算 2 2 ( m − 1 ) S + ( n − 1 ) S 2 A B SW = = 928 m+n−2
信区间是 15 .06 + 0.18) = (14 .88, 15 .24 ) ( 15 .06 − 0.18,
应用数理统计第二章参数估计(3)区间估计
![应用数理统计第二章参数估计(3)区间估计](https://img.taocdn.com/s3/m/563c543dfc4ffe473368ab7f.png)
例1 有一大批月饼,现从中随机地取16袋,称得重量(以克 计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 ,设袋装月饼的重量近似地服从正态 分布,试求总体均值的置信度为0.95的置信区间。 解: 2未知, 1-=0.95, /2=0.025,n-1=15, t0.975 (15) 2.1315 由已知的数据算得 x 503.75, S* 6.2022
n1 (n2 1) S12 12 n1 (n2 1) S12 P F (n 1, n1 1) 2 F (n 1, n1 1) 1 2 /2 2 2 1 / 2 2 2 n2 (n1 1) S2 n2 (n1 1) S2
10
得所求的标准差的置信区间为 (4.58, 9.60)
2.4.3 两个正态总体参数的区间估计
在实际中常遇到下面的问题:已知产品的某一质量指标 服从正态分布,但由于原料、设备条件、操作人员不同,或 工艺过程的改变等因素,引起总体均值、总体方差有所改变, 我们需要知道这些变化有多大,这就需要考虑两个正态总体 均值差或方差比的估计问题。
ˆ a ˆ b} {g(a) T ( X , X ,..., X ; ) g(b)} { 1 2 n
其中g ( x )为可逆的已知函数, T ( X 1 , X 2 ,..., X n ; 况
设总体X~N(,2),X1, X2, …,Xn是总体X的样本,求,2 /2 /2 的置信水平为(1)的置信区间.
求得 的置信水平为(1)的置信区间: ( 2未知)
S S* t1 2 (n 1) or X t1 2 (n 1) X n1 n
参数的点估计与区间估计
![参数的点估计与区间估计](https://img.taocdn.com/s3/m/a05613c0bceb19e8b8f6bac3.png)
d
ln d
L
n i1
xi
1
令
n 0 ,
1 n
n i1
xi
x.
有时用求导方法无法最终确定未知参数的 极大似然估计, 此时用极大似然原则来求 .
例: 设总体 X ~ U [a, b] , ( x1 , x2 ,…, xn ) 为一样本值,
求 a, b 的极大似然估计.
解:
X 的概率密度
1(ba), axb,
P{Xk}CrkCCN SN Skr , 0kmiSn ,r)(
把上式右端看作 N 的函数,记作 L(N; k) .
应取使 L(N; k) 达到最大的N, 作为 N 的极大似然估计.
但用对 N 求导的方法相当困难, 我们考虑比值:
L( N ; k ) (NS)(Nr) L( N 1; k ) N(NrSk)
n
近似为 f (xi;)dxi , 其取值随 而变;
i1
既然在一次抽样中就得到了样本值(x1 , x2 , …, xn) , 因而我们有理由认为: 样本 ( X1 , X2 , …, Xn ) 在 ( x1 , x2 , …, xn ) 旁边取值的概率比较大;
根据“概率最大的事件最可能发生”,我们可取
参数估计又分点估计与区间估计.
§1 参数的点估计
设总体 X 的分布中含未知参数 ,
( X1 , X2 , …, Xn ) 是一样本, 要构造一统计量
(X1,,
Xn)作为
的估计
(
叫做
的点估计量);
对应样本值( x1 , x2 , …, xn ), (x1,, xn) 可作为
的估计值,叫做 的点估计值.
则称( 1 , 2 )是 的置信度(置信水平, 置信概率)为
参数的区间估计
![参数的区间估计](https://img.taocdn.com/s3/m/420567e719e8b8f67c1cb995.png)
若存在统计量 θ θ ( X 1 , X 2 , , X n ) 和 θ θ ( X 1 , X 2 , , X n ), 使得 P {θ θ θ } 1 α, 则称区间 (θ , θ ) 是参数θ 的置信度为1-α的置信区间, θ 和 θ 分别称为置信度 为1-α的置信区间的置信下限和置信上限, 1-α称为置 信度。
第四节
参数的区间估计
一、置信区间和置信度 二、单个正态总体均值和方差的置信区间 三、两个正态总体均值差的置信区间 四、两个正态总体方差比的置信区间
一、置信区间和置信度 P152
1.定义: 设总体X的概率密度为 f ( x , θ ), θ是未知参数, X1,X2,…,Xn为X 的样本,对于事先给定的α (0<α<1),
(一)总体均值 的估计 2 1. 方差 已知 (X z 2 , X z 2 )
n n
S S 2. 方差 (X t ( n 1), X t ( n 1) ) n 2 n 2 (二)总体方差n 2的估计 n
2未知
1. 已知
( i 1
2 ( X μ ) i 2 χα (n)
注: (1)置信区间的长度反映了估计的精确度,置信区间
长度越小,估计的精确度越高. (2)置信度1-α反映了估计的可靠度, 1-α 越大越可
靠. 但是,若提高可靠度就会降低精确度,提高精确
度就会降低可靠度. 处理原则: 先保证可靠度(置信度)1-α, 再选置信区间中长 度最小的那个以提高精确度.
二、单个正态总体均值和方差的置信区间
所以,总体均值 的置信度为0.95的置信区间是:
n 7 7 ( 115 1.96 , 115 1.96 ) (110.43 , 119.57) 9 9
参数区间估计
![参数区间估计](https://img.taocdn.com/s3/m/fc8b427f2a160b4e767f5acfa1c7aa00b42a9d56.png)
参数区间估计参数区间估计是统计学中的一种方法,它用于估计一个总体参数的未知值,并给出一个置信区间,其中该参数可能落入的区间范围。
参数区间估计和点估计是估计总体参数两种基本的方法。
点估计是根据样本数据得到一个数值作为总体参数的估计值,而参数区间估计则是给出一个区间范围,并在此范围内“置信”该参数的值。
在进行参数区间估计时,需要用到区间估计的公式,其中包括样本容量、样本均值、样本标准差和置信水平等参数。
置信水平是一个常用的概念,它表示总体参数在这个置信区间内的概率。
例如,置信水平是95%,则表示我们有95%的把握认为总体参数在这个置信区间内的概率非常高,这个区间被称为95%置信区间。
置信区间的长度取决于置信水平和样本大小。
当置信水平升高时(例如,从90%提高到95%),置信区间变宽,这使得我们更加信任我们的估计结果。
样本大小也会影响置信区间的长度,样本容量越大,置信区间就越小。
需要注意的是,置信区间并不是总体参数的具体取值,而只是一个常规结论,总体参数可能在这个范围内,也可能不在。
不过,当样本容量增加时,置信区间变的越来越小,通常认为总体参数落在这个区间内的概率也随之增加。
在实际应用中,关于置信区间的选择有时并不是那么显然。
通常,我们希望使用更高的置信水平来增加对区间估计的置信度;但是,同时也会导致区间的长度变大,因为区间长度越小,实际概率越小,也就是说,得到的区间准确率越高。
总的来说,参数区间估计是统计学上一种有用的方法,它允许我们使用样本数据来估计总体参数的未知值,并给出总体参数可能落在的置信区间。
这些区间是统计学上的常规结论,不能确定总体参数的确切值,但总体参数肯定会落在该区间内的概率相对较大。
在进行区间估计时需要考虑置信水平、样本容量等因素,并根据实际情况选择恰当的置信区间。
第4节正态总体参数的区间估计
![第4节正态总体参数的区间估计](https://img.taocdn.com/s3/m/a627633355270722192ef742.png)
3
, 给定 ,0 1 , 定义 设是总体的一个未知参数
确定两个统计量
ˆ , ˆ 分别称为置信下限和置信上限. 区间. 1 2
ˆ , ˆ ]为 的 置信水平为 1 的 置信 则称区间 [ 1 2
1.75 1.96 1.96 0.49, n 50
所以 的置信区间为
(4.10 0.49, 4.10 0.49 ) (3.61, 4.59 ) .
10
例3 在上例中 , 为使 的置信水平是 0.95 的置信区间
的长度 L 1.5, 求样本容量 .
, u0.025 1.96, 1.75, 解 0.05
u / 2
x
X | | u / 2 X u / 2 X u / 2 / n n n
于是所求 的置信区间为 ( X u 有时简记为 ( X u / 2
2
n
, X u 2 ), n n
7
).
2 某厂生产滚珠,直径 X 服从正态分布 N ( , ). 例1 为了估计 , 抽检 6 个滚珠, 测得直径为 ( mm) : 14.70, 15.21,14.90,14.91,15.32,15.32,
对给定的置信水平 1 ,
按标准正态分布的 水平双侧分位数的定义,
查正态分布表得 u 2 ,
6
1.
已知时 的置信区间
2
/2
( x)
X U ~ N (0,1) , / n
1
O
/2
X P{ | | u 2 } 1 , n
2参数的区间估计实验报告
![2参数的区间估计实验报告](https://img.taocdn.com/s3/m/5c84fb3abcd126fff7050b26.png)
参数的区间估计实验报告姓名: 班级: 学号(后3位):2016年12 月06 日00:00至24:00提交到邮箱:longsheng63@一.实验名称:参数的区间估计 二.实验性质:综合性实验 三.实验目的及要求:1.了解【活动表】的编制方法;2.掌握【单个正态总体均值Z 估计活动表】的使用方法. 3.掌握【单个正态总体均值t 估计活动表】的使用方法. 4.掌握【单个正态总体方差卡方估计活动表】的使用方法. 5.掌握【两个正态总体均值Z 估计活动表】的使用方法. 6.掌握【两个正态总体均值t 估计活动表】的使用方法. 7.掌握【两个正态总体方差卡方估计活动表】的使用方法. 8.掌握单个正态总体和两个正态总体参数的区间估计方法. 四.实验内容、实验操作关键步骤及实验主要结果1.某厂生产的化纤强度2~(,0.85)X N μ,现抽取一个容量为25n =的样本,测定其强度,得样本均值 2.25x =,试求这批化纤平均强度的置信水平为0.95的置信区间. 实验操作关键步骤及实验主要结果由于应选用样本函数 TINV 、SQRT 求μ的置信区间,所以,要选用【 单个正态总体均值t 估计活动表】,得到如下表的实验结果.因此,这批化纤平均强度的置信水平为0.95的置信区间为 (1.899137245,2.600862755) .单个正态总体均值t 估计活动表 置信水平 0.95 样本容量 25 样本均值 2.25 样本标准差 0.85标准误差 0.17t 分位数(单) 1.71088208 t 分位数(双) 2.063898562单侧置信下限 1.959150046 单侧置信上限 2.540849954 区间估计估计下限 1.899137245 估计上限2.6008627552.已知某种材料的抗压强度2~(,)X N μσ,现随机抽取10个试件进行抗压试验,测得数据如下:482,493,457,471,510,446,435,418,394,469.(1)求平均抗压强度μ的置信水平为0.95的置信区间. (2)求2σ的置信水平为0.95的置信区间. 实验操作关键步骤及实验主要结果(1)由于应选用样本函数 TINV 、SQRT 求μ的置信区间,所以,要选用【 单个正态总体均值t 估计活动表】,得到如下表的实验结果.因此,平均抗压强度μ的置信水平为0.95的置信区间为 (432.3068626,482.6931374) .单个正态总体均值t 估计活动表 抗压强度 抗压强度 482 置信水平 0.95 493 平均 457.5 样本容量 10 457 标准差 35.21757768样本均值 457.5 471 方差 1240.27777 样本标准差 35.21757768 510446 标准误差11.13677591435 t 分位数(单) 1.833112933 418 t 分位数(双) 2.262157163 394469 单侧置信下限 437.085032 单侧置信上限 477.914968 区间估计估计下限 432.3068626 估计上限482.6931374(2)由于应选用样本函数 CHIINV 求2σ的置信区间,所以,要选用【 单个正态总体方差卡方 估计活动表】,得到如下表的实验结果.因此,2σ的置信水平为0.95的置信区间为 (586.7969434,4133.663681) .单个正态方差卡方估计活动表 抗压强度 抗压强度 482 置信水平 0.95 493 平均 457.5 样本容量 10 457 标准差 35.21757768 样本均值 457.5 471 方差 1240.27777 样本方差 1240.278 510446 卡方下分位数(单) 3.325112843 435 卡方上分位数(单) 16.9189776 418 卡方下分位数(双) 2.7003895 394 卡方上分位数(双) 19.0227678 469单侧置信下限 659.7622067 单侧置信上限 3357.029529 区间估计估计下限 586.7969434 估计上限 4133.6636813.用一个仪表测量某一物理量9次,得样本均值56.32x =,样本标准差0.22s =. (1)测量标准差σ的大小反映了仪表的精度,试求σ的置信水平为0.95的置信区间. (2)求该物理量真值的置信水平为0.99的置信区间. 实验操作关键步骤及实验主要结果(1)由于应选用样本函数 CHIINV 求σ的置信区间,所以,要选用【 单个正态标准差卡方 估计活动表】,得到如下表的实验结果.因此,σ的置信水平为0.95的置信区间为 (0.100373285,0.807439177) .单个正态标准差卡方估计活动表 置信水平 0.95 样本容量 9 样本均值 56.32 样本标准差0.22卡方下分位数(单) 2.732636793 卡方上分位数(单) 15.50731306 卡方下分位数(双) 2.179730747 卡方上分位数(双) 17.53454614单侧置信下限 0.113494839 单侧置信上限 0.644066568 区间估计估计下限 0.100373285 估计上限0.807439177(2)由于应选用样本函数 TINV 、SQRT 求μ的置信区间,所以,要选用【 单个正态总体均值t 估计活动表】,得到如下表的实验结果.因此,该物理量真值的置信水平为0.99的置信区间为 (56.07393826,56.56606174) .单个正态总体均值t 估计活动表 置信水平 0.99 样本容量 9 样本均值 56.32 样本标准差 0.22标准误差 0.073333333 t 分位数(单) 2.896459448t 分位数(双) 3.355387331单侧置信下限 56.10759297 单侧置信上限 56.53240703 区间估计估计下限 56.07393826 估计上限56.566061744.设从总体211~(,)X N μσ和总体222~(,)Y N μσ中分别抽取容量为110n =,215n =的独立样本,经计算得82x =,256.5x s =,76y =,252.4ys =. (1)若已知2164σ=,2249σ=,求12μμ-的置信水平为0.95的置信区间. (2)若已知2212σσ=,求12μμ-的置信水平为0.95的置信区间.(3)求2122σσ的置信水平为0.95的置信区间.实验操作关键步骤及实验主要结果(1)由于应选用样本函数 NORMSINV 、SQRT 求12μμ-的置信区间,所以,要选用【 两个正态总体均值差Z 估计活动表】,得到如下表的实验结果.因此,12μμ-的置信水平为0.95的置信区间为 (-0.093775671,12.09377567) .两个正态总体均值差Z 估计活动表 置信水平 0.95 样本1容量 10 样本1均值 82 总体1方差 64样本2容量 15 样本2均值 76 总体2方差 49标准误差 3.109126351 Z 分位数(单) 1.644853627Z 分位数(双) 1.959963985单侧置信下限 0.885942245 单侧置信上限 11.11405776 区间估计估计下限 -0.093775671 估计上限12.09377567(2)由于应选用样本函数 TINV 、SQRT 求12μμ-的置信区间,所以,要选用【 两个正态总体均值差t 估计活动表】,得到如下表的实验结果.因此,12μμ-的置信水平为0.95的置信区间为 (-0.206222664,12.20622266) .两个正态总体均值差t估计活动表置信水平0.95样本1容量10样本1均值82样本1方差56.5样本2容量15样本2均值76样本2方差52.4总方差54.00434783t分位数(单) 1.713871528t分位数(双) 2.06865761单侧置信下限0.858178432单侧置信上限11.14182157区间估计估计下限-0.206222664估计上限12.20622266(3)由于应选用样本函数 FINV 求2122σσ的置信区间,所以,要选用【两个正态总体方差比F 估计活动表】,得到如下表的实验结果.因此,2122σσ的置信水平为0.95的置信区间为(0.335974873,4.09512052).两个正态总体均方差比F估计活动表置信区间0.95样本1容量10样本1方差56.5样本2容量15样本2方差52.4F下分位数(单) 2.645790735F上分位数(单)0.33052686F下分位数(双) 3.209300341F 上分位数(双) 0.263299766单侧置信下限 0.407531956 单侧置信上限 3.262198644 区间估计估计下限 0.335974873 估计上限4.095120525.设滚珠直径服从正态分布,现从甲、乙两台机床生产同一型号的滚珠中,分别抽取8个和9个样品,测得其直径(单位:mm )如下:(1)求2122σσ的置信水平为0.95的置信区间.(2)若已知2212σσ=,求12μμ-的置信水平为0.95的置信区间.实验操作关键步骤及实验主要结果(1)由于应选用样本函数 FINV 求2122σσ的置信区间,所以,要选用【 两个正态总体方差比F 估计活动表】,得到如下表的实验结果.因此,2122σσ的置信水平为0.95的置信区间为 (0.807941784,17.925779) .两个正态总体均方差比F 估计活动表 甲台 乙台 15 15.2 置信区间 0.95 14.5 15 样本1容量 815.2 14.8 样本1方差 0.09553571 15.5 15.214.8 15 样本2容量 915.1 15 样本2方差 0.02611111 15.2 14.814.8 15.1 F 下分位数(单) 3.500463855 14.8 F 上分位数(单) 0.268404113 F 下分位数(双) 4.528562147 甲台 乙台 F 上分位数(双) 0.204109098平均 15.0125 平均 14.98888889 单侧置信下限 1.045237069 标准差 0.309088522 标准差 0.161589329 单侧置信上限 13.63173812 方差 0.09553571 方差 0.02611111 区间估计估计下限 0.807941784 估计上限17.925779(2)由于应选用样本函数 TINV 求12μμ-的置信区间,所以,要选用【 两个正态总体均值差t 估计活动表】,得到如下表的实验结果.因此,12μμ-的置信水平为0.95的置信区间为 (-0.226910711,0.274132931) .两个正态总体均值差t 估计活动表 甲台 乙台 15 15.2 置信水平 0.95 14.5 15 样本1容量 8 15.2 14.8 样本1均值 15.0125 15.5 15.2 样本1方差 0.09553571 14.8 1515.1 15 样本2容量 915.2 14.8 样本2均值 14.98888889 14.8 15.1 样本2方差 0.02611111 14.8总方差0.058509257甲台 乙台 t 分位数(单) 1.753050356t 分位数(双) 2.131449546 平均 15.0125平均14.98888889标准差 0.309088522 标准差 0.161589329 单侧置信下限 -0.182435225 方差 0.09553571 方差 0.02611111 单侧置信上限 0.229657445 区间估计估计下限 -0.226910711 估计上限0.274132931。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A
2
•例:设有一批电子元件的寿命X~N(a,1), 现从中抽取容量为5的一组样本,算得其样本 均值为5000小时,试估计a.
解:由点估计,a的估计值为 aˆ 5000 .
实际上a的值是非真是5000呢?显然,不同的
抽样,可得到不同的 aˆ 值,故5000与a会有
差异.这种差异有多大呢?
我们从另一个角度考虑
2 2(n1),
1 22(n1)(n 12 )S2 22(n1)
2 1
2(n1),
/2
/2
(n 22 (1 n ) S 1 2)2(1 2 n 2(1n )S 2 1),
所以
间的实现中,约有95个能覆盖 ,而不是说一个实 现以 0.95 的概率覆盖了 .
要求 以很大的可能被包含在置信区间内,就是
说 尽量, 可概靠率.置信P {度ˆ1即可靠ˆ要2度}尽.1可 能大,即要求估计
区间的宽度反映了估计的精度.显然,区间越小, 精度越高.
区间估计中的精确性与可靠性是相互矛盾的. 当样本容量一定时,提高估计的可靠度,将降低 估计的精度,相反,提高估计的精度,将降低 估计的可靠度.
③ 由Z/2确
定置信区间
简记为
X
n
Z 2
(2) 未知方差 2 时 —— 实用价值更大 !!
由于 (XnZ/2, XnZ/2)与 有关, 故不能采用已知方差
的均值估计方法 —— 用 U 但其解决的思路一致.
X
S /
n
分布的分位数求 的置信区间.
由于 S 2是 2 的无偏估计量, 故可用 S 替代 的估计量:
P { ˆ1 ˆ2 } 1 成 立,我 们 称1 为 置 信 度 或 置 信 概 率 ,区 间
( ˆ1 ,ˆ2 )为 参 数 的 置 信 度 为1 的 置 信 区 间 .分 别 称 ˆ1 ,ˆ2为 置 信 上 限 和 置 信 下 限 .
A
7
置信度为 0.95 是指 100 组样本值所得置信区
A
3
由 于 aˆ = X 是 一 个 随 机 变 量 , 它 有 自 己 的 分 布 X : N (a, 1 )
n 因 此 , U X a : N (0,1)
1n 于 是 对 给 定 的 一 个 正 数 (0 1), 有
P{
X 1
a n
<z /2}=1-
A
4
即
P{X
1 n
z /2 <a<X
设 X1, …, Xn 是总体 X ~ N( , 2)的样本, X ,─S2 分别是其样本
均值和样本方差, 求参数 、 2 的置信水平为1- 的置信区间.
1. 均值 的置信区间
① 确定未知参数的
(1)已知方差 2 时
估计量及其函数的分布
X
1 n
n i1
Xi
是 的无偏估计量,
由抽样分布定理知
X─ ~ N( ,
2/n),
U
故可用
─
X
作为
EX
X / n
~ N(0, 1),
的一个估计量,
有了分布就可求出U 取值于任意区间的概率
对给定的置信度 1- , P(|U|Z/2),② 由分布求分位数Z/2
|X / n| Z /2 X nZ /2 X nZ /2
即得置信区间 (XnZ/2, XnZ/2),
<z /2}=1-
0.4
ch7-6
0.3
0.2
P{ X 1
a n
z
/2}=
取 = 0.05
0.1
z-2 1
2
-1
z 1
2
2
Z/2 Z1/2
z 2z1 2 1 .9 6 ( 1 .9 6 )3 .9 2 0.4 0.3
z2 3 z1 3 1 .8 4 ( 2 .1 3 ) 3 .9 7 0.2
由抽样分布定理知 T = X ~ t(n-1),
Sn
令 P {|T |t2(n1 )}1,
查 t 分布表确定 /2 分位数 t/2(n -1),
|
X
Sn
|
t/2(n1)
X S nt2(n 1 )X S nt2(n 1 )
(XS nt2(n1), XSnt2(n1))即为 的置信度为1- 的区间估计.
在实际使用中,总是在保证一定的可靠度的情况 下尽可能地提高其精度.
A
8
区间估计的步骤
(1)选 取 一 个 合 适 的 随 机 变 量 T ,这 个 随 机 变 量
一 方 面 包 括 了 待 估 参 数 ,另 一 方 面 ,它 的 分 布
是已知的;
(2)根 据 实 际 需 要 ,选 取 合 适 的 置 信 度 1-;
2. 方差 2 的置信区间的求法
(2) 未知时 因为 2 的无偏估计为 S 2 , 由抽样分布定理知
2
=
(n1)S2
2
~2(n1),
找一个含 与S, 但不含 ,
且分布已知的统计量
由 P {1 2 2 ( n 1 )2 2 2 ( n 1 ) } 1
确定 2 分布的 /2 分位数
1 n
z
/2}=1-
如 果 取 0.05有 Z /2 1.96,于 是 有
P{10.72<a<12.48}= 0.95
这 就 是 说 ,我 们 有 95%的 把 握 认 为 a在 区 间
(10.72 , 12.48) 内.这样一种方式的估计
称为区间估计.
为什么要z取/2 ?
A
5
P{
X 1
a n
§6.4 参数的区间估计
2010年11月
A
1
点估计与区间估计:
矩估计与极大似然估计,都是一种点估计。
点估计的两个缺陷:Байду номын сангаас(1)不能说明估计值与真值的偏差到底有多大
(精确性); (2)不能说明这个估计有多大的可信度(可靠性);
区间估计是指用一个(随机) 区间去做未知参数
的估计,可以解决这两个不足 。
在保持面积不变的条件下,
0.1
以对称区间的长度为最短 .
z-2
1
3
-1
z1
2
2
3
定 义 :设 总 体 X 的 分 布 中 含 有 未 知 参 数 ,
是 任 意 给 定 的 正 数 (0< <1),如 果 能 从 样 本
出 发 确 定 出 两 个 统 计 量 ˆ1 ( X 1 , X 2 ,L , X n ), ˆ2 ( X 1 , X 2 ,L , X n ), 使 得
(3)根 据 相 应 分 布 的 分 位 数 概 念 ,写 出 如 下
形式的概率表达式
P{ T1 T T2} 1 ( 4 ) 将 上 式 表 达 式 变 形 为 P { ˆ1 ˆ2 } 1 ( 5 ) 写 出 参 数 的 置 信 区 间 ( ˆ1 , ˆ2 )
A
9
(一) 单个正态总体置信区间的求法