概率论第八章 置信区间

合集下载

概率论与数理统计第八章2资料

概率论与数理统计第八章2资料
解:有放回地抽取3个球, 若取到0个或1个白球,认为袋中黑球多。 若取到2个或3个白球,认为袋中白球多。
用表示取到的白球个数 若白球占1 4,则的分布为
0 1 2 3 P 27 27 9 1
64 64 64 64 若白球占3 4,则的分布为
0 1 2 3 P 1 9 27 27
64 64 64 64 可见,当=0或1时,认为白球占1 4
解: 0 1 P 1p p E p
若X1,...,
X
为一组样本,则
n
p X
1 n
n i1
Xi
m n
n
其中m Xi表示重复试验中事件发生次数。 i1
即可用事件发生的频率来估计概率。
例3 设总体服从[a, b]上的均匀分布,用矩法 估计a与b
解:设X1,...,Xn为一组样本
由于E a b 2
实际上,是似然函数L的最大值点。
由于lnL与L同时达到最大值
求ln L的最大值点往往更方便。 ln L称为对数似然函数。 若为向量,=(1,...,m )
解方程组
ln L
1 ...
0
ln L 0 m
得到驻点(1,..., m ), 它常常就是最大值点。
例6(选讲) 用最大似然法估计事件发生的概率p 解: 0 1
DX 2 3
3
ai
i1
3
DX ' ai2DXi
3
ai
2
2
3
a
2 i
i1
i1
i1
3 2
ai i1
利用
ai2
a2j
2aia

j
3
ai
2
a1

概率论第八章 置信区间

概率论第八章 置信区间

试问机器是否正常 (给定显著性水平 0.05)
解 : 设X ~ N ( , ), 此是在 0.015已知条件下 ,
2
判断均值 0.5
还是 0.5的问题, 为此
1)提出假设 H 0 : 0.5; H1 : 0.5;
2)显著性水平 0.05, 样本容量 n9
装糖重总体 X 的均值和标准差, 已知 0.015, 则 X ~ N ( , 0.0152 ), 其中 未知.
问题: 根据样本值判断 0.5 还是 0.5 .
提出两个对立假设H 0 : 0 0.5 和 H1 : 0 . 再利用已知样本作出判断是接受假设 H0 ( 拒绝 假设 H1 ) , 还是拒绝假设 H0 (接受假设 H1 ). 如果作出的判断是接受 H0, 则 0 ,
又如, 对于正态总体提出数学期望等于 0 的 假设等. 假设检验就是根据样本对所提出的假设作 出判断: 是接受, 还是拒绝.
假设检验问题是统计推断的另一类重要问题. 如何利用样本值对一个具体的假设进行检验?
通常借助于直观分析和理论分析相结合 的做法,其基本原理就是人们在实际问题中经 常采用的所谓实际推断原理:“一个小概率事 件在一次试验中几乎是不可能发生的”.
对实际中需作出判断的 问题, 提出适当的 统计假设, 根据来自总体的样本 X 1 , X 2 , , X n , 选择适当的统计量 , 此统计量需服从熟知的 分 布, 据此分布由小概率原理 可以确定原假设的 拒绝域, 若样本值落入此拒绝域 中, 则拒绝原假 设, 否则接受原假设。
二、假设检验的相关概念
H0:0 H0: 0 H 0: = 0
vs vs vs
H 1: > 0 H 1: < 0 H1: 0

概率统计及随机过程:置信区间

概率统计及随机过程:置信区间

2.方差DX未知,对EX进行区间估计
上面的讨论是在DX已知的情况下进行的, 但实际应用中往往是DX未知的情况。
设x1,x2,,xn为正态总体N(,2)的一个 样本,由于2未知,我们用样本方差S2来
代替总体方差2,
x
1 n
( x1
x2
xn
)
~
N(, 2
n
)
U x ~ N (0,1)
/ n
1 n
sn2
m n
作为1 的2近似置信区间。
3.方差
2 1
22且 为2 未知
由第七章定理五知,统计量
(x y) (1 2 ) mn(m n 2)
(m
1)S
2 m
(n
1)S
2 n
mn
服从t(m+n-2)分布。由此可得1 2
的置信区间为
(*)
x
y
t1 2
(m
n
2)
(m
1)s
2 m
(n
容量为10和15的独立样本,测得样本方差
分别为
,s12 求 0.2二1, s2总2 0体.67 方差 比 的0.95
置信12 区/ 22间。
解 这里=0.05,m=10,n=15, 查F分布表得
F1 (m 1, n 1) F0.975 (9,14) 3.21 2
F
2
(m 1, n
1)
F0.025 (9,14)
表,可得临界值
2 2
(n
1)及1使22 (得n
1)
P{
2
(n
2
1)
Y
2 12
(n
1)} 1
P{
2

置信区间

置信区间

2
(n 1)
2 1(nຫໍສະໝຸດ S2 1)}1
2
2
则得到σ2随机区间
(n 1)S 2 (n 1)S 2
[
,
]
2
(n
1)
2 1
(n
1)
2
以 1 的概率包含未知方差σ2,
这就2是σ2的置信度为
1-α的置信区间。
24
例1 某自动车床加工零件,抽查16个测得长度(毫米)
12.15 12.12 12.01 12.08 12.09 12.16 12.03 12.01
这种形式的估计称为区间估计. 也就是说,我们希望确定一个区间,
使我们能以比
较高的可靠程度相信它包含真参数值.
这里所说的“可靠程度”是用概率来度量的,
称为置信概率,置信度或置信水平.
习惯上把置信水平记作 的正数,称为显著水平。
1
,这里 是一个很小
2
定义7.6
两个统计量
若由总体X的样本 X1,X2,…Xn 确定的
6
一、数学期望的置信区间
1、已知σ2时,μ的置信区间

X ~ N(, 2)
X ~ N(, 2 )
EX DX 2
n
n
则随机变量
X
Z
~ N (0,1)
2
n

X
P{
2
z } 1
2
n
2
z
2
2
z
2 7

X
P{
2
z } 1
2
n
2
2
P{z 2
X 2
z 2} 1
z
z
n

概率统计中的置信水平与置信区间

概率统计中的置信水平与置信区间

概率统计是一门研究随机现象的学科,它运用数学的方法对随机数据进行分析和处理。

在概率统计中,置信水平与置信区间是两个重要概念,它们被广泛应用于实证研究、市场调查、医学研究等领域。

本文将详细介绍置信水平与置信区间的概念及其在实际应用中的作用。

首先,我们来了解一下置信水平的概念。

置信水平是指在统计推断中,对一个特定参数的估计结果所具有的可靠程度。

通常以α表示,常见的置信水平有90%、95%、99%等。

以95%的置信水平为例,表示在统计推断中,我们有95%的置信度认为真实参数在置信区间内。

接下来,我们来介绍一下置信区间的概念。

置信区间是指在一定置信水平下,对一个未知参数的估计范围。

置信区间通常由一个下限和一个上限组成,表示估计值在该范围内的可能性。

以某种特定结果的95%置信区间为例,表示有95%的置信度认为未知参数在该区间内。

在概率统计中,确定置信水平与置信区间需要使用统计方法。

通常使用正态分布或t分布来进行统计推断。

对于大样本量和已知总体标准差的情况,使用正态分布进行推断;对于小样本量和未知总体标准差的情况,使用t分布进行推断。

一般情况下,置信水平越高,置信区间越宽,即估计的可靠性越高。

概率统计中的置信水平与置信区间在实际应用中具有重要的作用。

首先,置信水平与置信区间可以帮助研究者对未知参数做出合理的估计与推断。

比如在医学研究中,研究人员可以通过置信区间对一种新药物的疗效进行估计,从而为临床实践提供科学依据。

其次,置信水平与置信区间可以用于比较实验结果的显著性。

通过比较两个实验结果的置信区间,可以判断它们是否具有显著差异。

比如在市场调查中,调查人员可以通过置信区间判断两个广告效果的显著性,从而决定是否需要调整广告策略。

此外,置信水平与置信区间还可以帮助研究者确定样本量大小。

根据预先确定的置信水平和置信区间宽度,可以计算出所需的最小样本量。

通过合理地确定样本量大小,可以提高统计推断的准确性和可靠性。

总之,概率统计中的置信水平与置信区间是进行统计推断的重要工具。

《概率论与数理统计》习题及答案第八章

《概率论与数理统计》习题及答案第八章

《概率论与数理统计》习题及答案第⼋章《概率论与数理统计》习题及答案第⼋章1. 设x.,x2,,%…是从总体X中抽岀的样本,假设X服从参数为兄的指数分布,⼏未知,给泄⼊〉0和显著性⽔平a(Ovavl),试求假设H o的⼒$检验统计量及否建域.解选统汁量*=2⼈⼯⼄=2如庆则Z2 -Z2(2n) ?对于给宦的显著性⽔平a,査z'分布表求出临界值加⑵",使加⑵2))=Q因z2 > z2 > 所以(F": (2/1)) => (/2 > /; (2n)),从⽽a = P{X2 > 加⑵“} n P{r > Za(2/0)可见仏:2>^的否定域为Z2>Z;(2?).2. 某种零件的尺⼨⽅差为O-2=1.21,对⼀批这类零件检查6件得尺⼨数据(毫⽶):,,,,,。

设零件尺⼨服从正态分布,问这批零件的平均尺⼨能否认为是毫⽶(a = O.O5).解问题是在/已知的条件下检验假设:“ = 32.50Ho的否定域为1“ l> u af2u0(n5 = 1.96 ,因1“ 1=6.77 >1.96,所以否泄弘,即不能认为平均尺⼨是亳⽶。

3. 设某产品的指标服从正态分布,它的标准差为b = 100,今抽了⼀个容量为26的样本,计算平均值1580,问在显著性⽔平a = 0.05下,能否认为这批产品的指标的期望值“不低于1600。

解问题是在b?已知的条件下检验假设://>1600的否定域为u < -u a/2,其中X-1600 r-r 1580-1600 c , “11 = ------------ V26 = ------------------- x 5.1 = —1.02.100 100⼀叫05 =—1.64.因为// =-1.02>-1.64 =-M005,所以接受H(>,即可以认为这批产品的指标的期望值“不低于1600.4. ⼀种元件,要求其使⽤寿命不低于1000⼩时,现在从这批元件中任取25件,测得其寿命平均值为950⼩时,已知该元件寿命服从标准差为o-=100 ⼩时的正态分布,问这批元件是否合格(<7=0.05)解设元件寿命为X,则X~N(“,IO。

置信区间知识

置信区间知识

s125 试由试验结果求EX的置信水平为99%的近似置信
区间
解 由题设x17.84 s125 n100 给定001
查附表u/22.56 计算可得
x u /2
s 17.840.32 n
故的置信水平为99%的近似置信区间为(1752 1816)

P12 / 2(2n)
2n
X
2/2(2n)
1
经不等式变形得
P
2nX
2/2(2n)
2nX
2 1
/2(2n)
1
于是
2nX
2/2(2n)
,
2nX
2 1
/2(2n)
为所求置信区间
11
三、正态总体参数的置信区间
1 均值的置信区间 (1)方差 2已知的情形
根据例512 在 2已知的条件下 的1置信区间为
T X
S/ n
渐近服从N(0 1) 于是的近似置信区间为
X u/2
S n
,
X
u /2
S n
26
例519 某厂新研究开发了某类设备所需的关键部件,
现无法确定此部件的的连续使用寿命X(单位 kh)所服从的
分布类型 通过加速失效试验法 测试100个此类部件的连
续使用寿命 测得样本平均值为x17.84 样本标准差为
P|
Xp p(1 p)/n
|
u
/
2
1
经不等式变形得 P{ap2bpc0}1 其中
a n(u/2)2 b 2nX (u/2)2 c n(X )2
又由a0知ap2bpc0等价于p1pp2 其中
p1
1 2a
(b
b2
4ac

概率密度估计置信区间

概率密度估计置信区间

概率密度估计置信区间
概率密度估计的置信区间是用来描述对真实概率密度函数进行估计时的不确定性范围。

一般情况下,我们使用统计方法对数据进行分析,并根据样本数据来估计概率密度函数。

常用的概率密度估计方法包括核密度估计和参数估计。

在进行概率密度估计时,我们可以得到一个估计的概率密度函数。

然而,由于样本数据的有限性以及估计方法的不确定性,估计的概率密度函数可能与真实概率密度函数存在一定的偏差。

为了描述估计结果的不确定性,我们可以计算概率密度估计的置信区间。

置信区间是指对于给定置信水平(通常选择95%或99%),在重复抽样下,包含真实概率密度函数的区间的概率。

计算概率密度估计的置信区间需要考虑估计方法的方差以及样本数据的大小。

常见的计算方法包括基于正态分布近似的方法(如渐进法和Bootstrap法)以及基于非参数统计的方法(如Jackknife法和交叉验证法)。

总之,概率密度估计的置信区间提供了对估计结果的不确定性进行量化的方法,可以帮助我们评估概率密度估计的可靠性和稳定性。

1。

置信区间(详细定义及计算)

置信区间(详细定义及计算)

假设标准差 0 7,置信度为 95%;
试求总体均值 的置信区间。 解:已知 0 7, n 9, 0.05. 由样本值算得: 1 x (115 120 110 ) 115 . 9

2 [X z 2 , X z 2 ] n n 115 1.96 7 / 9 , 115 1.96 7 / 9 110.43 , 119.57
则称区间 [1 , 2 ] 是 的置信水平(置信度)为 1 的置信区间. 1 和 2 分别称为置信下限和置信上限 (双侧置信区间).
1 为置信度, 为显著水平.
4
置信水平的大小是根据实际需要选定的. 例如,通常可取显著水平 0 .025, 0 .05, 0 .1, 等. 即取置信水平 1 0.975 或 0.95,0.9 等. 由给定的置信水平,我们求出 根据一个实际样本, 一个尽可能小的区间 ,使 [1 , 2 ]
n

2
z
2
z
2
7
P{
X Leabharlann 2 z } 1 2
n

2
z
2

2
z
2
P{ z 2
X

2
z 2 } 1
P{ z 2 X z 2 } 1 n n P{ X z 2 X z 2 } 1 n n [X z 2 , X z 2 ] 这就是说随机区间 n n 它以1-α的概率包含总体 X的数学期望μ。
1 ( x1 , x2 , xn ), 2 ( x1 , x2 , xn ) 都是常数。 [1 , 2 ] 为常数区间。

概率统计及随机过程:置信区间

概率统计及随机过程:置信区间

2.方差DX未知,对EX进行区间估计
上面的讨论是在DX已知的情况下进行的, 但实际应用中往往是DX未知的情况。
设x1,x2,,xn为正态总体N(,2)的一个 样本,由于2未知,我们用样本方差S2来
代替总体方差2,
x
1 n
( x1
x2
xn
)
~
N(, 2
n
)
U x ~ N (0,1)
/ n
1 n
s n
t1
(n
1)
二.方差DX的区间估计
设总体 X ~ N (, 2 ) , x是1, x2来, 自, xn于总体的样本。 现利用样本给出2的置信区间。考虑统计量
Y
(n 1)s2
2
, 其中s2
1 n 1
n i 1
( xi
x)2
由第七章定理三可知,统计量
Y
(n 1)s2
2
~
2 (n 1)
于是,对给定的(0<<1),查2分布
注意:区间[1,2]是随机区间。
二、单侧置信限
若对于给定的(0<<1),统计量
1(x1,x2,,xn)满足
P{ (x ,, x )} 1
1
1
n
则称区间[1,+)为相应于置信度是1- 的单侧置信区间,1称为置信度是1-的 单侧置信下限。
问题: 如何确定总体参数的区间估计 [1,2]呢?对于一般总体是难于确定的.现 仅能确定正态总体N(,2)中参数,2的区 间估计这对许多实际应用已经够了.
设总体X~N(,2),其中2已知, 又x1,x2,,xn为来自于总体的样本。
由第七章第三节中的结论可知
x
1 n

数理统计中的置信区间

数理统计中的置信区间

数理统计中的置信区间数理统计作为应用数学的一部分,研究的是随机现象的数量特征及其规律。

其中的置信区间是统计分析中的一个重要概念,用于描述样本所包含总体参数的可信程度。

本文将从置信区间的定义、构建方法和应用实例三个方面来探讨置信区间在数理统计中的意义和作用。

一、置信区间的定义置信区间是指在一定置信水平下,总体参数的一个区间估计值。

在进行样本调查或者实验研究时,我们通常无法获得整个总体数据,而仅仅是获得了一个样本数据。

这时,我们需要通过从样本中获得一定的统计量,如样本均值、标准差等,来对总体的未知参数进行概率推断。

而置信区间是一种用来评估样本统计量对总体参数的估计精度的方法。

在这个过程中,我们需要先给出一个置信水平,也就是一个事件发生的概率。

例如,我们可以以95%的置信水平来估计总体参数。

这样,我们就可以根据样本数据计算出一个置信区间,其意义是:在一百次样本调查中,有95次会得到的置信区间会覆盖总体参数真实值。

二、置信区间的构建方法置信区间的构建方法有很多种,通常使用的有以下三种方法:1. 正态分布法:当总体服从正态分布时,我们可以采用正态分布来估计总体参数,并据此构建置信区间。

具体方法是:根据样本数据计算出样本均值和标准差,使用正态分布的双侧临界值来限定置信区间。

2. 学生t分布法:当总体的方差未知时,我们需要使用学生t分布来对样本均值进行估计,并据此构建置信区间。

具体方法是:根据样本数据计算出样本均值和标准差,然后根据置信水平和样本容量来查找t分布表,并据此来构建置信区间。

3. 二项分布法:当研究对象为二项分布时,我们需要使用二项分布来估计总体参数,并据此构建置信区间。

具体方法是:根据样本数据计算出样本成功率和样本容量,使用二项分布的双侧临界值来限定置信区间。

三、置信区间的应用实例置信区间在实际应用中有很多场景。

下面就以一些常见的例子来说明:1. 产品质量检验在产品生产过程中,需要对生产线上的产品进行质量检验。

《概率论与数理统计教学课件》8第八章置信区间与假设检验之间的关系及p值

《概率论与数理统计教学课件》8第八章置信区间与假设检验之间的关系及p值
验问题 :
H0 : 0, H1 : 0 也有类似的对应关系 . 若已求得单侧置信区间 ( ( X1, X2, , Xn ), ), 则当0 ( ( x1, x2, , xn ), ) 时接受 H0;
当0 ( ( x1, x2, , xn ), ) 时拒绝 H0 . 反之, 若已求得检验问题 H0 : 0 , H1 : 0
若 0 ( , ), 则接受 H0; 若 0 ( , ), 则拒绝 H0 .
反之 ,对于任意的0 , 考虑显著性水平为 的假设检验问题:
H0 : 0, H1 : 0 .
假设它的接受域为
( x1, x2, , xn ) 0 ( x1, x2, , xn ). 即有 P0 { ( X1, X2 , , Xn ) 0 ( X1, X2 , , Xn )} 由0 的任意性,

拒绝H
,再
0

0.01也要拒绝H0,但不
能知道将再降低一些是否也要拒绝H0. 而p值法
给出了拒绝 H0的最小显著性水平 . 因此p值法比
临界值法给出了有关拒绝域的更多的信息.
二、典型例题
例2 用p值法检验本章第一节例2 的检验问题
H 0 : 0 0.545, H1 : 0 0.05 解 用Z检验法 , 现在检验统计量Z x 0 的观察
(, ( X1, X2 , , Xn ))与显著水平为 的左边检 验问题 H0 : 0, H1 : 0 有类似的对应关系. 若已求得单侧置信区间 (, ( X1 , X2 , , Xn )),
则当0 (, ( x1, x2, , xn ))时接受 H0; 当0 (, ( x1, x2, , xn ))时拒绝 H0.
那么在检验问题
H0 : 0, H1 : 0中 p值 P0 {t t0 } t0右侧尾部面积, 如图3;

置信区间

置信区间

(n 1)
(n 1)S 2
2
2
2
(n 1)} 1
p y
2 1
(n
1)
2
2
x
2
(n
1)
23
2
即 py
2
2
12 (n1) 2
p( y)d
y
0
2
2 1
(n
1)
2
(n
1)
x
2
2
p(y)d y
2
( n 1)
2
P{12 2
(n 1)
(n 1)S 2 2
2
2
2
(n 1)} 1
P{
(n
2
1)S 2 (n 1)
这种形式的估计称为区间估计. 也就是说,我们希望确定一个区间,
使我们能以比
较高的可靠程度相信它包含真参数值.
这里所说的“可靠程度”是用概率来度量的,
称为置信概率,置信度或置信水平.
习惯上把置信水平记作 的正数,称为显著水平。
1
,这里 是一个很小
2
定义7.6
两个统计量
若由总体X的样本 X1,X2,…Xn 确定的
T X ~ t(n 1)
S2
则对给定的α,令
n P{
X
S2
n
t (n 1)} 1
2
查t 分布表,可得
t (n 1) 的值。
P{X
S n
t
2 (n
2
1)
Xቤተ መጻሕፍቲ ባይዱ
S n
t
2
(n
1)}
1
则μ的置信度为1- α的置信区间为
[X

《概率论与数理统计》习题及答案 第八章

《概率论与数理统计》习题及答案 第八章

《概率论与数理统计》习题及答案第 八 章1.设12,,,n X X X 是从总体X 中抽出的样本,假设X 服从参数为λ的指数分布,λ未知,给定00λ>和显著性水平(01)αα<<,试求假设00:H λλ≥的2χ检验统计量及否定域. 解 00:H λλ≥选统计量 200122nii XnX χλλ===∑记212nii Xχλ==∑则22~(2)n χχ,对于给定的显著性水平α,查2χ分布表求出临界值2(2)n αχ,使22((2))P n αχχα≥=因 22χχ>,所以2222((2))((2))n n ααχχχχ≥⊃≥,从而 2222{(2)}{(2)}P n P n αααχχχχ=≥≥≥ 可见00:H λλ≥的否定域为22(2)n αχχ≥.2.某种零件的尺寸方差为21.21σ=,对一批这类零件检查6件得尺寸数据(毫米):32.56, 29.66, 31.64, 30.00, 21.87, 31.03。

设零件尺寸服从正态分布,问这批零件的平均尺寸能否认为是32.50毫米(0.05α=).解 问题是在2σ已知的条件下检验假设0:32.50H μ= 0H 的否定域为/2||u u α≥ 其中29.4632.502.45 6.771.1X u -==⨯=-0.0251.96u =,因|| 6.77 1.96u =>,所以否定0H ,即不能认为平均尺寸是32.5毫米。

3.设某产品的指标服从正态分布,它的标准差为100σ=,今抽了一个容量为26的样本,计算平均值1580,问在显著性水平0.05α=下,能否认为这批产品的指标的期望值μ不低于1600。

解 问题是在2σ已知的条件下检验假设0:1600H μ≥0H 的否定域为/2u u α<-,其中 158016005.1 1.02100X u -==⨯=-.0.051.64u -=-.因为0.051.02 1.64u u =->-=-,所以接受0H ,即可以认为这批产品的指标的期望值μ不低于1600.4.一种元件,要求其使用寿命不低于1000小时,现在从这批元件中任取25件,测得其寿命平均值为950小时,已知该元件寿命服从标准差为100σ=小时的正态分布,问这批元件是否合格?(0.05α=)解 设元件寿命为X ,则2~(,100)X N μ,问题是检验假设0:1000H μ≥. 0H 的否定域为0.05u u ≤-,其中95010005 2.5100X u -==⨯=-0.05 1.64u = 因为0.052.5 1.64u u =-<-= 所以否定0H ,即元件不合格.5.某批矿砂的5个样品中镍含量经测定为(%)X : 3.25,3.27,3.24,3.26,3.24设测定值服从正态分布,问能否认为这批矿砂的镍含量为3.25(0.01)α=?解 问题是在2σ未知的条件下检验假设0: 3.25H μ=0H 的否定域为 /2||(4)t t α>522113.252,(5)0.00017,0.0134i i X S X X S ===-⨯==∑0.005(4) 4.6041t =3.252 3.252.240.3450.013X t -==⨯=因为0.005||0.345 4.6041(4)t t =<=所以接受0H ,即可以认为这批矿砂的镍含量为3.25.6.糖厂用自动打包机打包,每包标准重量为100公斤,每天开工后要检验一次打包机工作是否正常,某日开工后测得9包重量(单位:公斤)如下: 99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5 问该日打包机工作是否正常(0.05α=;已知包重服从正态分布)?解 99.98X =,92211(()) 1.478i i S X X ==-=∑, 1.21S =,问题是检验假设0:100H μ=0H 的否定域为/2||(8)t t α≥. 其中99.9810030.051.21X t -==⨯=-0.025(8) 2.306t =因为0.025||0.05 2.306(8)t t =<= 所以接受0H ,即该日打包机工作正常.7.按照规定,每100克罐头番茄汁中,维生素C 的含量不得少于21毫克,现从某厂生产的一批罐头中抽取17个,测得维生素C 的含量(单位:毫克)如下 22,21,20,23,21,19,15,13,16, 23,17,20,29,18,22,16,25.已知维生素C 的含量服从正态分布,试检验这批罐头的维生素含量是否合格。

概率统计中的假设检验与置信区间——概率论知识要点

概率统计中的假设检验与置信区间——概率论知识要点

概率统计中的假设检验与置信区间——概率论知识要点概率统计是一门研究随机事件发生概率和统计规律的学科。

在实际应用中,我们经常需要通过一定的样本数据来对总体进行推断。

假设检验与置信区间是概率统计中常用的两种方法,用于对总体参数进行推断和判断。

本文将介绍假设检验与置信区间的概念、原理和应用。

一、假设检验假设检验是比较样本数据与某个假设之间的差异是否显著的统计方法。

在进行假设检验时,我们首先需要建立原假设(H0)和备择假设(H1)。

原假设通常是我们要证伪的假设,备择假设则是原假设的对立假设。

在假设检验中,我们需要选择一个适当的检验统计量(test statistic),该统计量的取值与样本数据相关,可以用来判断原假设的真假。

常见的检验统计量有z统计量和t统计量。

以z统计量为例,当样本数据服从正态分布,并且总体参数的值已知时,可以使用z统计量进行假设检验。

z统计量的计算公式为:z = (x - μ) / (σ / √n)其中,x为样本均值,μ为总体均值,σ为总体标准差,n为样本容量。

在进行假设检验时,我们需要设定显著性水平(significance level),常见的有0.05和0.01。

显著性水平表示在原假设为真的情况下,出现拒绝原假设的概率。

如果计算得到的检验统计量的值小于或大于临界值(critical value),则可以拒绝原假设。

二、置信区间置信区间是对总体参数的一个区间估计,用于表示我们对总体参数的估计范围。

置信区间的计算是基于样本数据的统计量,常见的有均值、比例和方差等。

以均值的置信区间为例,当样本数据服从正态分布,并且总体标准差已知时,可以使用z分布来计算置信区间。

置信区间的计算公式为:CI = x ± z * (σ / √n)其中,CI表示置信区间,x为样本均值,z为分位数,σ为总体标准差,n为样本容量。

在进行置信区间估计时,我们需要设定置信水平(confidence level),常见的有0.95和0.99。

概率论置信区间

概率论置信区间

4. 技术人员对奶粉装袋过程进行了质量检验。

每袋的平均重量标准为克、标准差为克。

监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。

现考虑这36袋奶粉所组成样本的平均重量。

(1) 描述的抽样分布,并给出和的值,以及概率分布的形状;服从正太分布,其均值10.1406,6μσ==== 1.68。

平均重量概率分布形状为高斯分布。

400.8406(x 400.8)(x )( 3.089)(3)1.683P Z -≤=≤=Φ-≈Φ-= 1(3)0.0013-Φ=(3) 假设某一天技术人员观察到,这是否意味着装袋过程出现问题了呢,为什么?不能,因为当均值为400.8出现时,属于小概率事件,可是实际情况上小概率事件可能会发生。

5. 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.33.1 6.2 5.8 2.34.15.4 4.5 3.2 4.4 2.0 5.4 2.66.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.71.41.22.93.52.40.53.62.5求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。

(数据见练习1数据.xls-练习1.5)答:使用Excel 自带的软件可以分别得到下面的表: 当置信水平为90%时,列1平均3.316667 标准误差 0.268225中位数 3.25 众数 5.4 标准差 1.609348方差 2.59 峰度 -0.8877 偏度 0.211009区域 5.9 最小值 0.5 最大值 6.4 求和119.4406=μ1.10=σx x x μx σxx 8.400=x观测数36最大(1) 6.4最小(1) 0.5置信度(90.0%) 0.453185所以置信水平为90%时,其置信区间为(3.316667-0.453185,3.316667+0.453185)当置信水平为95%时,可以得到下面的表:列1平均 3.316667标准误差0.268225中位数 3.25众数 5.4标准差 1.609348方差 2.59峰度-0.8877偏度0.211009区域 5.9最小值0.5最大值 6.4求和119.4观测数36最大(1) 6.4最小(1) 0.5置信度(95.0%) 0.544525所以置信水平为95%时,其置信区间为(3.316667-0.544525,3.316667+0.544525)当置信水平为99%时,可以得到下面的表:列1平均 3.316667标准误差0.268225中位数 3.25众数 5.4标准差 1.609348方差 2.59峰度-0.8877偏度0.211009区域 5.9最小值0.5最大值 6.4求和119.4观测数36最大(1) 6.4最小(1) 0.5置信度(99.0%) 0.730592所以置信水平为99%时,其置信区间为(3.316667-0.730592,3.316667+0.730592)。

置信区间

置信区间

置信区间。
选取统计量为
T X ~ t(n 1)
S2
n
由公式知μ的置信区间为
[X
查表 t0.05 (39) t0.025(39) 2.0227
S n t 2 (n 1)]
则所求μ的置2信区间为
[96.05 , 113.95]
若σ2=25
μ的置信区间为
即 [103.45 , 106.55]
[X
n
z
2 ]
[105
5 1.96] 40
20
例5 用某仪器间接测量温度,重复测量5次得 12500 12650 12450 12600 12750
求温度真值的置信度为 0.99 的置信区间。
解 设μ为温度的真值,
X表示测量值,通常是一个
正态随机变量
EX .
问题是在未知方差的条件下求μ的置信区间。
[X
S n
t
2
(n
1),
X
S n
t
2
(n
1)]
[X
S n
t
2
(n
1)]
19
例4 为了调查某地旅游者的消费额为X,
随机访问了
40名旅游者。
得平均消费额为
x 105 元,样本方差
s 2 282 设 X ~ N (, 2 )求该地旅游者的平均消费额
μ的置信区间。
0.05
解 本题是在σ2未知的条件下求正态总体参数μ的
一般是在保证可靠度的
条件下尽可能提高精度.
16
例2 已知某种油漆的干燥时间X(单位:小时)
服从正态分布
X ~ N ( ,1), 其中μ未知,现在抽取
25个样品做试验,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

表2.1 的显著性水平为 的检验一览表
检验 法 条件 H0 H1 检验统计量 H0的拒绝域W
0 >0
Z z
X 0
Z检验 已知 0 <0 Z
=0 0 0 >0 T检验 未知 0 <0 =0 0

n
Z z
Z z
故Z
0.5112 0.5 0.015 / 9
2.24 1.96
所以拒绝原假设 , 认为机器工作不正常。
四、小结
假设检验的基本原理、相关概念和一般步骤.
假设检验的两类错误
真实情况 (未知) H0 为真 H0 不真
所 接受 H0 正确


策 拒绝 H0
犯第I类错误 正确
犯第II类错误
五、 单个正态总体参数的假设检 验
第八章
8.1
假设检验
假设检验的基本概念
8.2
正态总体参数的假设检验
第一节
假设检验的基本概念
一、假设检验的基本原理 二、假设检验的相关概念 三、假设检验的一般步骤
一、假设检验的基本原理
在总体的分布函数只知其形式、但不知其参 数的情况下, 为了推断总体的某些性质, 提出某些 关于总体的假设.
例如, 提出总体服从泊松分布的假设;
于是可以选定一个适当的正数k,
x 0 当观察值 x 满足 k时, 拒绝假设H 0 , / n x 0 反之, 当观察值 x 满足 k时, 接受假设H 0 . / n X 0 因为当H 0为真时 Z ~ N (0,1), / n
由标准正态分布分位点的定义得 k z / 2 ,
于是拒绝假设H0, 认为包装机工作不正常.
以上所采取的检验法是符合实际推断原理的.
由于通常总是取得很小, 一般取 0.01, 0.05,
| X 0 | 因而当H 0 为真, 即 0时, z / 2 是一个 / n 小概率事件 , 可以认为如果 H 0 为真, 由一次试验得到满足不 等式 的观察值x , 几乎是不会发生的 . x 0
即认为机器工作是正常的, 否则, 认为是不正常的.
பைடு நூலகம்
由于要检验的假设是总体均值, 故可借助于样本均 值来判断.
因为 X 是 的无偏估计量,
所以若 H 0 为真, 则 | x 0 | 不应太大, X 0 当H 0为真时, ~ N (0,1), / n | x 0 | 衡量 | x 0 | 的大小可归结为衡量 的大小, / n
H0:0 H0: 0 H 0: = 0
vs vs vs
H 1: > 0 H 1: < 0 H1: 0
1. 已知方差σ2 时的Z检验
H0: =0 vs H1: 0 1)提出假设 H 0 : 0 ; H1 : 0 ;
2)给定显著性水平 ? , 样本容量 n ?
不显著的, 则我们接受 H 0 ,
上述关于 x 与 0 有无显著差异的判断是在显 著性水平 之下作出的.
三、假设检验的一般步骤
1. 根据实际问题的要求, 提出原假设 H 0 及备择 假设 H1 ;
2. 给定显著性水平 以及样本容量 n ;
3. 确定检验统计量以及拒绝域形式;
4. 按 P{ H 0 为真拒绝 H 0 } 求出拒绝域;
试问机器是否正常 (给定显著性水平 0.05)
解 : 设X ~ N ( , ), 此是在 0.015已知条件下 ,
2
判断均值 0.5
还是 0.5的问题, 为此
1)提出假设 H 0 : 0.5; H1 : 0.5;
2)显著性水平 0.05, 样本容量 n9
前两个称之参数假设检 验, 后一个称为分布
拟合检验 .i )为双边假设检验 , ii)为单边假设检验。
2. 检验统计量 X 0 统计量 Z 称为检验统计量. / n 3. 拒绝域与临界点
当检验统计量取某个区域中的值时, 我们拒 绝原假设H0, 则称区域W为拒绝域, 拒绝域的边 界点称为临界点. 如在前面实例中, 拒绝域为 | z | z / 2 ,
装糖重总体 X 的均值和标准差, 已知 0.015, 则 X ~ N ( , 0.0152 ), 其中 未知.
问题: 根据样本值判断 0.5 还是 0.5 .
提出两个对立假设H 0 : 0 0.5 和 H1 : 0 . 再利用已知样本作出判断是接受假设 H0 ( 拒绝 假设 H1 ) , 还是拒绝假设 H0 (接受假设 H1 ). 如果作出的判断是接受 H0, 则 0 ,
3)选择Z统计量 :
X Z , / n
在H 0真时,
Z
X 0
/ n
~ N (0,1)
4)由P | Z | z /2 , z /2 ?(查表)
确定H 0的拒绝域为:
W {( X1, X 2 ,
, X n ) : Z z /2}
5)由所得样本观察值得 X ?(计算), 并计算Z 值, H 0 ; 拒绝备择假设 H1。 若 Z z /2,则接受原假设
下面结合实例来说明假设检验的基本思想.
实例 某车间用一台包装机包装葡萄糖, 包得的 袋装糖重是一个随机变量, 它服从正态分布.当 机器正常时, 其均值为0.5千克, 标准差为0.015 千克.由长期实践可知, 标准差较稳定某日开工 后为检验包装机是否正常, 随机地抽取它所包装 的糖9袋, 称得净重为(千克): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 分析: 用 和 分别表示这一天袋
临界点为 z z / 2 , z z / 2 .
4. 两类错误及记号
在对原假设 H 0的真伪进行判断时 ,由于样 本的随机性可能产生两 类错误:
, 拒绝 第I类错误: 在假设H 0实际上为真时 H 0的错误, 谓之" 弃真" 错误, 其概率记为
P 拒绝H 0 H 0 真
第II类错误:
又如, 对于正态总体提出数学期望等于 0 的 假设等. 假设检验就是根据样本对所提出的假设作 出判断: 是接受, 还是拒绝.
假设检验问题是统计推断的另一类重要问题. 如何利用样本值对一个具体的假设进行检验?
通常借助于直观分析和理论分析相结合 的做法,其基本原理就是人们在实际问题中经 常采用的所谓实际推断原理:“一个小概率事 件在一次试验中几乎是不可能发生的”.
若 Z z /2,则拒绝原假设 H 0 ; 接受备择假设 H1。
2. σ未知时的 t 检验
设样本X 1 , X 2 , , X n来自正态总体 N ( , ),
2
其中 2为未知参数, n为样本容量,给定显 著性水平 ,考虑三种关于 的检验问题:
H0:0
vs
H 1: > 0
/ n
z / 2
x 0 在一次试验中, 得到了满足不等式 z / 2 / n 的观察值 x , 则我们有理由怀疑原来的假设H 0的 正确性, 因而拒绝H 0 .
x 0 若出现观察值 x 满足不等式 z / 2 , 则 / n 没有理由拒绝假设H 0 , 因而只能接受H 0 .
P 拒绝H 0 H 0真
称 为显著性水平,相应的假设检验称为显著性 检验.


设总体 X ~ N ( , ), 为已知, X 1 , X 2 ,, X n
2
是来自总体 X 的样本, 给定显著性水平 ,
H 0 : 0 ; H 1 : 0
当样本容量固定时 , 选定后, 数 k (如前k z ) 就
在假设H 0实际上不真时 , 接受H 0的错误, 谓之" 取伪" 错误, 其概率记为
P接受H 0 H 0 不真
当样本容量 n 一定时, 若减少犯第一类错误 的概率, 则犯第二类错误的概率往往增大.反之 亦然。
5. 显著性检验
只对犯第一类错误的概率加以控制,即给定 一个较小的数 (0 1) 使得犯第一类错误的概 率不超过 , 即
对实际中需作出判断的 问题, 提出适当的 统计假设, 根据来自总体的样本 X 1 , X 2 , , X n , 选择适当的统计量 , 此统计量需服从熟知的 分 布, 据此分布由小概率原理 可以确定原假设的 拒绝域, 若样本值落入此拒绝域 中, 则拒绝原假 设, 否则接受原假设。
二、假设检验的相关概念
1. 为已知, 关于 的检验 ( Z 检验)
2
2. 为未知, 关于 的检验( t 检验)
2
3. 关于总体方差 的检验( 检验)
2 2
一 均值的假设检验
设样本X 1 , X 2 , , X n来自正态总体 N ( , ),
2
其中 , 2为未知参数, n为样本容量,给定显 著性水平 ,考虑三种关于 的检验问题:
1. 原假设和备择假设 常用H 0表示原假设 , H1表示备择假设 ,
i ) H 0 : 0 ; H1 : 0
ii) H 0 : ; H 1 :
2 2 0 2
2 0
iii) H 0 : F ( x ) F0 ( x ); H 1 : F ( x ) F0 ( x )
2
著性水平,则在不同条件下 的显著性检验
2
见下一览表:
表2.3 的显著性水平为 的检验一览表
2
检验法 条件
H0
H1
检验统计量
n
H0的拒绝域

2
2 02 2 02
5. 取样, 根据样本观察值确定接受还是拒绝H 0 .
相关文档
最新文档