总体参数区间估计(6)讲解
7.8 两个正态总体参数的区间估计
2 1
2 2
)
1
nm
因此,均值差1−2的置信水平1−α的置信区间为
(( X Y ) z 2
2 1
n
2 2
m
,(X
Y
)
z
2
2 1
2 2
)
nm
两个正态总体参数的区间估计
2.均值差1−2的置信区间 (方差12 =22 = 2,但 2 未知情形)
易知 ( X Y ) (1 2 ) ( X Y ) (1 2 ) ~ N (0,1)
枢轴量 T X Y (1 2 ) ~ t(n m 2)
S 1 n 1 m
根据 t分布的性质,取分位数tα/2 (n+m−2) 有
P{|
X Y (1 2 )
S 1 n 1 m
|
t
2(n
m
2)}
1
因此,均值差1−2的置信水平1−α置信区间为
2
(2n)=
2 0.05
(18)=28.869,12
2 (2n)
2 0.95
(18)
9.39
计算得:2nX 1062 1/λ 的置信水平为0.90的置信区间为 ( 1062 , 1062) (36.787,113.099)
28.869 9.39
两个正态总体参数的区间估计
2
,
2 2
m
)
由正态分布的性质可得
X
Y
~
N (1
2
,
2 1
总体参数的区间估计
三、总体参数的区间估计
图5-10 “探索”对话框
图5-11 “探索:统计量”对话框
三、总体参数的区间估计
单击“统计量”按钮,弹出“探索:统计量”对话框,如图5-11所示。 该对话框中有如下四个复选框: (1)描述性:输出均值、中位数、众数、标准误、方差、标准差、极小值 、极大值、全距、四分位距、峰度系数和偏度系数的标准误差等。此处能够设 置置信区间,默认为90%(α=0.1),可根据需要进行调整。 (2)M 最大似然确定数。 (3)界外值:输出五个最大值和五个最小值。 (4)百分位数:输出第5%、10%、25%、50%、75%、90%、95%位数 。
三、总体参数的区间估计
【例5-17】 某餐馆随机抽查了50位顾客的消费额(单位:元)为 18 27 38 26 30 45 22 31 27 26 35 46 20 35 24 26 34 48 19 28 46 19 32 36 44 24 32 45 36 21 47 26 28 31 42 45 36 24 28 27 32 36 47 53 22 24 32 46 26 27 在90%的概率保证下,采用点估计和区间估计的方法推断餐馆顾客的平均消 费额。 解:执行“分析”→“描述统计”→“探索”命令,打开“探索”对话框。由于本例只 有消费额一个变量,且需要对消费额进行探索性分析,故选中左侧列表框中的“消 费额”选项,将其移入“因变量列表”框中,如图5-10所示。
解:已知n=31,α=0.01,=10.2;σ=2.4,z0.005=2.58,由于总 体方差已知,为大样本,可以利用式(5-23)来进行计算。
即(9.088,11.312 该学生每天的伙食费在显著性水平为99%时的置信区间为( 9.088,11.312)。
概率论与数理统计实训06讲解
函 数 说 明
二项分布的最大似然估计 返回 水平的参数估计和置信区间 泊松分布的最大似然估计 返回 水平的 参数和置信区间 正态分布的最大似然估计 返回 水平的期望、方差和置信区间 均匀分布的最大似然估计 返回 水平的参数估计和置信区间 指数分布的最大似然估计 返回 水平的参数估计和置信区间
expfit
例 1 产生 100 行2 列服从区间(10, 12)上的均匀分布的随机数, 计算区间端 点“a”和“b”的极大似然估计值, 求出置信度为0.95 的这两个参数的置信 区间.
解 在命令窗口中输入: r = unifrnd(10, 12, 100, 2); [ahat, bhat, aci, bci] = unifit(r)
调 用 形 式
binofit (X, N) [PHAT, PCI] = binofit (X, N, ALPHA) poissfit (X) [LAMBDAHAT, LAMBDACI]= poissfit (X,) normfit (X, ALPHA) [MUHAT, SIGMAHAT, MUCI, SIGMACI] = normfit (X, ALPHA) unifit (X, ALPHA) [AHAT, BHAT, ACI, BCI] = unifit (X, ALPHA) expfit (X) [MUHAT, MUCI] = expfit (X, ALPHA)
基本数学原理:
样本数字特征法 1 用样本均值 x n x 作为总体均值EX的估计值; 用样本方差 S n 1 1 ( x x ) 作为总体方差DX的估计值。 在Matlab中,样本x = [x1, x2,…, xn],则 样本均值:mx = 1/n*sum (x) 样本方差:S2 = 1/(n-1)*sum ((x-mx).^2)
统计学区间估计详细讲解
2
x求解。若 x已知,则
x
即:
n
20
2 的正态分布。
x ~ N (82,2 )
STAT 8.1.2抽样误差的概率表述
x ~ N (82,22 )由概率论可知,
Z x
有以下关系式成立:
一般称,
x
服从标准正态分布,即, Z ~ N (0,1)
P(
x
1 为置信度,可靠程度等,反映估计结果的可信程度。若
STAT 8.1.3计算区间估计:已知时的大样本情况 在CJW公司的例子中,样本均值产生的抽样误差是3.92或更小 的概率是0.95。因此,可以构建总体均值的区间为,
x , x 82 3.92,82 3.92
x x
78.08,85.92
由于,从一个总体中抽取到的样本具有随机性,在一次偶然的 抽样中,根据样本均值计算所的区间并不总是可以包含总体均 值,它是与一定的概率相联系的。如下图所示:
抽样误差
x= x
(实际未知)
STAT 要进行区间估计,关键是将抽样误差 区间可表示为:
x x 此时,可以利用样本均值的抽样分布对抽样误差的大小进行 描述。
上例中,已知,样本容量n=100,总体标准差 20 ,根据 中心极限定理可知,此时样本均值服从均值为 ,标准差为
x , x
本章难点
1、一般正态分布标准正态分布; 2、t分布; 3、区间估计的原理; 4、分层抽样、整群抽样中总方差的分解。
8.1总体均值的区间估计(大样本n>30)
点估计的缺点:不能反映估计的误差和精确程度
STAT
区间估计:利用样本统计量和抽样分布估计总体参数的可能区 间 【例1】CJW公司是一家专营体育设备和附件的公司,为了监控 公司的服务质量, CJW公司每月都要随即的抽取一个顾客样本 进行调查以了解顾客的满意分数。根据以往的调查,满意分数 的标准差稳定在20分左右。最近一次对100名顾客的抽样显示, 满意分数的样本均值为82分,试建立总体满意分数的区间。 8.1.1抽样误差 抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。
概率论与数理统计第6章参数区间估计2,3节
n
E(X
k
)
E(X
k)
i1
i1
二、有效性
未知参数 的无偏估计量不是唯一的.
设 ^1 和 ^2 都是参数 的无偏估计量,
θˆ 1
θˆ 2
集中
分散
蓝色是采用估^ 计量 1 , 用 14 个样本值得到的 14 个估计值. 紫色是采用估^ 计量 2 , 用 14 个样本值得到的 14 个估计值.
若limD(ˆ)0, 则ˆ是的一致估 . 计量 n
回顾例子.设总体X的概率密度为
f(x)6x3 (x),0x;
0, 其他
X1, X2,…, Xn 是取自总体X 的简单随机样本, (1) 求的矩估计量 ˆ;
(2) 求ˆ的方差D(ˆ).
解:矩估计 ˆ量 2X. D(ˆ)4D(X)4D(X)2
若滚珠直径服从正态分布X ~ N( , 2), 并且已知 = 0.16(mm),求滚珠直径均值的置信水平为95%
的置信区间.
解:由上面求解的置信水平为1- 的置信区间
Xσn 0 uα/,2 Xσn 0 uα/2
已 n 知 1,0 0 0 .1,6 0 .0,5 x110i110xi 14.92,
若进行n次独立重复抽样,得到n个样本观测值,
每个样本观测 个值 随确 机(定 ˆ1区 ,ˆ2一 )间 .那么
每个区间的 可真 能 , 或 值 包不 含包 的含 真 , 值
根据伯努利大数定理, 在这n个随机区间中,
包含 真值1 的 0(1 0 约 )% 占 ,不包含 10 的 % 0. 约
便得 k的 到 最大似 ˆk(X 1,然 X 2, ,估 X n).计
第二节 判别估计量好坏的标准
总体参数的区间估计
因为
ˆ (1 P ˆ) P SP ˆ n
0.1 (1 0.1) 0.0077 1500
上一张 下一张 主 页Fra bibliotek退 出
所以该地区老年人结核病患病率ρ 的95%、 99%置信区间为:
0.1 1.96 0.0077 0.1 1.96 0.0077
0.1 2.58 0.0077 0.1 2.58 0.0077
越高。
上一张 下一张 主 页 退 出
常用的置信度为95%和99%,故由(5-13)
式可得总体平均数μ 的95%和99%的置信区间如
下:
( x t 0.05 S x x t 0.05 S5-14 x ) ( 5-15 ) x t 0.01S x x t 0.01 S x
P( x t a S x x t a S x ) 1 a
称为置信半径; ta S x
(5-13)式称为总体平均数μ 置信度为1-a的置
信区间。其中
x和 ta S x
分别称为置信下限和置信上限; 置信上、下限 x ta S x
之差称为置信距,置信距越小,估计的精确度就
ˆ 其中, P 为样本百分数, 为样本百分数标准 S ˆ P
误, 的计算公式为: SP ˆ
SP ˆ ˆ (1 P ˆ P ) 5-18) ( n
上一张 下一张 主 页 退 出
【例5.10】 调查某地1500老年人,患结核病
的有150人,求该地区老年人结核病患病率的
95%、99%置信区间。
ˆ ,采用正态分布近似法求 由于>1000, >1% P 置信区间。
上一张 下一张 主 页 退 出
总体参数的区间估计公式
总体参数的区间估计公式在进行区间估计时,我们首先需要收集到一个样本,并根据样本对总体参数进行估计。
然后根据样本的统计量,结合分布的性质和抽样方法,建立置信区间。
设总体参数为θ,我们希望得到它的置信水平为1-α的置信区间。
置信水平表示我们对总体参数的估计的可信程度,一般常用的置信水平有90%、95%和99%等。
参数估计的方法有很多,具体的方法选择取决于总体参数的性质、样本的大小以及其他假设条件。
常见的参数估计方法有:1.总体均值的区间估计:假设总体呈正态分布,样本大小为n,则总体均值的区间估计公式为:[样本均值-Z值(α/2)*总体标准差/√(n),样本均值+Z值(α/2)*总体标准差/√(n)]其中Z值(α/2)为标准正态分布的分位数,可以从标准正态分布表中查得。
2.总体比例的区间估计:假设总体为二项分布,样本大小为n,成功的次数为x,则总体比例的区间估计公式为:[样本比例-Z值(α/2)*√(样本比例*(1-样本比例)/n),样本比例+Z值(α/2)*√(样本比例*(1-样本比例)/n)]其中Z值(α/2)为标准正态分布的分位数,可以从标准正态分布表中查得。
3.总体方差的区间估计:假设总体呈正态分布,样本大小为n,则总体方差的区间估计公式为:[(n-1)*样本方差/卡方分布(α/2),(n-1)*样本方差/卡方分布(1-α/2])]其中卡方分布是用于描述自由度为n-1的卡方随机变量的概率分布,可以从卡方分布表中查得。
以上是常见的总体参数区间估计公式,这些公式是根据统计学理论推导而来的,适用于不同情况下的参数估计。
在实际应用中,我们根据具体问题和假设条件选择适当的参数估计方法,计算置信水平的区间估计,从而对总体参数进行估计和推断。
第六章 参数值的估计
第六章 参数值的估计 第一节 参数估计的一般问题一、估计量与估计值参数估计就是用样本统计量去估计总体参数,如用X 估计μ,用S2估计2σ,用p 估计π等。
总体参数可以笼统地用一个符号θ表示。
参数估计中,用来估计总体参数的统计量的名称,称为估计量,用θ表示,如样本均值、样本比例等就是估计量。
用来估计总体参数时计算出来的估计量的具体数值,叫做估计值。
二、点估计与区间估计——参数估计的两种方法 1、点估计用样本估计量θ的值直接作为总体参数θ的估计量值。
2、区间估计它是在点估计基础上,给出总体参数估计的一个区间,由此可以衡量点估计值可靠性的度量。
这个区间通常是由样本统计量加减抽样误差而得到。
以样本均值的区间估计来说明区间估计原理:根据样本均值的抽样分布可知,重复抽样或无限总体抽样情况下,样本均值,由此可知,样本均值落在总体均值两侧各为一个标准误差范围内的概率为0.6827,两个标准误差范围0.9545,三个标准误差范围0.9973,并可计算出样本均值落在μ的两侧任何一个标准误差范围内的概率(根据已知的μ,σ计算)。
但实际估计时,μ是未知的,因而不再是估计样本均值落在某一范围内的概率,而只能根据已设定的概率计算这个范围的大小。
例如:约有95%的样本均值会落在距μ的两个标准误差范围内,即约有95%的样本均值所构造的两个标准误差的区间会包括μ。
在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,区间的最小值为置信下限,最大值为置信上限。
例如,抽取了1000个样本,根据每个样本构造一个置信区间,其中有95%的区间包含了真实的总体参数,而5%的没有包括,则称95%为置信水平/置信系数。
构造置信区间时,可以用所希望的值作为置信水平,常用的置信水平是90%,95%,99%,见下表:α称为显著性水平,表示用置信区间估计的不可靠的概率,1-为置信水平。
如何解释置信区间:如用95%的置信水平得到某班学生考试成绩的置信区间为(60,80),即在多次抽样中有95%的样本得到的区间包含了总体真实平均成绩,(60,80)这个区间有95%的可能性属于这些包括真实平均成绩的区间内的一个。
正态总体参数的区间估计
总体均值μ的区间估计是一种基于抽样 调查的方法,通过样本均值和标准差 来估计总体均值的范围,常用t分布或z 分布计算置信区间。
详细描述
在进行总体均值μ的区间估计时,首先 需要收集样本数据,计算样本均值和 标准差。然后,根据样本数据的大小 和置信水平,选择适当的分布(如t分 布或z分布)来计算置信区间。最后, 根据置信区间的大小和分布特性,可 以得出总体均值μ的可能取值范围。
正态分布的性质
集中性
正态分布的曲线关于均值μ对称。
均匀变动性
随着x的增大,f(x)逐渐减小,但速 度逐渐减慢。
随机变动性
在μ两侧对称的位置上,离μ越远, f(x)越小。
正态分布在生活中的应用
金融
正态分布在金融领域的应用十分 广泛,如股票价格、收益率等金 融变量的分布通常被假定为正态 分布。
生物医学
THANKS
感谢观看
实例二:总体方差的区间估计
总结词
在正态分布下,总体方差的区间估计可以通过样本方 差和样本大小来计算。
详细描述
当总体服从正态分布时,根据中心极限定理,样本方差 近似服从卡方分布。因此,总体方差σ²的置信区间可以 通过以下公式计算:$[s^2 cdot frac{n - 1}{n} cdot F^{-1}(1 - frac{alpha}{2}), s^2 cdot frac{n - 1}{n} cdot F^{-1}(1 - frac{alpha}{2})]$,其中$s^2$是样本 方差,$n$是样本容量,$F^{-1}$是自由度为1的卡方 分布的逆函数,$alpha$是显著性水平。
详细描述
当总体服从正态分布时,根据中心极限定理,样本均值 近似服从正态分布。因此,总体均值μ的置信区间可以通 过以下公式计算:$[bar{x} - frac{s}{sqrt{n}} cdot Phi^{-1}(1 - frac{alpha}{2}), bar{x} + frac{s}{sqrt{n}} cdot Phi^{-1}(1 - frac{alpha}{2})]$,其中$bar{x}$是样 本均值,$s$是样本标准差,$n$是样本容量,$Phi^{1}$是标准正态分布的逆函数,$alpha$是显著性水平。
两个总体参数的区间估计
等:12=22
1
2 的 (1 )置信区间为:
(x1 x2 ) t (n1 n2 2)
2
s2
s2
p p
n1 n2
其中
s
2
为
p
s
2
p
(n1
1)s12 (n2 1)s22 n1 n2 2
@
两个总体参数的区间估计
(3)两个总体都服从正态分布;两个总体方差未知但相等
:12≠22
的1 2
@
两个总体参数的区间估计
2.配对样本
(1)(匹配大样本)
假定条件:两个匹配的大样本 sd
di d 2
(Hale Waihona Puke 1)(n1 30和n2 30)
两个总体均值之差d=1-2在1- 置信水平
的置信区间为:
对应差值的均指
对应差值的标准差
@
两个总体均值之差的估计
(2)匹配小样本
假定条件:
▪ 两个匹配的小样本(n1< 30和n2 < 30) ▪ 两个总体各观察值的配对差服从正态分布
@
两个总体比例之差的区间估计
❖ 1.假定条件
▪ 两个总体服从二项分布 ▪ 可以用正态分布来近似 ▪ 两个样本是独立的
❖ 2.两个总体比例之差1- 2在1-置信水平
下的置信区间为
@
统计学
置(1 信 )区间为:
(x1 x2 ) t ( f )
2
s12 s22 n1 n2
f 表示自由度,
( s12
s
2 2
)2
f
n1 n2
(s12 n1 ) 2 (s22 n2 ) 2
n1 1
n2 1
一个总体参数的区间估计
x z
1-3
x
2
n
或 x z
s
2
n
( 未知)
!
总体均值的区间估计
(例题分析)
【 例 】一家食品生产企业以生产袋装食品为主,每天产量大约8000
袋。按规定,每袋应为100g。为对食品质量进行监测,企业质检部
门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产
的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产
机 地 抽 取 了 100 名
下岗职工,其中65
人为女性职工。试
以95%的置信水平
估计该城市下岗职
工中女性比例的置
信区间
解:已知 n=100,p=65% , 1- = 95%,
z/2=1.96
p z
2
p (1 p )
n
65%(1 65%)
65% 1.96
100
65% 9.35%
49
38
34
48
50
34
39
45
48
45
32
!
总体均值的区间估计
(例题分析)
解:已知n=36, 1- = 90%,z/2=1.645。根据样本数
据计算得:ഥ
= . , = .
总体均值在1- 置信水平下的置信区间为
x z
2
s
7.77
39.5 1.645
1-5
!
总体均值的区间估计
(例题分析)
【例】一家保险公司收集到由36个投保人组成的
随机样本,得到每个投保人的年龄(单位:周岁)
数据如下表。试建立投保人年龄90%的置信区间
总体参数的区间估计公式
总体参数的区间估计公式摘要:1.总体参数的区间估计概述2.区间估计公式的推导3.区间估计在统计学中的应用正文:一、总体参数的区间估计概述总体参数的区间估计是统计学中一种重要的参数估计方法。
在实际问题中,我们通常需要对总体的某个未知参数进行估计,例如均值、方差等。
由于样本数据的随机性,我们需要通过一定的方法来估计总体参数的真实值,区间估计就是其中一种常用的方法。
区间估计的核心思想是利用样本数据计算出一个区间,该区间内包含总体参数真实值的概率在一定范围内。
这个概率范围通常用置信水平来表示,置信水平越高,所估计的区间范围就越宽,包含总体参数真实值的可能性就越大。
二、区间估计公式的推导设总体X 的概率密度函数为f(x),样本容量为n,样本均值为x,样本标准差为s,我们要估计总体均值μ。
根据中心极限定理,当n 充分大时,样本均值的分布近似于正态分布,即:x ~ N(μ, σ/n)其中,σ为总体方差。
为了估计总体均值μ,我们可以构造一个置信区间。
设α为置信水平,对应的Z 值为Zα,那么:μ的置信区间为:x ± Zα * s / √n其中,s / √n 为样本标准差除以√n,它实际上是总体标准差σ的估计。
三、区间估计在统计学中的应用区间估计在统计学中有广泛的应用,主要包括以下几个方面:1.对总体参数的单个估计:通过构造置信区间,我们可以估计总体参数的单个值,如均值、方差等。
2.对总体参数的统计推断:通过比较不同置信水平下的置信区间,我们可以对总体参数进行统计推断,如判断总体参数是否等于某个值等。
3.对样本容量的估计:在实际问题中,我们通常需要根据样本数据来估计总体参数,而样本容量的大小直接影响到估计的准确性。
通过构造置信区间,我们可以估计合适的样本容量。
双正态总体参数的区间估计
双正态总体参数的区间估计双正态总体是指一个总体服从正态分布,且这两个分布的均值和方差都相等。
在双正态总体中,我们常常需要估计总体参数的区间估计,即估计参数的真实值落在哪个区间内。
对于双正态总体的均值μ,我们可以使用Z分数进行区间估计。
假设我们想要在95%的置信水平下估计μ的区间为(a,b),则有:P(μ-a < X < μ+b) = 0.95其中,X是从双正态总体中抽取的样本,a和b是未知的参数。
为了解决这个问题,我们可以利用双正态总体的对称性质,即在均值μ两侧的概率相等。
因此,我们可以使用Z分数的对称性质,得到:P(μ-a < X < μ+b) = 0.975这意味着,在95%的置信水平下,μ的区间为(a,b)的概率为0.975,也就是说,μ的真实值落在这个区间内的概率为0.975。
对于双正态总体的方差σ^2,同样可以使用Z分数进行区间估计。
假设我们想要在95%的置信水平下估计σ^2的区间为(d,e),则有:P(σ2-d < X2 <σ2+e) = 0.95其中,X2是从双正态总体中抽取的样本的方差,d和e 是未知的参数。
同样,我们可以利用双正态总体的对称性质,得到:P(σ2-d < X2 < σ2+e) = 0.975因此,在95%的置信水平下,σ2的区间为(d,e)的概率为0.975,也就是说,σ2的真实值落在这个区间内的概率为0.975。
需要注意的是,对于双正态总体的均值和方差的区间估计,我们需要先确定置信水平和区间长度。
一般来说,置信水平为95%是比较常见的选择,区间长度一般为2倍标准误差。
具体的参数和区间长度需要根据实际情况进行调整。
心理统计名词解释点估计和区间估计
心理统计名词解释:1. 点估计点估计是一种通过样本数据估计总体参数的方法。
在心理统计学中,研究者通常只能获得一部分总体数据,因此需要利用样本数据来估计总体的特征。
点估计就是利用样本数据计算出一个数值作为总体参数的估计值,常见的点估计方法包括最大似然估计和矩估计。
2. 区间估计区间估计是一种用来估计总体参数范围的方法。
与点估计不同,区间估计不仅给出了参数的点估计值,还给出了参数估计的置信区间。
置信区间是总体参数的估计范围,通常表示为一个区间,例如(μ-δ, μ+δ),其中μ为参数的点估计值,δ为置信区间的半径。
心理统计中的点估计和区间估计在研究中具有重要意义。
通过点估计和区间估计,研究者可以对总体的特征进行估计,并对估计结果的可靠性进行评估。
这两种估计方法在量化研究中被广泛应用,对于从样本数据推断总体特征具有重要的参考价值。
点估计和区间估计的应用:3. 点估计的应用在心理统计学中,点估计通常用来估计总体的各种参数,如均值、方差、比例等。
研究者利用样本数据计算出点估计值,并将其作为总体参数的估计值。
在一项实验中,研究者可以利用样本数据计算出实验组和对照组的平均得分,以此作为两组总体均值的估计值。
4. 区间估计的应用区间估计在心理统计学中具有重要意义,它不仅给出了总体参数的估计值,还给出了估计的可靠范围。
研究者通常会根据置信水平选择相应的置信区间,常见的置信水平包括95、99等。
在研究中,研究者可以利用区间估计来估计总体均值的置信区间,从而评估估计结果的可靠性。
点估计和区间估计的特点:5. 点估计的特点点估计给出了总体参数的一个具体数值估计,具有直观性和简单性。
研究者可以通过点估计方便地获得总体参数的估计值,并基于这一估计值进行推断和决策。
然而,点估计也存在一定局限性,它无法提供参数估计的置信范围,使得估计结果的可靠性无法直观评估。
6. 区间估计的特点区间估计不仅给出了总体参数的估计值,还给出了参数估计的可靠范围。
正态总体参数的区间估计
第19讲 正态总体参数的区间估计教学目的:理解区间估计的概念,掌握各种条件下对一个正态总体的均值和方差进行区间估计的方法。
教学重点:置信区间的确定。
教学难点:对置信区间的理解。
教学时数: 2学时。
教学过程:第六章 参数估计§6.3正态总体参数的区间估计1. 区间估计的概念我们已经讨论了参数的点估计,但是对于一个估计量,人们在测量或计算时,常不以得到近似值为满足,还需估计误差,即要求知道近似值的精确程度。
因此,对于未知参数θ,除了求出它的点估计ˆθ外,我们还希望估计出一个范围,并希望知道这个范围包含参数θ真值的可信程度。
设ˆθ为未知参数θ的估计量,其误差小于某个正数ε的概率为1(01)αα-<<,即ˆ{||}1P θθεα-<=-或αεθθεθ-=+<<-1)ˆˆ(P这表明,随机区间)ˆ,ˆ(εθεθ+-包含参数θ真值的概率(可信程度)为1α-,则这个区间)ˆ,ˆ(εθεθ+-就称为置信区间,1α-称为置信水平。
定义 设总体X 的分布中含有一个未知参数θ。
若对于给定的概率1(01)αα-<<,存在两个统计量1112(,,,)n X X X θθ= 与2212(,,,)n X X X θθ= ,使得12{}1P θθθα<<=-则随机区间12(,)θθ称为参数θ的置信水平为1α-的置信区间,1θ称为置信下限,2θ称为置信上限,1α-称为置信水平。
注(1)置信区间的含义:若反复抽样多次(各次的样本容量相等,均为n ),每一组样本值确定一个区间12(,)θθ,每个这样的区间要么包含θ的真值,要么不包含θ的真值。
按伯努利大数定理,在这么多的区间中,包含θ真值的约占100(1)%α-,不包含θ真值的约仅占100%α。
例如:若0.01α=,反复抽样1000次,则得到的1000个区间中,不包含θ真值的约为10个。
(2)置信区间的长度表示估计结果的精确性,而置信水平表示估计结果的可靠性。
【VIP专享】6-5区间估计
从两条流水线上抽取了容量分别为13与17的两个相互独
立的样本
则由
P(
2
2
(n 1)S 2
2
2
2 1
)
1
2
0.15 0.125
0.1 0.075
2
得 2 的置信区间为
(n 1)S 2
2 1
2
(n
1)
,
(n 1)S 2
2
(
n
1)
2
0.05
2 • 0.025
-2
2
4
•
6
8 10
2
2 1
2
2
(3)′当 已知时, 方差 2 的 置信区间(这种情况在实际中很少)
(5)
]
[14.71,
15.187]
③
2 的置信区间为
(n 1) s2
[
,
2 1
2
(n
1)
(n 1) s2
]
2
(n
1)
2
具体计算得: s2 0.051.
查表得
2 1
2
(n
1)
2 0.975
(5)
12.833,
2 2
(n
1)
2 0.025
(5)
0.831
所以 2 的置信区间为
5s2
[
,
5 s2 ] [0.0199, 0.3069 ]
抽取 6 件, 测得直径为 15.1 , 14.8 , 15.2 , 14.9 , 14.6 , 15.1
① 若 2=0.06, 求 的置信区间 ② 若 2未知,求 的置信区间 ③ 求方差 2的置信区间.
置信度 均为0.95
6-5非正态总体参数的区间估计
2 a n u ,
2
2 b (2nX u ) ,
2
总体服从指数分布 未知参数 的置信水平为1 的置信区间是 1 1 1 1 ˆ ˆ ( 1 , 2 ) ( (1 u ) , (1 u ) ).
X n
2
c nX 2 .
X
n
2
概率论与数理统计教程(第四版)
[例2] 从一批电子元件中,抽取 50个样品,测得它们 设电子元件的使用寿命 的使用寿命的均值为1200小时, 服从指数分布e( ) , 求未知参数 的置信水平为 0.99 的置信区间.
解:由题设有 n 50 , x 1200. 已给置信水平1 0.99 ,
0.01 , 查附表得 u2 u0.005 t0.005 () 2.58. 由此得
目录
上一页
下一页
返回
结束
[例1]从一批产品中抽取 200个样品, 发现其中 9 个次品, 求这批产品的次品率 p 的置信水平为90%的置信区间. 解: 设随机变量 0 , 若取得正品; X 1 , 若取得次品. p ( x ; p ) p x (1 p )1 x , 概率函数为 则 X 服从 "0 1" 分布, x 0或1, 其中 p 是这批产品的次品率. 按题意, 样本容量 n 200 ,样本观测值 x1 , x2 ,, x200 中恰有 9 个 1 与 191个 0 , 所以 1 200 9 x xi 200 0.045. 200 i 1
则未知参数 p 的置信水平为1 的置信区间是
b b 2 4ac b b 2 4ac ( p1 , p2 ) ( ˆ ˆ , ). 2a 2a
第4节正态总体参数的区间估计
3
, 给定 ,0 1 , 定义 设是总体的一个未知参数
确定两个统计量
ˆ , ˆ 分别称为置信下限和置信上限. 区间. 1 2
ˆ , ˆ ]为 的 置信水平为 1 的 置信 则称区间 [ 1 2
1.75 1.96 1.96 0.49, n 50
所以 的置信区间为
(4.10 0.49, 4.10 0.49 ) (3.61, 4.59 ) .
10
例3 在上例中 , 为使 的置信水平是 0.95 的置信区间
的长度 L 1.5, 求样本容量 .
, u0.025 1.96, 1.75, 解 0.05
u / 2
x
X | | u / 2 X u / 2 X u / 2 / n n n
于是所求 的置信区间为 ( X u 有时简记为 ( X u / 2
2
n
, X u 2 ), n n
7
).
2 某厂生产滚珠,直径 X 服从正态分布 N ( , ). 例1 为了估计 , 抽检 6 个滚珠, 测得直径为 ( mm) : 14.70, 15.21,14.90,14.91,15.32,15.32,
对给定的置信水平 1 ,
按标准正态分布的 水平双侧分位数的定义,
查正态分布表得 u 2 ,
6
1.
已知时 的置信区间
2
/2
( x)
X U ~ N (0,1) , / n
1
O
/2
X P{ | | u 2 } 1 , n
总体参数估计
符号表示 样本统计量
x
P
p
2
s2
第15页/共85页
。
第六章 总体参数估计
一、总体均值的区间估计
(一)正态总体、方差已知,或非正态总体、大 样本
当总体服从正态分布且 已知,或总体不是
正态分布但大样本时,样本均值的抽样分布均
为正态分布,其数学期望为总体均值 ,方差
为 。而样本均值经过标准化后的随机变量则
n1 n2
((22)1)-置12信、水2平2下未的知置时信,区两间个为总体均值之差1-2在
(x1 x2 ) z 2
s12
s
2 2
n1 n2
第35页/共85页
第六章 总体参数估计
【例】某地区教育委员会 想估计两所中学的学生高 考时的英语平均分数之差 ,为此在两所中学独立抽 取两个随机样本,有关数 据如右表 。建立两所中
t
( x1
x2 )
sp
1 n1
(1
1 n2
2 )
~
t (n1
n2
2)
两个总体均值之差1-2在1- 置信水平下的置信
区间为
x1 x2 t 2 n1 n2 2
s
2 p
1 n1
1 n2
第40页/共85页
第六章 总体参数估计
【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各 随机安排12名工人,每个工人组装一件产品所需的时间(分钟)下如表。假定两 种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两 种方法组装产品所需平均时间差值的置信区间
2. 统计学家在某种程度上确信这个区间会包含真 正的总体参数,所以给它取名为置信区间
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
间为
(三)总体均值的区间估计
1、大样本、未知 2、使用正态分布统计量Z
Z X ~ N (0,1) n
3、总体均值 在1-置信水平下的置信区
间为
【例】某市交通部门为了对城市的环境进行监测,定期公 布该市居民每天小汽车的里程数,抽取了36个居民作为一 个简单随机样本,得到资料如下。试构造该市居民每天小 汽车里程数的总体均值的95%的置信区间。
p 为 P的无偏、有效、一致估计量。
第二节 单个总体均值和比率的区间估计
一、总体均值的区间估计:大样本 (n≥30)的情形
总体标准差已知 总体标准差未知
二、总体均值的区间估计:小样本 (n<30)的情形 三、总体比率的区间估计
区间估计
1. 在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减抽样误差而得到的
第一节 参数估计的基本问题 第二节 单个总体均值和比率的区间估计 第三节 样本容量的确定 第四节 两个总体均值和比率差异的区间估计 第五节 分层抽样、整群抽样和等距抽样的区
间估计
案例导入
STAT
一家食品生产企业以生产袋装食品为主,每天的产量约为 8000袋左右。按规定每袋的重量应不低于100克,否则即为不合 格。为对产量质量进行检测,企业设有质量检查科专门负责质 量检验,并经常向企业高层领导提交质检报告。质检的内容之 一就是每袋重量是否符合要求。
x
一般称,1 为置信度,可靠程度等,反映估计结果
的可信程度。若事先给定一个置信度,则可根据标准
正态分布找到其对应的临界值 Z 。进而计算抽样误
2
差
x
x
Z 2
x
(三)总体均值的区间估计
1、大样本、已知 2、使用正态分布统计量Z
Z X ~ N (0,1) n
或推断。
通常,把用来估计总体特征的样本指标叫估计 量或统计量,待估计的总体指标叫总体参数。
1、它在逻辑上运用归纳推理而不是演绎推理。
特 2、在方法上运用不确定的概率估计方法,而不 点 是运用确定的数学分析方法。
3、抽样估计存在抽样误差。
点估计
从总体中抽取一个随机样本,计算与总 体参数相应的样本统计量,然后把该统 计量视为总体参数的估计值,称为参数 的点估计。
总体均值的区间估计
1、总体服从正态分布、小样本、未知
2、使用t分布统计量
t x ~ t(n 1)
sn
3、总体均值 在1-置信水平下的置信区
间为
x t 2
s n
【例】谢尔工业公司拟采用一项计算机辅助程序来培训 公司的维修职员掌握及其维修的操作,以减少培训工人 所需要的时间。为了评价这种培训方法,生产经理需要 对这种程序所需要的平均时间进行估计。以下是利用新 方对15名职员进行培训的培训天数资料。
量更有效。
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
ˆ
一致性
• 一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数。
P(ˆ) 较大的样本容量
B
较小的样本容量
A
ˆ
抽样估计量的优良标准
数理统计证明:
x 为 X的无偏、有效、一致估计量;
S
为
n 1
的无偏、有效、一致估计量;
(2)误差边际 x x 32 50 40 36 39.5
n
36
x
Z 2
n
总体标准差 (未知)
样本标准差 s
样本标准差
s
(
x
2
x)
7.77
误差边际
n 1
x
Z 2
Z
n
2
s 1.645 * 7.77 2.13
优点 简单,具体明确
缺点
无法控制误差,仅适用于对推断的准 确程度与可靠程度要求不高的情况
x的抽样分布
点估计的最大好处:给出确定的值 点估计的最大问题:无法控制误差
估计值的优良标准
问题:
x
不是那第一一,个我统m们计e为量什来么估以计这某一个个总而体
参数?
mo
估计第值二的,优如良果标有两准个:以上的统计 无量估偏可计以结性用果、来是有估否效计一性某致个?、总是一体否致参一性数个,统其计
3.78 15
95%的置信区间为
53.87 ±3.78 即(50.09,57.65)天。
三、总体比率的区间估计
1、样本比例近似服从正态分布
n 30, np 5, n(1 p) 5
2、使用正态分布统计量 z z p ~ N (0,1)
p(1 p)
n
3、总体比例在1-置信水平下的置信区间为
分析:区间点估计 误差边际
解: n 90( 2 大样本), 1 95%,Z 1.96 2
(1)样本比例 p m 397 0.44 n 902
(2)误差边际
p(1 p)
0.44 0.56
P
Z 2
1.96 n
0.0324 902
(3)95%的置信区间0.44 ±0.0324 即(0.4076,0.4724)。
职员 1 2 3 4 5
时间 52 44 55 44 45
职员 6 7 8 9 10
时间 59 50 54 62 46
职员 11 12 13 14 15
时间 54 58 60 62 63
根据上述资料建立置信度为95%的总体均值的区间估 计。(假定培训时间总体服从正态分布)。
解:依题意,总体服从正态分布,n=15(小样本),此时
一致性 估计量将在概率意义下越来越接近
于总体真实值
若 越大 越小,则称 为 的一致估计量
limP( ) 1 n
无偏性
• 无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 。
P(ˆ)
无偏
A
有偏
B
ˆ
有效性
• 有效性:与离散度相联系。对同一总体参数 的两个无偏点估计量,有更小标准差的估计
居民
1 2 3 4 5 6 7 8 9
汽车里 程数
32 50 40 24 33 44 45 48
汽车里 程数
47 31 36 39 46 45 39 38 45
居民
19 20 21 22 23 24 25 26 27
汽车里 程数
27 43 54 36 34 48 23 36 42
第6章 总体参数估计 STAT
本章重点 1、单个总体均值的区间估计; 2、样本容量的确定; 3、两个总体均值之差的区间估计。
本章难点 1、小样本情形下总体参数的区间估计; 2、其他组织形式总体参数的区间估计及样本容量的确 定。
第一节 参数估计的基本问题
也叫抽样估计,就是根据样本指
参数估计 标数值对总体指标数值作出估计
解:依题意,1 95%,Z 1.96, 2000, 200 2
可得
n
(z )2 2
2
E2
1.962 20002 2002
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
一、总体均值的区间估计
STAT
大样本(n≥30)的情形
【例】Duotu公司是一家专营体育设备和附件的公司, 为了监控公司的服务质量,Duotu公司每月都要随即 的抽取一个顾客样本进行调查以了解顾客的满意分 数。根据以往的调查,满意分数的标准差稳定在20 分左右。最近一次对100名顾客的抽样显示,满意分 数的样本均值为80分,试建立总体满意分数的区间。
居民
28 29 30 31 32 33 34 35 36
汽车里 程数
34 39 34 35 42 53 28 49 39
分析:区间估计包括两个部分——点估计和误差边际,只需分 别求出即可到的总体的区间估计。
解:已知
(1)样本的汽车里程数
n 3(6 大样本), 1 90%,Z 1.645 2
由于产品的数量大,进行全面的检验是不可能的,可行的 办法是抽样,然后用样本数据估计平均每袋的重量。质检科从 某天生产的一批食品中随机抽取了25袋,下表是对每袋食品重 量的检验结果。(假定该种袋装食品重量服从正态分布。)
案例导入
STAT
25袋食品的重量(克)
112.5 102.6 100.0 116.6 136.8
n
36
(3)90%的置信区间为39.5 ±2.13 即(37.37,41.63)里。
注意
(1)置信系数一般在抽样之前确定,根据样本所建立的区间能 包含总体参数的概率为
(2)置信区间的长度(准确度)在置信度一定的情况下,与样 本容量的大小呈反方向变动,若要提高估计准确度,可以扩大样 本容量来达到。
二、总体均值的区间估计
101.0 107.5 123.5 95.4 102.8
103.0 95.0 102.0 97.8 101.5
102.0 108.8 101.6 108.4 98.4
100.5 115.6 102.2 105.0 93.3
根据表中数据,质检科估计出该天生产的食品每袋的平均
重量在101.57~109.14克之间,其中,估计的可信程度为95%,
量要优于另一个?
抽样估计量的优良标准
设 为待估计的总体参数, 为样本统 计量,则 的优良标准为:
无偏性 指样本指标的均值应等于被估计 的总体指标