第3章-总体均数的估计和假设检验PPT幻灯片

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
= 18.55(mg/kg)
(3) 可信区间的解释
1) 可信区间的涵义 95%CI:从总体中随机抽取含量为 n 的样本 100个,算得100个可信区间,平均有95个可信
区间包含总体均数μ(可信度为95%)。
2) 可信区间的两个要素 准确度 accuracy :反映在可信度 1- 的大小 精密度 precision : 反映在区间的长度
(2) 总体均数可信区间的计算: 1) 当σ未知时 P ( -tα/2 · < t < t α/2 · ) =1 -α χ-μ P( -tα/2 · < Sχ < t α/2 · ) =1 -α 故总体均数:μ的(1-α)双侧可信区间为:
χ- tα/2 · Sχ < μ <χ+ tα/2 · Sχ χ± tα/2 · ·Sχ 或 χ± tα/2 · · S /√n
例4:某地调查正常成年男子144人的红细胞计数,得:
x =5.38×1012/L , S =0.44 ×1012/L .
(1)95%被调查者的红细胞计数是多少?
x ± 1.96 ·s= 5.38±1.96 ×0.44
99%CI :
> Fra Baidu bibliotek - t0.01 · ·Sχ < x + t0.01 · ·Sχ
例3:随机抽取10个午餐肉罐头测定其亚硝酸盐含量 均数为17.6mg/kg , 标准差为1.64mg/kg,估计 该批午餐肉罐头平均含量的95%CI。
t0.05 ·9= 1.833 下侧95%CI:< x + t0.05 · ·Sχ = 17.6+1.8331.64/10
α/2
-t
α/2
0
+t
双侧 单侧
P(
t
P≤(-ttα≤/2
-,t)α+· P)(=t
≥ α
tα/2
,
)
=
α
或 P( t ≥ tα· ) = α
三 、总体均数的估计
1. 点估计 point estimation
用样本均数作为总体均数的估计值
2. 区间估计 interval estimation
(1) 可信区间的概念 confidence interval , CI 按一定的概率(可信度,1 -α) 估计包含总体均 数所在范围,亦称总体均数的可信区间
例2:某地随机抽取 25 名1岁婴儿测定其血红蛋白
x =123.7g/L , S =11.9g/L , 试估计该地1岁婴儿 的血红蛋白的平均浓度。
x ± tα/2 · ·Sχ = x ± tα/2 · ·S/√n
t0.05/2,24 = 2.064
t0.01/2,24 = 2.797
95% CI
123.7±2.064×11.9/√25 = 123.7 ±2.064×2.38
= ( 118.8 , 128.6 ) g/L
99% CI
123.7±2.797×11.9/√25 = 123.7 ±2.797×2.38
= ( 117.0 , 130.4 ) g/L
单侧可信区间:
95%CI :
上侧: > x - t0.05 · ·Sχ 下侧: < x + t0.05 · ·Sχ
2) 当σ未知但 n 足够大时
x - u/2 ·sχ <μ< x + u/2 ·sχ 即 x ± u/2 ·sχ 或 x ± u/2 · s /√n
3) 当σ已知
x - u/2 ·σχ < μ < x + u/2 ·σχ 即 x ± u/2 ·σχ 或 x ± u/2 ·σ/√n
总体均数95%可信区间
2. t- 分布特征
1)以0为中心,左右对称
2)t-分布曲线的形状与自由度有关 3)t-分布曲线下面积为1
t-分布曲线下面积分布可由t值表中查出
f(t) =-(χ-μ) / σχ -
= ∞(u-d)
= 5
=1
-4 -3 -2 -1 0 +1 +2 +3 +4
自由度分别为1、5、∞的t-分布
t -分布曲线下面积分布从 t 值表(P696)查出:
一.均数的抽样误差和标准误
1.抽样误差(Sampling error) 由于抽样造成的样本均数与总体均数的
差异、或样本均数之间的差异。抽样误差是 不可避免的,但可以控制。
2.表示方法:标准误 Standard error
是说明样本均数抽样误差的大小的指标, 反映了样本均数间的离散程度。也反映了样 本均数与总体均数的差异;
( 95% confidence interval , 95% CI )
x ± t0.05/2 · ·Sχ
x ± u s· 0.05/2 χ ,
x ± 1.96 ·sχ
x ± u 0.05/2 ·σχ
x ± 1.96 ·σχ
总体均数99%可信区间
( 99% confidence interval , 99% CI )
x ± t 0.01/2 · ·Sχ
x ± u s· 0.01/2 χ , x ± u 0.01/2 ·σχ
x ± 2.58 ·sχ
x ± 2.58 ·σχ
例1:某地随机抽取100名1岁婴儿测定其血红蛋白
x =123.7g/L , S =11.9g/L , 试估计该地1岁婴儿 的血红蛋白的平均浓度。
σ
σ
σ
……
服从标准正态分布 N(0,1)
若: x1, x2 , x3 , …… 服从正态分布 N(μ, σx )
则:
x1 –μ
σx
,
x2 –μ
σx
,
x3 –μ
σx
……
服从标准正态分布 N(0,1) 若:σx 未知,用 Sx 代替
则: x1 –μ , x2 –μ , x3 –μ ……
Sx
Sx
Sx
服从 t 分布
3.标准误的计算公式
σ σχ = √n
σχ : 总体标准误
S S χ = √n
4.标准误的意义
S χ :样本标准误,
为σχ的估计值
1)表示抽样误差的大小
2)与均数结合表示样本均数对总体均数的
代表性( x±Sx )
设: x1, x2 , x3 , ……服从正态分布 N(μ, σ)
则: x1 –μ , x2 –μ ,x3 –μ
x ± 1.96 ·sχ = x ± 1.96 ·S/√n
95% CI
123.7±1.96×11.9/√100 = 123.7 ±1.96×1.19
= ( 121.4 , 126.0 ) g/L
99% CI
123.7±2.58×11.9/√100 = 123.7 ±2.58×1.19 = ( 120.6 , 126.8 ) g/L
相关文档
最新文档