雷静卫生统计学第六章 参数估计基础课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
但实际工作中 x 需用 s x 来估计,这样,对正
态变量采用的就不是Ζ变换而是t变换了,即
t(x)/sx
其结果即为t分布。观察t分布曲线图
雷静卫生统计学第六章 参数估计基础
11
f(t)
0.4
υ=∞
υ=5
0.3
υ=1
0.2
0.1
0.0 -5 -4 -3 -2 -1 0 1 2 3
图6-4 自由度为1、5、∞的t分布
雷静卫生统计学第六章 参数估计基础
14
一、总体均数可信区间的计算** : 方法:1.t分布法:
σ未知且n较小时
2.正态近似法:
σ已知或σ未知但n较大时
雷静卫生统计学第六章 参数估计基础
15
1.t分布法:σ未知且n小时,某自由度的t曲线下有95%
的t值在±t0.05 / 2, 之间,即:
P ( t0 .0/2 5 , t t0 .0/2 5 ,) 0 .95
Sp = p(1p) n
反映率的抽样误差的大小。例6-1.
雷静卫生统计学第六章 参数估计基础
9
t分布
前面讲过,对正态变量x采用
X 变
换,则将正态分布N(μ,σ2)变换为标准正
态分布N(0,1)。
已知样本均数也服从正态分布,那么对 x 采
用Ζ变换,即可将其变换为标准正态分布。
雷静卫生统计学第六章 参数估计基础
雷静卫生统计学第六章 参数估计基础
2
一、样本均数的抽样分布与抽样误差
实验6-1:假定某年某地13岁女生身高服从正态分 布N(155.4,5.32)(cm)。利用计算机在该总 体中随机抽取100个样本,每个样本n=30,即可 求得如表6-1第(2)列中的100个样本均数。由 这100个样本均数,可绘成样本均数的频率分布 表(表6-2)。
黑球的频率列成频率分布表即表6-3,观察表中 的频率分布特征。
雷静卫生统计学第六章 参数估计基础
8
由此分布可知:样本率与样本率之间;样本率与总体 率之间均存在差异,即抽样误差。
根据二项分布的原理,样本频率的总体概率为π, 的标准误为
σp= (1) n
实际工作中,总体率往往未知,常用样本率来近似代 替总体率,则有
雷静卫生统计学第六章 参数估计基础
7
二、样本频率的抽样分布与抽样误差
实验6-3,摸球实验。观察二项分布总体中样本频 率的分布特征。
一个口袋内装有形状、重量完全相同的黑球和白 球,其中黑球比例为20%(π=20%),从中重复 摸球50次(ni=50),计算摸到黑球的频率(样本
率pi)。这样的实验重复进行100次,将每次得到
观察样本均数抽样分布的特点
雷静卫生统计学第六章 参数估计基础
3
样本均数抽样分布的特点:
① 样本均数恰好等于总体均数的情况很少; ② 样本均数之间亦存在差异; ③ 样本均数的分布围绕总体均数左右基本对称,
呈近似正态分布; ④ 样本均数之间的变异明显小于原始变量值之
间的变异;
雷静卫生统计学第六章 参数估计基础
2)σ未知,但n足够大(n>50)时,可知t分布 逼近Ζ分布,此时t曲线下有95%的t值在±1.96之间
即:P(-1.96≤t≤+1.96)=0.95
P(-1.96≤ (x)/sx≤+1.96)=0.95
P( x1.96sx≤ ≤ x1.96sx)=0.95
故总体均数μ的95%可信区间为
( x1.96sx , x1.96sx )
雷静卫生统计学第六章 参数估计基础
t 45
12
t分布的特征:只有一个参数ν
以0为中心,左右对称的单峰分布;
t分布是一簇曲线,形态变化与n(即自由度)大 小有关。自由度ν越小,t分布曲线越低平;自 由度ν越大,t分布曲线越接近标准正态分布 (Ζ分布)曲线。
t分布峰部较矮,尾部翘得较高,说明远侧的t值 的个数相对较多,即尾部面积(概率P)较大。 自由度ν越小这种情况越明显,ν渐大时,t分 布渐逼近标准正态分布;当ν=∞时,t分布就成 为标准正态分布了。
4
已证明:
从正态总体N( μ,σ2 )中,随机抽取例 数为n的样本,样本均数 x 也服从正态分布, 此正态分布为N ( μ, ) ;x 2
雷静卫生统计学第六章 参数估计基础
5
均数的抽样误差——指由抽样而造成的样本均数 与总体均数之间的差异。
x 称标准误,它说明均数抽样误差的大小。
x / n
附表2,t界值表P467
雷静卫生统计学第六章 参数估计基础
13
总体均数及总体概率的估计
参数估计有两种方法: 1.点(值)估计:未考虑抽样误差 2.区间估计:可信区间又称置信区间 (confidence interval,CI) 指按一定的概率估计总体均数的可能范围。 概率1-α称为可信度(置信度),常取95% 或99%
P ( t0 .0/2 5 , (x)/sx t0 .0/2 5 ,) 0 .95
P (x t0 .0/2 5 ,s x x t0 .0/2 5 ,s x ) 0 .95
故总体均数μ的95%可信区间为:
( xt0.05/2,sx , xt0.05/2,sx )
雷静卫生统计学第六章 参数估计基础
16
2.正态近似法:
1)σ已知时,正态曲线下有95%的Ζ值在±1.96之间,
即:
P(-1.96≤Ζ≤+1.96)=0.95
P(-1.96≤ (x)/x≤+1.96)=0.95
移项后整理得,总体均数μ的95%可信区间为
( x 1 .96 x,x 1 .96 x)
雷静卫生统计学第六章 参数估计基础
17
n越大,标准误越小,样本均数的抽样误差亦越小
实际工作中,σ常未知,而是用样本标准差s来估
计,则有 sx s/ n
常用来说明均数的抽样误差的大小。
雷静卫生统计学第六章 参数估计基础
6
即使从偏态总体抽样,当n足够大时, 样本均数也近似正态分布(见实验6-2, 观察图6-1及图6-2的变化)。
第六章 参数估计基础
抽样分布与抽样误差 t分布 总体均数及总体率的估计
雷静卫生统计学第六章 参数估计基础
1
抽样分布与抽样误差
在实际工作中,由于总体中各观察对象之间存在 着个体变异,且随机抽取的样本又只是总体中的 一部分,因此计算的样本统计量,不一定恰好等 于相应的总体参数。
这种由于个体变异的存在,在抽样研究中产生的 样本统计量与相应的总体参数间的差异,称为抽 样误差(sampling error)