医学统计学第四讲计量资料的统计推断-抽样误差及t分布1学时27页PPT
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
24
例题
随机抽查某地30名40~44岁哈萨克族成年男性 的骨密度,测得其骨密度均数为187.11mg/cm2
标准差为42.32mg/cm2, 试估计骨密度总体均 数的95%可信区间。 n=30, ν=n-1=29 查表 t(0.05/2, 29)=2.045
代入公式:X±t(а/2 ,ν) ×Sx , 即:
5
从偏态分布总体中抽 样,n足够大时,样 本均数也服从正态分
布
n
x1
N(μ,σ2)
n
μ x 2
n
x3
n
...
σ x 4
...
x
中心极限定理:
n
xn
①样本均数服从正态分布;②样本均数的均数等于总体均数,样
本均数的标准差就是标准误。
6
●(均数)标准误的
●计算
X n
s s
x
n
理论值
估计值
●影响因素:σ 一定时,n↑,标准误↓
均数的可靠性。通常用 x sx表示。
2、利用标准误作总体均的区间估计。 3、用标准误作假设检验。
9
标准正态变量变换
随机变量X N(m,2)
u X m
u变换
标准正态分布
N(0,12)
均数 X
N(m,2 n)
u X m n
u变换
标准正态分布
N(0,12)
10
二、t分布
均数 X
N(m,2 n)
u X m n
参数的估计
点估计:由样本统计量 X、S、p
直接作为总体参数估计值 m、 、
区间估计:在一定可信度下,同 时考虑抽样误差
16
总体均数的区间估计(interval estimation)
▲ 概念:根据样本均数,按一定的可信度(概率,1а)估计总体均数可能所在的一个数值范围,称为 总体均数的可信区间(confidence interval, CI)。
医学统计学第四讲计量资 料的统计推断-抽样误差
及t分布1学时
自信是向成功迈出的第一步
第一节 抽样误差和总体均数估计
3
统计推断 statistical inference
总体
抽取部分观察单位 样本
内容:
1. 参数估计
参 数 统计推断 统计量
(estimation of parameters)
如:总体均数
2. 包括:点估
如:样本均数
计与区间估计
总体标准差 总体率
样本标准差S3. 2. 假设检验(
样本率 P
test of
hypothesis)
4
一、均数的抽样误差
总体
抽取部分观察单位 样本
参 数 统计推断 统计量
如:总体均数µ
如:样本均数X
总体标准差σ
样本标准差S
总体率π
样本率 P
抽样误差
(sampling error) :由 于个体差异导 致的样本统计 量之间以及统 计量与总体参 数间的差别。
▲ 习惯上用总体均数的95%(或99%)可信区间,表示 该区间包 含总体均数m的概率为95%(或99%),用此 范围估计总体平均数,表示100次抽样中,有 95(99) 次包含总体均数。
17
总体均数的区间估计(interval estimation)
▲ 方法:根据已知条件不同,采用不同 的方法:
(1) u 分布法 (2) t 分布法
p= 0.05(双侧)
-t
t(0.05/2,ν)
相同自由度下 t 值越大,对应的尾侧
面积越小,即p值越小,反之亦然。
14
● t 分布的应用
1、估计总体均数的可信区间; 2、作 t 检验。
三 总体均数的估计
统计推断的任务就是用样本信息推论总体特征。参数估 计是任务之一。用样本均数估计总体均数(参数)有两 种方法。
7
●标准误的意义:反映抽样误差的大小。标准误越 小,抽样误差越小,用样本均数估计总体均数的可 靠性越大。
例题:随机抽取某市200名7岁男孩,其 身高均数为124.0cm,标准差为4.6cm, 试估计其抽样误差.
SXSn
4.6 0.3c3m 120
8
●标准误的作用 1、反映抽样误差的大小,说明样本
5%是小概率事件,所以在实际应用中就认为 总体均数在算得的可信区间。
(2)t 分布法
应用条件: σ未知,且n较小(n≤100)时. 根据t分布的特点可知,95%的t值分布在 ± t0.05/2,ν之间,即:-t0.05/2, ν ≤t≤ t0.05/2, ν
x-t0.05 sx/≤ 2μ , ≤ x+t0.05 sx/2,
(123.4cm , 124.6cm)
22
意义:
虽然不能知道某市全体7岁男孩身高均数的 确切数值,但有95%的把握说该市全体7岁男孩身 高均数在123.4 ~ 124.6cm之间,。
换句话说,做出该市全体7岁男孩身高均数在 123.4 ~ 124.6cm之间的结论,说对的概率是95%, 说错的概率是5%。
③ u分布是t分布的特殊形式。
12
t 分布的图形(u分布是t分布的特殊形式)
t分布不是一条曲线,而是一簇曲线,自由度一定时,t 分布曲线下面积分布有一定规律。为便于使用,可根 据t值表查找。
13
t 界值表(p262 附表2 )
横坐标:自由度υ 纵坐标:概率p,即曲线下尾侧阴影部分的面积; 表中 的数字:相应的 |t | 界值。
18
(1)u分布法
应用条件:
①σ已知 ② σ未知但n足够大
19
u分布法估计总体均数可信区间
① 已知,总体均数95%的可信区间为:
X 1.96 X
根据样本均数服从u分布,95%的样本均数u值在
±1.96之间,即 -1.96≤x-μ≤1.96 σx
x -1 .9σ x 6 ≤ μ ≤ x+ 1 .9σ x 6 20
u变换
标准正态分布
N(0,12)
tXmXm, vn1
S n SX
Student t分布 自由度:n-1
这时,对正态变量X采取的不是u变换而是t变换了,t
值的分布为t分布。也称为student 分布。 11
t 分布的图形(u分布是t分布的特殊形式)
t 分布特征: ①以纵轴为对称轴的单峰曲线
②t分布为一簇曲线,其形态与自由度有关。
uቤተ መጻሕፍቲ ባይዱ布法估计总体均数可信区间
② 未知,但样本例数n足够大(n>100), 总体均数95%的可信区间可近似地表达为:
X 1.96 S X
21
例题
已知抽样调查某市7岁男童200名,平均身高 为124.0cm, 标准误为0.33cm,试估计该市7岁 男孩身高总体均数的95%可信区间。
(x1.96·s x ,x1.96 ·s x)即 (124.0±1.96×0.33)= (123.4, 124.6) 即:该地7岁男孩平均身高的95%可信区间为
例题
随机抽查某地30名40~44岁哈萨克族成年男性 的骨密度,测得其骨密度均数为187.11mg/cm2
标准差为42.32mg/cm2, 试估计骨密度总体均 数的95%可信区间。 n=30, ν=n-1=29 查表 t(0.05/2, 29)=2.045
代入公式:X±t(а/2 ,ν) ×Sx , 即:
5
从偏态分布总体中抽 样,n足够大时,样 本均数也服从正态分
布
n
x1
N(μ,σ2)
n
μ x 2
n
x3
n
...
σ x 4
...
x
中心极限定理:
n
xn
①样本均数服从正态分布;②样本均数的均数等于总体均数,样
本均数的标准差就是标准误。
6
●(均数)标准误的
●计算
X n
s s
x
n
理论值
估计值
●影响因素:σ 一定时,n↑,标准误↓
均数的可靠性。通常用 x sx表示。
2、利用标准误作总体均的区间估计。 3、用标准误作假设检验。
9
标准正态变量变换
随机变量X N(m,2)
u X m
u变换
标准正态分布
N(0,12)
均数 X
N(m,2 n)
u X m n
u变换
标准正态分布
N(0,12)
10
二、t分布
均数 X
N(m,2 n)
u X m n
参数的估计
点估计:由样本统计量 X、S、p
直接作为总体参数估计值 m、 、
区间估计:在一定可信度下,同 时考虑抽样误差
16
总体均数的区间估计(interval estimation)
▲ 概念:根据样本均数,按一定的可信度(概率,1а)估计总体均数可能所在的一个数值范围,称为 总体均数的可信区间(confidence interval, CI)。
医学统计学第四讲计量资 料的统计推断-抽样误差
及t分布1学时
自信是向成功迈出的第一步
第一节 抽样误差和总体均数估计
3
统计推断 statistical inference
总体
抽取部分观察单位 样本
内容:
1. 参数估计
参 数 统计推断 统计量
(estimation of parameters)
如:总体均数
2. 包括:点估
如:样本均数
计与区间估计
总体标准差 总体率
样本标准差S3. 2. 假设检验(
样本率 P
test of
hypothesis)
4
一、均数的抽样误差
总体
抽取部分观察单位 样本
参 数 统计推断 统计量
如:总体均数µ
如:样本均数X
总体标准差σ
样本标准差S
总体率π
样本率 P
抽样误差
(sampling error) :由 于个体差异导 致的样本统计 量之间以及统 计量与总体参 数间的差别。
▲ 习惯上用总体均数的95%(或99%)可信区间,表示 该区间包 含总体均数m的概率为95%(或99%),用此 范围估计总体平均数,表示100次抽样中,有 95(99) 次包含总体均数。
17
总体均数的区间估计(interval estimation)
▲ 方法:根据已知条件不同,采用不同 的方法:
(1) u 分布法 (2) t 分布法
p= 0.05(双侧)
-t
t(0.05/2,ν)
相同自由度下 t 值越大,对应的尾侧
面积越小,即p值越小,反之亦然。
14
● t 分布的应用
1、估计总体均数的可信区间; 2、作 t 检验。
三 总体均数的估计
统计推断的任务就是用样本信息推论总体特征。参数估 计是任务之一。用样本均数估计总体均数(参数)有两 种方法。
7
●标准误的意义:反映抽样误差的大小。标准误越 小,抽样误差越小,用样本均数估计总体均数的可 靠性越大。
例题:随机抽取某市200名7岁男孩,其 身高均数为124.0cm,标准差为4.6cm, 试估计其抽样误差.
SXSn
4.6 0.3c3m 120
8
●标准误的作用 1、反映抽样误差的大小,说明样本
5%是小概率事件,所以在实际应用中就认为 总体均数在算得的可信区间。
(2)t 分布法
应用条件: σ未知,且n较小(n≤100)时. 根据t分布的特点可知,95%的t值分布在 ± t0.05/2,ν之间,即:-t0.05/2, ν ≤t≤ t0.05/2, ν
x-t0.05 sx/≤ 2μ , ≤ x+t0.05 sx/2,
(123.4cm , 124.6cm)
22
意义:
虽然不能知道某市全体7岁男孩身高均数的 确切数值,但有95%的把握说该市全体7岁男孩身 高均数在123.4 ~ 124.6cm之间,。
换句话说,做出该市全体7岁男孩身高均数在 123.4 ~ 124.6cm之间的结论,说对的概率是95%, 说错的概率是5%。
③ u分布是t分布的特殊形式。
12
t 分布的图形(u分布是t分布的特殊形式)
t分布不是一条曲线,而是一簇曲线,自由度一定时,t 分布曲线下面积分布有一定规律。为便于使用,可根 据t值表查找。
13
t 界值表(p262 附表2 )
横坐标:自由度υ 纵坐标:概率p,即曲线下尾侧阴影部分的面积; 表中 的数字:相应的 |t | 界值。
18
(1)u分布法
应用条件:
①σ已知 ② σ未知但n足够大
19
u分布法估计总体均数可信区间
① 已知,总体均数95%的可信区间为:
X 1.96 X
根据样本均数服从u分布,95%的样本均数u值在
±1.96之间,即 -1.96≤x-μ≤1.96 σx
x -1 .9σ x 6 ≤ μ ≤ x+ 1 .9σ x 6 20
u变换
标准正态分布
N(0,12)
tXmXm, vn1
S n SX
Student t分布 自由度:n-1
这时,对正态变量X采取的不是u变换而是t变换了,t
值的分布为t分布。也称为student 分布。 11
t 分布的图形(u分布是t分布的特殊形式)
t 分布特征: ①以纵轴为对称轴的单峰曲线
②t分布为一簇曲线,其形态与自由度有关。
uቤተ መጻሕፍቲ ባይዱ布法估计总体均数可信区间
② 未知,但样本例数n足够大(n>100), 总体均数95%的可信区间可近似地表达为:
X 1.96 S X
21
例题
已知抽样调查某市7岁男童200名,平均身高 为124.0cm, 标准误为0.33cm,试估计该市7岁 男孩身高总体均数的95%可信区间。
(x1.96·s x ,x1.96 ·s x)即 (124.0±1.96×0.33)= (123.4, 124.6) 即:该地7岁男孩平均身高的95%可信区间为