总体均数的估计与假设检验-医学统计教学课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对无限总体不可能对所有个体逐一观察, 对有限总体限于人力、财力、物力、时间 或个体过多等原因,不可能也没必要对所 有个体逐一研究(如对一批罐头质量检查)。
借助抽样研究。
4
欲了解某地18岁男生身高值的平均水平, 随机抽取该地10名男生身高值作为样本。
由于个体变异与抽样的影响,抽得的样本 均数不太可能等于总体均数,造成样本统 计量与总体参数间的差异(表现为来自同一 总体的若干样本统计量间的差异),称为抽 样误差。
t分布为一簇单峰分布曲线,不同,曲线 形状不同
t分布以0为中心,左右对称 t分布与有关, 越小, t值越分散,t分
布的峰部越低,而两侧尾部翘得越高 当逼近, S X 逼近 X ,t分布逼近u分布
17
f(t)
=∞(标准正态曲线)
=5
0.3
=1
0.2
0.1
-4
-3
-2
-1
0
1
2
3
4
t值
自由度分别为1、5、∞时的t分布
S
SX
意
义 描述个体值的离散程度; 反映抽样误差的大小;
衡量样本均数对样本个体 衡量样本均数估计总体均
值的代表性
数的可靠性
计Leabharlann Baidu
算 S (X X)2
n1
S
S
X
n
与均数的关系 S 越小, X 对样本个体值的 SX 越小, X 估计的可靠性
代表性越好
越大
与 n 的 关系 n →∞,S →
n →∞, SX → 0
应
用 计算变异系数
计算标准误
估计参考值范围
均数的假设检验 估计的可信区间
12
第二节
t 分布
13
1908年,英国统计学
家 W.S.Gosset 以笔
名 “Student”在《
Biometrics》杂志上
发表论文,首次提出
t分布概念,后人又
称Student’s
t-
distribution,开创了
小样本统计推断的新
附表2 t 界值表
-t
0
t
概 率,P
自由度 单侧
0.25
0.20
0.10
0.05
0.025 0.01
0.005 0.0025 0.001 0.0005
双侧 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001
1
1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
纪元,被认为是统计
学发展史上的里程碑
之一。 14
William Seely Gosset(1876~1937,英)
15
t 分布的概念
X ~N ( , 2) u X N (0,1)
X~N(,2) u X nN(0,1) n
X
X~N(,2)t S nt分 布
n
16
t分布的图形与特征
若 X i 不服从正态分布
n大(n>60):则
X
近似服从正态分布
j
n小(n<60):则 X j 为非正态分布
10
样本统计量的标准差称标准误 (standard error, SE)
样本均数的标准差称均数的标准误 (standard error of mean, SEM)
X
n
S SX n
11
标准差与标准误的区别
2
0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
3
0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4
0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
500
0.675 0.842 1.283 1.648 1.965 2.334 2.586 2.820 3.107 3.310
1000
0.675 0.842 1.282 1.646 1.962 2.330 2.581 2.813 3.098 3.300
0.6745 0.8416 1.2816 1.6449 1.9600 2.3264 2.5758 2.8070 3.0902 3.2905
5
0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
100
0.677 0.845 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
200
0.676 0.843 1.286 1.653 1.972 2.345 2.601 2.839 3.131 3.340
t分布曲线下面积与横轴t值间关系(附表2)
t界值表中一侧尾部面积称单侧概率 (α) 两侧尾部面积之和称双侧概率(α/2) t0.05/2,9=2.262 , t0.05,9=1.833
在相同自由度时,t 值增大,α减小
在相同α 时,单尾α 对应的t值比双尾α 的小
20
t0.05,9=1.833
t0.05/2,9=2.262 21
附表2 t 界值表
-t
0
t
自由度
概 率,P
单侧 双侧
0.25 0.50
0.20 0.40
0.10 0.20
0.05 0.10
0.025 0.01 0.05 0.02
0.005 0.0025 0.001 0.0005 0.01 0.005 0.002 0.001
1
1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
抽样误差是不可避免的。 抽样误差是有规律的。
5
8
中心极限定理(central limit theorem)
从均数为、标准差为的总体中独立随机
抽样,当样本含量n较大时,
样本均数的分布将趋于正态分布
此分布的均数为
标准差为
X
n
9
中心极限定理(central limit theorem)
若 X i 服从正态分布 则 X j 服从正态分布
2
0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
总体均数的估计 与假设检验
第二军医大学卫生统计学教研室 张罗漫
1
讲课内容
均数的抽样误差与标准误 t 分布 总体均数的估计 t 检验 假设检验的注意事项 正态性检验和两样本方差比较的F检验
2
第一节 均数的抽样误差与标准误
3
了解总体特征的最好方法是对总体的每一 个体进行观察、试验,但这在医学研究实 际中往往不可行。
借助抽样研究。
4
欲了解某地18岁男生身高值的平均水平, 随机抽取该地10名男生身高值作为样本。
由于个体变异与抽样的影响,抽得的样本 均数不太可能等于总体均数,造成样本统 计量与总体参数间的差异(表现为来自同一 总体的若干样本统计量间的差异),称为抽 样误差。
t分布为一簇单峰分布曲线,不同,曲线 形状不同
t分布以0为中心,左右对称 t分布与有关, 越小, t值越分散,t分
布的峰部越低,而两侧尾部翘得越高 当逼近, S X 逼近 X ,t分布逼近u分布
17
f(t)
=∞(标准正态曲线)
=5
0.3
=1
0.2
0.1
-4
-3
-2
-1
0
1
2
3
4
t值
自由度分别为1、5、∞时的t分布
S
SX
意
义 描述个体值的离散程度; 反映抽样误差的大小;
衡量样本均数对样本个体 衡量样本均数估计总体均
值的代表性
数的可靠性
计Leabharlann Baidu
算 S (X X)2
n1
S
S
X
n
与均数的关系 S 越小, X 对样本个体值的 SX 越小, X 估计的可靠性
代表性越好
越大
与 n 的 关系 n →∞,S →
n →∞, SX → 0
应
用 计算变异系数
计算标准误
估计参考值范围
均数的假设检验 估计的可信区间
12
第二节
t 分布
13
1908年,英国统计学
家 W.S.Gosset 以笔
名 “Student”在《
Biometrics》杂志上
发表论文,首次提出
t分布概念,后人又
称Student’s
t-
distribution,开创了
小样本统计推断的新
附表2 t 界值表
-t
0
t
概 率,P
自由度 单侧
0.25
0.20
0.10
0.05
0.025 0.01
0.005 0.0025 0.001 0.0005
双侧 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001
1
1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
纪元,被认为是统计
学发展史上的里程碑
之一。 14
William Seely Gosset(1876~1937,英)
15
t 分布的概念
X ~N ( , 2) u X N (0,1)
X~N(,2) u X nN(0,1) n
X
X~N(,2)t S nt分 布
n
16
t分布的图形与特征
若 X i 不服从正态分布
n大(n>60):则
X
近似服从正态分布
j
n小(n<60):则 X j 为非正态分布
10
样本统计量的标准差称标准误 (standard error, SE)
样本均数的标准差称均数的标准误 (standard error of mean, SEM)
X
n
S SX n
11
标准差与标准误的区别
2
0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
3
0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4
0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
500
0.675 0.842 1.283 1.648 1.965 2.334 2.586 2.820 3.107 3.310
1000
0.675 0.842 1.282 1.646 1.962 2.330 2.581 2.813 3.098 3.300
0.6745 0.8416 1.2816 1.6449 1.9600 2.3264 2.5758 2.8070 3.0902 3.2905
5
0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
100
0.677 0.845 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
200
0.676 0.843 1.286 1.653 1.972 2.345 2.601 2.839 3.131 3.340
t分布曲线下面积与横轴t值间关系(附表2)
t界值表中一侧尾部面积称单侧概率 (α) 两侧尾部面积之和称双侧概率(α/2) t0.05/2,9=2.262 , t0.05,9=1.833
在相同自由度时,t 值增大,α减小
在相同α 时,单尾α 对应的t值比双尾α 的小
20
t0.05,9=1.833
t0.05/2,9=2.262 21
附表2 t 界值表
-t
0
t
自由度
概 率,P
单侧 双侧
0.25 0.50
0.20 0.40
0.10 0.20
0.05 0.10
0.025 0.01 0.05 0.02
0.005 0.0025 0.001 0.0005 0.01 0.005 0.002 0.001
1
1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
抽样误差是不可避免的。 抽样误差是有规律的。
5
8
中心极限定理(central limit theorem)
从均数为、标准差为的总体中独立随机
抽样,当样本含量n较大时,
样本均数的分布将趋于正态分布
此分布的均数为
标准差为
X
n
9
中心极限定理(central limit theorem)
若 X i 服从正态分布 则 X j 服从正态分布
2
0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
总体均数的估计 与假设检验
第二军医大学卫生统计学教研室 张罗漫
1
讲课内容
均数的抽样误差与标准误 t 分布 总体均数的估计 t 检验 假设检验的注意事项 正态性检验和两样本方差比较的F检验
2
第一节 均数的抽样误差与标准误
3
了解总体特征的最好方法是对总体的每一 个体进行观察、试验,但这在医学研究实 际中往往不可行。