医学统计学课件--第三章 总体均数的估计与假设检验(第3章)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

样本号
Xi
Si
1
1999年某市18 岁男生身高值 Xi~N(μ, σ2) μ=167.7cm σ=5.3cm 2 ni = 10 3 · · · 99 100
167.41
165.56 168.20 · · · 169.40 165.69
2.74
6.57 5.36 · · · 5.57 5.09
6
2012-9-19
X 或 X u SX
2
,
2
,
单侧
X u , X 或 X u , X 或
X u , S X X u , S X
2012-9-19
医学统计学
29
例 某地抽取正常成年人200名,测得其血 清胆固醇均数为3.64 mmol/L,标准差为 1.20mmol/L,估计该地正常成年人血清胆 固醇均数95%可信区间。
-t
0
t
0.0025 0.005 127.321 14.089 7.453 5.598 4.773 2.871 2.839 2.820 2.813 2.8070
0.001 0.002 318.309 22.327 10.215 7.173 5.893 3.174 3.131 3.107 3.098 3.0902
从均数为、标准差为的总体中独立随机 抽样,当样本含量n较大时, 样本均数的分布将趋于正态分布 此分布的均数为
标准差为
X
n
2012-9-19
医学统计学
9
中心极限定理(central limit theorem)
若 X i 服从正态分布 则 X j 服从正态分布
若 X i 不服从正态分布 n大(n>60):则 X j 近似服从正态分布 n小(n<60):则 X j为非正态分布
2012-9-19
医学统计学
3
了解总体特征的最好方法是对总体的每一
个体进行观察、试验,但这在医学研究实 际中往往不可行。 对无限总体不可能对所有个体逐一观察, 对有限总体限于人力、财力、物力、时间 或个体过多等原因,不可能也没必要对所 有个体逐一研究(如对一批罐头质量检查)。
借助抽样研究。
2012-9-19 医学统计学 4
2012-9-19
医学统计学
10
样本统计量的标准差称标准误 (standard error, SE) 样本均数的标准差称均数的标准误
(standard error of mean, SEM)
n
X
2012-9-19
SX
医学统计学
S n
11
标准差与标准误的区别
S 意 义 描述个体值的离散程度; 衡量样本均数对样本个体 值的代表性 计 算
t0.05
2,9
2.262
166.95±2.262×1.1511=164.35~169.55(cm)
故该地18岁男生身高均数的 95%可信区间为(164.35, 169.55)cm。 μ=167.7cm 双尾 2012-9-19
医学统计学
28
1.单一总体均数的1–α可信区间 (2)已知或未知但n足够大: 双侧 X u
S (X X ) n 1
2
SX
反映抽样误差的大小; 衡 量 样本 均数 估 计总 体均 数的可靠性
S S n
X
与均数的关系 S 越小, X 对样本个体值的 S X 越小, X 估计的可靠性 代表性越好 与 n 的 关系 n →∞,S → 应 用 计算变异系数 计算标准误 估计参考值范围
2012-9-19

) t分布
医学统计学 16
n
t分布的图形与特征
t分布为一簇单峰分布曲线,不同,曲线
形状不同
t分布以0为中心,左右对称
t分布与有关, 越小, t值越分散,t分
布的峰部越低,而两侧尾部翘得越高
当逼近, S 逼近 ,t分布逼近u分布 X X
2012-9-19
医学统计学
样本均数抽样分布具有如下特点:
各样本均数未必等于总体均数
各样本均数间存在差异
样本均数围绕 X =167.69cm呈正态分布
样本均数变异度( S
体值变异度(σ = 5.3cm)大大缩小
X
1.69cm )较原总体个
2012-9-19
医学统计学
7
2012-9-19
医学统计学
8
中心极限定理(central limit theorem)
欲了解某地18岁男生身高值的平均水平,
随机抽取该地10名男生身高值作为样本。 由于个体变异与抽样的影响,抽得的样本 均数不太可能等于总体均数,造成样本统 计量与总体参数间的差异(表现为来自同一 总体的若干样本统计量间的差异),称为抽 样误差。 抽样误差是不可避免的。 抽样误差是有规律的。
2012-9-19 医学统计学 5
2012-9-19 医学统计学 12
越大 n →∞, S X → 0 均数的假设检验 估计的可信区间
第二节
t 分布
2012-9-19
医学统计学
13
1908年,英国统计学 家 W.S.Gosset 以笔 名 ―Student‖ 在 《Biometrics》 杂 志 上发表论文,首次提 出t分布概念,后人 又 称 Student’s t-distribution , 开 创 了小样本统计推断的 新纪元,被认为是统 计学发展史上的里程 碑之一。 2012-9-19 医学统计学
14
William Seely Gosset(1876~1937,英)
2012-9-19
医学统计学
15Βιβλιοθήκη Baidu
t 分布的概念
X ~ N(, ) N(0,1)
2
u
X
X ~ N( ,

2
u
X n
) N(0,1)
2 t X S n
n
X ~ N( ,
-t
0
t
0.005 0.0025 0.001 0.0005 0.01 0.005 0.002 0.001 63.657 127.321 318.309 636.619 9.925 14.089 22.327 31.599 5.841 7.453 10.215 12.924 4.604 5.598 7.173 8.610 4.032 4.773 5.893 6.869 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 4.317 4.029 3.833 3.690 3.581 3.497 3.428 3.372 3.326 3.286 5.208 4.785 4.501 4.297 4.144 4.025 3.930 3.852 3.787 3.733 5.959 5.408 5.041 4.781 4.587 4.437 4.318 4.221 4.140 4.073
2012-9-19 医学统计学 24
预先给定的概率(1)称为可信度
(confidence level),常取95%或99%。
可信区间通常由两个数值构成,
称可信限(confidence limit, CL) 。
μ
可信下限(L) 可信上限(U)
总体参数是未知的、一个固定的值。
(所以要用包含来描述)。 样本统计量是随机变量。
0.0005 0.001 636.619 31.599 12.924 8.610 6.869 3.390 3.340 3.310 3.300 3.2905
t分布曲线下面积与横轴t值间关系(附表2)
t界值表中一侧尾部面积称单侧概率 (α)
两侧尾部面积之和称双侧概率(α/2) t0.05/2,9=2.262 , t0.05,9=1.833
2012-9-19 医学统计学 25
二、总体均数可信区间的计算
1. 单一总体均数的可信区间 (1)未知 按t分布原理 (2)已知或未知但n足够大(如n>60) 按u分布原理 2. 两总体均数之差的可信区间
2012-9-19 医学统计学 26
1.单一总体均数的1–α可信区间 (1)未知 双侧 单侧
X t
,
2
S
X
, X t
2
,
S
X
X t , SX X t , SX
2012-9-19
医学统计学
27
例 在例3-1中抽得第15号样本的 X=166.95(cm),S=3.64(cm), 求其总体均数的95%可信区间。
SX 3.64 10 1.1511
医学统计学
17
f(t)
=∞(标准正态曲线) =5
0.3
=1
0.2
0.1
-4
-3
-2
-1
0
1
2
3
4
t 值
自由度分别为1、5、∞时的t分布
附表2 t 界值表
自由度 单侧 双侧 1 2 3 4 5 100 200 500 1000 概 0.25 0.50 1.000 0.816 0.765 0.741 0.727 0.677 0.676 0.675 0.675 0.6745 0.20 0.40 1.376 1.061 0.978 0.941 0.920 0.845 0.843 0.842 0.842 0.8416 0.10 0.20 3.078 1.886 1.638 1.533 1.476 1.290 1.286 1.283 1.282 1.2816 0.05 0.10 6.314 2.920 2.353 2.132 2.015 1.660 1.653 1.648 1.646 1.6449 0.025 0.05 12.706 4.303 3.182 2.776 2.571 1.984 1.972 1.965 1.962 1.9600 率,P 0.01 0.02 31.821 6.965 4.541 3.747 3.365 2.364 2.345 2.334 2.330 2.3264 0.005 0.01 63.657 9.925 5.841 4.604 4.032 2.626 2.601 2.586 2.581 2.5758
第三章 总体均数的估计 与假设检验
第二军医大学卫生统计学教研室 张罗漫
2012-9-19 医学统计学 1
讲课内容
均数的抽样误差与标准误
t 分布 总体均数的估计 t 检验 假设检验的注意事项 正态性检验和两样本方差比较的F检验

医学统计学
2012-9-19
2
第一节
均数的抽样误差与标准误
第三节 总体均数的估计
2012-9-19
医学统计学
23
一、可信区间的概念
参数估计是用样本统计量推断总体参数。
有点估计和区间估计两种。
点估计是用样本统计量直接估计其总体参
数值。如用 X 估计、S估计等。 方法虽简单,但未考虑抽样误差大小。
区间估计是按预先给定的概率(1 ),确定
一个包含总体参数的范围。该范围称为参数 的可信区间(confidence interval, CI)
在相同自由度时, t
值增大,α减小
在相同α 时,单尾α 对应的t值比双尾α
的小
2012-9-19 医学统计学 20
2012-9-190.05,9
t
=1.833
医学统计学
t0.05/2,9=2.262
21
附表2 t 界值表
自由度 单侧 双侧 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0.25 0.50 1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.697 0.695 0.694 0.692 0.691 0.20 0.40 1.376 1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 0.873 0.870 0.868 0.866 0.10 0.20 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 0.05 0.10 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 概 率,P 0.025 0.01 0.05 0.02 12.706 31.821 4.303 6.965 3.182 4.541 2.776 3.747 2.571 3.365 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602
相关文档
最新文档