医学统计学课件:参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X =143.37
s = 5.23 x1,x2,x3…x10
样本含量 n=10
X=142.72
s = 9.2473 x1,x2,x3…x10
X =144.07
s = 4.72 x1,x2,x3…x10
6
点估计
• 直接用样本统计量作为总体参数的估计值
–方法简单,但未考虑抽样误差的大小 –在实际问题中,总体参数往往是未知的,但它们是固
3
参数估计
• 由样本统计量估计总体参数
– 点估计(point estimation) – 区间估计(interval estimation)
4
参数估计之一:点估计 • 用样本统计量作为总体参数的估计
例如: 用样本均数作为总体均数的一个估计
5
点估计的缺陷
=?cm, =?cm
x1,x2,x3,x4…… N
10
均数的可信区间
P(t , t t, ) 1
P ( t ,
X s
t
,
) 1
X
P(X t , sX X t , sX ) 1
• 总体均数的(1- )可信区间定义为:
X t , sX , X t , sX
11
影响可信区间大小的因素
• 可信度
– 可信度越大,区间越宽
-t
0
t
0.005 0.0025 0.001 0.0005 0.01 0.005 0.002 0.001 63.657 127.321 318.309 636.619 9.925 14.089 22.327 31.599 5.841 7.453 10.215 12.924 4.604 5.598 7.173 8.610 4.032 4.773 5.893 6.869
X t0.05,24 sX 73.6 2.064 6.5 / 25 76.3(次 / 分) 即该地正常成年男子脉搏总体均数的95%可信区间为:
70.9~76.3(次/分) 。用该区间估计该地正常成年男子脉搏总 体均数的可信度为95%。
16
例4.2 某 市 2001 年 120 名 7 岁 男 孩 身 高 均 数
MEDICAL STATISTICS 医学统计学
参数估计 Parameter Estimation
主要内容
点估计 区间估计 两个要素 均数可信区间的构建 正确理解可信区间的涵义
2
统计推断的内容
参数估计
(parameter estimation)
假设检验
(hypothesis test)
0.10 0.20 3.078 1.886 1.638 1.533 1.476
概 率,P 0.05 0.025 0.01 0.10 0.05 0.02 6.314 12.706 31.821 2.920 4.303 6.965 2.353 3.182 4.541 2.132 2.776 3.747 2.015 2.571 3.365
• 个体变异
– 变异越大,区间越宽
• 样本含量
– 样本含量越大,区间越窄
12
当样本含量较大时,例如n>100,t分布近似标准 正态分布,此时可用标准正态分布代替t分布,作
为可信区间的近似计算。相应的100(1-)%可信区
间为:
X Fra Baidu bibliotek sX , X u sX
13
例4.1 • 随机抽取某地25名正常成年男子,测得该
22
0.686 0.858 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23
0.685 0.858 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.768
24
0.685 0.857 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
样本的脉搏均数为73.6次/分,标准差为6.5 次/分,求该地正常成年男子脉搏总体均数 95%的可信区间。
14
自由度
单侧 双侧
1
2
3
4
5
0.25 0.50 1.000 0.816 0.765 0.741 0.727
0.20 0.40 1.376 1.061 0.978 0.941 0.920
附表2 t 界值表
9
0.703 0.883 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10
0.700 0.879 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
21
0.686 0.859 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
25
0.684 0.856 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
15
例4.1
本例自由度=12-1=24,经查表得t0.05,24=2.064,则
X t0.05,24 sX 73.6 2.064 6.5 / 25 70.9(次 / 分)
可信度(1-), 可靠性
– 一般取90%,95%。 – 可人为控制。
精确性
– 是指区间的大小(或长短)
兼顾可靠性、精确性
9
均数的可信区间
• 基础:抽样误差理论 • 从正态分布总体中随机抽取一个样本,则
t X ~t
s
(n1)
X
t值接近于0的可能性较大,远离0的可能性较小, 出现太大的t值和太小的t值的可能性更小,根据t 分布的性质,t有95%可能在-t0.05,v到t0.05,v之间。
定的值,并不是随机变量值。而样本统计量随样本的 不同而不同,属随机的。
7
区间估计
• 按一定的概率或可信度(1- )用一个区间估计总体 参数所在范围,这个范围称作可信度为1- 的可
信区间(confidence interval, CI),又称置信区间 。 这种估计方法称为区间估计。
8
可信区间的两个要素
6
0.718 0.906 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7
0.711 0.896 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8
0.706 0.889 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041