实验设计样本的含量估计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
侧值。自由度=∞,然后查t值表,利用公式再计
算N,N为两样本总例数。
Q1和Q2为样本比例,Q1 =n1/N, Q2 =n2/N,N= n1+n2,
当样本比例不等时: Q1+Q2=1; 当两样本例数相等时:Q1=Q2=0.5。
例8-3 用新药降低高血脂患者的胆固醇,研究者规定试验 组与对照组(安慰剂)相比,平均降低20㎎/L以上,才有实 际推广应用价值。以参考文献中得知胆固醇的标准差为30㎎ /L。规定单侧α=0.05,β=0.10,要求估计样本含量。 (条件是 (1)Q1=0.40,Q2=0.60; (2)Q1=Q2)
解: 规定,Q1=Q2=0.50;单侧α=0.05,β=0.10;
t0.05, 1.645, t0.10, 1.282; S=30㎎/L,δ=20㎎/L。
代入公式
N
Z Z
2
Q11 Q21
1.645 1.28230 2
N
20
0.51 0.51
77
从上述计算可以看出,在其它条件不变的情况 下,若两组含量的比例相同,则所需样本含量最少。
卫生统计学(第五版)
卫生统计学与数学学教研室
总体和样本
总体
对总体规律的推断
样本
基于样本资料 的推论
例:所有高胆固醇患者
例:在一个临床试验中 150例高胆固醇患者
例:试验药物治疗 降低了胆固醇
第四节 样本含量的估计
样本含量即观察例数的多少,又称样本大小。 样本含量的估计原则是指在研究结论具有 一定可靠性(精确度和检验效能)的基础上确 定最少的样本例数。 随着试验设计的类型不同其样本含量估计的 方法也不同
影响假设检验时样本含量估计的因素有四个: (一)检验水准:α (二)检验效能:1-β (三)总体变异度:σ或π (四)容许误差:δ=μ1-μ2或δ=π1-π2
(一)检验水准α
第一类错误的概率,即检验水准。 越小,所需样本含量越多。一般取=0.05,并可 根据专业要求决定取单侧α或双侧α。
(二)检验效能1-β
1 2 ,其它符号同前。
例 新药8-的6 近用控旧率药须治达疗到慢5性0%肾才炎有的推近广控使率用为价3值0%。,已现知试合验并新率药疗效c ,
=40%;定α=0.05(单侧),1-β=0.90,问每组需要多少病例?
解: 1 50%, 2 30%, c 40%, 0.05, 0.1,
10
例8-2 某医师试验某种升白细胞药的疗效,先以9例低白细胞 病人做预试验,结果计算出用药前后白细胞差值的标准差为 2.5千个/mm3(或×109/L),现要做正式临床试验,且要求白细 胞平均上升1千个/mm3才算该药有临床实际有效, 问要多少病人进行正式临床试验?
解: 1 2.5 单侧 0.05 单侧 0.1
以自由度 查t界值表 t0.05, 1.645 t0.1, 1.282
代入公式
2
N
Z Z
d
1.645 1.282 2.52
N
1
53.5
取54
要54例病人进行正式临床试验
(2)两样本均数比较
计算公式:
N
Z Z
2
Q11 Q21
(8-2)
Z有单侧和双侧之分,为标准正态分布,Z 只取单
解:
设 0.05双侧, 0.10,Z0.05/2 1.96, Z0.10 1.282,
本例
1 0.91,2 0.75, 0.73, 0.91 0.75 20.73/ 2 0.10,
代入公式
2
N
Z
2 Z
21 2 /
/ 1 2
N
1.96
2 0.10 1.282
0.51
2
0.5 0.3
206例
两组总例数为206例,每组需103例。
(2)设新药组占60%,旧药组占40%,则: Q1和Q2为样本比例,Q1 =n1/N, Q2 =n2/N,N= n1+n2,
N
Z
c 1c
Q11 Q21
Z
1
1 1
Q11 2
12
Q21
2
1 2
1.645
解:规定,Q1=0.40,Q2=0.60;单侧α=0.05,β=0.10;
t0.05, 1.645, t0.10, 1.282; S=30㎎/L,δ=20㎎/L。
代入公式
N
Z Z
2
Q11 Q21
1.645 1.28230 2
N
20
0.41 0.61
80
总例数80例;试验组例数80×0.4=32例;对照组例数80×0.6=48例。
一、样本含量估计的意义
样本含量过小,所得指标不稳定,用以 推断总体的精密度和准确度差。使检验效能 偏低,出现假阴性的结果。
样本含量过大,导致人力、物力和时间 上的浪费。常引入更多的混杂因素,对研究 结果造成不良影响。
所以,在医学科研中,必须根据资料的 性质,借助适当的公式,进行样本含量的估 计。
二、影响样本含量估计的因素
二、样本含量的估计方法
查表法 样本含量的估计方法
计算法
精品文档 欢迎下载
读书破万卷,下笔如有神--杜甫
新的治疗方法,预计有效率是90%。给定 0.05, 0.1,
问至少需要观察多少病例?
解: 0 0.8, 1 0.9 0.9 0.8 0.1 双侧 0.05, 0.1,
t0.05/ 2, 1.96, t0.10, 1.282;
代入公式
n
0
ห้องสมุดไป่ตู้
1
0
Z
Z
2
n 0.8 1 0.8 1.64 1.282 136 .4 137
检验效能1−或第二类错误概率的大小 。 1−越大,所需样本含量越多,第二类错误的概率愈 小。通常取=0.1或 0.2,一般1−不能低于0.75。
(三)总体变异度σ或π
总体标准差越大,所需样本含量越多;总体概率π 越接近0.50,则所需样本含量越多。通常根据预实验、 查阅文献和专业知识判断 值。由于总体标准σ差 往往未知或不易获得,一般可用预试验的样本标准
➢单样本均数检验或均数的配对检验 ➢两样本均数的比较 ➢两样本率的比较
(1)单样本均数检验或均数的配对检验
计算公式:
2
N
Z Z
2
N
Z Z
d
(8-1)
Z有单侧和双侧之分,为标准正态分布,Z 只取单
侧值。自由度=∞,然后查t值表,利用公式再计
算N。 若 取d为配对比较若,用S估计,则取 Sd
0.41 0.4
0.61 0.41
1.282
0.5
1
0.5
0.61
0.3
1
0.3
0.41
2
0.5 0.3
209例
新药组:209×0.6=125例 旧药组:209×0.4=84例
实验设计
一、影响样本含量估计的因素
(一)检验水准:α (二)检验效能:1-β (三)总体变异度:σ或π (四)容许误差:δ=μ1-μ2或δ=π1-π2
差S来估计或代替。
(四)容许误差δ=μ1-μ2或δ=π1-π2
希望发现或需控制的样本和总体间或两个样本间某统 计量的差别大小。如=μ1−μ2,或=π1−π2。越 小,所需样本含量越多。可作预实验或用专业上有意 义的差值代替。
三、样本含量的估计方法
查表法 样本含量的估计方法
计算法
样本含量估计的方法较多,有些公式较为复杂, 计算繁琐。最常用的几种方法有:
(3)样本率与总体率的比较 (大样本)
计算公式:
N
0
1
0
Z
Z
2
(8-3)
Z有单侧和双侧之分,为标准正态分布,Z 只取单
侧值。自由度=∞,然后查t值表,利用公式再计 算n。
式中 0 为已知总体率, 1 为预期实验结果的总体率,
1 0
例8-4 已知用常规方法治疗某病的有效率是80%,现试验一种
上述公式也适用于交叉设计的样本含量估计。
例8-1 呋喃丙胺治疗血吸虫病人血红蛋白变化。 δ=10g/L,σ=25 g/L,双侧α=0.05,β=0.10。
解:
以自由度 查t界值表 t0.05, 1.96 t0.1, 1.28
代入公式
N
Z Z
2
N (1.96 1.28 )25 2 66
Z0.05单 1.645 Z0.10 1.282
, (1)若要求两组例数相等,则: Q1=Q2=0.5。
N
Z
c 1c
Q11 Q21
Z
1
1 1
Q11 2
12
Q21
2
1 2
1.645
0.41 0.4 0.51 0.51
1.282
0.5
1
0.5
0.51
0.3
1
0.3
20.91 0.730.75 0.73 / 0.10
/ 0.91 0.752 58
因此,需要约58名鼻咽癌患者的血清。
(5)两组样本频率检验
计算公式:
N
Z
2
c 1 c Q11 Q21
Z
1
1
1
Q11
2
1
2
Q21
1 2
(8-5)
式中 c 为两总体合计概率, c Q11 Q2 2 ,
0.1
需要观察137个病例。
(4)配对二分类资料的χ2检验
计算公式:
2
N
Z
2 Z
21 2 /
/
1
2
(8-4)
式中,Z和Z 同上;1和 2 为两总体的阳性概率,
为两处理结果一致的总体阳性概率,
1 2 2 / 2。
例8-5 拟比较甲、乙两种血清学方法对鼻咽癌患者的检出情况, 初步估计甲法的阳性检出率为91%,乙法的阳性检出率为75%, 两种方法一致的阳性检出率为73%。请估计样本含量。
算N,N为两样本总例数。
Q1和Q2为样本比例,Q1 =n1/N, Q2 =n2/N,N= n1+n2,
当样本比例不等时: Q1+Q2=1; 当两样本例数相等时:Q1=Q2=0.5。
例8-3 用新药降低高血脂患者的胆固醇,研究者规定试验 组与对照组(安慰剂)相比,平均降低20㎎/L以上,才有实 际推广应用价值。以参考文献中得知胆固醇的标准差为30㎎ /L。规定单侧α=0.05,β=0.10,要求估计样本含量。 (条件是 (1)Q1=0.40,Q2=0.60; (2)Q1=Q2)
解: 规定,Q1=Q2=0.50;单侧α=0.05,β=0.10;
t0.05, 1.645, t0.10, 1.282; S=30㎎/L,δ=20㎎/L。
代入公式
N
Z Z
2
Q11 Q21
1.645 1.28230 2
N
20
0.51 0.51
77
从上述计算可以看出,在其它条件不变的情况 下,若两组含量的比例相同,则所需样本含量最少。
卫生统计学(第五版)
卫生统计学与数学学教研室
总体和样本
总体
对总体规律的推断
样本
基于样本资料 的推论
例:所有高胆固醇患者
例:在一个临床试验中 150例高胆固醇患者
例:试验药物治疗 降低了胆固醇
第四节 样本含量的估计
样本含量即观察例数的多少,又称样本大小。 样本含量的估计原则是指在研究结论具有 一定可靠性(精确度和检验效能)的基础上确 定最少的样本例数。 随着试验设计的类型不同其样本含量估计的 方法也不同
影响假设检验时样本含量估计的因素有四个: (一)检验水准:α (二)检验效能:1-β (三)总体变异度:σ或π (四)容许误差:δ=μ1-μ2或δ=π1-π2
(一)检验水准α
第一类错误的概率,即检验水准。 越小,所需样本含量越多。一般取=0.05,并可 根据专业要求决定取单侧α或双侧α。
(二)检验效能1-β
1 2 ,其它符号同前。
例 新药8-的6 近用控旧率药须治达疗到慢5性0%肾才炎有的推近广控使率用为价3值0%。,已现知试合验并新率药疗效c ,
=40%;定α=0.05(单侧),1-β=0.90,问每组需要多少病例?
解: 1 50%, 2 30%, c 40%, 0.05, 0.1,
10
例8-2 某医师试验某种升白细胞药的疗效,先以9例低白细胞 病人做预试验,结果计算出用药前后白细胞差值的标准差为 2.5千个/mm3(或×109/L),现要做正式临床试验,且要求白细 胞平均上升1千个/mm3才算该药有临床实际有效, 问要多少病人进行正式临床试验?
解: 1 2.5 单侧 0.05 单侧 0.1
以自由度 查t界值表 t0.05, 1.645 t0.1, 1.282
代入公式
2
N
Z Z
d
1.645 1.282 2.52
N
1
53.5
取54
要54例病人进行正式临床试验
(2)两样本均数比较
计算公式:
N
Z Z
2
Q11 Q21
(8-2)
Z有单侧和双侧之分,为标准正态分布,Z 只取单
解:
设 0.05双侧, 0.10,Z0.05/2 1.96, Z0.10 1.282,
本例
1 0.91,2 0.75, 0.73, 0.91 0.75 20.73/ 2 0.10,
代入公式
2
N
Z
2 Z
21 2 /
/ 1 2
N
1.96
2 0.10 1.282
0.51
2
0.5 0.3
206例
两组总例数为206例,每组需103例。
(2)设新药组占60%,旧药组占40%,则: Q1和Q2为样本比例,Q1 =n1/N, Q2 =n2/N,N= n1+n2,
N
Z
c 1c
Q11 Q21
Z
1
1 1
Q11 2
12
Q21
2
1 2
1.645
解:规定,Q1=0.40,Q2=0.60;单侧α=0.05,β=0.10;
t0.05, 1.645, t0.10, 1.282; S=30㎎/L,δ=20㎎/L。
代入公式
N
Z Z
2
Q11 Q21
1.645 1.28230 2
N
20
0.41 0.61
80
总例数80例;试验组例数80×0.4=32例;对照组例数80×0.6=48例。
一、样本含量估计的意义
样本含量过小,所得指标不稳定,用以 推断总体的精密度和准确度差。使检验效能 偏低,出现假阴性的结果。
样本含量过大,导致人力、物力和时间 上的浪费。常引入更多的混杂因素,对研究 结果造成不良影响。
所以,在医学科研中,必须根据资料的 性质,借助适当的公式,进行样本含量的估 计。
二、影响样本含量估计的因素
二、样本含量的估计方法
查表法 样本含量的估计方法
计算法
精品文档 欢迎下载
读书破万卷,下笔如有神--杜甫
新的治疗方法,预计有效率是90%。给定 0.05, 0.1,
问至少需要观察多少病例?
解: 0 0.8, 1 0.9 0.9 0.8 0.1 双侧 0.05, 0.1,
t0.05/ 2, 1.96, t0.10, 1.282;
代入公式
n
0
ห้องสมุดไป่ตู้
1
0
Z
Z
2
n 0.8 1 0.8 1.64 1.282 136 .4 137
检验效能1−或第二类错误概率的大小 。 1−越大,所需样本含量越多,第二类错误的概率愈 小。通常取=0.1或 0.2,一般1−不能低于0.75。
(三)总体变异度σ或π
总体标准差越大,所需样本含量越多;总体概率π 越接近0.50,则所需样本含量越多。通常根据预实验、 查阅文献和专业知识判断 值。由于总体标准σ差 往往未知或不易获得,一般可用预试验的样本标准
➢单样本均数检验或均数的配对检验 ➢两样本均数的比较 ➢两样本率的比较
(1)单样本均数检验或均数的配对检验
计算公式:
2
N
Z Z
2
N
Z Z
d
(8-1)
Z有单侧和双侧之分,为标准正态分布,Z 只取单
侧值。自由度=∞,然后查t值表,利用公式再计
算N。 若 取d为配对比较若,用S估计,则取 Sd
0.41 0.4
0.61 0.41
1.282
0.5
1
0.5
0.61
0.3
1
0.3
0.41
2
0.5 0.3
209例
新药组:209×0.6=125例 旧药组:209×0.4=84例
实验设计
一、影响样本含量估计的因素
(一)检验水准:α (二)检验效能:1-β (三)总体变异度:σ或π (四)容许误差:δ=μ1-μ2或δ=π1-π2
差S来估计或代替。
(四)容许误差δ=μ1-μ2或δ=π1-π2
希望发现或需控制的样本和总体间或两个样本间某统 计量的差别大小。如=μ1−μ2,或=π1−π2。越 小,所需样本含量越多。可作预实验或用专业上有意 义的差值代替。
三、样本含量的估计方法
查表法 样本含量的估计方法
计算法
样本含量估计的方法较多,有些公式较为复杂, 计算繁琐。最常用的几种方法有:
(3)样本率与总体率的比较 (大样本)
计算公式:
N
0
1
0
Z
Z
2
(8-3)
Z有单侧和双侧之分,为标准正态分布,Z 只取单
侧值。自由度=∞,然后查t值表,利用公式再计 算n。
式中 0 为已知总体率, 1 为预期实验结果的总体率,
1 0
例8-4 已知用常规方法治疗某病的有效率是80%,现试验一种
上述公式也适用于交叉设计的样本含量估计。
例8-1 呋喃丙胺治疗血吸虫病人血红蛋白变化。 δ=10g/L,σ=25 g/L,双侧α=0.05,β=0.10。
解:
以自由度 查t界值表 t0.05, 1.96 t0.1, 1.28
代入公式
N
Z Z
2
N (1.96 1.28 )25 2 66
Z0.05单 1.645 Z0.10 1.282
, (1)若要求两组例数相等,则: Q1=Q2=0.5。
N
Z
c 1c
Q11 Q21
Z
1
1 1
Q11 2
12
Q21
2
1 2
1.645
0.41 0.4 0.51 0.51
1.282
0.5
1
0.5
0.51
0.3
1
0.3
20.91 0.730.75 0.73 / 0.10
/ 0.91 0.752 58
因此,需要约58名鼻咽癌患者的血清。
(5)两组样本频率检验
计算公式:
N
Z
2
c 1 c Q11 Q21
Z
1
1
1
Q11
2
1
2
Q21
1 2
(8-5)
式中 c 为两总体合计概率, c Q11 Q2 2 ,
0.1
需要观察137个病例。
(4)配对二分类资料的χ2检验
计算公式:
2
N
Z
2 Z
21 2 /
/
1
2
(8-4)
式中,Z和Z 同上;1和 2 为两总体的阳性概率,
为两处理结果一致的总体阳性概率,
1 2 2 / 2。
例8-5 拟比较甲、乙两种血清学方法对鼻咽癌患者的检出情况, 初步估计甲法的阳性检出率为91%,乙法的阳性检出率为75%, 两种方法一致的阳性检出率为73%。请估计样本含量。