样本量计算

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1.估计样本量的决定因素
1.1资料性质
计量资料如果设计均衡 ,误差控制得好 ,样本可以小于 30例; 计数资料即使误差控制严格 , 设计均衡, 样本需要大一些 ,需要 30-100例。

1.2研究事件的发生率研究事件预期结局出现的结局（疾病或死亡），疾病发生率越高，所需的样本量越小，反之就要越大。

1.3研究因素的有效率有效率越高，即实验组和对照组比较数值差异越大，样本量就可以越小，小样本就可以达到统计学的显着性，反之就要越大。

1.4显着性水平
即假设检验第一类（a）错误出现的概率。

为假阳性错误出现的概率。

a越小，所需的样本量越大，反之就要越小。

a水平由研究者具情决定，通常a取0.05或0.01。

1.5检验效能
检验效能又称把握度，为1-B，即假设检验第二类错误出现的概率，为假阴性错误出现的概率。

即在特定的a水准下，若总体参数之间确实存在着差别，此时该次实验能发现此差别的概率。

检验效能即避免假阴性的能力，B越小，检验效能越高，所需的样本量越大，反之
就要越小。

B水平由研究者具情决定，通常取B为0.2，0.1或0.05。

即1 —B =0.8，0.1 或
0.95，也就是说把握度为 80%， 90%或 95%。

1.6容许的误差（S）
如果调查均数时，则先确定样本的均数（）和总体均数（m）之间最大的误差为多少。

容许误差
越小，需要样本量越大。

一般取总体均数（1— a ）可信限的一半。

1.7总体标准差（s）一般因未知而用样本标准差 s 代替。

1.8双侧检验与单侧检验
采用统计学检验时 ,当研究结果高于和低于效应指标的界限均有意义时 , 应该选择双侧检验 , 所需样本量就大 ; 当研究结果仅高于或低于效应指标的界限有意义时 , 应该选择单侧检验 , 所需样本量就小。

当进行双侧检验或单侧检验时，其a或B的Ua?界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算
由于对变量或资料采用的检验方法不同，具体设计方案的样本量计算方法各异，只有通过查
阅资料，借鉴他人的经验或进行预实验确定估计样本量决定因素的参数，便可进行估算。

护理中的量性研究可以分为3种类型：①描述性研究：如横断面调查，目的是描述疾病的分布情况或现况调查；②分析性研究：其目的是分析比较发病的相关因素或影响因素；③
实验性研究：即队列研究或干预实验。

研究的类型不同，则样本量也有所不同。

2.1描述性研究
护理研究中的描述性研究多为横断面研究，横断面研究的抽样方法主要包括单纯随机抽样、系统抽样、分层抽样和整群抽样。

分层抽样的样本量大小取决于作者选用的对象是用均数还是率进行抽样调查。

例.要做一项有关北京城区护士参与继续教育的学习动机和学习障碍的现状调查，采用分层多级抽样，选用的是均数抽样的公式込为检验水准a对应的u值，c为总
体标准差，S为容许误差，根据预实验得出标准差 c =1.09，取a =0.05，S =0.1，样本量算得520例，考虑到10%-15%勺失访率和抽样误差，样本扩展到 690例。

2.2分析性研究
2.2.1探索有关变量的影响因素研究
有关变量影响因素研究的样本量大多是根据统计学变量分析的要求，样本数至少是变量数
的5-10倍。

例如，如果研究肺结核患者生存质量及影响因素，首先要考虑影响因素有几个，然后通过文献回顾，可知约有12个预测影响变量，如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持，那么
研究的变量就可以在60-120例。

这是一种较为简便的估算样本量的方法，在获得相关文献支持下，最好根据公式计算，计量资料的样本量估算可用公式，根据预实验
中的数据（也可以依据其他文献的结果）得出标准差S和容许误差S，代入公式最终计算
出样本量，计数资料资料可用公式，P为样本率。

2.2.2研究某变量对另一变量的影响
对于研究某变量对另一变量的影响来说，样本量可以根据直线相关的公式
E二4|仏（1切）/（1勺）"2+3获得，八与“与分别为检验水准a和第u类错误的概率B相对应的U值，p为总体相关系数。

例.要做一项血透患者自我管理水平对其健康状况影响的研究，
假设 a =0.05， power=0.80,
查表得卩a =1.96 ,卩3 =0.84，总体相关系数可选用文献报道中血液透析患者自我管理水平与
健康调查简表得分相关系数为 0.274，代入公式就可算出所需样本量为103例。

2.2.3两变量或多变量的相关研究
对于两变量或多变量相关的研究，样本量与自变量的多少有关，一般是其10倍，也可以采用公式' - U计算。

5为检验水准a相对应的U值，S为标准差，S为容许误差。

例.研究慢性腰背痛患者认知-情感应对、自我和谐与适应水平的关系.
设定显着性水平a = 0.05，则U a =1.96，标准差和容许误差可从预实验中获得，根据预实验的S和S值，算出S/ S =5,样本量则为99例.
2.3实验性研究
实验性研究样本量的估算公式，也分计量资料和计数资料两种。

计量资料可采用两样本均数的计算公式 N仁N2，〔心+咯z）S❻| ，计数资料可采用率的计算公式
\ n ' 厂"厂-巴。

式中N1、N2分别为两样本含量，一般要求相等，S为两总体标准差的估计值，一般假设其相等或取合并方差的平方根，S为两均数之差值（若为
自身对照，S也可以写为d）, t a ?/2和t 3 ?/2分别为检验水准a和第U类错误概率3 相对应的t值。

a有单双侧之分，而3只取单侧。

例.一项心肌梗死患者院外自助式心脏康复的效果研究，可以采用此公式计算，其中的d可以选取文献中报
道的、自助式康复手册的随机对照研究中的干预组和对照组在普通健康问卷GHQ的得分：d=10.7-5.3=5.4，
计算Sc为8.78，双侧a =0.05， 3 =0.1，查表得t a ?/ 2=1.96，t3 =1.282，代入公式得岀两组各需样本为56 例。

附临床研究样本量的估计：
1.计量资料
1.1对总体平均数m做估计调查的样本估计
公式：
式中：n为所需样本大小；Ua为双侧检验中，a时U的界值，当a=0.05 时，U 0.05 ?=1.96,a=0.01
时,U0.01 ?=2.58 ; s为总体标准差；3为容许的误差。

例1:某学校有学生3500人，用单纯随机
抽样调查学生的白细胞水平，根据预查标准差为950个/ mm,允许误差不超过100个/mm ,
应调查多少人？
N=3500 d=100 个 /mm s=950 个/mm
a=0.05 (双侧)Ua=1.96
n=(1.96 X 950/100)〜347
1.2对样本均数与总体均数的差别做显着性检验时，所需样本的估计。

单侧检验用：单侧检验用：n=[ ( U2?a?+ U 2? p?) s/ 3](式1.2-1 )
双侧检验用：n=[ (U a?+ U 2? p?) s/ 3](式 1.2-2 )
式中：a与P分别为第一类错误及第二类错误出现的概率，U a、?U2? a、?U2? p??分别为a、
2a、2p检验水准的t值。

2计数资料
2.1对总体率n ?做估计调查的样本大小
公式：n= ( U a?/ 3 /P ( 1 —P )(式 2.1 )
式中：3为容许的误差：即允许样本率(p)和总体率(P)的最大容许误差为多少。

P为样本率。

例2:对某地HBsAg阳性率进行调查，希望所得的样本率(p)和总体率(P)之差不超过2%基于小规模预调查样本率 P=14%应调查多少人？(规定a=0.05)
已知：3 =0.02, P=0.14 , a=0.05 , Ua=1.96
n=(1.96/0.02)2/? X 0.14(1 —0.14) =1156
需调查约1160人.
2.2对样本率与总体率的差别做显着性检验时，所需样本的估计。

单侧检验用：n= (U2? a?+ U 2 ? p?/ 3?)(式 2.2-1 )
双侧检验用：n= (U a?+ U 2?p?/ 3) (式 2.2-2 )
式中：a与P分别为第一类错误及第二类错误出现的概率，U a、?U2? a、?U2? p??分别为a、
2a、2p检验水准的t值。

2.3对样本均数与总体均数的差别做显着性检验时，所需样本的估计。

单侧检验用：n=[ (U2?a?+ U 2?p?) s/ 3 ]P1 —P)式 2.3-1 )
式中：a与B分别为第一类错误及第二类错误出现的概率，U a、?U2? a、?U2? p?分别为a、
2a、2 B检验水准的U值。

3病例对照研究的样本量估计
选择患有特定疾病的人群作为病例组，和未患这种疾病的人群作为对照组，调查两组人群过去暴露于某种(些)可能危险因素的比例，判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。

3.1设置估算样本量的相关值
①人群中研究因素的暴露率(对照组在目标人群中估计的暴露率)；
②比值比(odds ratio ，OR)估计出的各研究因素的相对危险度或暴露的比值比(即RR或OR
③a值，检验的显着性水平，通常取 a =0.01或0.05 ;
④期望的把握度(1- B ),通常区B =0.10或0.20 ;即把握度为90%或 80%
根据以上有关参数查表或代公式计算
公式为：
n= (U +U ) /(p 1 ?-p 0?)2(式 3.1 )
p 1 ?=p 0? x OR/1-p0 ?+OR xp
=1/2 ( p 1 ?+p 0?) =1-q 1 ?=1-p 1 ?q0 ?=1-p 0
p0与P1分别为对照组及病例组人群估计的暴露率；
OR为主要暴露因子的相对危险度或暴露的比值比(RR或 OR 。

q0?=1-P0?, q1?=1-P1?;
为两组暴露史比例的平均值，
既=(P1?+P2?)/2, Q1?=1-P1?;
例：拟用病例对照研究法调查孕妇暴露于某因子与婴儿先天性心脏病的关系。

估计孕妇有
30%J露于此因子。

现要求在暴露造成相对危险度为2时，即能在95%勺显着性水平以90%
的把握度查出，病例组和对照组各需多少例？
p0=0.3 OR=2，设 a =0.05, B =0.10,
用双侧检验 U a =1.96 U B ?=1.282
p1?=(0.3 x 2)/[1+0.3(2-1)]=0.46
q0?=1-0.3=0.7 =1/2(0.3+0.46)=0.38
q1?=1-0.46=0.54 =1-0.38=0.62
n=(1.96 +1.282 )2/(0.46-0.3)2? 〜192，即病例组与对照组各需 192人.
4实验研究的样本量计算
4.1计量资料：计量资料指身高、体重、血压、血脂和胆固醇等数值变量。

估计公式为：
n=2(U a+比)2显/¥?(式4.1)
n为计算所得一个组的样本人数，如果两组的人数相等，则全部试验所需的样本大小为2n；U a?为显着性水平相应的标准正态差；
U B?为B相应的标准正态差；
S 为估计的标准差，S 2?= (S 1?2?+3 2?2?) 12 ;
d为两组数值变量均值之差，
例题：某新药治疗高血压，将研究对象随机分为治疗组和对照组。

假设：a=0.05, B =0.10, 血压的标准差分别为 9.7与12.3mmHg检测两组的血压差为 2.6mmHg查表：z a ?=1.96, z
B ?=1.282(双侧检验),需要多大样本。

4.2计数资料：即非连续变量资料，如发病率、感染率、阳性率、死亡率、病死率、治愈率、有效率等。

当现场试验的评价指标是非连续变量时，按下式计算样本大小：
n=[U +U ] /(P -P ) (式 4.2 )
P :对照组发生率
P :实验组发生率
5诊断试验的样本量估计
5.1设置估算样本量的相关值
①灵敏度60%
②特异度60%
③a值，检验的显着性水平，通常取 a =0.01或0.05 ;
④期望的把握度(1- B),通常区B =0.10或0.20 ;即把握度为90%或 80% 5.2计算公式
公式：n= (U a?/ S) /P (1 —P)(式 5.2 )
式中：
U a?为显着性水平相应的U值,通常取a =0.01或0.05 ；
S为容许的误差：即允许样本率(p)和总体率(P)的最大容许误差为多少。

P为诊断试验的灵敏度或特异度；
例：预计所评价的诊断试验的灵敏度为90%特异度85%
S =0.025，规定a=0.05,病例组和对照组应调查多少人？
已知：S =0.02, a=0.05 , Ua=1.96
n=(1.96/0.025)2/? X 0.85(1 —0.85) =783
n=(1.96/0.025)2/? X 0.90(1 —0.90) =553
对照组需783人，病例组需553人。

参考文献
[1]胡修周.医学科学研究学[M].北京：高等教育出版社.2006,76.
[2]刘娜，倪平，陈京立.护理研究中量性研究的样本量估计[J].中华护理杂志，2010，
45(4): 378-379.。