医学科研设计的基本原则
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章医学科研设计的基本原则
医学科研设计是指对某一项医学研究的具体内容和方法的安排。作为科学研究,生物医学研究探索生物医学领域内未知事物和未知规律的科学活动,必须有科学的研究方法和合理的设计才能获得真实、可靠的研究结果。以人为主要研究对象的生物医学研究,由于研究对象的复杂性和特殊性,影响研究效应的因素很多、许多因素无法完全消除,因此对研究设计的要求就更高。如果研究设计存在缺陷(如样本代表性、可比性、混杂等),就可能影响研究结果的可靠性和研究价值。另一方面,还要考虑研究对象(样本)的数量,样本量过少或过多都会对研究结果造成影响。一个缜密而完善的研究设计,能合理地安排各种研究因素,严格控制各种误差,用较少的人力、物力和时间,最大限度地获得足够而可靠的资料。合理的研究设计是顺利开展各种医学研究的前提条件,也是得到预期结果、达到事半功倍的保证。为了达到上述目的,在医学研究设计中必须遵循四项基本原则:随机化原则、对照原则、盲法原则和重复原则。
第一节随机化原则
随机化的核心是机会均等。随机化是医学研究中一项非常重要的原则。在医学研究中,随机化包括两方面的内容:随机化抽样和随机化分组。通过随机化选择研究对象,可以得到一个有代表性的样本。当存在未知或不可控制的非处理因素时,随机化分组将研究对象随机分配到实验组和对照组之中,使这些非处理因素在实验组和对照组的分布一致。因此,随机化是实验性研究中保证组间均衡、可比的重要手段。
一、随机化抽样
随机化抽样是指总体或目标人群中的每一个个体都有相同机会被抽中作为研究对象(样本)。在医学研究中,由于时间、人力、物力限制,通常不能把所有目标人群都作为研究对象,而只能选取其中一部分作为研究对象(样本)。对一组(或几组)研究对象(样本)进行调查或实验,获得原始数据,经过数据整理和统计分析得到样本信息(如均数、率等指标),并以样本的信息来推断总体人群的特征。要实现这一推断的前提条件是所采用的研究对象(样本)要有代表性,即能代表目标人群。否则,就不能实现这一推断。获得一个有代表性样本的常用方法是采用随机化抽样来选择研究对象,即目标人群中每一个个体被选中的概率
相等。这样获得的样本称为随机样本。“随机”不等于“随意”或“随便”。医学研究一般都需要推论,因此都需要采用随机化抽样的方法选择一组有代表性的研究对象。随机化抽样也是数据能统计分析和推断的前提。社会学、新闻传播学常用典型调查,其调查结果反映一部分(特殊人群)的特征,不能推论到普通人群。
二、随机化抽样的常用方法
在医学研究中常见的随机化抽样方法有单纯随机化抽样、系统随机化抽样、分层随机化抽样、整群随机化抽样以及多阶段抽样随机化方法。
(一)单纯随机化抽样
也称为简单随机化抽样,一种最简单、最基本的抽样方法。其基本原理是从总体N个对象中,采用随机方法(如随机数字)抽取n个,构成一个样本。它的重要原则是总体中每个对象被抽到的概率相等(均为n/N)。常见的随机方法有抽签或抓阄、掷骰子、掷硬币(50%的概率)等;比较科学又方便的方法是用随机数字。随机数字表是根据概率论的原理编制的一种统计表,是获得随机数字的常用工具,见表3-1。使用时是首先随机地确定所用表的起始行数、列数,然后逐行、逐列按次序连续选取若干随机数,其结果比抽签方法更理想。
利用计算机数据库软件中的随机函数(RAND(X))和取整函数(INT(X))可以产生任意位数的随机数字。例如利用公式INT(RAND(x)×100)+1可以产生1-100之间的随机数字。
利用随机数字进行单纯随机抽样的基本步骤如下:
1. 确定目标人群的特征;
2. 将目标人群中的每个个体编号、排序;
3. 给每个个体分配一个随机数字;
4. 预先确定选择研究对象的方法。如欲抽取50%的人群作为样本,则可以按照随机数字是偶数或奇数还确定;如欲选择1/3的人群,则可以把随机数字除以3后根据余数的情况选择;也可以根据随机数字的大小;
5. 根据随机数字选择研究对象。
单纯抽样方法适合在总体单位数不大,各个单位之间变异较小的情况下经常采用的抽样方法。如总体数量大时,必须有所有单位的名单、编号,抽样过程比较麻烦。被抽到的个体比较分散,资料收集困难,可行性不大。如总体变异大,即使采用单纯随机抽样,获得样本的代表性也不一定好。
单纯随机抽样的标准误按资料性质可用公式3-1和3-2计算。
均数的标准误:
n s N n S X
2
)1(-= (3-1) 率的标准误:
1)1()1(---=n p p N n S p (3-2)
上式中s 为样本标准差,p 为样本率,N 为总体含量,n 为样本含量,其中n/N 为抽样比,若小于5%可以忽略不计。
(二) 系统随机化抽样
也称为机械抽样或等距抽样。它是指按照总体一定顺序,机械地每隔若干单位抽取一个研究对象组成样本的方法(图3-1)。
采用系统抽样的基本步骤如下:
1. 确定目标人群的特征。
2. 将目标人群中的每个个体排序、编号,如从1~N 相继编号。
3. 确定抽样间隔:K =N /n 。式中N 为总体单位总数,n 为样本含量;根据抽样间隔,把总体依次分成k 组。
4. 在第一组人群中,用随机抽样方法抽取个体i 作为研究对象。然后依次加上K 作为下一组的样本号,即第j 组内的被抽中的样本号为:i +(j -1)×K 。以此来确定所有的样本。
系统抽样优点:(1)事先不需知道总体内的单位数;(2)容易在人群现场进行抽样,特
别是总体人数比较多时,也容易进行;(3)所得到的样本是从均匀分布在总体各个部分,一般代表性较好。
系统抽样的缺点:假如总体各单位的分布呈周期性趋势,而抽样间隔刚好是其周期的倍数,则可能使样本产生很大的偏性。
系统抽样标准误的计算可用单纯随机抽样公式代替。
(三) 分层抽样
如果一个总体中各个单位间的变异比较大,那么采用单纯随机抽样的方法获得样本的代表性并不很好。对这样的总体进行抽样,可以采用分层抽样的方法。先把总体按某种特征(影响变异最大的因素,如年龄、性别、文化水平、疾病程度等)分为若干层,然后分别从每一层内进行单纯随机抽样,组成一个样本,见图3-2。
通过分层,把内部变异很大的总体分成一些内部变异较小的层。每一层内个体变异越小越好,而层间变异则越大越好。分层可以提高总体指标估计值的精确度,比单纯随机抽样所得到的结果准确性更高,能保证总体中每一个层都有个体被抽到。分层调查除了能估计总体的参数值,还可以分别估计各个层内的情况。
如果各层内的样本数n i 按各层单位数(N i )的比例分配,即:
N N n i
n i ⨯= (3-3)
式3-3中n 为总样本数,N 为总体单位数,N i 为各层内单位数,这种设计称为按比例分配的分层抽样。其标准误的计算公式如下:
均数的标准误:
∑-
=i i n S N n n 22x )1)(1(S
(3-4)
率的标准误: