科研课题常用的统计方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

表4 老年股骨颈骨折患者骨密度、骨形态计量学 参数与形态计量学正常值比较 (%, x s )
组别 正常值 骨密度降低≥2.5g 骨密度降低<2.5g 10 7 例数 TBV 15.36 8.683.18** 7.922.58** OV 1.07 7.7813.54 4.357.40 TOS 13.21 6.557.07* 5.946.27* FRS 4.76 6.798.68 2.432.19*
如果正态性检验结果认为数据不服从正态 分布时,可以进行数据转换,但比较麻烦。 简单的方法是用非参数统计。过去一般认 为非参数统计效率较差,但这是指当数据 为正态分布时。 常用的非参数统计有秩和检验和符号秩和 检验等。

2.关于多组计量资料的一揽子比较:
在多组计量资料的组间两两比较时不可以 用“一揽子比较”。 所谓“一揽子比较”是进行多组比较时进 行所有的两两比较。 这是因为,在进行两组间比较时我们确定 了第I类错误的概率。一般我们用=0.05。 如果做一揽子比较,就会扩大,也即,第I类 错误的概率扩大了。我们就会得到过多的假阳 性结果。这时对第I类错误的概率进行调整的 方法很多。
科研课题常用的统计方法
徐 谦
主要内容
一、为什么在医学研究中必须应用统计学 二、常用的统计方法; 三、统计方法上常见的一些问题; 四、科研论文中应写明所用统计分析方法 的具体名称; 五、统计检验结论的表达。

一、为什么在医学研究中必须 应用统计学
医学研究的目的是探索医学领域内未知的事物, 而反映未知事物特征的指标常带有变异性。 由于变异性的存在,实验或观测的结果就必然带 有不确定性。为了获得带有规律性的结果,人们就 不得不进行大量的实验或观测。然而总体的容量很 大,甚至是无限的,研究者的时间、精力、人力和 物力却是十分有限的。客观实际迫使研究者不得不 从总体中进行抽样研究,以期通过样本所提供的信 息去推论总体的规律性。
分层卡方
例如:

国外的口服避孕药剂量都相当大,某次病 例对照研究调查了口服避孕药与心肌梗死的 情况,考虑到年龄是一个可能的混杂因素, 将其也纳入调查,得到如下数据,请分析口 服OC与心肌梗死有无关系。
年龄<40
年龄≥40
病例 对照 合计
服用 未服 服用 未服 OC OC OC OC 21 26 18 88 17 59 7 95 38 85 25 183
3、2检验
2检验是使用最多的一种计数资料的假设 检验方法,可用来推断2个及多个总体率或总 体构成比之间有无差异。 2检验的误用常见于以下几种情况。

(1)具体的2检验类型没有详细说明。如2 个率比较用四格表(22表) 2检验,多个 率比较用k2表2检验,小样本资料(n<40) 或四格表中有“0‖,不宜用2检验,而应采 用Fisher确切概率法。 (2)行列表资料,若资料中有1个格子的 理论频数<1或者理论频数<5的格子数超过 总格子数的1/5时,没有将相邻的行(列) 合并后再计算2值。
变量变换
非正态分布
非参数检验
组别 对照组 轻度妊高症
总例数
阳性
阴性
39
6
6(18.0) 33(21.0)
2(2.8) 4(3.2)
中度妊高症
重度妊高症
9
22
8(4.1)
19(10.1)
1(4.9)
3(11.9)

本例本应选用4个率比较的42表2检验。 值得注意的是,本例有4个格子的理论频数 值小于5(表4),占总格子数的l/2,超 过总格子数的l/5,必须并组。

例1
某医生发明了一种新的治疗某病的疗法 (简称治疗组),用现在公认的疗法作为 对照(简称对照组),经临床试验,对照 组与治疗组的疗效分别为 P1=75% P2=95%。 问:能认为这两个有效率之间的差别有统 计学意义吗?

答:这两个有效率之间的差别可能有统 计学意义,也可能没有统计学意义。 因为结论不仅取决于二者之差的绝对值 大小,更主要的是取决于随机误差的大小, 千万不可轻率地做出统计推断。 现假定这两个有效率分别来自下列甲、 乙、丙三批实验的结果,则具有下列3种不 同的统计检验结果。
表1 治疗组和对照组年龄比较
例数
治疗组 对照组 30 30
xs
54.87±8.77 54.23±8.01
表 治疗组和对照组性别比较
男 治疗组 对照组 14 15 女 16 15
表1所用的统计学方法: 两独立样本资料的t检验 t=0.292, P=0.771,差别无统计学意义。
表2 治疗组和对照组日间症状积分比较 (
表4 白细胞介素-10的测定结果(ng/L, x s
组别 哮喘组 例数 20 自发管 HMD 氟美松
44.62.5 33.42.6 62.68.5
对照组
20
53.68.2 53.57.3 62.66.4
问题1:哮喘组与对照组的组间比较,如加HMD后IL-10的差 别,请问用什么统计方法? 问题2:哮喘组以自发管”、“HMD‖、“氟美松”三组之间的 差别,请问用什么统计学方法?
方差分析的条件
各样本是相互独立的随机样本 各样本来自正态分布 各样本方差相等,即方差齐。
例1

某医生为了评价宣肺补益法治疗慢性咳 嗽的疗效,按照慢性咳嗽标准募集病例,同 时排除同时伴有心脑血管疾病、肺结核、肺 癌,吸烟者及其他非慢性咳嗽的病例,采用 统一的纳入标准选了60例病例,采用随机、 单盲、对照的设计进行实验,结果如下.
例 3

为探讨甘草甜素是否能够通过抑制11-羟化 固醇脱氢酶2型催化活性导致血压升高,对一 组Wistar大鼠(9只)给予外源性甘草甜素5 周,并与对照组比较,观察其血压变化情况, 结果见表3。
表3 甘草甜素对大鼠血压的影响( 组别 例数 收缩压
xs
舒张压
对照组
加甘草甜素5周组
7
9
951
11411*
17.1615.00
4.058.24 0
72.73
25.64 0
各组与对照比较: P< 0.05; A与 B比较 P<0.01; A与 C比较P<0.心力衰竭患者细胞凋亡抑制因子 (Apo-l/Fas)水平变化,现采用链霉亲和 素-生物素ELISA法分别测定60例心力衰竭患 者和52例正常对照组血清Apo-1/Fas含量, 结果见表 ,组间比较采用单因素方差分析, 两两比较采用 q检验。结论为:心力衰竭患 者血清 Apo-l/Fas水平反映了衰竭心肌细胞 凋亡状态。
二、常用的统计方法
1、t检验和方差分析
t检验
1、一组样本资料的t检验 2、配对设计资料的t检验 3、两组独立样本资料的t检验
t检验的应用条件
(1)随机样本; (2)要求样本取自正态分布的总体; (3)均数比较时,要求两总体方差相等 (方差齐性)。 若两总体方差不相等,用t´检验或 变量变换或秩和检验等方法处理。
年龄是否为混杂因素有比较严格的判断标准。 题中要求的分层分析可以用 cochran’s and mantel-Haenszel statistics 来完成,同时可利用risk复选框 给出各层独自的OR值用于比较。

4、非参数检验
(1) 总体分布已知 如:正态分布
(2)总体分布非正态
参数检验
表6 不同心功能患者血清Apol/Fas水平变化 组别 对照组 心功能I级 心功能II级 Apol/Fa(pg/L) 0.66980.0246 0.66510.0178 0.66460.0588*
心功能Ill级
0.73950.0666*

以上资料采用方差分析比较5个均数的差 别是正确的,但均数两两比较不是用q检验, 而应是多个实验组与1个对照组比较的 Dunnet-t检验。

例 2

用直接免疫荧光方法检测37例妊高征患者 和39例同期非妊高征孕妇血清中抗中性粒细 胞浆抗体( ANCA)的表达。对照组与轻、中、 重度妊高征患者ANCA阳性率分别为15.4%、 33.3%、88.9%、86.4%。统计分析采用2 检验。
表2 76位孕妇血清中ANCA表达情况的比较(理论频数)
xs
治疗后

组别
中药干预组 西药治疗组
例数
30 30
治疗前
2.33±0.55 2.33±0.55
0.43±0.10 1.00±0.24
请问: (1)中、西药组的是否均有疗效? (2)中药组和西药组的疗效有差 别吗,哪组的疗效更好?
例2
已知北方农村儿童前囟门闭合月龄为
14.1月。某研究人员从东北某县抽取36 名儿童,得囟门闭合月龄均值为14.3, 标准差为5.08月。问该县儿童前囟门闭 合月龄的均数是否大于一般儿童?

表1 假设的3批实验结果
组别 有效 对照组 治疗组 15 19 30 38 45 57 无效 5 1 10 2 15 3 合计 20 20 40 40 60 60 有效率 (%) 75 95 75 95 75 95
甲实验
乙实验
对照组 治疗组 丙实验 治疗组 对照组
甲实验中,P1与P2之间的差别无统计学意义 (校正的2=1.765,P =0.1840386; 乙实验中, P1与P2之间的差别有统计学意 义(2=6.27, P =0.0122487); 丙实验中, P1与P2的差别有统计学意义 (2=9.41,P =0.0021560)。

正确的做法应当是先做总的检验,然后 再用各种多重比较的方法。 如果各组间方差不齐,则不宜用方差分 析而需用非参数统计方法来处理。

表6 燃煤型砷中毒患者皮肤组织中P53mt阳性表达分析 组别 A组 例数 18
阳性细胞密度
阳性率 88.89
38.0729.00
B组
C组 对照组
11
39 12
依此类这种试验方法在统计学上称为具有重复测量的设计原作者错误地将同一个时间点上测得的数据任意排列在一起无意识地使重复测自同一只鼠的k个k1其具体取值常需结合专业知识来确定试验数据的顺序全部被打乱了致使本来可以排除的来自受试对象的个体差异混杂在试验误差之中处理数据的数学模型也被迫从具有重复测量设计的方差分析转为析因设计的方差分析
与正常值比较:*P<0.05,**P<0.001 )

可以看到有不少标准差大于均数。数 据很可能是很偏态,不宜使用t检验。
例 5

20例过敏性支气管哮喘患者及20例正常 人,每人抽取静脉血10 ml,经处理后分成 三管,一管仅用小牛血清1640培养(自发 管),一管加10mg/L屋尘螨(HMD),一 管加 10mg/L氟美松,体外培养后,分别对 外周血单个核细胞(PBLC)中的白细胞介 素(IL)-10进行测定,结果见表5。
805
928*


采用的是实验组与对照组做2个样本均数比 较的两独立样本比较的t检验的统计处理方 法。
本例的错误是: 2组收缩压的方差不齐,标准差最大11mmHg, 最小l mm Hg,相差11倍。 其中(1mmHg = 0.133kPa)

正确的处理方法是,对原始数据先做对数 转换,当方差齐性这一条件满足后, 再做 t检验。 若数据转换后仍达不到方差齐性的要求, 则必须用非参数统计方法比较组间差别。
表 两种药物疗效的比较
组别 例数 痊愈 显效 进步 无效 A药 300 100 50 50 100 B药 300 50 100 100 50
用2检验,2=56.556,=3,P=0.001,得出有统计学意义, 但是任何两列进行对换。Pearson 2的数值也不会有变化。
对于这种顺序分类变量资料可以用Wilcoxon秩和检验、Ridit分析
答:
哮喘组与对照组的组间比较,如加HMD后IL10的差别,不应采用配对t检验,而应采用成 组(团体)t检验(若方差不齐,还需变量转 换或改用非参数统计方法); 哮喘组以自发管”、“HMD‖、“氟美松”三 组之间的差别则应采用随机单位组设计的单 因素方差分析。


事实上,t检验和方差分析是一种所谓的 “稳健的”(robust)统计方法。就是说, 当分布偏离正态分布不大时,对其结果的 影响不大。但对于计量数据还是应当先做 正态性检验。
表3 76位孕妇血清中ANCA表达情况的比较(理论频数)
组别
总例数
阳性 10(6.9) 19(10.1)
阴性 5(8.1) 3(11.9)
对照组
轻、中度妊高症 重度妊高症
39
15 22
6(18.0) 33(21.0)

如按疗效分成多个等级,如痊愈、显效、 进步、无效4个疗效等级,则目前常用的2 (Pearson 2)不能说明疗效的好坏。因为 Pearson 2只检验结构是否均衡而不能检验 两组疗效是否有差别。
相关文档
最新文档