一种适合中医药临床疗效评价的新思路

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一种适合中医药临床疗效评价的新思路-CPOE模式
河南省中医药研究院范军铭（450004）
摘要：本文分析当前中医临床疗效评价存在的问题，认为中医辨证论治、证候、中医治疗慢性病、中西医结合等疗效评价以及伦理限制等条件下往往不适合RCT,提出了以足够样本量的队列研究(C)为基础，以倾向评分法(P)为条件，以结局指标(O)为金标准，充分把握暴露因素(E)水平划分的四要素综合构建成一种新的研究模式-CPOE模式，并分析了这种模式的优点。

关键词：CPOE模式疗效评价队列研究倾向评分
中医药的临床疗效评价问题一直是阻碍中医药走向世界的一大障碍。

如何采用合理的方法来进行评价是中医界多年来一直在寻求的答案[1]。

在药物临床试验研究中，随机对照临床试验（RCT）无疑是最理想的金标准。

但是，中西医有很多不同之处，传统的RCT在评价中医疗效时不一定合适[2]。

中医临床疗效评价在方法学上有待创新，寻找合适的评价方法是目前更紧急的任务[3]。

本文将讨论中医临床研究中哪些情况不适合RCT，并针对这些情况提出我们将采取什么样的思路来解决这些问题。

一、中医疗效评价常常不适合RCT
1．辨证论治不适合用RCT。

中医理论的核心是辨证论治，临床上治疗时很难用一种方法、或一个处方、或一种药自始至终治疗病人，大部分时候是要根据患者的具体情况随证加减。

即使中成药使用也只能针对某一种证候来使用，用到一定程度也需要根据情况进行调整。

所以，中医治病往往是一个方案，而不是具体的某个方和某个药。

另一方面，中医药具有多靶点、多途径、低效应、见效慢、整体调节等特点，这与RCT试验要求的治疗措施固定、评价指标效应强的条件格格不入。

所以，采用RCT试验评价中药，如果严格按照方案执行则中药疗效往往不理想，如果疗效理想很多时候则很难想象是严格按照方案执行了。

有人研究表明[4-5]，中医临床研究文献循证医学价值普遍较低。

大家虽然越来越趋向于RCT，但存在问题不少。

部分研究未进行组间基线资料均衡性比较;多中心的研究较少;部分研究对照组和治疗组的样本含量相差较大；79.96%的RCT未对其随机的具体方法进行描述,使得其是否正确地使用了随机方法存在疑问;描述随机隐藏的很少;采用盲法的比例还比较低,各时间段均低于10%；在样本含量方面，对样本含量进行估计的文献很少,这样会造成样本含量过少而出现假阳性或假阴性结果,或样本含量过大而浪费资源且精度下降。

在观察指标方面，如高血压研究广泛采用的是血压和症状等指标, 虽然其简便直观,但其对研究价值的评估意义远不如国
际上广泛采用的针对心血管终点事件的相对危险度降低、绝对危险度降低、需要治疗的患者数等指标。

在统计方面，使用的统计方法多局限于χ2检验、t检验和u检验等一元统计方法,且多数研究未说明统计量的大小,使其结果无法进行meta分析,降低了其对临床决策的价值。

所以，面对辨证论治这种复杂干预，采用传统的RCT方法往往是不适合的。

2.中医证候疗效评价不适合用RCT。

中医证候是中医理论的核心，中医证候是由一组症状群组成。

首先，很多疾病的中医证候分型尚未统一，辨证分型尚缺乏统一标准和规范，有的即使有标准和规范，在操作层面上仍会出现较大的偏差。

其次，很多疾病病情程度与症状并不成正比，症状消失并不代表疾病好转或痊愈。

最后，中医的很多症状和舌脉用药后会出现变化，这种变化有时很难说是疾病好转或加重，有时甚至预示着证候从A证转换成了B 证，而这种转变很多时候也说不清与疾病有什么关系。

因此，对于在众多未知的情况下去采用RCT来评价中医证候的疗效显然是不适合的。

3.中医治疗慢性病疗效评价不适合用RCT。

慢性病如高血压、糖尿病、肝病、肿瘤、肾病等，病程较长，中医药治疗的目的往往是缓解症状、改善生活质量、减少并发症、减少终点事件的发生。

由于中医治疗慢性病需要长期用药、或间断长期用药，短期内看到中医治疗的效果往往很难，而长期进行RCT试验临床上根本没有可操作性。

因此，中医治疗慢性病疗效评价不适合用RCT。

4.中西医结合治疗不适合用RCT。

凡是中西医结合治疗的疾病，大部分中医药处于配合地位，配合中医药的目的往往是从长计议，期望的是远期的效果，或者是消除或减轻西药的不良反应或副作用。

由于西药的效应短期内就会很大，如果进行RCT试验，中药的效应往往会被淹没。

如果为了观察中药的长期效应，RCT试验显然无法操作［7-8］。

5.研究条件及伦理的限制不适合RCT。

随着西医学的发展，很多中医优势病种越来越不具有优势，很多疾病都有标准的治疗方案，如果为了试验而不给患者进行标准治疗则有违反伦理原则，而一旦采用标准治疗，则中药本来就弱的效应就更不易显现，由此，很多情况下，实际上是无法进行RCT的。

总之，中西医有很多不同之处，传统的RCT在评价中医疗效时遇到挑战，在方法学上有待创新。

经典的RCT试验主要用于评价干预的特异性疗效。

针对中医复杂性干预，评价的疗效应当是系统疗效，因此在中医干预评价中应当充分考虑干预构成的多样性以及干预对象的社会属性和个体差异，综合多种方法来评价中医的复杂干预。

这就需要考虑评价中患者、干预及结局的要素，建立与传统的临床流行病学或循证医学中的RCT试验有所不同的创新方法学模式[3]。

二、CPOE模式构想
本文将根据中医特点结合现代统计学研究成果，提出一种新的研究模式-CPOE模式并加以论述.
本文的CPOE模式，是一种临床疗效评价模式，是指为适应中医药的特点，将适合于中医药复杂干预疗效评价方法中的设计和分析中的核心要素综合成一种模式， C指队列研究(cohort study)，E指暴露因素(exposure factor)、O指结局指标(outcome indicators)、P指倾向评分(Propensity score), 这种模式的关键在于以足够样本量的队列研究(C)为基础，以倾向评分法(P)为条件，以结局指标(O)为金标准，充分把握暴露因素(E)水平划分的四个要素上，这四种核心要素是作为该临床疗效评价模式中的基石，离开了对某一项要素的限定，该研究模式对疗效评价的医学循证价值就会大打折扣。

下面就有关CPOE模式中的四个要素分别论述如下：
1.队列研究适用于评价复杂性干预的结果，适合中医辨证论治的疗效评价，目前中医研究中采纳的很少，应增加队列研究在中医临床研究中的应用。

队列研究(cohort study)作为经典流行病学观察性研究方法之一 ,在临床研究中被广泛应用,在循证医学证据评价等级体系中其研究结果仅次于随机对照临床试验(RCT)[3]。

与西医相比,国内目前队列研究方法在中医药领域的应用还比较少，尚处于探索阶段[3]。

个体化辨证施治是中医的特色，采用统一的药物或治疗方案，在某些情况下与医学伦理学相违背,不能使用随机对照临床试验,而可以使用队列研究，在随访观察并收集详细资料的基础上,得出与随机对照试验同样有意义、有说服力的结论。

因此,应当增加队列研究在中医临床研究中的应用[4]。

最理想的队列研究是分层多中心前瞻性队列研究，它避免了随机对照试验的实施困难，其要求的条件没有随机对照试验严格，让患者和医生自己决定采取何种干预措施，尊重了患者的价值，提高了患者的依从性，提高了临床的可操作性，比较适合中医辨证论治的临床疗效评价,值得深入探讨研究[1]。

众多知名中医研究专家[6]还提出了以临床实践数据为导向优化中西医结合治疗方案的思路,即在“临床科研一体化”思想指导下,通过建立结构化临床信息采集系统,按照循证医学理念,前瞻性科研设计,动态采集临床信息,构建中西医结合诊疗数据仓库,借助现代数据挖掘及统计分析方法,以临床实践数据为导向两次分组评价临床疗效,优化中西医结合治疗方案的新思路。

并认为其缺点在于临床干预措施复杂,混杂因素较多,要想得出某一方面结果,可能需要极大的样本量[6]。

实际上这种思路就是队列研究的思路，对于其缺点正好可以利用下面论述的倾向评分法来解决。

2.倾向评分法是处理非随机对照研究中混杂因素的最新方法，可有效解决队列研究中混杂因素干扰结果评价的难题，目前在中医临床研究中应用很少。

倾向评分法(propensity scoremethod)是由Rosenbaum和Rubin于20世纪80年代提出的[7]。

2000年之后,这一方法日益受到人们的关注。

国际上越来越多的研究者将倾向评分法应用到流行病学、健康服务研究、经济学以及社会科学等许多领域[8-9]。

它是近年来新出现的一种减少混杂偏倚的方法，主要用于非随机对照试验，国内大多数学者对于倾向评分法尚不熟悉，相关的研究也很少[10]。

倾向评分法包括分层法、回归调整法[10]、配比法[11]和加权法[12]，每种方法得到的结果会稍有一定的差异，有时两种以上方法得到同样的结论更能说明结果的可靠性。

在药物临床试验研究中，随机对照临床试验（RCT）无疑是最理想的金标准。

然而由于一些研究条件及伦理的限制，或者是所进行的研究是慢性病预防的时候随机化就往往不能够实现［13-14］。

像这样当随机化不能执行或者是受到破坏的时候，治疗效果的判断就会变得复杂起来。

因为我们无法判定组间的差异是由于治疗或暴露所引起的还是由于组间的分配不平
衡而造成的。

克服上述问题的传统方法是使用多元回归来对混杂进行校正［15］，即将一些混杂因素作为协变量来引入回归方程从而达到纠正各组间不平衡的目的。

但当协变量过多时，分析将变得复杂和困难，这时采用另外一种方法就是计算倾向指数（Propensity Score，记为PS）［16］来处理这一类数据。

倾向指数是指在给定可观察到的协变量条件下受试者选择干预治疗而非对照治疗的概率。

其实质就是将多个协变量的信息综合成一个复合变量，客观上起到了降维的作用。

近年来应用倾向指数对非随机化数据的处理也得到了更多的关注，有越来越多的研究者开始应用此方法来平衡组间的不均衡［17］,在流行病学研究中,该方法可以在分析阶段有效平衡非随机对照研究中的混杂偏倚,使研究结果接近随机对照研究的效果［17］。

近两年来，有学者[18]已将倾向评分法的几种方法在SAS中实现的过程及宏程序公开发表，大大方便了统计人员和有关研究人员的使用。

但是，由于中医临床研究整体水平较低，在统计分析时，采用先进的统计方法进行分析的文章较少，尚未见到采用PS法分析的中医研究文献。

因此，需要尽快将PS法引入到中医临床研究中。

3.中医临床队列研究中暴漏因素的测量是重要问题，暴露水平如何分层，直接影响评价结果，目前尚无人进行有关方面的医学循证研究，应从统计学角度开展相关研究。

应用队列研究评价中医疗效，首要解决的问题是暴露的定义和测量问题，关于暴露的定义，目前在中医研究界基本达成共识，就是将中医药辨证论治作为一个整体干预因素[19]。

关于暴露的测量问题，多主张按中医治疗累计时间 [20]，如李丛煌等[21]，将中医药治疗看作为一种暴露因素,按照肺癌患者接受中医治疗的暴露程度不同进行队列划分,将只接受中医药治疗者(极高暴露)划为中医队列,将在西医常规治疗基础上接受长期中医综合治疗者(高暴露)或接受长期中成药治疗者(较高暴露)均划为中西医结合队列,将接受西医常规治疗基础上给与短期或间断中医药治疗者(弱暴露)及仅接受西医放化疗等常规治疗的患者(无暴露)则划分为西医队列。

关于中医治疗作为暴露因素的暴露水平分层的问题，目前还停留在概念层面，更多深层次的问题尚无人研究，例如，分多少层合适？节点如何划分？分层不同对评价结果的影响程度？何种统计模型检验效能最好？等等，亟需从统计学角度开展相关方面的研究。

4.结局评价在中医疗效评价中至关重要，只有选择客观性强的结局指标评价中医疗效，其结果才有可能被现代医学所认可。

结局评价(outcome assessment)是目前国际医学界一个新的研究热点，因为人们越来越认识到:恰当的疗效评定指标是临床试验的重要环节，采用不同的判效指标甚至可以得出有效或无效的截然相反的结论[22]。

美国替代医学办公室(OAM)顾问委员会明确指出:传统/替代医学疗法的“有效性评价是一个关键和核心的问题”、“其疗效必须用人们认可的终点指标来加以证实”[23]，世界Cochlane协作组织已开始重新审视并系统评价传统医学(包括中医药)的临床疗效[24]。

临床试验中的结局指标主要可分为3类,即有效性、安全性和卫生经济学评价指标[25]。

有效性结局指标因疾病不同而不同，共同的指标是死亡和生存时间，但对于很多疾病来讲，结局指标是一种可测量的疾病或检测指标，强调的是客观性，不易受机体、环境、设备、研究者等因素影响，结局指标的选择根据客观性不同将直接影响疗效的评价结果。

目前，很多试验的结局指标，包括“十一五”国家重大项目中部分课题方案很多结局指标选择均不适当[24]。

只有选择对患者有直接影响的主要结局指标才能够证实干预措施的真正疗效，以实验室
检验为主的生物学指标只是一种次要结局指标，只有在主要结局指标不可行、且次要结局指标被证实与主要结局指标具有因果关系的情况下才能够作为代替主要结局指标的替代指标使用[24];并且评价结局指标应简单并易于测量[26],
总之，结局指标的不同将直接影响干预结果的判定，对中医疗效的评价选择结局评价尤为重要，就中医的疗效评价来说，不同的结局指标对结果的判定会引起多大的差异，尚无人从统计学角度进行探讨，有必要结合真实临床数据进行深入研究。

三、结语
CPOE模式基于现代临床流行病学和统计学的角度出发，结合中医临床特点，有针对性地为中医临床疗效评价构建研究模式，它既综合了传统的队列研究方法和最新的倾向评分方法（PS法），又强调了结局指标和暴露水平分组方法的重要性。

将四种要素综合形成一种研究模式，有利于强化单个要素的重要性和互相结合的重要性，有利于强化适合中医疗效评价的特异性，有利于提高中医疗效评价方法的科学性。

CPOE模式的方法和思路在评价中医复杂长期干预的疗效评价方面具有创新性，目前在中医研究领域无人应用。

本人认为CPOE 模式的构建，对提高中医研究水平、评价中医疗效、完善中医临床疗效评价方法、促进中医临床科研病历一体化均有重大意义。

值得在今后临床研究的实践中进行检验。

[1]胡立胜，郑淑美，王伟，等. 评价辨证论治疗效的分层多中心前瞻性队列研究方法[J].中华中医药杂志,2008,23(2):146~148.
[2]刘建平，循证医学方法与中医疗效评价[J].首都医科大学学报，2007，28（2）: 212- 215.
[3]邢建民，费宇彤，陈薇，等. 观察性研究在中医临床研究中的应用(1)—队列研究方法及设计[J].中医杂志,2008,49(6):502-503.
[4]聂广宁，王磊.我国中医药临床对照试验文献发表趋势分析. 辽中医药大学学报[J]，2010,12（12）：
[5]毛兵，王刚，樊涛，等.中医药随机对照试验报告质量评价[J].中国循证医学杂志，2007，7(12)：880-887. [7]Shenyang Guo，Richard P Barth，Claire Gibbons.Propensity scorematching strategies for evaluating substance abuse services for childwelfare clients ［J］.Children and Youth Services Review，2006，28：357-383. [8]Concato J，Shah N，Horwitz RI.Randomized，controlled trials，observational studies，and the hierarchy of research designs［J］.NEngl J Med，2000，342：1887-1892.
[6]徐浩，史大卓，刘保延，等等．以临床实践数据为导向构建中西医结合临床指南的设想[J］．中国中西医结合杂志，2009,29(6):544-546.
[7]Rosenbaum, PR. and Rubin, DB. The central role of the propensityscore in observational studies for causal effects[J]. Biometrika,1983, 70, 41-55.
[8]Austin PC. A critical appraisal of propensity score matching in the medical literature
between 1996 and 2003 [ J]. Statistics in Medicine, 2008, 27(12): 2037-2049.
[9]Til Stu¨rmer，Manisha Joshi，Robert J.Glynn.A review of the application of propensity score methods yielded increasing use，advantages in specific settings，but not substantially different estimates compared with conventional multivariable methods ［J］.Journal of Clinical Epidemiology，2006，59：437-447.
[10]李智文，任爱国. 倾向评分分层和回归分析[J].中国生育健康杂志，2010，21(3)：186-188.
[11]李智文，任爱国. 倾向评分配比法[J].中国生育健康杂志，2010，21(2)：121-123.
[12]李智文，任爱国. 倾向评分加权分析法[J].中国生育健康杂志，2010，21(4)：186-188.
[13]Shenyang Guo，Richard P Barth，Claire Gibbons.Propensity scorematching strategies for evaluating substance abuse services for childwelfare clients［J］.Children and Youth Services Review，2006，28：357-383.
[14]Concato J，Shah N，Horwitz RI.Randomized，controlled trials，observational studies，and the hierarchy of research designs［J］.NEngl J Med，2000，342：1887-1892.
[15] Helena Marti，Jon Perez-Barcena，Miquel Fiol.Analysis with thepropensity score of the association between likelihood of treatmentand event of interest in observational studies［J］.An example with myocardial reperfusion，2005，58：126-136.
[16]Rosenbaum，P.R.，Rubin，D.B.The central role of the propensity score in observational studies for causal effects［J］.Biometrika，1983，70：41－55.
[17]Til Stu¨rmer，Manisha Joshi，Robert J.Glynn.A review of the application of propensity score methods yielded increasing use，advantages in specific settings，but not substantially different estimates compared with conventional multivariable methods ［J］.Journal of Clinical Epidemiology，2006，59：437-447.
[18]李智文，任爱国. 倾向评分法在SAS软件中的实现[J].中国生育健康杂志，2010，21(5)：320-322.
[19]张惠敏，陈薇，刘建平. 队列研究应用于评价中医临床疗效中暴露的定义和测量方法[J].循证医学,2011,11(4):249-252. [20]张惠敏，陈薇，刘建平. 队列研究应用于评价中医临床疗效中暴露的定义和测量方法[J].循证医学,2011,11(4):249-252.
[21]李丛煌,花宝金,林洪生,等. 队列研究在肺癌临床研究中的应用[J]. 中华中医药学刊,2011,29(1):45-47.
[22]Jay Herson. The use of surtogate endpoints in clinical trials[J].Statistics in Medicine，1989，8:403.
[23]胡大一，项志敏.临床医学模式转变一从经验医学到循证医学[J].中国实用内科杂志，1998，18(11):688. [23]Levin J S，Class T A，Kushi L H，et al.Quantitative methods in re search on complementary and altemativ medicine.A methodological manifesto「S].Med Care，1997，35(11):1079.
[24]郭新峰,赖世隆,梁伟雄.中医药临床疗效评价中结局指标的选择与应用[J].广州中医药大学学报,2002,19(12):251~255. 。

[25]张宏伟，刘建平. 临床试验中的结局指标及效应测量[J]. 中医杂
志,2007,48(8):696-698.
[26]梁伟雄,王奇,温泽淮,等等. 中医临床研究方案设计优化的常见问题与对策[J]. 广州中医药大学学报,2008,25(5):381-384.。