遗传关联性研究Meta分析中的Hardy-Weinberg平衡

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国循证心血管医学杂志2016年11月第8卷第11期Chin J Evid Based Cardiovasc Med,November,2016,Vol.8,No.11• 1281 ••循证理论与实践•
遗传关联性研究Meta分析中的Hardy-Weinberg平衡
翁鸿1,2,江梅3,仇成凤4,曾宪涛1,2
【摘要】Hardy-W einberg平衡(H W E)在科学领域是一个常用的假设,其在遗传关联性研究中的重 要性被日益重视。

HW E与基因型分型质量密切相关,因此,制作遗传关联性研究Meta分析时,需要检验
对照组人群基因型分布是否符合H W E。

本文从HW E定律的产生背景出发,介绍其检验方法,以及在制
作遗传关联性研究Meta分析时如何处理对照组不符合HW E的研究。

【关键词】遗传关联性研究;基因多态性;Hardy-W einberg平衡;Meta分析
【中图分类号】R4 【文献标志码】A【文章编号】1674-4055(2016)11-1281-03 Hardy-Weinberg equilibrium in Meta-analysis of genetic association study WENG Hong", JIANG Mei, Q1U
Cheng—feng, ZENG Xian-tao. Center f or Evidence-Based and Translational Medicine, Zhongnan Hospital, Wuhan
University, Wuhan 430071, China.
Corresponding author: ZENG Xian-tao, E-mail: zengxiantao1128@
[Abstract] To H ardy-W einberg equilibrium(HWE) is a common hypothesis in field of science and its importance is more and more predominant in genetic association study. HWE is closely correlated with quality of
genotyping. Therefore, the coincidence between genotype distribution in controls and HWE should be tested when
a M eta-analysis of genetic association study was conducted. The test method, and how to deal with the studies that
were not coincided with HWE during performing M eta-analysis of genetic association study were introduced in the
paper based on the emerging background of HWE.
[Key words] Genetic association study; Gene polymorphism; Hardy-W einberg equilibrium; M eta-analysis
在理想状态下(如随机交配,没有选择、突变或迁徙),人群若符合Hardy-Weinberg平衡
(HW E),某一特征基因比例在遗传中将保持不变。

当前HWE在科学研究领域是一个常用假设,涵盖植物学[1]、法医学[2]及遗传流行病学[3]。

在遗传关联性研究中HWE的重要性也逐渐被研究者发现。

Trikalin。

s等[4]对42篇遗传关联性研究 Meta分析的591个研究再次进行Meta分析,结果 发现,对照组中不符合HWE校正后,33篇Meta分 析文献总的比值比在10%以内变化,另外9篇在 10%~31%变化,其中3篇校正后统计学关联性消 失。

因此,在制作遗传关联性研究Meta分析时,进行对照组HWE检验是重要的步骤。

本文全面阐 述HWE的产生、检验方法以及在遗传关联性研究 Meta分析中如何处理。

1群体遗传与进化
1.1进化达尔文进化理论有三条原则:①变异原 则;②遗传原则;③选择原则。

变异原则是指在 任何一个群体中,不同个体之间都存在一定程度 的差异,包括形态、生理及行为;遗传原则是指基金项目:国家重点研发计划专项基金(2016YFC0106300)
作者单位:1430071武汉,武汉大学中南医院循证与转化医学中 心;2 430071武汉,武汉大学循证与转化医学中心;3510120广州,广 州医科大学附属第一医院•呼吸疾病国家重点实验室•呼吸疾病国 家临床研究中心•广州呼吸疾病研究所; 4 418000怀化,怀化市第一 民医院临床药学研究室•循证医学中心
通讯作者:曾宪涛,E-mail:zengxiantao1128@
doi:10.3969/j.issn.1674-4055.2016.11.01后代与其杂交亲本的相似性多于与无关个体的相 似性;选择原则是指在特定的环境中,某些个体 总比其他个体有更强的生存能力。

群体遗传学将 上述三条原则转变成精准的遗传学概念的科学,从研究群体的遗传结构及其变化规律来探讨进化 的机制。

1.2孟德尔群体进化的单位是群体,并不是个 人,这是由于个体生命的长短是有限的,且其遗 传结构除发生突变之外,一生中均是固定的。

而 群体分布广泛,世代相传,具有时间上的连续性,在遗传结构上也能发生改变。

群体遗传学研 究群体是一种特定的孟德尔群体,是一群相互交 配的个体集合,该群体中所有个体共有的全部基 因即为基因库。

Dobzhansky[5]定义其为一群能够
相互繁殖的个体,并享有一个共同的基因库。

1.3群体的遗传结构群体遗传学主要是研究群体 遗传组成变化的机制。

遗传结构是指群体中各基 因的频率及各基因型的数量分布。

因此,群体遗 传学采用等位基因频率和基因型频率两个概念来 表达群体遗传结构。

等位基因频率是指某种基因 在某个群体中出现的比例;基因型频率是指某种 特定基因型的个体占群体内全部个体的比例。

2 HWE定律的概念和要点
2.1 HWE定律的概念群体遗传结构的变化引起 遗传水平上的变化,即进化。

突变和重组是可遗 传变异的源泉,是进化所需的原料。

在有性繁殖
• 1282 •中国循证心血管医学杂志2016年11月第8卷第11期Chin J Evid Based Cardiovasc Med,November,2016,Vol.8,No.11
过程中,通过遗传漂变和自然选择将变异体有区 别地传递到后代中去。

但遗传本身并不改变基因 频率,即HWE定律的原理。

该定律指出:当一个
大的孟德尔群体中的个体间进行随机交配,并同 时无选择、无突变、无迁徙和遗传漂变发生时,下一代基因型的频率和前一代一样,这个群体被 称为处于随机交配系统的平衡中[6-10]。

该定律是在1908年由英国数学家Hardy和德国医生W e inberg 分别独立发现的,故称HWE定律,又称基因型频 率的平衡定律,它是群体遗传学的第一理论基石 ―11,12]。

假设一对等位基因A和B的频率分别为p和 q,且p+q=l,在该群体中有二种基因型AA、AB 和BB,其基因型频率分别为p2、2pq和q2,根据 HWE定律,则(p+q)2= p2+2pq+q2=l(表1)。

因此HWE定律也被称为二项式平方定律。

2.2 HWE定律的要点HWE定律的要点主要有三 条[6]:①在以随机交配为前提的孟德尔群体中,如果没有基因突变、选择或迁移的干扰,则基因 频率在遗传过程中不发生变化;②群体的基因
型频率的平衡建立在二项式定律之中[(p+q)2= p2+2pq+q2=1],孟德尔群体的基因型频率取决于
其等位基因频率;③随机交配是保持平衡状态的 重要保障。

2.3 HWE定律的推广HWE定律不仅适用于二等位基因的情况,也适用于复等位基因和伴性基因。

如有三个等位基因A、B、C,其频率分别为 p、q、r,且p+q+r=1,那么在孟德尔群体中,这 三个等位基因及其六种基因型满足的平衡为:(p+q+r) 2=p2+2pq+2pr+q2+2qr+r2 (表2)。

3影响HWE的因素
3.1基因分型错误这是引起HWE偏离的重要因素[13,14]。

在很多基因分型平台中,鉴定杂合子个 体比纯合子个体更具有挑战性,难度更大,因此,该基因型的个体缺失引起数据偏离HWE;基因分型质量差的另一个原因是可分型率低,即大量单核苷酸多态性(SNP)位点或个体无法 进行基因分型,这一问题在全基因组关联研究(GWAS)中更为显著,在候选基因研究中也会产生,基因型的随机缺失对试验结果的影响较
小,但基因分型错误率太高就意味着非随机缺
失,对结果会产生偏倚;此外,病例组和对照组
中遗失率的不同也会对试验结果产生偏倚,如两 组DNA提取或储存的差异所引起的丢失[15,16]。

3.2选择性配对即非随机配对。

HWE检验要求 所分析的SNP是随机配对的,但由于其他因素的 干扰,如择偶中女性对男性身高的选择,以及在 聋哑人群中也可能发生[16,17]。

3.3选择偏倚由于死胎或早期死亡等因素导致某些基因型的流失,这些流失的基因型可能被忽 略,因此可能会受到选择偏倚的影响。

3.4人群分层在研究中混合了遗传学隔离的人
群,可能会引起基因型频数偏离HWE。

人群分层 是遗传关联性研究中较为重要的一个因素。

3.5偶然因素有的研究分析了多个SNP,增加了 I型错误的发生,因此其HWE检验的P值也需要进
行多重检验校正,以得到校正后的P值。

3.6其他因素小群体中可能由于遗传漂变、
始祖效应、空间限制及杂合子优势而导致偏离HWE[17,18],如囊性纤维化病,杂合子个体比正常
的纯合子个体有生殖优势。

4 HWE的检验
4.1 Pearson卡方检验检验某个群体是否符合HWE最常用的方法是Pearson卡方检验(表3)。

假设有100个人,AA、AB、BB的基因型频数(O)分别为:〇(AA)=70、O(AB)=20、O (BB)=10,计算出A、B等位基因的频率分别为:f(A)= (70x 2+20 )/( 2x 100 ) =0.8、f(B) = ( 10x 2+20 ) /( 2x 100 )=0.2,然后 分别计算出各基因型频率的期望值(E):E (AA) =100 x0.82=64,E (AB) =2x100x0.8
表2复等位基因的HWE
表1等位基因A和B的HWE
母本配子及其频率
父本配子及其频率
母本配子及其频率
父本配子其频率A(p)B(q)C(r)
A(p)B(q)A(p)A A(p2)A B(p q)A C(p r)
A(p)A A(p2)A B(p q)B(q)A B(p q)B B(q2)B C(q r) B(q)A B(p q)B B(q2)C(r)AC (p r)B C(q r)C C(r2) p+q=1p2+2pq+q2=1p+q+r=1p2+2pq+2pr+2qr+q2+r2=1
表3 Pearson卡方检验计算方法
AA AB BB总计A等位基因频率B等位基因频率
计算方法
观测值(O)X Y Z N=X+Y+Z p=(2X+Y)/2N q=(2Z+Y)/2N
期望值(E)
举例
Np22Npq Nq2N=Np2+2Npq+Nq2
观测值(O)7020101000.80.2
期望值(E)64324100
(O-E) 2/E0.56 4.5914.06
x0.2=32,E(BB)=100x0.22=4o Pearson卡方拟合优度检验是通过求和(〇-E)2/E来给定卡 方值,该例的卡方值为:X2=(7〇-64 ) 2/64+ (20-32) 2/32+( 10-4) 2/4=14.06。

此外,值得 注意的是,此处卡方分布的自由度为3-1-1 = 1,不是3-1=2,因为等位基因频率p已经在观测值中进行了估算,因此卡方分布的自由度又减少一个。

因此,该卡方值对应的P值为0.0002,提 示该基因型频数偏离HWE,可能会存在杂合子数目的部分丢失。

最后一步也可以在EXCEL中输人“=CHIDIST (卡方值,自由度)”然后得 出相应的P值。

此外,也有多种软件可以实现HWE检验,如Stata软件中的genhwi命令(命令格 式genhwi AA AB BB)、网页版检验HW E(http:// ./software/hwe-mr-calc.shtml)及研究 者自行在EXCEL中编辑计算公式。

4.2其他检验方法Pearson卡方检验是最常用的检 验HWE的方法,但当突变基因频率较为罕见时,Pearson卡方检验的统计效能难以满足,此时应使 用确切检验[7,8,10L L i等[19]提出了一种似然比检验(LRT),并指出LRT比常用的Pearson卡方检验 具有更强的统计效能。

但2&%等[20]指出当标志物 不依赖疾病时,LRT的检验效能也不足,需要数 据最优化来计算检验统计量,因此他们提出了一 种收缩检验,比LRT更具有统计效能,也易于用 在全基因组关联研究的数据中。

此外,资3“等[21]还提出了一种简单均方根统计量来检验HWE,以及X连锁的单核苷酸多态性的HWE检验[22]、近 亲系数检验[23]、不完全列举法[24]及绘图法[25]。

总 之,检验基因型频数是否偏离HWE的方法有多 种,读者可根据情况选择合适的方法,比如Stata 软件的genhwi命令同时提供了Pearson卡方检验、LRT检验以及确切检验的结果。

5遗传关联性研究Meta分析中对HWE的处理
5.1检测对照组基因型是否符合H W E研究者普遍认为遗传关联性研究的可靠性和有效性在较大 程度上依赖对照组的正确选择[26]。

病例组中的群 体可能由于受到疾病压力(选择压力的一种)的 作用,使得其基因型分布偏离HWE;而未患病的 对照组基因型分布应该符合HWE,因此,在进行 遗传关联性研究的Meta分析时,应该检测病例- 对照研究的对照组基因型分布是否符合HWE。

但 由于检验HWE的效能较低,特别是对于中等效应 值的检测,因此,HuGENet推荐评估的主要目的 是评价偏离HWE程度的大小,而不是检验是否具 有统计学意义[27]。

因此,推荐研究者在制作遗传 关联性研究Meta分析中,报告纳人研究对照组基 因型的HWE情况时应报告检验结果的P值,而不是仅报告该研究的对照组是否符合HWE。

5.2对照组基因型分布偏离HWE研究的处理制作遗传关联性研究Meta分析时,有研究者提出将 对照组基因型分布偏离HWE的研究进行排除,也 有研究者认为应该将其纳人,然后进行敏感性分 析或Meta回归分析,来比较结果的稳定性或检验 组间是否有差异[17,28-31]。

目前普遍较为推荐的为 后者,先将所有研究纳人进行合并分析,然后进 行敏感性分析,排除对照组偏离HWE的研究,将 敏感性分析的结果与总的合并结果进行比较,验 证汇总结果的稳健性。

6小结
本文概述了HWE定律产生的背景及历史,并 阐明了其在遗传学中的地位,因此,HWE定律在 遗传关联性研究中也不可忽视,在进行遗传关联 性研究Meta分析时要进行HWE的检验。

详述了群 体偏离HWE的原因,主要是基因分型质量的原因 以及检验HWE的目的。

并展示了检验HWE的方 法,其中Pearson卡方检验最为常用,软件操作也 较为简单。

最后,阐述了遗传关联性研究Meta分 析中如何处理对照组不符合HWE的研究,即先进 行汇总分析后,再进行敏感性分析,对比研究结 果,考察汇总结果的稳健性。

此外,提倡研究者 在制作遗传关联性研究Meta分析时,应报告对照 组基因型分布偏离HWE的程度(即P值),而不 仅仅是报告是否符合HWE。

参考文献
[1] Anastassopoulos E. DNA Fingerprinting in Plants: Principles,
Methods and Applications[J]. Economic Botany,2009,14(14):129-31. [2] Council BN. The evaluation of forensic DNA evidence[M].
Washington DC: National Academy Press,2010.
[3] Sham P. Statistics in Human G enetics[M]. London: Arnold
Publishers,2001.
[4] Trikalinos TA,Salanti G,Khoury MJ,et al. Impact of violations and
deviations in Hardy-W einberg equilibrium on postulated gene-
disease associations[J]. Am J Epidemiol,2006,163(4):300-9.
[5] DOBZHANSKY T. Mendelian populations as genetic systems[J].
Cold Spring Harb Symp Quant Biol,1957,22(7):385-93.
[6]王亚馥,戴灼华.遗传学[M].第二版,北京:高等教育出版社,2008.
[7] Wigginton JE,Cutler DJ,Abecasis GR. A note on exact tests of Hardy-
Weinberg equilibrium[J]. Am J Hum Genet,2005,76(5):887-93.
[8] Schaid DJ,Batzler AJ,Jenkins GD,et al. Exact tests of Hardy-
Weinberg equilibrium and homogeneity of disequilibrium across
strata[J]. Am J Hum Genet,2006,79(6):1071-80.
[9] Mayo O. A century of Hardy-Weinberg equilibrium[J]. Twin Res
Hum Genet,2008,11(3):249-56.
[10] Shan G. A note on exact conditional and unconditional tests for
Hardy-Weinberg equilibrium[J]. Hum Hered,2013,76(1):10-7. [11] James V N eel. H ardy-W einberg Equilibrium and Prim itive
Populations[J]. Am J Hum Genet,1965,17(1):91-2.
[12] H ardy GH. M ENDELIAN PRO PO RTIONS IN A MIXED
POPULATION[J]. Science,1908,28(706):49-50.
(下转1287页)
验的Meta分析[J].中国循证心血管医学杂志,2016,8(8):In Press. [12]王权,杨廉洁,何倩,等.应用R软件m e ta m is c程序包及
CopulaREMADA程序包实现诊断准确性试验的Meta分析[J].中国循证心血管医学杂志,2016,8(4):392-5.
[13] M enten J,Lesaffre E. A general framework for comparative
Bayesian m eta-analysis of diagnostic studies[J]. BMC Med Res Methodol,2015,15:70.
[14] Kuss O,Hoyer A,Solms A. Meta-analysis for diagnostic accuracy
studies: a new statistical model using beta-binomial distributions and bivariate copulas[J]. Statist Med,2014,33(1):17-30.
[15] Novielli N,Cooper NJ,Sutton AJ,et a/. Bayesian model selection for
meta-analysis of diagnostic test accuracy data: Application to Ddimer for deep vein thrombosis[J]. Res Synth Methods,2010,1(3-4):226-38.
[16] Jaramillo D,D urr S,Hick P,et a/. Bayesian estimation of diagnostic
sensitivity and specificity of a nervous necrosis virus antibody ELISA[J]. Prev Vet Med,2016,1(123):138-42.
[17] Doebler P,Holling H,Bohning D. A Mixed Model Approach to Meta­
Analysis of Diagnostic Studies With Binary Test Outcome[J]. Psychol Methods,2012,17(3):418-36.
[18] Zhou Y,Dendukuri N. Statistics for quantifying heterogeneity
in univariate and bivariate m eta-analysesof binary data: The
case of m eta-analyses of diagnostic accuracy[J]. Statist Med, 2014,33(16):2701-17.
[19] Valle D,Lima JM,Millar J,et a/. Bias in logistic regression due
to im perfect diagnostic test results and practical correction approaches[J]. Malar J,2015,14:434.
[20] van Enst WA,Ochodo E,Scholten RJ,et a/. Investigation of publication
bias in m eta-analyses of diagnostic test accuracy: a m eta­epidemiological study[J]. BMC Med Res Methodol,2014,14:70. [21] Lee J,Kim KW,Choi SH,et a/. Systematic Review and Meta-Analysis
of Studies Evaluating Diagnostic Test Accuracy: A Practical Reviewfor Clinical Researchers Part II. Statistical Methods of Meta-Analysis[J]. Korean J Radiol,2015,16(6):1188-96.
[22] Tang LL,Zhang W,Li Q,et a/. L east squares regression
m e t h o d s fo r c l u s t e r e d R O C d a t a w i t h d i s c r e t e c o v a r i a t e s [ J] .
BMJ,2016,58(4):747-65.
[23] Leeflang MM,Deeks JJ,Gatsonis C,et a/. Systematic reviews of
diagnostic test accuracy[J]. Annals of Internal M edicine,2008,149
(12):889-97.
[24] Doebler P,Holling H. M eta-analysis of Diagnostic Accuracy and
ROC Curves with Covariate Adjusted Semiparametric Mixtures[J].
Psychometrika,2015,80(4):1084-104.
本文编辑:姚雪莉
(上接1283页)
[13] Gomes I,Collins A,Lonjou C,et a/. Hardy-Weinberg quality control[J].
Ann Hum Genet,1999,63(Pt 6):535-8.
[14] Hosking L,Lumsden S,Lewis K,et a/. Detection of genotyping
errors by Hardy-W einberg equilibrium testing[J]. Eur J Hum Genet,2004,12(5):395-9.
[15] Clayton DG,Walker NM,Smyth DJ,et a/. Population structure,
differential bias and genomic control in a large-scale, case-control association study[J]. Nat Genet,2005,37(11):1243-6.
[16] Al-Chalabi A,Almasy L. Genetics of Complex Human Diseases: A
Laboratory Manual[M]. New York: Cold Spring Harbor Laboratory Press,2009.
[17] Salanti G,Sanderson S,Higgins JP. Obstacles and opportunities
in m eta-an alysis of genetic association studies[J]. Genet Med,2005,7(1):13-20.
[18] Chen YS,Su YC,Pan W. Effect of spatial constraints on Hardy-
Weinberg equilibrium[J]. Sci Rep,2016,6:19297.
[19] Li M,Li C. Assessing departure from Hardy-Weinberg equilibrium in
the presence of disease association[J]. Genet Epidemiol,2008,32(7): 589-99.
[20] Zang Y,Yuan Y. A shrinkage method for testing the Hardy-Weinberg
equilibrium in case-control studies[J]. Genet Epidemiol,2013,37(7): 743-50.
[21] Ward R,Carroll RJ. Testing Hardy-Weinberg equilibrium with a
simple root-mean-square statistic[J]. Biostatistics,2014,15(1):74-86.
[22] Zheng G,Joo J,Zhang C,et a/. Testing association for markers on the X
chromosome[J]. Genet Epidemiol,2007,31(8):834-43.[23] Salanti G,Amountza G,Ntzani EE,et a/. Hardy-Weinberg equilibrium
in genetic association studies: an empirical evaluation of reporting, deviations, and power[J]. Eur J Hum Genet,2005,13(7):840-8. [24] Maurer HP,Melchinger AE,Frisch M. An incomplete enumeration
algorithm for an exact test of Hardy-W einberg proportions with multiple alleles[J]. Theor Appl Genet,2007, 115(3):393-8.
[25] G raffelm an J,C am arena JM. G raphical tests for H ard y-
W einberg equilibrium based on the ternary plot[J]. Hum Hered,2008,65(2):77-84.
[26] 刘红,胡永华.遗传流行病学研究中的H-W平衡检验[J].中南大
学学报(医学版),2010,35(1):90-3.
[27] Little J,Higgins JPT (editors). The HuGENet™ HuGE Review
Handbook, version 1.0. http://www.hugenet.ca (accessed 28 February 2006).
[28] Nakaoka H,Inoue I. Meta-analysis of genetic association studies:
methodologies, between-study heterogeneity and winner's curse[J]. J Hum Genet,2009,54(11):615-23.
[29] Sagoo GS,Little J,H iggins JP. System atic reviews of genetic
association studies. Human Genome Epidemiology Network[J]. PLoS Med,2009,6(3):e28.
[30] M inelli C,Thompson JR,Abrams KR,et a/. How should we use
information about HWE in the meta-analyses of genetic association studies?[J]. Int J Epidemiol,2008,37(1):136-46.
[31] Salanti G,Higgins JP,Trikalinos TA,et a/. Bayesian meta-analysis
and meta-regression for gene-disease associations and deviations from Hardy-Weinberg equilibrium[J]. Stat Med,2007,26(3):553-67.
本文编辑:姚雪莉。

相关文档
最新文档