几种基因_环境基因_基因交互作用研究方法的样本量比较
配对病例对照研究基因与基因交互作用样本量的确定
!& # %!来自! 基础理论与方法 !配对病例对照研究基因与基因交互作用 样本量的确定
王志萍 ! 李会庆
基因主作用与样本量与基因主作用增加时样本量减少的规律相同随基因交互作用增大交互作用的样本量明显减少研究基因主作用的样本量远低于研究基因交互作用所需要的样本量在探讨两个基因与疾病关系时按主作用参数确定样本量以研究两个基因各自对疾病的影响如果研究条件许可可按研究基因交互作用所需的样本量进行基因之间交互作用的研究不能用研究基因主作用的样本量研究基因与基因之间的交互作用否则将得出错误的结论病例对照设计适用于罕见疾病危险因素的研究疾病的发生频率变化对样本量计算影响很小该软件计算研究设计样本量是采用人群中的无关正常者作为对照根据3值的交互作用乘法模型同时假设uu等位基因型的危险度为du的前提下计算的且仅适用于两基因存在相乘交互作用的情况a3468
!! 目 前 认 为 约 () 的 疾 病 属 于 基 因 缺 陷 性 遗 传 绝大多数疾 病 的 发 生 与 基 因 的 易 感 性 有 关 " 易 病# 感基因及基因与基因之间交互作用的研究为新热点 之一 # 病例对照研究是最常被采用的研究方法之一 " 由于基因研究花费 高 # 用最小的样本获取最佳结果 是设计的重要问题 " 本文旨在提供采用匹配的病例 对照设计方法研究 基 因 与 基 因 间 交 互 作 用 # 所需要 的样本量大小 " 基本原理 符号注释 ( 设 ? 代表疾病 & !’ ; 与 + 代表两个要 研究的等位基因 # 分别有三个基因型 $ # UU# U . . .和 # 其 中 U 和 [ 分 别 为 易 感 基 因 位 点# [ [# [ A# A A%
几种基因交互作用研究方法的样本量比较
究生G 主要研究方向: 分子遗传流行病学G
共三人G 这种方法可以消除人群分层的影响 避免种 族差异的混杂作用G
研究基因-环境交互作用时 前两种方法要求 收集病例和对照的遗传~ 环境暴露资料 而病例-父 母研究对父母的环境暴露资料不作要求G 研究基因 -基因交互作用时 病例-父母研究亦与其他方法 不同 不需要父母表型的资料G
所需样本量 或根据样本量计算出研究的检验效能, 该软件可从美国南加利福尼亚洲大学网站(http, // hydra. uSc. edu/gxe) 免费下载, 2. 2. 2 样本量比较
表 1 单纯交互作用模型基因-环境交互作用研究样本量
Table 1 Sample size of studies of pure
2. 2. 2. 1 基因-环境交互作用 基因-环境交互作 用有四种模型, 单纯交互作用模型( pure interactiOn
- 140-
Chzn Dzs COnt1O P1eU 2003 A!r ; "( 2)
mOdel) 只有环境和遗传因素同时作用才能增加发 病危险 二者均无独立作用( Re= 1 Rg= 1) ; 遗传修 饰 模 型 ( G-mOdif icatiOH mOdel) 环 境 因 素 无 独 立 作 用 ( Re = 1 Rg = 2) ; 环 境 修 饰 模 型 ( E-mOdif icatiOH mOdel ) 与遗传修饰模型相反( Re= 2 Rg= 1) ; 遗传 环 境 修 饰 模 型 ( GE-mOdif icatiOH mOdel ) 环 境 因 素 和遗传因素均有独立作用( Re= 2 Rg= 2) G
基因与环境的交互作用:来自差别易感性模型的证据
心理科学进展 2017, Vol. 25, No. 8, 1310–1320 Advances in Psychological ScienceDOI: 10.3724/SP.J.1042.2017.013101310基因与环境的交互作用:来自差别易感性模型的证据*赵德懋 冯姝慧 邢淑芬(首都师范大学心理学系, 北京 100048)摘 要 差别易感性模型认为, 携带某种基因型的个体既容易受到消极环境的不利影响, 同时也容易受到积极的、支持性环境的有利影响。
随着定量遗传学和分子遗传学技术的不断发展, 涌现出关于基因−环境对儿童发展交互作用的大量研究, 主要包括5-HTTLPR 、DRD 4、MAOA 、COMT 和BDNF 五种基因与环境因素(如, 母亲敏感性、压力性生活事件和家庭养育环境等)对儿童发展的交互作用, 支持了差别易感性模型。
但是, 关于基因与环境交互作用的机制、携带易感性基因个体的种族和性别差异问题以及优势敏感性假说的验证, 都是该领域未来研究的重要方向。
关键词 基因−环境交互作用; 基因; 差别易感性; 优势敏感性 分类号B845当前心理学界中一个公认的观点——人类的发展结果不仅仅是由先天生物因素或后天环境因素决定的, 而是两者交互作用的结果, 这一理论思想早已提出, 但是缺乏相应的实证研究。
近年来, 由于定量遗传学和分子遗传学技术的发展, 使得人类在理解基因−环境对个体发展的交互作用方面取得了重大进展(Ellis, Boyce, Belsky, Bakermans-Kranenburg, & van Ijzendoorn, 2011)。
差别易感性模型(Differential Susceptibility Model)是解释基因−环境交互作用的最重要理论之一, 该理论模型巧妙地化解了遗传与环境的争论, 可以合理地解释为什么在相同环境中不同个体会出现不同的发展结果, 为外部环境与儿童发展领域的研究提供了新的范式和方向(Windhorst et al., 2015), 是当前心理学的研究热点和前沿问题之一。
人脑影像表型的基因组与暴露组广度关联研究
国际医学放射学杂志InternationalJournalofMedicalRadiology2021May 鸦44穴3雪:249-253人脑影像表型的基因组与暴露组广度关联研究于春水△【摘要】脑影像技术可以精确刻画人脑结构与功能,其个体变异决定了人类认知功能及神经精神疾病易感性的个体差异。
人脑结构与功能的个体差异与遗传变异、环境暴露、遗传-遗传交互作用、环境-环境交互作用及遗传-环境交互作用有关,需要从整个基因组和暴露组广度进行系统研究。
重点讨论基因组广度关联研究、暴露组广度关联研究、基因组广度遗传-遗传交互作用研究、暴露组广度环境-环境交互作用研究及基因组-暴露组广度遗传-环境交互作用研究在揭示人脑结构与功能个体差异成因中的潜在价值及其面临的挑战。
【关键词】磁共振成像;基因组;暴露组;人脑中图分类号:R394;R445.2文献标志码:AGenome -and exposome -wide association studies of human brain imaging phenotypes YU Chunshui △.Department of Radiology and Tianjin Key Laboratory of Functional Imaging,Tianjin Medical University General Hospital,Tianjin 300052,China.△E-mail:******************.cn【Abstract 】Human brain structure and function can be precisely characterized by brain imaging techniques and theirinter -individual variations are associated with individual differences in cognitive abilities and susceptibility to neuropsychiatric disorders.Individual differences in human brain structure and function can be attributed to genetic variations,environmental exposures,as well as gene -gene,environment -environment and gene -environment interactions.These effects should be unbiasedly investigated from the whole genome and exposome.Here,we discuss the potential values and challenges in investigating individual differences in brain structure and function by genome -wide association,exposome-wide association,genome-wide gene-gene interaction,exposome-wide environment-environment interaction and genome-exposome-wide gene-environment interaction analyses.【Keywords 】Magnetic resonance imaging;Genome;Exposome;Human brainIntJMedRadiol,2021,44(3):249-253作者单位:天津医科大学总医院医学影像科,天津市功能影像重点实验室,天津300052△E-mail :******************.cn 基金项目:国家重点研发计划“重大慢性非传染性疾病防控研究”重点专项(2018YFC1314300);国家自然科学基金重点项目(82030053)DOI:10.19300/j.2021.S18881专家述评以MRI 为代表的脑影像技术可以准确评估人脑结构与功能,其个体变异决定了人类认知功能及神经精神疾病易感性的个体差异[1]。
基因环境交互作用的统计学研究方法
基因环境交互作用的统计学研究方法基因环境交互作用是指基因和环境之间相互影响的现象,其中基因和环境的作用不是简单的加法,而是一种相互作用的关系。
基因环境交互作用对个体的发育和进化具有重要作用。
因此,为了研究基因环境交互作用的统计学方法,已成为现代遗传学和生态学的重要研究方向之一。
基因环境交互作用的研究需要考虑两个要素:遗传变异和环境变异。
遗传变异指不同个体之间的基因差异,而环境变异则包括不同个体之间或同一个体在不同环境条件下的表现差异。
这两个要素的交互影响导致了基因环境交互作用的现象。
在现代生物技术的帮助下,研究基因环境交互作用的方法不断发展。
统计学方法在生物研究中有着广泛的应用,也成为研究基因环境交互作用的重要工具。
下面将详细介绍几种常用的统计学研究方法。
1. 方差分析方差分析(ANalysis of VAriance,ANVOA)是研究基因环境交互作用的常用方法之一。
它通过比较不同处理组之间的方差大小来分析基因和环境之间的关系。
方差分析可通过单因素方差分析和双因素方差分析进行。
单因素方差分析是研究基因或环境对表现型影响的一种方法。
例如,我们想研究不同基因型对某一性状的影响,就可以将不同基因型的个体分成不同处理组,并进行方差分析。
如果不同处理组间的方差显著,则说明基因型对性状有影响。
双因素方差分析则是同时分析基因和环境对表现型影响的方法。
例如,我们想研究不同基因型在不同环境条件下对某一性状的影响,就可以将不同基因型的个体分成不同处理组,然后在不同环境条件下进行方差分析。
如果不同处理组间的方差显著,则说明基因环境交互作用存在。
2. 回归分析回归分析是一种寻找变量间关系的方法,它可以用来研究基因和环境间的交互作用。
回归分析可分为线性回归和非线性回归两类。
线性回归是一种用来寻找变量间线性关系的方法,它可以用来研究基因环境交互作用对表现型的影响。
例如,我们想研究不同基因型和环境条件对某一性状的影响,就可以利用线性回归进行分析。
叉生分析在基因一环境交互作用
叉生分析在基因一环境交互作用叉生分析是一种方法,用于研究基因与环境之间的交互作用对个体特征或疾病风险的影响。
通过比较同卵双生子(基因相同)和异卵双生子(基因相似度约为50%)之间的差异,可以确定基因对特定环境因素的敏感性,以及基因与环境的相互作用。
叉生分析的基本原理是通过比较同卵双生子和异卵双生子的相似性和差异性。
同卵双生子的基因组是完全一样的,而异卵双生子的基因组则与兄弟姐妹更为相似。
因此,如果在同卵双生子中其中一特征或疾病的发生率更高,那么很可能这是由于不同环境条件导致的。
而如果在同卵双生子和异卵双生子中差异显著,那么研究者有理由相信这是基因与环境交互作用的结果。
在进行叉生分析之前,研究人员首先需要建立双生子队列,收集同卵双生子和异卵双生子的临床数据、生物标本以及环境因素数据。
然后研究人员通过统计分析,计算基因与环境对特定表型的贡献。
叉生分析可以应用在许多领域,包括研究常见疾病(如心血管疾病、糖尿病、癌症等)、复杂疾病(如精神疾病、自闭症、阿尔茨海默病等)以及个体特征(如身高、体重、智力等)。
通过叉生分析,研究人员可以准确地确定基因与环境之间的相互作用,从而更好地理解复杂性疾病的发病机制。
例如,许多研究使用叉生分析来研究肥胖症的发病机制。
通过比较肥胖同卵双生子与肥胖异卵双生子以及瘦卵双生子之间的差异,研究人员可以确定哪些基因变异在特定环境因素下与肥胖的风险相关。
这些环境因素可能包括饮食习惯、运动水平、社会经济地位等。
通过叉生分析,研究人员可以更好地理解个体肥胖风险的遗传和环境基础,以及如何针对不同基因型和环境条件个体定制个体化的干预措施。
叉生分析的局限性包括研究样本的选择偏差、统计算法的复杂性以及环境因素的测量和分类问题。
另外,基因与环境交互作用的研究需要更大的样本量和更复杂的统计模型。
因此,在应用叉生分析时需要充分考虑这些因素。
总之,叉生分析是一种有效的方法,可以帮助我们研究基因与环境交互作用对个体特征或疾病风险的影响。
基因与疾病研究的样本量计算方法
文章编号:100120580(2004)0720886202 中图分类号:R19514 文献标识码:A【卫生统计】基因与疾病研究的样本量计算方法李大庆1,李颢1,王志萍2,李会庆3 随着基因谱的建立,遗传因素与疾病发生关系的研究已经进入了广泛探索的阶段。
其中仅有约5%的疾病属于基因缺陷性遗传所致,绝大部分疾病的发生与基因的易感性有关。
如肿瘤、心脑血管疾病属于多因素所致的疾病,已有的研究资料表明,多个(种)易感基因参与发病。
充分利用临床病例进行相关研究,发现有关的易感基因,将会把疾病的防治引入新的领域。
但基因研究的资金投入大,因此确定研究设计和样本量非常重要。
本文就设计类型和样本量的计算方法作简要介绍。
1 样本量计算方法111 设计类型 研究疾病与基因的关系时需要考虑基因与基因、基因与环境因素的独立及交互作用。
临床研究设计可分为4种类型:(1)病例-对照,对照为一般人群或其它病人,与病例间没有亲戚关系;(2)病例-同胞对照,对照为病例的兄弟姐妹,包括双胞胎;(3)病例-父母对照;(4)仅用病例不设对照。
评价指标为OR(比数比)。
如果要评价几个基因对疾病发生的作用,则应选择外环境因素基本一致的设计方案,如病例-同胞对照和病例-父母对照;如果要研究环境因素的作用,则最好选择基因一致的设计,如病例-单卵双胞胎设计等。
仅用病例不设对照设计一般是观察病例中某些基因型的分布频率。
112 样本量的计算原理 假设等位基因型的分布符合Hard-weinberg平衡定律,假设研究的基因为G和H,其中G的等位基因型为AA、Aa和aa;H的等位基因型为BB、Bb和bb型。
欲探讨基因型A和B是否与某病的易感性有关联,其样本量计算方法如下:疾病在人群中的发生概率为Po,Ag和Bh基因型的相对危险度(OR)以Rg和Rh表示,交互作用以Rgh表示。
计算公式如下P0=eα1+eα,R g=eγg,R h=eγh,Rgh=eγgh等位基因型的赋值为:显性遗传AA和Aa型G=1,aa型G=0,隐性遗传AA G=1,Aa和aa型G=0,OR值为G=1与G=0的比值。
基因环境交互作用分析方法在流行病学研究中的应用
垦堕垦堂童生皇堕塑查垫!!竺!旦第42卷第1期Int J Med Parasit Dis,January 2015,V01.42,No.1 ·49··综述·基因一环境交互作用分析方法在流行病学研究中的应用何健杨坤+【摘要】基因一环境交互作用(gene.environment interac ti on)分析方法适合探讨流行病学中遗传和环境多种因素对于疾病发生或传播的作用,并逐渐成为流行病学研究的重要研究手段。
该文从基因.环境交互作用方法的研究设计和统计学方法两方面,综述此方法的最新国内外研究进展.期望拓展在寄生虫病等研究领域的应用。
【关键词1基因.环境交互作用;流行病学;统计学分析Applic ation of ge ne·en vi ro nm en t in t er a c ti o n an a l ys i s in epide miol ogica l st udie s He Ji an,Ya ngKun*.Jiangsu Institute of Parasitic Di s e a s e s,K e y L a b o r a t o r y of Parasitic D i se a s e Control a nd Prevention,Min蠡try of Heal th,J ia rt gsu Provincial Key Laboratory ofParasite Molecular Biolog y,Wu xi 214064,C h i na+Corresponding author:Yang Kun,Em ail:ji pdy k@163.comSu pp on ed b y N a t i o n a l N a t u r a l S c i en c e F o u n d a t i o n of China(81101275)【Abstract】Gen e.en vironm ent interaction anal ysi s,as me tho d of m uh i.fa ct or s tu dv,c an explore the roleof genetic and envi ronment al factors in the prevalenc e an d transmission of di s e a se s,a n d it has be c o meveryi m p or t a n t m eans of ep i d e m i o l o g i c al s t u d y.R e s e a r c h d e s i g n a n d statistical met hods of g e n e—e n v i ro n m e nt inter-action metho d were revie we d in this paper,aiming at pro vi di n g re f er en c e in the flied of parasitic d i s e a se ss tu d y.【Key words】Gene-environment inte ra ct io n;E pi dem io lo gy;St at is tic al a na ly si s随着人们对于疾病发生认识的改观,发现诸互作用分析方法的进展,以期为流行病学病因研如癌症[I之]、慢性病[3-4]、精神疾病[5-6]、媒介传播究提供参考。
中国人群胰腺癌遗传易感性研究
中国人群胰腺癌遗传易感性研究胰腺癌目前仍是预后差,死亡率极高的消化道恶性肿瘤,5年生存率小于5%。
2008年,世界范围内估计新发病例为27万多例,估计死亡病例为26万多例,居全球恶性肿瘤死因的第8位。
近年来,全求胰腺癌的发病率已趋平稳,而我国则呈上升趋势,从70年代相对少见到2005年居常见恶性肿瘤死因的第7位。
胰腺癌高病死率的现状一直没得到改善的重要原因是由于病因尚未清楚。
目前手术切除是唯一可能的治愈方法,由于缺乏有效的早期诊断方法,多数病例确诊时已是晚期,丧失手术切除机会。
恶性肿瘤是一种慢性复杂性疾病,是环境和遗传因素长期共同作用的结果。
胰腺癌的家族聚集性提示遗传因素在胰腺癌的发生过程中扮演重要角色。
因此,开展胰腺癌的遗传易感性研究,寻找特异敏感的生物标志物应用于早期诊断,评估疗效及预后,以及应用发展新的治疗靶,对于我国胰腺癌的综合防治具有重要意义。
第一部分SWI/SNF复合物的遗传变异与胰腺癌发生风险关系研究背景:基因的异常转录是癌症发生的基础,染色质高度紧密的折叠阻止了转录因子、辅因子与DNA的结合,所以凡涉及DNA的反应都要克服染色质的高度紧密性。
ATP依赖的染色质重构复合物是利用水解ATP获得的能量来动员核小体,改变染色质的结构,使得转录因子与DNA结合,从而调节靶基因的转录。
其中交配型转换/蔗糖不发酵复合物(mating type switch/sucrosenon-fermenting, SWI/SNF)蛋白家族广泛参与细胞的分化、增殖和DNA修复,作为肿瘤抑制基因被研究得最为深入,大量的研究发现在包括胰腺癌在内的很多人类癌症中都发现SWI/SNF复合物亚基的突变或表达异常。
研究目的:分析SWI/SNF 复合物遗传变异与中国汉族人群胰腺癌发生的关系;评价SWI/SNF复合物关键基因的遗传变异基因-基因,基因-环境交互作用在于在胰腺癌发生过程中的效应。
研究方法:采用两阶段病例-对照研究系统地分析ATP依赖的染色质重构复合物SWI/SNF基因的遗传变异与中国人群胰腺癌发生风险关系。
研究基因与环境交互作用的样本量确定
和 n 3非中心参数为 n : ( , :,
l 7 l
)一 !
n ( !!用 这 种 分 布 和 非 中 一 参 数 。 以 计 p a 一 ), i f , 可 算 检 测 交 互 作 用 效 应 的 研 究 效 能 , 选 择 必 需 的 样 或
量是 值 得关 注的 问题 、以前 在 进 行基 冈与环 境 交互 作用 病 例 对照 研 究 时 , 环 境 因素 作 为分 类 变 量 , 把 遗
传 凶 素 作 为 二分 变 量 。 述 确 定 研 究 效 能 和 所 需 的 阐
基 因组 中所 占的 比例 以 隐性 的模 式 为 ! 1 和
.
样 本量 的疗 法 。Hw n a g等人用 S t G 公 式 计 算 mi P h 了二 分 环 境 暴 露 和二 分 遗 传 冈 素 的 样 本 量 , o p F pa
和 S i ema pe l n将 环 境 暴 露 分 为 多 个 等 级 ,= 些 研 g f这 I l 究 的 结 果 都 是 二 分 事 件 变 量 , 某 种 疾 病 的 发 生 如 入 f 曾 忽 视 结 果 变 黾 是 连 续 性 分 | 的状 况 . 『 ] 布 近 年 米 介 绍 计 算 研 究 效 能 的 方 法 , 受 交 互 作 用 效 应 都 定 为 0的 限 制 。 a l n等 人 考 虑 到 遗 传 因 素 对 连 续 环 u 境 暴 露 和 连 续 分 布 结 果 有 关 联 的 效 . 过 调 查 遗 通
假设 在 粜一 确 定 的常 染 色体 基 因 伉点 一 两个 卜有
不 同的等 他 基 凶 , a和 A , a是 罕 见 等 位 基 因 。 3种 有
一种基于大样本的基因-环境互作关联分析方法[发明专利]
专利名称:一种基于大样本的基因-环境互作关联分析方法专利类型:发明专利
发明人:任文龙,肖静,何书
申请号:CN202210394490.2
申请日:20220414
公开号:CN114678066A
公开日:
20220628
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于大样本的基因‑环境互作关联分析方法,通过采集目标个体的基因序列、环境信息、表型信息,构建基因‑环境检测线性混合模型,并基于预处理共轭梯度法、矩估计方法对基因‑环境检测线性混合模型进行求解,构建服从于卡方分布的基因‑环境互作得分测试统计量,然后应用基因‑环境互作得分测试统计量,完成对基因序列与环境信息是否存在互作效应的判断,该方法可以快速识别多个环境信息对基因‑环境互作位点的基因的影响,适用于大样本的基因‑环境互作关联快速检测。
申请人:南通大学
地址:226001 江苏省南通市崇川区啬园路9号
国籍:CN
代理机构:南京经纬专利商标代理有限公司
代理人:田凌涛
更多信息请下载全文后查看。
基因-基因(环境)交互作用分析方法的比较
基因-基因(环境)交互作用分析方法的比较袁芳;刘盼盼;徐进;费丽娟;郝玲妹;邱旭君;张莉娜【摘要】Three methods of analyzing the gene-gene (environment) interactions are compared in the etiology research of complex diseases to analyze their applicability conditions and the advantages and disadvantages. It shows that crossover analysis is simple and easy to apply, but only applicable for analyzing interactions of single genetic factor and single environment factor. Logistic regression is straight-forward in explaining the epidemiological significance of interaction and performs well in analyzing the main effects, but still has limitations in analyzing higher order interactions. Multifactor dimensionality reduction renders a model-free method and is sensitive to high dimensional data, but it is short of accuracy in estimating the main effects. Considering the advantages identified with each of these three methods in analyzing interaction, the author makes some efforts in this paper to integrate these methods aiming at improving effectiveness interaction analysis.%对复杂疾病病因研究中基因一基因(环境)交互作用的3种分析方法进行了比较,剖析了它们的适用条件和优缺点.结果表明:叉生分析简单易行,但只适用于分析单个遗传和单个环境因素的交互作用;Logistic回归易解释交互作用的流行病学意义且能很好地分析主效应,但在分析高阶交互作用时存在局限性;多因子降维法无需指定特定的遗传模式且对高维数据敏感,但无法估计主效应.鉴于这3种方法在分析交互作用时各有其优点,三者联合应用于交互作用分析效果更佳.【期刊名称】《宁波大学学报(理工版)》【年(卷),期】2012(025)004【总页数】5页(P115-119)【关键词】叉生分析;Logistic回归;多因子降维法;交互作用【作者】袁芳;刘盼盼;徐进;费丽娟;郝玲妹;邱旭君;张莉娜【作者单位】宁波大学医学院,浙江宁波315211;宁波大学医学院,浙江宁波315211;宁波大学医学院,浙江宁波315211;宁波大学医学院,浙江宁波315211;宁波市第七医院,浙江宁波315200;宁波市第七医院,浙江宁波315200;宁波大学医学院,浙江宁波315211【正文语种】中文【中图分类】R181;R195.1随着疾病遗传学研究的深入开展,人们发现基因对疾病的影响是非常复杂的,很多疾病并非简单的由单一基因影响,许多常见疾病和复杂性状可能是多个基因和环境因素之间交互作用的结果. 目前已有多个研究称上位性(基因-基因交互作用)在常见的复杂疾病的表型与基因型关系中发挥关键作用[1-3]. 因此,正确地分析基因-基因(环境)的交互作用对于复杂疾病的病因探索或寻找易感基因有着重要意义. 目前用于交互作用分析的方法有很多种,最常用的有叉生分析、Logistic回归、多因子降维法. 此外,还有位点交互作用的分析方法: 全交互作用模型(Full Interaction Model,FIM),贝叶斯基因关联映射法(Bayesian Epistasis Association Mapping,BEAM),最大条件嫡概率模型(Maximum Entropy ConditionalProbability Modeling,MECPM)[4]等. 近几年以决策树为基础的非参数统计方法也可用于交互作用分析,包括分类和回归树(Classification and Regression Trees,CART),随机森林(Random Forest,RF)、FlexTree[5].这些方法各有其适用性,在交互作用的检验效能方面也广泛存在争议. 笔者就应用较广泛、理论相对成熟的叉生分析、Logistic回归、多因子降维 3种方法进行了比较,阐述其在交互作用分析中的意义.1 叉生分析在统计学上,Ottman将基因-环境的交互作用定义为环境暴露因素对含有不同基因型人群的疾病影响不同,或者基因型对不同环境暴露条件下人群的疾病影响不同[6]. 叉生分析就是根据这一定义来分析基因-环境交互作用的基本流行病学单元,它主要采用2×4叉生表分析单个基因和单个环境因素的交互作用[7]. 叉生分析可适用于传统的病例对照研究、病例同胞对照研究、病例父母对照研究,也可用于单纯病例研究、不完全病例对照研究和队列研究设计的资料.1.1 2×4叉生表叉生分析中,基因和环境因素均为二分类变量(表 1),基因型和环境暴露因素可能的 4种疾病风险组合可以表示为: R11(同时暴露于环境因素和遗传因素对疾病的效应),R10(仅暴露于环境因素对疾病的效应),R01(仅暴露于遗传因素对疾病的效应),R00(遗传和环境因素均未暴露时的疾病风险). R00作为 R11、R10、R01共同的对照组,其OR=1. 交互作用的存在与否取决于相加或相乘模型的选择,若所研究的交互作用为相加交互作用,当 R11-R01≠R10-R00时认为存在交互作用,若所研究的交互作用为相乘交互作用,则当R11/R01≠R10/ R00时考虑存在交互作用. 表1 基因(G)与环境(E)因素作用2×4叉生分析表G E 病例对照 OR值意义++a b R11=ah/bg G、E联合作用效应+- c d R01=ch/dg G单独作用效应-+e f R10=eh/fg E单独作用效应-- g h R00=1 共同对照在表1的基础上还可以计算单纯病例组、单纯对照组中的OR值,对环境、遗传因素分别分层后的疾病风险信息可从表2中获得. 可以通过公式计算得到,分层之后各层的OR值之比等于基于相乘模型时的 OR值,单纯病例组与单纯对照组的 OR值之比也等于基于相乘模型时的OR值.1.2 交互作用评价指标Rothman等[8]提出了相加模型下交互作用的定量评价指标,包括交互作用指数(Synergy Index,SI)、交互作用超额相对危险度(Relative Excess Risk of Interaction,RERI)、交互作用归因比(Attributable Proportion of Interaction,AP)和纯交互作用归因比(AP*).当SI=1时,说明G、E间无相加交互作用,相互独立; SI>1,G、E间具有正相加交互作用,同时存在时效应增强; SI<1,G、E间具有负相加交互作用,同时存在时效应减低. 效应指数 SI既可用于交互作用的定性分析,又可用于交互作用的定量测量. SI绝对值越大,说明因素间交互作用越强.RERI表示两因素联合作用与其单独作用之和的差值,用于描述归因于交互作用的危险度的大小.RERI的绝对值越大,说明因素间的交互作用越强;如果没有相加模型的交互作用,RERI=0.表示G、E同时存在时,疾病的总危险性中可归因于其交互作用的比例. AP绝对值越大,说明因素间的交互作用越强.表示由G、E引起的疾病效应中归因于两者的交互作用所占的比例.交互作用为相乘模型时也可以用交互作用指数进行评价[9],当SI=1时,表明G、E间无相乘交互作用; SI>1时,G、E间存在正相乘交互作用; SI<1时,G、E间存在负相乘交互作用.叉生表计算直观,不仅能分析基因和环境因素各自的主效应,还能计算相加或相乘模型下交互作用的值. 由于使用了相同的参考组,可以对遗传、环境以及两者之间交互作用的疾病危险性进行比较. 对于病例对照研究,不仅可以计算单纯病例和单纯对照下的OR值,还可以分层估计各暴露因素的疾病相对危险度. 如果对照的选择具有良好的代表性,单纯对照中各暴露因素的OR值有助于评估人群中遗传和环境因素的分布是否独立. 但叉生分析并不适用于所有的关联研究,只能分析单个遗传和单个环境因素的交互作用,并且要求两者均为二分类变量,当研究多个因素或者暴露和结局变量为等级、连续型变量(剂量反应)时,叉生分析则无法应用. 此外,研究多个因素时,各因素之间的交互作用作为极为复杂,不能简单地描述为相加或相乘模型.表2 分层情况下因素作用的分析E+ EG 病例对照病例对照+ a b c d- e f g h 分层 OR值意义单纯病例组 ag/ce 基于相乘模型的交互作用单纯对照组 bh/df 人群中暴露因素相互独立性相乘模型R11/(R01×R10)=adgf/bceh 基于存在相乘交互作用相加模型 R11-(R01+R10-1) 基于存在相加交互作用遗传因素分层1 ad/bc 暴露于G时,E的作用遗传因素分层2 eh/fg 未暴露于G时,E的作用环境因素分层1 af/be 暴露于E时,G的作用环境因素分层2 ch/dg 未暴露于E时,G的作用2 Logistic回归模型Logistic回归是分析分类预测变量与离散性结果之间关系的常用模型,是一种参数估计方法.Logistic回归中交互项回归系数的估计是以存在相乘交互作用为基础,在分析交互作用时引入一个相乘项进入回归模型,通过相乘项回归系数的估计来判断交互作用是否有意义及其作用大小. 适用于病例对照研究、横断面研究、封闭队列研究和临床研究的资料,当变量间存在多重共线性问题时,不宜用Logistic回归.通常 Logistic回归用于分析相乘模型下的交互作用,仅当自变量为二分类变量时可估计相加交互作用,Logistic回归对连续性自变量相加交互作用估计的可行性目前研究还较少. Knol等[10]采用模拟数据及临床实际例子证明了Logistic回归在分析一个二分类变量、一个连续性变量以及两个连续性变量相加交互作用时的可行性,并且运用SI、RERI和AP定量评价交互作用. 由于该研究数据来源和样本量的局限性,Logistic回归是否可以分析连续性变量的相加交互作用还需进一步研究.2.1 Logistic回归模型分析交互作用Logistic回归模型为logit(Π)=β0+β1G+β2E+β3G×E,其中: β0 为常数项,β1、β2、β3 为回归系数,ORG=exp(β1)、ORE=exp(β2)、ORG×E=exp(β3)分别为遗传因素、环境因素及交互作用项的调整优势比,反映了各因素对疾病发生的作用. β3=0时,ORG×E=1,G、E 间无交互作用; β3>1,ORG×E>1,G、E 间存在正交互作用; β3<1,ORG×E<1,G、E 间存在负交互作用.2.2 Logistic回归模型的扩展应用Logistic回归不仅能够估计基因-基因(环境)的交互作用,还能估计各自的主效应. 偏回归系数与调整优势比OR呈指数函数关系,其流行病学意义容易解释. Logistic 回归虽有着其独有的优势,但仍存在一定的局限性. 模型估计的参数个数有限,向模型中引入主效应项时,可能的交互项会呈现指数增长趋势,这时Logistic回归就不适用于处理这种含有多个因素的交互项. Hosmer等[11]建议当模型中纳入P个参数时,P+1≤min(N1,N0)/10时为最好,其中N1为出现阳性结果的例数,N0为阴性结果出现的例数. 此外,Logistic回归对维度较敏感,由于高维空间中数据稀疏或存在例数为 0的交互项,用 Logistic回归进行参数估计时标准误较大,假阳性率较高,难以检测真正有意义的交互作用.在候选基因位点较多,样本量相对较小的情况下,容易导致模型的过度拟合,随着交互作用阶数的增多,这种局限性就更显著.由于Logistic回归在分析高维数据方面的局限性,Park等[12]提出了用惩罚Logistic回归来分析基因-基因(环境)的交互作用. 惩罚 Logistic回归是对Logistic回归模型进行简单的修正,将修正系数λ与 Logistic 回归模型相结合,进行二次方调整.Logistic回归模型的二项分布对数似然函数为:惩罚Logistic 回归模型的函数为其中: λ为正常数,λ / 2 ||β| |2 为二次方惩罚项.运用牛顿迭代和岭回归对回归系数进行估计,λ选择使似然函数最大的值. 进行二次方惩罚后,采用哑变量对研究因素进行编码,变量间的多重共线性不会降低模型的拟合度,同时解除了样本量大小对模型中因素数目的限制. 另外,应用二次方惩罚解决了因样本量较小或考虑高阶交互作用存在时高维数据稀疏以及空格子的出现导致检验效能降低的问题,维持了模型参数估计的稳定性.3 多因子降维法多因子降维法(Multifactor Dimensionality Re-duction,MDR)将多个因子看作一个多因子组合,其中的因子指的是研究的变量(基因型或环境因素),维指的是研究的多因子组合中的因子数(如基因型数目). MDR方法的主要思想是将多位点基因型之间的基因-基因或基因-环境的交互作用转换成一个具有两水平的新变量(高危、低危),从而将高维的结构降低到一维,使高阶交互作用的分析更易实现. MDR方法分析的自变量为独立分类变量,例如基因型和环境因素,结局变量为二分类变量,例如病例或对照(患病或未患病),治疗的有效或无效. MDR是一种非参数统计方法,无需指定特定的遗传模式,适用于平衡的病例对照研究和不一致同胞对研究[13].MDR分析交互作用一般包括以下几个步骤:(1)随机将研究数据分为K等份,以便进行K重交叉验证. 通常将数据分为10等份,9份作为训练数据,构建MDR模型,另外的1份为检验数据,进行交叉验证. (2)从一系列基因或分类环境因素中选择N个需研究的因子,N个研究因子即可代表N个空间维度. (3)在N维列联表中,根据每个因子不同的观察值水平,列出N个因子的多水平组合,然后分别计数每一单元格内的病例、对照例数. 例如有N个SNP,每个有m个基因型,则有Nm种基因型组合. (4)对N维列联表中的每一单元格进行分类标记,若病例对照数之比大于或等于某一阈值(例如 1)则标记为高危,否则为低危. 如果某一单元格中只有病例无对照则标记为高危,反之则为低危. 这样所有的基因型组合都能被分成高危和低危两个水平,从而有效地达到 N维结构降低到单维两水平的目的. (5)依次列出各因子组合的分类误差,选出错分误差最小的模型. (6)通过检测样本的十重交叉验证来估计模型的预测误差. 模型由 9/10的训练样本拟合,通过1/10的检验样本来估计预测误差. 为了减少数据划分造成的偶然误差,十重交叉验证重复进行10次,取10次的平均误差作为预测误差的无偏估计. 最后用预测误差的平均值筛选出最有可能存在交互作用的模型.4 讨论上述3种方法各有其优缺点,应综合考虑各方法的适用性,在实际分析中几种方法结合使用. 叉生分析简单直观,但因其只能分析单个基因和单个环境因素的交互作用而受到限制. 应用于资料分析时,可先用Logistic回归筛选具有统计学意义的变量,再运用叉生分析具体分析每两个变量的交互作用大小及相对危险度. 惩罚Logistic回归不仅能够分析样本量相对较小的高阶交互作用,而且其拟合的模型比传统Logistic回归模型更稳定.并且应用惩罚Logistic回归的逐步选择法可以较准确地将具有交互作用的因素从众多研究变量中检测出来,这是传统Logistic回归模型所不能做到的.MDR在分析各因素、各水平间交互作用时并不考虑主效应,因此当主效应没有统计学意义时,MDR仍可发现高阶交互作用,但是MDR却不能发现主效应. MDR对高阶交互作用敏感,无论是何种类型的高阶交互作用(超相乘模型、相乘模型、超相加模型、相加模型等),MDR均具有较好的统计学检验效能. 而且惩罚Logistic回归模型和传统的Logistic回归模仅适用于相乘模型的交互作用分析.因此,可将MDR和惩罚Logistic回归方法联合使用,优势互补.人类基因组关联研究和高通量基因分型技术的深入发展,产生了大量有待分析的复杂生物信息数据,对于研究基因-基因(环境)交互作用,尤其是高阶交互作用的统计学计算方法是一项重大的挑战. 目前有学者提出,分阶段进行交互作用分析可以克服计算方法的困难[14]. 例如,在第1阶段,采用快速筛选方法(如 Tuning ReliefF)选择SNPs,使整个SNP集减少到一个子集. 第2阶段,采用复杂的模型方法(如MDR)来选择SNP子集中有意义的交互作用项. 第3阶段,用假设检验来检验交互项的统计学意义. 这一方法在实际应用中是否能真正克服计算困难还有待更多的研究来验证. 尽管用于基因-基因(环境)交互作用分析的方法有多种,但目前没有任何一种方法可以适用于所有的情况,因此仍需要探索更为合适的方法.基因组关联研究中,大量SNPs的识别对于交互作用的分析是一项挑战,但同时也为进一步的深入研究提供了机遇,如果能正确合理地运用各种复杂的统计学方法,可以提高交互作用的检验效能.未来应在寻找更普遍适用的交互作用检测方法、交互作用生物学意义解释方面作出更多的努力.参考文献:[1]Thornton-Wells T A,Moore J H,Haines J L. Genetics,statistics and human disease: Analytical retooling for complexity[J]. Trends Genet,2004,20:640-647.[2]Moore J H. The ubiquitous nature of epistasis in determining susceptibility to common human diseases[J].Hum Hered,2003,56:73-82.[3]Sing C F,Stengard J H,Kardia S L. Dynamic relationships between the genome and exposures to environments as causes of common human diseases[J].World Rev Nutr Diet,2004,93:77-91.[4]Chen L,Yu G,Langefeld C D,et al. Comparative analysis of methods for detecting interacting loci[J]. BMC Genomics,2011,12:344.[5]Garcia Magarinos M,Lopez-de-Ullibarri I,Cao R,et al.Evaluating the ability of tree-based methods and logistic regression for the detection of SNP-SNP interaction[J].Annals of Human Genetics,2009,73:360-369. [6]Ottman R. Gene-environment interaction: Definitions and study designs[J]. Prev Med,1996,25:764-770.[7]Botto L D,Khoury M J. Commentary: Facing the challenge of gene-environment interaction: The two-byfour table and beyond[J]. Am J Epidemiol,2001,153:1016-1020.[8]Rothman K J,Greenland S,Lash T L. Modern epidemiology[M]. 3nd. Philadelphia: Lippincott Williams& Wilkins Publishers,2008:71-85.[9]Khoury M J,Flanders W D. Nontraditional epidemiologic approaches in the analysis of gene-environment interaction: Case-control studies with no controls[J]. Am J Epidemiol,1996,144:207-213.[10]Knol M J,Van Der Tweel I,Grobbee D E,et al.Estimating interaction on an additive scale between continuous determinants in a logistic regression model[J].International Journal of Epidemiology,2007,36:1111.[11]Hosmer D W,Lemeshow S. Applied logistic regression[M]. 2nd. Hoboken: John Wiley & Sons Publishers,2000:260-263.[12]Park M Y,Hastie T. Penalized logistic regression for detecting geneinteractions[J]. Biostatistics,2008,9:30.[13]Ritchie M D,Hahn L W,Roodi N,et al. Multifactordimensionality reduction reveals high-order interactions among estrogen-metabolism genes in sporadic breast cancer[J]. Am J Hum Genet,2001,69: 138-147. [14]Yang C,Wan X,He Z,et al. The choice of null distributions for detecting gene-gene interactions in genome-wide association studies[J]. BMC Bioinformatics,2011,12(Suppl):S26.。
基因以及基因与环境因子之间的交互作用研究
21Байду номын сангаас0 0年第 4期
网络 训练算 法 的研究更 是几乎 没有 。总 的来讲 , 目前 采用 人 工神 经 网络 技术 来 进 行雪 水 当量 遥感 反演 建模研 究 中存 在 以下 问题 :
2 1 对 人工神 经 网络 模型输 入参 数的选 择 与组合 方案研 究较 少 .
尽管 已有 一些人工 神经 网络积 雪参 数反 演建 模 的研究 , 但是 这些 研 究 中神 经 网络 的输 入 层 一 般仅使 用 了微波亮 温 , 而对 于 影响雪 水 当量 的其他 因子 ( 雪状态 、 积 地形 、 植被 、 大气 等 ) 还 未进 行考虑 。再 者 , 些 因子 中有 的可 能对雪 水 当 量 的影 响 比较强 , 的则 可 能 比较 弱 , 且 这 有 并 可 以忽略 , 因此需 要研 究建 模过 程 中 的参 数选 择 与组 合方 案 , 些 研 究 内容 当前 开展 的非常 这
取得母 亲和婴儿 的基因 , 应变量 来 自母亲 或婴儿 。 由于研究经 费有 限 , 究人员 的初始计划 响 研
是 病例 cs) ae 和对照 (o t 1的比例是 1 5或稍 高 , 决于 g n tpn cnr ) o : 取 e oy ig的费用 , 实验对 象 的参
与情 况和 当时研究经 费的状况 。常用 的分 析方 法是 l i i o s c回归模 型 。这 类 分析 通常 有效 但 gt
P n sl na 的 一 些研 究 人 员 正 在 进 行 几 项 NI 资 助 的 项 目, 如 , rtr BrhSu y e ny a i v ) H 例 P ee m i td , t P ec mpi Su y rel s td 。在这些 研究 中 , a a 研究 人员 希望能 找到 与母 亲孕期前 后 身体健 康高 度相关 的基 因并 结合 临床 试验 以期 找到更 好 的治 疗方案 。在 这两个 研究 中 , 研究 人员 已取 得或 即将
第3讲基因-环境交互作用研究概况.
基因-环境交互作用研究概况南京医科大学王守林一、概述疾病都是在致病因素的损伤与机体的抗损伤作用下,因机体稳态调节紊乱而发生的异常生命活动过程。
致病因素主要是来自机体内在或外在的一些因素,是引起疾病发生的必不可少的因素,像传染病那样用单一因素来解释其他疾病的发生已不能满足今天人类对致病因素的认识,许多疾病的发生是遗传因素和环境因素综合作用的结果。
复杂疾病一般由多种遗传与环境因素以及它们的相互作用造成的,在人群中比较常见的,如糖尿病、肥胖症、骨质疏松症、高血压、心血管疾病、自身免疫性疾病等。
复杂性疾病和单基因疾病的一个最显著的区别在于,它不依照经典的孟德尔模式遗传。
在复杂性疾病中,很多位点相互作用并且和环境因素一起影响疾病的形成。
疾病的临床表型一般是几种不同的中间表型的复合体,这些中间表型背后有不同的遗传和环境因素的作用。
复杂性状疾病具有以下特点:遗传模式尚未确定、群体遗传异质性强、外显率低、多基因参与、单一基因作用微弱,同时还受一组环境因素的作用。
遗传因素和环境因素对复杂疾病的作用的分析方法有比较成熟和完备的理论和实践基础,但遗传因素与环境因素交互作用研究方法还不是很成熟。
有证据表明,很多复杂疾病(如:肿瘤、肥胖、高血压等)实际是多基因与环境交互作用的共同结果,因此如何正确分析和评价基因和环境的交互作用在复杂疾病病因学上的作用就显得至关重要。
此外,对于认识和消除致病因素,对疾病的预防、诊断和治疗也具有重要意义。
(一)遗传变异—内因遗传变异几乎与所有的疾病发生有关,基因在有序调控机制下的正常表达是健康的基础。
某个或某些基因的突变、缺失或调控障碍,使相应的蛋白质结构或功能发生变异,导致细胞对环境改变的应答反应失常并引起疾病发生。
遗传变异至少部分解释了对暴露于同样环境因素之后的这种患病危险的个体差别。
由遗传基础决定个体患病的危险,称为遗传易感性,而由环境因素决定个体患病的危险,称为获得易感性。
遗传易感性是多基因遗传中使用的一个特定概念,易感性高,患病的可能性就大;易感性低,患病的可能性就小。
基因与环境对疾病影响的交互作用研究方法
mo d e 1 ) , 即环 境和 遗传 因素 对 疾 病 的发 生 无 单 独 效
应 ,只有两 者 同 时 作 用 时 才 能 改 变 疾 病 发 生 的 风 险 ;遗 传 修饰 模 型 ( G — mo d i f i c a t i o n mo d e 1 ) ,即环
秘密 的解 开 。基 因与疾 病 关联性 研 究 已成为 目前 的
中 国 预 防 医学 杂 志 2 0 1 5年 1月 第 1 6 卷 第 1期 C h i n P r e v Me d ,J a n . 2 0 1 5 ,Vo 1 . I 6 No . 1
・ 7 5 ・
・
综 述 ・
基 因与 环 境 对 疾 病 影 响 的交 互 作 用 研 究 方 法
境 因素不存 在 独 立 效 应 ;环 境 修 饰 效 应 模 型 ( E — mo d i f i c a t i o n mo d e 1 ) ,即遗传 不存 在 独 立 效 应 ;遗 传 环境 修 饰 模 型 ( GE — mo d i f i c a t i o n mo d e 1 ) ,即 环 境 和遗 传 因 素 均 能 改 变 疾 病 发 生 的 风 险 。基 因一 基 因交互 作用 同样 也存 在单 纯 交互作 用模 型 和多种 危 险修饰 模 型 ( r i s k ~ mo d i f i c a t i o n mo d e 1 ) ,单 纯 交 互
同作用 才能 改变 疾病 的发 生 风险 ;多种 危险 修饰模
型 指两 位点 单独 或 同时存 在 与疾病 的发 生都 有一 定
对 照设 计 、纯 病 例 设 计 等 设 计 方 法 ] 。本 文 就对 分 子 流行病 学 中 的交互 作用 、交 互作 用 的研究 设 计
三基因拟合 p 值
三基因拟合 p 值三基因拟合p值是一种常见的生物统计学方法,用于研究基因与疾病之间的关系。
在过去的几十年中,人们已经发现了许多与疾病相关的基因。
然而,单个基因通常只能解释疾病发生的一小部分原因。
因此,研究人员开始尝试将多个基因组合起来,以更好地解释疾病的发生和发展。
在这篇文章中,我们将探讨三基因拟合p值的原理、应用和局限性。
一、三基因拟合p值的原理三基因拟合p值是一种用于评估三个基因与疾病之间关系的统计方法。
这种方法通常用于研究复杂疾病,如癌症、糖尿病、心血管疾病等。
其原理是将三个基因的遗传变异结合起来,评估它们对疾病的贡献。
具体来说,三基因拟合p值是通过比较观察到的数据和预期数据之间的差异来计算的。
预期数据是基于人口统计学数据和三个基因的遗传变异频率计算的,而观察数据是从疾病患者和健康人群中收集的。
在计算三基因拟合p值时,我们需要考虑几个因素。
首先,我们需要确定三个基因的遗传变异类型,例如单核苷酸多态性(SNP)或结构变异。
其次,我们需要确定每个变异的频率。
最后,我们需要确定每个变异与疾病之间的关系。
这些因素将被用于计算每个个体的三基因拟合p值。
如果一个人的p值小于预设的阈值,那么这个人就被认为是与疾病相关的。
二、三基因拟合p值的应用三基因拟合p值是一种广泛应用于生物医学研究中的统计方法。
它可以用于研究复杂疾病的遗传基础,评估基因组的复杂性,并为个性化医疗提供指导。
以下是三基因拟合p值的一些具体应用:1.评估基因组的复杂性研究人员通常使用三基因拟合p值来评估基因组的复杂性。
简单地说,如果一个疾病只与一个基因相关,那么我们可以使用单基因关联研究来研究这个疾病。
但是,如果一个疾病与多个基因相关,那么我们需要使用三基因拟合p值来评估这种复杂性。
2.研究复杂疾病的遗传基础三基因拟合p值可以用于研究复杂疾病的遗传基础。
例如,研究人员可以使用三基因拟合p值来研究糖尿病的遗传基础。
他们可以选择三个与糖尿病相关的基因,计算每个个体的三基因拟合p值,并比较糖尿病患者和健康人群之间的p值分布。
基因-基因(环境)交互作用分析方法的比较
C R ) 随机森林(ad m F r tR ) FeTe . A T, R n o oe , F 、 l r J s x e 这些方 法各有其适用性, 交互作用的检验效能 在 方面也广泛存在争议. 笔者就应用较广泛、理论相
法估计主效应. 于这 3 鉴 种方法在分析交互作 用时各有其优点,三者联合应用于交互作用分析效
果 更佳 .
关键 词 :叉 生分析 ;L gs c回 归;多 因子 降 维法;交互作 用 o ii t
中图分 类号 : 8 : 9 . R1lR151
文 献标 识码 : A
文 章编 号 :0 153 2 1 10—12( 02)0—l50 40 l-5
对成熟的叉生分析 、L g t oii sc回归 、多因子降维 3 种方法进行 了比较 ,阐述其在交互作用分析 中的
意义 .
1 叉 生分析
在统计学上, t a 将基因 一环境的交互作用 Ot n m 定义为环境暴露 因素对含有不 同基因型人群的疾 病影 响不 同, 或者基因型对 不 同环境暴露 条件下 人群的疾病影响不 同【 叉生分析就是根据这一定 6 】 . 义来分析基因 一 环境交互作用的基本流行病学单 元, 它主要采用 2 4 x 叉生表分析单个基因和单个环 境 因素 的交 互作 用[ .叉生分析可适 用于传统 的 病例对照研究 、 病例同胞对照研究 、 病例父母对照 研究, 也可用于单纯病例研究 、 不完全病例对照研 究和 队列研究设计的资料. 11 x . 2 4叉 生表 叉生分析 中, 因和环境 因素均为二分类变 基 量( 1 基因型和环境暴露因素可能的 4种疾病 表 ) , 风险组合可以表示为: 1( R 同时暴露于环境因素和 1 遗传因素对疾病 的效应) R 0仅暴露于环境因素 , 1(
【doc】配对病例对照研究基因与基因交互作用样本量的确定
配对病例对照研究基因与基因交互作用样本量的确定中华流行病学杂志2004年7月第25卷第7期i』垦pi!!』!:!:!?623?基础理论与方法?配对病例对照研究基因与基因交互作用样本量的确定王志萍李会庆【摘要】目的采用配对病例对照研究探讨基因与基因交互作用所需的样本量.方法logistic回归分析原理建立两基因与一种疾病相关性模型,以模拟参数值回代计算样本量,计算过程以QU?uNTO软件完成.结果(1)基因交互作用越大,所需样本量越少;基因型分布频率P为35%(相当于显性遗传模型易感基因频率等于0.20,阴性遗传模型易感基因频率等于0.60)时,基因交互作用的样本量最少:如两基因主作用均为2,基因交互作用为2时样本量为700例;基因交互作用为5时样本量为200例.(2)探讨基因主作用与探讨基因交互作用所需的样本量不同.结论提供了可供查阅的两基因交互作用样本含量值.【关键词】病例对照研究;基因交互作用;样本量Samplesizerequirementsforassociationstudiesongene—geneinteractionincase—controlstudyWANGhi—ping.LIHui—qing.CollegeofPublicHealth,ShandongUniversity,Jinan250012,China Correspondingauthor:LIHui—qing.E—mail:***********************【Abstract】0bjectiveSamplesizerequirementsforassociationstudiesongene—geneinteractionincase-controlstudy.MethodsSelectingdifferentparameters(suchasinheritancemode,susce ptibilityfrequency,frequencyofallelefordisease,ORofgenemaineffect)andinfillingthemintoQUA NTOsoftwarebasedonconditional1ogisticregressionmode.Results(1)Themainparametersinfl uencingthe samplesizerequirementswerethelevelsofinteractionbetweengenesandthesusceptibilityfr equency.The numbersofsamplewerethesamebetweenrecessiveanddominantwhensusceptibilityfreque ncywerethesame.(2)Samplesizefortestingofgene—geneinteractionwasdifferentfromthatfortestingofgeneticeffects.ConclusionItwasconvenienttOusethenumbersofsamplesizefromtheresultsforgen e—geneinteractionincase—controlstudy.【Keywords】Case—controlstudy;Gene—geneinteraction;Samplesizerequirements 目前认为约5%的疾病属于基因缺陷性遗传病,绝大多数疾病的发生与基因的易感性有关.易感基因及基因与基因之间交互作用的研究为新热点之一,病例对照研究是最常被采用的研究方法之一.由于基因研究花费高,用最小的样本获取最佳结果是设计的重要问题.本文旨在提供采用匹配的病例对照设计方法研究基因与基因间交互作用,所需要的样本量大小.基本原理1.符号注释:设D代表疾病;g与h代表两个要研究的等位基因,分别有三个基因型(从,Aa,aa和BB,Bb,bb),其中A和B分别为易感基因位点,作者单位:250012济南,山东大学公共卫生学院(王志萍);山东省医学科学院基础医学研究所(李会庆)通讯作者:李会庆E.mail:huiqing4192@hotmailcornqA和qB分别表示g和h等位基因位点上A和B的携带频率.假定两基因位点不连锁.根据Hardy—Weinberg遗传平衡定律,g基因的各种基因型在人群中分布频率P,(g/q)分别为从=,Aa=2qA(1一q),aa=(1一q).同理,h基因的各种基因型在人群中分布频率P,(h/qB)分别为BB=,Bb=2qB(1一qB),bb=(1一qB).定义致病基因模型:当g=AA或h=BB时G(g)或G(h)=1;当g=aa或h=bb时G(g)或G(h)=0;当g=Aa或h:Bb时,G(g)或G(h)=6,其极限形式6=0为隐性遗传模型,而6=1为显性遗传模型.易感基因g与h相对危险度近似值(OR)以R和表示,=exp(~3g)和=exp(~),易感基因g与h交互作用(为相乘模型)OR值以R表示.疾病的本底发生概率为Pn.624?中华流行病学杂志2004年7月第25卷第7期ChinJEpidemiol,July2004,V o1.25,No.72.样本量的计算:采用条件logistic回归分析方法建立两种基因(g和h)与疾病D相关性及基因间交互作用的研究模型'.则N个配对样本其相应的条件似然值)=Ⅱ.半(1)式中,"1"代表病例,M(i)为每一匹配的对子中病例和对照的个数.当H=0时G的相对危险度R=exp (),当G=oNH的相对危险度R=exp(p).当G>0151H>0时相对危险度用R×R计算:R= exp(13).Rgh≠1表示存在交互作用.对数似然函数的最大预期值L的估计值£计算方法L=In[L(,,)](2)L.=In[L(,)](3)公式(3)表示基因g和h之间没有交互作用.样本量的计算公式(双侧检验)为()N=——(4)2(£.一L.)无效检验假设(Ho):&=0,即两个基因之间无交互作用.采用QUANTO软件(该程序可从/gxe下载)计算样本量大小.运行该程序时,首先在studydesign栏选择case—controlstudy;在hypothesis栏选择gene—gene interaction;在geneG和H两栏分别设定基因G和H的allelefrequency,inheritancemode:dominantor recessive,susceptibilityfrequency参数值;在disease riskmodel中设定baselinerisk水平,geneG和gene H的主作用以及交互作用水平;在power栏设定power,typeIerror,one—sidedortwosided;最后在calculation栏得到基因主作用和交互作用样本含量. 实例分析1.显性模型基因交互作用研究所需样本量:(1)易感基因携带率qa与q相同时交互作用样本量:在显性模型中,R,R和R各设定4个水平.结果提示:①不同qa或q对应不同样本量.当qA或qB为0.05(基因型频率P,为10%)时,样本量最大;qA或q为0.15~0.25(P为28%~44%)时,样本量最低.②相同R和R水平,随交互作用水平增加,样本量明显下降.例如,qA或q为0.2,R和R取值为2,R=2时样本量为696;R=3时样本量为322.③当基因间交互作用水平不同时,基因主作用R和R取值越大,样本量相应增大(表1).表1显性模型中易感基因不同携带率的交互作用样本含量(2)两易感基因携带率q与q不同时交互作用样本量:q和q可有很多种取值,形成多种组合方式.从稀有基因和常见基因中,分别取7个位点组合,选取R,R和R等于2和5两个水平,交互作用的样本量如表2所示.结果表明:①与表1比较,当qA或qB不同时,其样本量位于较低携带率样本量与较高携带率样本量(当两基因位点携带率相同时)之间.②R,R和R相同,qA或qB从稀有基因到常见基因,样本量逐渐减少,qA或q为0.15~0.25时,样本量最小.③R对样本量的影响远大于R和R.2.隐性模型中两基因间交互作用研究所需样本量:该模型两基因位点携带率相同时的样本量如表3示:①随q或q增加,样本量减少.qA或qB为0.5~0.6(P,为30%~36%),样本量最少.②随交互作用水平增加,样本量明显下降.③相同的RR和R增大时样本量相应增大.④第五组表示R和R不同组合时样本量.中华流行病学杂志2004年7月第25卷第7期c}JEp—idem—iol,』ly,,o,.13.显性模型与隐性模型样本量的相关性:按照Hardy—Weinberg平衡定律,如果隐性遗传方式qA=0.25,基因型频率P,为0.25的开平方0.5,如果显性遗传方式,P,则为0.4375.尽管隐性遗传方式中qA或qB与显性遗传方式中qA或qB不同,但表4示相同的P,,显性和隐性遗传方式所对应的样本含量一致,并随着P,的增加样本量明显减少.P,<0.2时,样本量>1000;当P,=0.35时,样本量最低;P在0.35以上,样本量逐渐增加.4.基因主作用的样本量:表5结果显示,当基因间无交互作用(R:1)时:①研究基因主作用所需的样本量明显小于研究交互作用的样本量.②与交互作用中样本量和P,之间规律相同,当P,<0.35时基因主作用所需的样本量随P增加而明显减少;P,:0.35时样本量最小;P,>0.35样本量增加.③与交互作用中样本量和R,R之间规律不同,当基因间无交互作用时,主作用样本量随R和R增加逐渐降低.5.疾病本底发生概率与样本含量:上述样本含量计算前提示该基因在人群中发病风险Po=0.0001.当Pb增加到0.005时,对样本量影响较小.讨论不同的设计方法达到同样检验效率所需的样本量大小不同.采用病例对照设计方法研究基因与基因交互作用,主要影响因素为疾病遗传模型,基因的易感性,基因的相对危险度,疾病本底发病风险,检验水准和把表2显性模型中易感基因携带率不同组合时交互作用样本含量625?626?中华流行病学杂志2004年7月第25卷第7期ChinJEpidemiol,July2004,V o1.25,No.7握度等.检验水准和把握度在设计中往往为定值.表4基因型频率P,不同遗传方式与样本量关系*数字计算条件为R=2,Rh=2,Rh=2,19o=0.0001表5基因主作用样本量1.易感基因携带率,基因在人群中分布频率与样本含量:在基因相对危险度,基因交互作用水平一定时,样本含量主要取决于易感基因携带率,基因型频率.易感基因携带率对样本量的影响受疾病模型的影响.尽管显性基因与隐性基因携带率不同,按基因型频率所计算的样本量在两疾病模型中的规律相同.当基因型频率P,小于0.01时,样本量较大,研究难于实施.当基因型频率P,在0.25~0.40(显性模型和隐性模型基因携带率q或q分别为0.13--0.23和0.5~0.63)左右,基因交互作用样本量较少,以P为35%时样本量最低.如果交互作用Rh=2(R=2,Rh=2)时,所需样本量低于1000;如果交互作用R=5(R=2,R=2)时,所需样本量在200左右.当两个易感基因携带频率不同时,交互作用样本量介于较低携带率所需样本量与较高携带率样本量之间.2.基因交互作用,基因主作用与样本量:与基因主作用增加时样本量减少的规律相同,随基因交互作用增大,交互作用的样本量明显减少.研究基因主作用的样本量远低于研究基因交互作用所需要的样本量.在探讨两个基因与疾病关系时,按主作用参数确定样本量以研究两个基因各自对疾病的影响.如果研究条件许可,可按研究基因交互作用所需的样本量进行基因之间交互作用的研究.不能用研究基因主作用的样本量研究基因与基因之间的交互作用,否则将得出错误的结论.3.病例对照设计适用于罕见疾病危险因素的研究,疾病的发生频率变化对样本量计算影响很小. 4.该软件计算研究设计样本量是采用人群中的无关正常者作为对照,根据OR值的交互作用乘法模型,同时假设从等位基因型的危险度为(R)的前提下计算的,且仅适用于两基因存在相乘交互作用的情况.参考文献1GauderrnanWJ.Samplesizerequirementsforassociationstudiesof gene—geneinteraction.AmJEpidemiol,2002,155:478—484.2GaudermanW,MorrisonJ.QUANTOdocumentation.[V ersionO. 4.2(Beta)]LosAngeles,CA:DepartmentofPreventiveMedicine, UniversityofSouthernCalifRnia,2001.3WitteJS,GaudermanWJ,ThomasDC.Asymptoticbiasand dfficiencyincase?controlstudiesofcandidategenesandgene—environmentinteractions:basicfamilydesigns.AmJEpidemiol, 1999.149:693.705.4Garci~ClosasM,LubinJ.Powerandsamplesizecalculationsin case-controlstudiesofgene—environmentinteractions:commentson differentapproaches.AmJEpidemiol,1999,149:689—692.5倪宗瓒,主编.卫生统计学.第4版.北京:人民卫生出版社, 2000.159.167(收稿日期:2003.09.02)(本文编辑:张林东)。
基因与环境的交互作用研究
基因与环境的交互作用研究基因与环境的交互作用研究是生物学和心理学领域的重要研究方向之一、这个领域的研究者试图探索基因和环境之间的相互作用如何影响个体的发展和行为。
这对于人类健康、疾病预防和治疗等方面具有重要意义。
本文将从实验设计、研究方法和应用方面综述基因与环境的交互作用研究。
首先,实验设计是基因与环境交互作用研究的关键环节。
实验者需要设计能够反映基因和环境交互效应的实验,并采集相应的数据进行分析。
一种常用的实验设计是孪生研究。
通过比较一对一卵和二卵双胞胎,研究者可以探索基因和环境对特定性状的贡献程度。
与此同时,家庭研究也是一个常用的实验设计。
该实验设计通过比较不同家庭环境下的亲子或兄弟姐妹,探索亲代基因和环境如何影响后代的发展和行为。
其次,研究方法是基因与环境交互作用研究的关键。
一个广泛使用的研究方法是相关性分析。
通过测量一组基因和环境因素,并计算它们之间的相关性,研究者可以确定基因和环境之间的相互作用程度。
此外,研究者还可以采用多变量统计分析方法。
这些方法允许研究者同时考虑多个基因和环境因素,以便更好地了解它们之间的相互作用。
基于基因与环境交互作用的研究成果,已经在多个领域找到了广泛的应用。
例如,在医学领域,研究者已经发现了许多与遗传相关的疾病的基因,并开始关注环境因素在疾病发生中的作用。
通过了解基因和环境之间的交互作用,医生可以更好地预测和治疗疾病。
此外,在心理学领域,研究者已经发现了基因和环境对人类行为和心理健康的影响。
这些研究成果有助于我们更好地理解人类行为的复杂性,并提供个性化的治疗方法。
尽管基因与环境交互作用研究取得了一些重要的突破,但仍然存在一些挑战。
首先,基因和环境之间的相互作用非常复杂,因此需要采用多种尺度和方法来研究。
其次,由于基因和环境都是动态的,不断变化的,研究者需要考虑到长期和短期的影响,并随着时间的推移进行观察。
总之,基因与环境交互作用的研究在生物学和心理学领域具有重要的意义。
研究中的基因与环境交互作用
研究中的基因与环境交互作用基因与环境交互作用一直是研究领域的热门话题。
人们对于基因和环境的影响是如何相互作用的,一直都存在着很大的兴趣。
随着研究技术的不断发展,目前已经有了很多对于基因与环境交互作用的研究成果。
那么这些成果是如何被发现的呢?一、什么是基因与环境交互作用首先,我们需要明确什么是基因与环境交互作用。
简单地说,基因与环境交互作用就是指人的遗传基因和周围环境之间互相影响、互相作用的过程。
也就是说,人的基因会决定他们对于环境的反应,并且环境的影响也会影响到人的基因表达。
例如,一个人的基因可能会决定他对于某种食物的反应。
如果他的身体不能很好地处理这种食物,那么他就会在吃了这种食物之后感到不舒服。
另一方面,环境对于这个人也会有影响。
如果他身处在一个很热的环境中,那么他的身体会更难以处理这种食物。
二、研究基因与环境交互作用的方法那么,在科学家们研究基因与环境交互作用的时候,都采用了哪些方法呢?首先,研究人员通常会使用动物模型来研究基因与环境交互作用。
通过对于动物模型进行基因编辑,科学家们可以研究不同的基因表达与环境之间的关系。
另外,研究人员也会使用人类研究方法来研究基因与环境交互作用。
例如,通过对大型人类基因组信息数据库进行分析,研究人员可以探索不同的基因变异和环境因素之间的关系。
三、基因与环境交互作用的研究成果在现代科学中,已经有很多对于基因与环境交互作用的研究成果了。
以下是其中的一些例子:1.基因对于肥胖的影响一些研究表明,肥胖与基因之间存在着密切的关系。
科学家们已经发现几十个与体重和肥胖相关的基因突变。
不过,基因并不是决定肥胖的唯一因素。
环境因素(例如饮食和生活方式)也会影响到一个人的体重。
2.基因对于心脏病的影响心脏病与遗传学之间也存在着密切的关系。
某些基因突变会使人更容易患上心脏病。
但是,这也取决于其他环境因素,例如高胆固醇饮食、高血压、糖尿病等等。
3.基因对于癌症的影响癌症与遗传学之间的关系亦是十分复杂的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
AA 、A a、aa 在人群中的频率分别为 qA 2、2 qA (1- qA )
和 (1- qA ) 2。 假设环境因素和遗传因素在人群中独
立存在。
定义协变量 G (g) , g 为易感基因型时 G (g) =
1, 否则 G (g) = 0。如果遗传模式为显性, 易感基因型
为 AA、A a, 即基因型 AA、A a 的人群患病的危险性
对于一个含有 N 个样本单位的样本, 其条件似 然函数为
N
L (Β, Β, Β ) = ∏ ∑ e g e ge
eΒgG il+ ΒeE il+ ΒgeG ilE il
i= 1
ΒgGij+ ΒeE ij+ ΒgeGijE ij
(2)
j ∈M ( i)
式中 l 代表病例,M ( i) 表示每个样本单位中的
172 1. 05
10 92 隐性 2 1078
86 1. 07 1058 1. 02
5 181
173 1. 05
10 92 0. 01 显性 2 11547
87 1. 06 10432 1. 11
5 1988
1472 1. 35
10 985 隐性 2 11547
598 1. 65 10861 1. 06
大于或小于基线人群 (基因型为 aa) ; 而遗传模式为
隐性时, 易感基因型为AA。所以遗传模式为显性和
隐性时, 人群中的易感基因型频率分别为 qA 2 + 2qA
(1- qA ) 和 qA 2。 文中用 G 代表 G (g)。 建立的 log istic 模型为
P r (D =
1
G, E)=
eΑ+ ΒgG+ ΒeE + ΒgeGE 1+ eΑ+ ΒgG+ ΒeE + ΒgeGE
1 研究方法简介
1. 1 配比- 病例对照研究 (ma tched ca se-con trol study) 病例和对照来源于同一人群, 对照是未患 所研究疾病的个体且与病例在匹配因素上保持一 致, 每个样本单位包含一个病例和 m 个对照, m = 1 时称为配对 (p a ir m a tch ing)。 这种方法可以排除匹 配因素的干扰。在研究遗传因素时, 由于不同种族之 间基因型频率可能会有差别, 所以应对病例和对照 的种族进行匹配以避免人群分层偏倚。此外, 年龄也 是复杂疾病研究中的一个匹配因子, 因为患病的危 险性常随年龄的增大而改变。 1. 2 病例- 同胞研究 (ca se- sib study) 病例- 同 胞研究的对照是从病例未患所研究疾病的同胞中抽 取的, 每个样本单位含一个病例和一个同胞。如果该 病的发病年龄不定, 则要求对照在病例的年龄时未 患病, 这就把对照限制为年长同胞了。如果环境因素 暴露水平长期不稳定, 这一限制条件会对环境因素 的研究结果造成影响, 但在遗传因素及其交互作用 的研究中则不存在这个问题。 1. 3 病例- 父母研究 (ca se-paren t study) 以病例 的父母作为对照, 每个样本单位包括病例及其父母
定义协变量 G (g)、H (h) , 同前文。文中用 G 和 H 分
别 G (g) Biblioteka H (h)。建立的 log istic 模型为
P r (D =
1
G,H
)=
eΑ+ ΒgG+ ΒhH + ΒghGH 1+ eΑ+ ΒgG+ ΒhH + ΒghGH
(3)
两 位点单独作用时的比值比 (odd s2ra tio ) 分别
Nr
0. 01 显性 2 16119 15444 1. 04
5 2347
2044 1. 15
10 1030 隐性 2 16119
804 1. 28 15714 1. 03
5 2347
2158 1. 09
10 1030 0. 20 显性 2 1078
883 1. 17 1054 1. 02
5 181
【作者单位】安徽省生物医学研究所, 安徽 合肥 230032 【作者简介】汪 媛 (1977- ) , 女, 安徽寿县人, 在读硕士研
究生。 主要研究方向: 分子遗传流行病学。
共三人。这种方法可以消除人群分层的影响, 避免种 族差异的混杂作用。
研究基因- 环境交互作用时, 前两种方法要求 收集病例和对照的遗传、环境暴露资料, 而病例- 父 母研究对父母的环境暴露资料不作要求。 研究基因 - 基因交互作用时, 病例- 父母研究亦与其他方法 不同 —— 不需要父母表型的资料。
位基因。g 和 h 位点的易感基因频率分别用 qA 和 qB
表示。假设两位点均符合 H a rdy2W einberg 平衡且不
连锁, 那么 g 位点 AA、A a 和 aa 基因型在人群中的
频率分别为 qA 2, 2qA (12qA ) 和 (12qA ) 2, h 位点各基因
型在人群中的频率分别为 qB 2, 2qB (12qB ) 和 (12qB ) 2。
eΒgG il+ ΒhH il+ ΒgeG ilH il
i= 1
ΒgGij+ ΒhH ij+ ΒgeGijH ij
(4)
j ∈M ( i)
各符号意义同式 (2)。
与基因- 环境交互作用研究相似, 应用病例-
父母研究时, 公式 (4) 的分母包含的是病例和病例的
15 个“假同胞”。
病例- 父母研究与其他方法的另一个不同点是 由公式 (1) 和 (3) 得到的 eΒ 不是比值比, 而是相对危 险度 (rela tive risk)。对于罕见疾病, 相对危险度等同 于比值比。 也有研究者提出, 在病例2父母研究中应 用泊松回归分析能扩展到对母系遗传性状和无亲本 资料的研究。为方便起见, 文中比值比和相对危险度 均用 R 表示。 2. 2 不同研究方法样本量的比较 2. 2. 1 样本量计算软件 本文计算样本量应用的 是由美国南加利福尼亚洲大学医学院的W. J am es Gauderm an 和 John M o rrison 共同开发的 QU AN 2 TO 软件。这是一种用于W indow s 系统的软件, 界面 友好, 能计算基因- 环境、基因- 基因交互作用研究 的样本量和检验效能。只需将研究方法、参数以及检 验水准输入程序, 就可以根据预定检验效能计算出 所需样本量, 或根据样本量计算出研究的检验效能。 该软件可从美国南加利福尼亚洲大学网站 (h ttp: hyd ra. u sc. edu gxe) 免费下载。 2. 2. 2 样本量比较
设人群中所研究疾病的患病率为 0. 01, 要求研 究的效能达到 80% , 显著性水平为 0. 05, 计算三种 方法所需样本量, 并计算配比病例- 对照研究与其 他方法样本量的比值 r, r> 1 说明其他方法比配比 病例- 对照研究效率高。
为 O R g= eΒg, O R h = eΒh, 两位点共同作用的比值比为
O R gO R h, 交互作用的比值比为O R gh= eΒgh。与O R ge相
似, O R gh 可以检验两位点的交互作用是否符合相乘
模型。R gh≠1 说明存在交互作用。
若有N 个样本单位, 条件似然函数为
N
L (Β , Β , Β ) = ∏ ∑ e g h gh
所有对象。
对于配比病例- 对照研究和病例- 同胞研究, 公式 (2) 的分母包含病例及其各个对照的信息; 对于 病例- 父母研究, 分母包含的是病例和病例的三个 “假同胞”的信息。 所谓“假同胞”是指根据病例父母
的基因型推论得到的病例其他可能的基因型。 如父
母的基因型均为 A a, 病例的基因型为 AA , 则病例
表 1 单纯交互作用模型基因- 环境交互作用研究样本量 Table 1 Sam ple size of stud ies of pure
环境因素 Pr (E= 1)
0. 20
0. 50
gene-env ironm en t in teraction
遗传因素
病例- 对照 病例- 同胞
Pr (E= 1) 遗传模式 Rge N
汪 媛
W ang Yuan
【文献标识码】A 【中图分类号】R 181. 33; R 181. 2 【文章编号】100826013 (2003) 0220138214 【关键词】 流行病学, 分子; 流行病学方法
基因- 环境和基因- 基因交互作用在疾病发病 中的作用日益引起人们的注意, 相应的流行病学研 究也逐渐增多。 本文对三种基因- 环境和基因- 基 因交互作用研究方法的样本量进行了比较, 这三种 方法分别是配比病例- 对照研究、病例- 同胞研究 和病例- 父母研究。
80 1. 15 830 1. 30 124 1. 46 59 1. 56 11499 1. 00 1976 1. 01 981 1. 00 7514 1. 54 1140 1. 74 519 1. 90 763 1. 01 166 0. 95 109 0. 86 624 1. 24 125 1. 26 78 1. 21
·138· ◇方法学◇
C h in J D is C on trol P rev 2003 A p r; 7 (2)
几种基因- 环境、基因- 基因交互作用研究方法的样本量比较
Sam ple size of stud ies of gene-env ironm en t and gene-gene in teraction
其他三种可能的基因型为A a (父源基因 A , 母源基
因 a)、aA (父源基因 a, 母源基因 A ) 和 aa (父源基因
a, 母源基因 a)。
2. 1. 2 基因- 基因交互作用 g 和 h 分别表示某