Nature Genetics上的肠道菌群GWAS研究是怎么做的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Nature Genetics上的肠道菌群GWAS研究是怎么做的
木子君
肠道菌群与人类健康的密切关系越来越受到重视,已经成为时下最热门的研究方向之一。被称为人类“第二基因组”的肠道菌群除了受到环境、饮食、疾病等因素的影响以外,还在一定程度上受到遗传因素影响,也就是说肠道微生物会受到宿主基因的控制。例如已报道的乳糖编码基因(lactase gene,LCT)与双歧杆菌的关联性(Goodrich, Davenport et al. 2016)。尽管这种概念已被广泛接受,但是基于GWAS的肠道菌群研究还很有限,到底有多少微生物受到宿主基因的影响,以及这种关联如何影响健康和疾病的发生,都非常值得研究。
那么一篇肠道菌群的GWAS研究如何做,怎样才能发到高水平的期刊呢?今天就以2016年发表在Nature Genetics上的一篇文章为例,讲讲肠道菌群的GWAS研究思路。
Genome-wide association analysis identifies variation in vitamin D receptor and other host
factors influencing the gut microbiota
本文主要利用1812人样本集进行GWAS研究,发现了一系列影响肠道菌群induvidual bacteria 和β-diversity的SNP。之后针对VDR基因上的SNP为例,研究了该基因影响肠道微生物的机制。
大致可以把这篇文章的思路分为三步:
下面我们看看作者如何一步步有理有据地走下来。
第一步:全基因组关联分析
本文的数据来自两个人群(PopGen和FoCus),共1812个样本有肠道微生物的16S测序以及SNP芯片数据。同时还有性别,年龄,吸烟状况,饮食情况等一些对于肠道微生物有影响的环境因素数据。
1. 前期处理
1.1 协变量
在做关联分析之前,要先确定协变量,校正其他因素对于肠道微生物的影响。经过相关性分析发现年龄,性别,吸烟,饮食等情况对于肠道微生物的影响都是显著的(图1),因此都被纳入关联分析作为协变量。
1.2微生物筛选
其次对于微生物信息也做了一些筛选。16S测序得到了38个门和174个属的丰度信息,但是有的分类单位丰度非常低,在实验中的稳定性很差。因此作者设计了一个实验:对于10个样本做三次测序的技术重复,并计算两两重复之间的相关性。发现reads大于40时技术重复的相关性r2达到0.97(图2),因此将低于40的分类单位都去除了。最终剩下58个分类单元(core measurable microbiota)用于后期关联分析。
1.3 人群分层
关联分析之前的质控,要检验样本是否有人群分层。根据计算总体的λGC = 1.00,因此没有人群分层(图3)。后面关联分析时还是将遗传的前3个主成分作为了协变量进行了校正。
1.4 关联分析
样本: n=1812(FoCus + PopGen)
微生物数据: 58个分类单元和40个40 species-level OTUs.
SNP: MAF >0.05 , IMPUTE2 INFO criteria >0.8.
模型: 负二项分布模型.
协变量: BMI, 年龄,性别,遗传主成分1-3, 饮食因素
结果:找到40个与单个微生物显著关联的位点,对于22个bacteria;42个与β-diversity 显著关联的位点,其中21个在独立的肥胖样本中验证。(见下图)
2. 目标位点和基因筛选
接下来,作者只选了一个位点rs7974353以及其对于的基因—VDR。这个位点并不是两个关联分析的交集(只在β-diversity关联分析中是显著的),也并不是top显著的位点。VDR基因是VitaminD受体基因,而在第一组关联分析后的富集分析结果在出现了response to vitamin 以及response to vitamin D response to vitamin A等关键词(图5),而且P值非常显著。提示该基因可能与β-diversity以及某些微生物关联。且根据文献查询结果,该基因的产物会形成VDR-RXR二聚体,VD、微生物的次级代谢产物secondary bile acid等都可以作为配
体与之结合从而发挥功能(图6)。因此作者后面选择该基因作为研究对象。
3. VDR基因功能验证
1. 基因敲除小鼠
在VDR基因敲除小鼠中证明了VDR基因确实会影响肠道菌群的β-多样性(图7)。同时还发现敲除后的小鼠Parabacteroides显著上升(图8),因此VDR与Parabacteroides呈负相关。
2. 结肠活检样本
59个结肠活检样本(case、control),疾病组中VDR上调,相应的Parabacteroides下调,呈负相关,与小鼠实验中一致。此外在该实验中,还发现bile acid代谢相关基因的表达与Parabacteroides的丰富显著相关(图9)。因此提出VDR基因通过影响bile acid代谢来影响肠道微生物(例如Parabacteroides)。下面,就要验证虚线的关系是否成立。
3. 代谢组检测
为了验证bile acid是否与肠道菌群相关,作者取了551个样本检测了血清中的5中bile acid 和fatty acid含量,然后与肠道菌群做相关性分析。发现多数bile acid确实与肠道菌群显著关联,其中bile acid 与Parabacteroides的相关性也是显著的(图10)。
也就是验证了后面一条虚线的关系。
4. 宏基因组测序
为了验证VDR与bile acid 代谢的相关性,作者选取了122个样本做了肠道菌群的全宏基因组测序,组装得到基因和通路的丰度,并选出与bileacid代谢相关的基因。发现VDR genotype 也显著影响肠道微生物中VDR代谢通路的基因丰度(图11)。