全基因组关联分析-基于全基因组重测序
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对已有参考基因组的物种群体进行全基因组重测序,检测分布于全基因组范围内的SNP标记,基于它们与分析性状的连锁不平衡关系,通过各种统计分析方 法,获得与这些性状关联的候选基因或基因组区域。与简化基因组及芯片技术相比,全基因组重测序可以更全面的挖掘基因组的变异信息,开发更多的分子标 记,因此可更精确的找到与性状关联的候选基因或基因区域。
与参考基因组比对 群体SNP检测、统计与注释
构建系统进化树 群体主成分分析
连锁不平衡分析 性状关联分析
目标性源自文库相关区域基因功能注释 构建单体型图谱
标准分析时间为120天,个性化分析需根据项目实际情况进行评估
案例解析
[案例一] 水稻代谢性状关联分析[1]
通过对有840种代谢产物的529份水稻进行全基因组重测序,结合 已知的950份水稻数据,获得6,428,770个SNP。通过群体分层分 析,分为Indica和Japonica两个亚群,对两个亚群水稻代谢性状 进行全基因组关联分析,鉴定出2947个与634个基因相关的主导 SNP位点。随后,在210个Indica的RILs群体中进行验证,定位 出36个候选基因与代谢相关。对36个候选基因进行实验验证,最 终确定了5个候选基因。
图2 重要性状GWAS结果
参考文献
[1] Chen W, Gao Y, Xie W, et al. Genome-wide association analyses provide genetic and biochemical insights into natural variation in rice metabolism [J]. Nature genetics, 2014, 46(7): 714-721.
[2] Zhou Z, Jiang Y, Wang Z, et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean [J]. Nature Biotechnology. 2015, 33(4):408-414.
GWAS on oil percent 10
8 6 4
2 0
5 10 15 20 25 30 35 40 45 Chromosome 3 (Mb)
−log10P
GWAS on oil percent 10
8 6 4 2 0
5 10 15 20 25 30 35 40 Chromosome 13 (Mb)
XP–CLR
–log10 P
–log10 P
40
30
20
10
0
Chr. 1 0
2
3
4
5
10
20
30
40 Flavonoids Phenolamines Terpenoids
6
7
8
9 10
AA and NA ders
Others
11 12 , Unknown
图1 关联分析曼哈顿图
300
200
Oil23–2
[案例二] 大豆驯化性状关联分析[2]
通过对302株大豆(62个野生大豆,130个地方品种和110个驯化 品种)进行高通量重测序,共发现979万个SNP,87.68万个 Indel,还有1614个CNV和6388个大片段缺失。通过构建系统进 化树以及主成分分析,发现本研究所选大豆群体明显可以聚成三 类——野生、驯化及改良。全基因组关联分析表明10个受选择区 域和9个驯化性状相关联,发现13个被注释为与油脂、株高等农 艺性状相关的位点。与之前QTL定位结果比较分析发现,230个 受选择区域中96个与调控油脂的QTL相关,21个区间内包含脂肪 酸合成关键基因。
100 0
Oil20–2
1
2
24–34 28–2 28–3 Oil36–9
3
4
Oil23–1
Oil36–2 E1
36–7 Sd oil-prot1–1 Oil1–2 16–5 Oil34–7 Oil34–5
Sg1 Oil24–1
5
6
7
8
9
W1
Oil24–4
E2
Oil32–2
10 11 12 13
−log10P
技术参数
适用范围 样品要求 文库类型 测序策略与深度 分析内容 项目周期
群体进化(基于全基因组重测序)
1. 已有参考基因组序列的动植物自然群体,建议样本数≥200个 2. 样本间无明显的亚群分化(如生殖隔离等) 3. 所研究表型性状遗传力较强
DNA样品总量: ≥3 μg 350 bp小片段文库
HiSeq PE150 推荐测序深度≥5X/个体
与参考基因组比对 群体SNP检测、统计与注释
构建系统进化树 群体主成分分析
连锁不平衡分析 性状关联分析
目标性源自文库相关区域基因功能注释 构建单体型图谱
标准分析时间为120天,个性化分析需根据项目实际情况进行评估
案例解析
[案例一] 水稻代谢性状关联分析[1]
通过对有840种代谢产物的529份水稻进行全基因组重测序,结合 已知的950份水稻数据,获得6,428,770个SNP。通过群体分层分 析,分为Indica和Japonica两个亚群,对两个亚群水稻代谢性状 进行全基因组关联分析,鉴定出2947个与634个基因相关的主导 SNP位点。随后,在210个Indica的RILs群体中进行验证,定位 出36个候选基因与代谢相关。对36个候选基因进行实验验证,最 终确定了5个候选基因。
图2 重要性状GWAS结果
参考文献
[1] Chen W, Gao Y, Xie W, et al. Genome-wide association analyses provide genetic and biochemical insights into natural variation in rice metabolism [J]. Nature genetics, 2014, 46(7): 714-721.
[2] Zhou Z, Jiang Y, Wang Z, et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean [J]. Nature Biotechnology. 2015, 33(4):408-414.
GWAS on oil percent 10
8 6 4
2 0
5 10 15 20 25 30 35 40 45 Chromosome 3 (Mb)
−log10P
GWAS on oil percent 10
8 6 4 2 0
5 10 15 20 25 30 35 40 Chromosome 13 (Mb)
XP–CLR
–log10 P
–log10 P
40
30
20
10
0
Chr. 1 0
2
3
4
5
10
20
30
40 Flavonoids Phenolamines Terpenoids
6
7
8
9 10
AA and NA ders
Others
11 12 , Unknown
图1 关联分析曼哈顿图
300
200
Oil23–2
[案例二] 大豆驯化性状关联分析[2]
通过对302株大豆(62个野生大豆,130个地方品种和110个驯化 品种)进行高通量重测序,共发现979万个SNP,87.68万个 Indel,还有1614个CNV和6388个大片段缺失。通过构建系统进 化树以及主成分分析,发现本研究所选大豆群体明显可以聚成三 类——野生、驯化及改良。全基因组关联分析表明10个受选择区 域和9个驯化性状相关联,发现13个被注释为与油脂、株高等农 艺性状相关的位点。与之前QTL定位结果比较分析发现,230个 受选择区域中96个与调控油脂的QTL相关,21个区间内包含脂肪 酸合成关键基因。
100 0
Oil20–2
1
2
24–34 28–2 28–3 Oil36–9
3
4
Oil23–1
Oil36–2 E1
36–7 Sd oil-prot1–1 Oil1–2 16–5 Oil34–7 Oil34–5
Sg1 Oil24–1
5
6
7
8
9
W1
Oil24–4
E2
Oil32–2
10 11 12 13
−log10P
技术参数
适用范围 样品要求 文库类型 测序策略与深度 分析内容 项目周期
群体进化(基于全基因组重测序)
1. 已有参考基因组序列的动植物自然群体,建议样本数≥200个 2. 样本间无明显的亚群分化(如生殖隔离等) 3. 所研究表型性状遗传力较强
DNA样品总量: ≥3 μg 350 bp小片段文库
HiSeq PE150 推荐测序深度≥5X/个体