人类外显子组测序
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[10] Yi X, Liang Y, Huerta-Sanchez E, et al. Sequencing of 50 human exomes reveals adaptation to high altitude[J]. Science, 2010, 329(5987): 75-78.
[11] Tennessen J A, Bigham A W, O’Connor T D, et al. Evolution and functional impact of rare coding variation from deep sequencing of human exomes [J]. Science, 2012, 337(6090): 64-69.
[3] Wei A H, Zang D J, Zhang Z, et al. Exome sequencing identifies SLC24A5 as a candidate gene for nonsyndromic oculocutaneous albinism [J]. Journal of Investigative Dermatology, 2013, 133(7): 1834-1840.
[8] Yan X J, Xu J, Gu Z H, et al. Exome sequencing identifies somatic mutations of DNA methyltransferase gene DNMT3A in acute monocytic leukemia [J]. Nature Genetics, 2011, 43(4): 309-315.
[12] Caburet S, Arboleda V A, Llano E, et al. Mutant cohesin in premature ovarian failure [J]. New England Journal of Medicine, 2014, 370(10): 943-949.
复杂疾病研究
混 合 型 低 脂 血 症 [5]: 发 现 致 病 基 因 ANGPTL3; 孤独症 [6]:发现 11 个新生突变 ……
癌症研究
卵巢癌 [7]:发现致癌基因 ARID1A; 白血病 [8]:发现致癌基因 DNMT3A; 小细胞肺癌 [9]:发现致癌基因 SOX2 ……
群体研究
藏族人高原适应性研究 ; [10] 深度解析人类罕见遗传变异 ; [11] ……
[13] Chesi A, Staahl B T, Jovicic A, et al. Exome sequencing to identify de novo mutations in sporadic ALS trios [J]. Nature Neuroscience, 2013, 16(7): 851-855.
[4] Sanna-Cherchi S, Sampogna R V, Papeta N, et al. Mutations in DSTYK and dominant urinary tract malformations [J]. New England Journal of Medicine, 2013, 369(7): 621-629.
[5] Musunuru K, Pirruccello J P, Do R, et al. Exome sequencing, ANGPTL3 mutations, and familial combined hypolipidemia [J]. New England Journal of Medicine, 2010, 363(23): 2220-2227.
[14] Zhang J, Fujimoto J, Zhang J, et al. Intratumor heterogeneity in localized lung adenocarcinomas delineated by multiregion sequencing [J]. Science, 2014, 346: 256-259.
4
5. 家系连锁分析
4.1. de novo mutation 筛选
7. 高频 CNV 分布及重现性分析
6. 纯合子区域(ROH)分析
4.2. 新生突变速率计算
8. 肿瘤纯度/倍性分析
5. 候选基因功能富集
9. 异质性/克隆结构分析
6. 蛋白互作网络分析(PPI)
10. NovoDrug 高频突变基因靶向用药预测
[2] Liu Y, Gao M, Lv YM, et al. Confirmation by exome sequencing of the pathogenic role of NCSTN mutations in acne inversa (hidradenitis suppurativa) [J]. Journal of Investigative Dermatology,2011, 131(7): 1570-1572.
外显子组测序
外显子组测序(Whole Exome Sequencing,WES)是利用探针杂交富集外显子区域的 DNA 序列, 通过高通量测序,发现与蛋白质功能变异相关遗传突变的技术手段。相比于全基因组测序,外显子组测序更 加经济、高效。
技术优势
1. 直接对蛋白编码序列进行测序,找出影响蛋白结构的变异 2. 高深度测序,可发现常见变异及频率低于 1% 的罕见变异 3. 针对外显子组区域测序,约占基因组的 1%,有效降低费用,周期和工作量
2.1. 显性遗传模式分析
3. 已知驱动基因筛选
2.2. 隐性遗传模式分析
2.2. 隐性遗传模式分析
4. 高频突变基因统计及通路富集分析
3. 候选基因功能注释
3. 候选基因功能注释
5. MRT 高频突变基因相关性分析
4. 基因功能及通路分析
4. 新生突变筛选及分析(成三 / 成四家系)
6. OncodriveCLUST 驱动基因预测
测序深度 1)单基因病 / 复杂疾病有效测序深度 50X 以上 2)肿瘤有效测序深度 100X 以上 注:可根据老师研究目的进行更高深度测序
项目周期 37 天
1. 数据质控:去除接头污染和低质量数据 2. 与参考序列进行比对、统计测序深度及覆盖度 3. SNP / InDel 检测、注释及统计 4. Somatic SNV / InDel 检测、注释及统计(成对样本)
[9] Rudin C M, Durinck S, Stawiski E W, et al. Comprehensive genomic analysis identifies SOX2 as a frequently amplified gene in small-cell lung cancer [J]. Nature Genetics, 2012, 44(10): 1111-1116.
标准信息分析
高级信息分析(单基因病)
高级信息分析(复杂疾病)
高级信息分析(癌症)
1. 突变位点过滤
1. 突变位点过滤
1. 易感基因筛查
2. 显 / 隐性遗传模式分析(需老师提供家系信息) 2. 显 / 隐性遗传模式分析(需老师提供家系信息)
2. NMF 突变特征及突变频谱分析
2.1. 显性遗传模式分析
案例解析
案例一 单基因病研究——外显子测序解析卵巢早衰的遗传因素 [12]
卵巢早衰通常是指女性 40 岁之前闭经,1% 的妇女患有此病,病因复杂,被认为受到遗传因素的影响。这项研究利用 外显子测序技术首次在中东家系 1(MO1DA)的卵巢早衰病人中发现了减数分裂基因中的 STAG3 基因突变可以导致隐性 遗传卵巢早衰,也在小鼠动物模型和卵巢早衰病患中得到了证实。为探索卵巢早衰或卵巢功能不全的发生机理,以及阐明 该病的临床高度异质性和遗传病因复杂性开辟了一个新的研究途径。
图 1 MO1DA 家系图谱 2
图2 STAG3 基因结构图(红色箭头为 STAG3 基因突变位置)
wenku.baidu.com
案例二 复杂疾病研究——外显子测序鉴定肌萎缩性脊髓侧索硬化症(ALS)的致病基因 [13]
肌萎缩性脊髓侧索硬化症(ALS),又称为渐冻症,是一种成年型的神经退行性疾病。本研究选取了 47 个父母 + 患病 儿的 ALS 家系,利用全外显子测序寻找 De novo mutation。发现了 25 个 de novo 突变基因,进行功能聚类分析,锁定 了 1 个与染色质包装、神经树突生长相关的基因 CREST,后期通过细胞试验验证了该基因突变会影响神经元的伸展,证实 CREST 突变与 ALS 相关。
图 4 对 11 位患者多区域采样的肿瘤组织进行测序揭示瘤内异质性
3
参考文献
[1] Krawitz PM, Schweiger MR, Rödelsperger C, et al. Identity-by-descent filtering of exome sequence data identifies PIGV mutations in hyperphosphatasia mental retardation syndrome [J]. Nature Genetics, 2010, 42(10): 827-829.
[7] Jones S, Wang T L, Shih I M, et al. Frequent mutations of chromatin remodeling gene ARID1A in ovarian clear cell carcinoma [J]. Science, 2010, 330(6001): 228-231.
图 3 ALS 家系图及 CREST 突变功能验证
案例三 癌症研究——外显子测序研究局限性肺腺癌瘤内异质性 [14]
本研究采用多区域取样分析瘤内异质性的研究思路,对 11 位患者的局限性肺腺癌的 48 个肿瘤样品进行了外显子测序。 共鉴定出 7269 个体突变,其中 21 个是已知的与癌症相关的基因突变,76% 的体突变及 21 个已知癌症基因突变中的 20 个都可以在同一肿瘤的所有区域样品中检测到,表明对肿瘤的某一区域进行单次活检,以适当的深度对其测序,可以鉴别 出绝大多数突变。而前期关于肾透明细胞癌的研究结果表明,肿瘤不同区域样品的共有突变仅占突变总数的 31%~37%, 说明肿瘤异质性在不同癌种间存在差异。
[6] O'Roak B J, Deriziotis P, Lee C, et al. Exome sequencing in sporadic autism spectrum disorders identifies severe de novo mutations [J]. Nature genetics, 2011, 43(6): 585-589.
7. 基因显著性分析(推荐 20 对 Case/Control or trios 样本) 11. NovoDR 耐药突变筛选
12. 基因组变异 Circos 图展示
1
应用方向
孟德尔疾病研究
马布里综合症 [1]: 发现致病基因 PIGV; 逆向性痤疮 [2]:发现致病基因 NCSTN; 眼皮肤白化病 [3]:发现致病基因 SLC24A5; 先天性肾脏和尿道畸形 [4]:发现致病基因 DSTYK;
技术流程
技术参数
样本检测 外显子捕获建库
上机测序 数据质控 SNP/InDel 检测 高级信息分析
生物信息分析
样品要求 样品类型:DNA 样品 样品总量:≥ 1.0 μg DNA (提取自新鲜及冻存样本)
≥ 1.5 μg DNA (提取自 FFPE 样本) 样品浓度:≥ 20 ng/µl
测序平台 HiSeq 4000 PE150
[11] Tennessen J A, Bigham A W, O’Connor T D, et al. Evolution and functional impact of rare coding variation from deep sequencing of human exomes [J]. Science, 2012, 337(6090): 64-69.
[3] Wei A H, Zang D J, Zhang Z, et al. Exome sequencing identifies SLC24A5 as a candidate gene for nonsyndromic oculocutaneous albinism [J]. Journal of Investigative Dermatology, 2013, 133(7): 1834-1840.
[8] Yan X J, Xu J, Gu Z H, et al. Exome sequencing identifies somatic mutations of DNA methyltransferase gene DNMT3A in acute monocytic leukemia [J]. Nature Genetics, 2011, 43(4): 309-315.
[12] Caburet S, Arboleda V A, Llano E, et al. Mutant cohesin in premature ovarian failure [J]. New England Journal of Medicine, 2014, 370(10): 943-949.
复杂疾病研究
混 合 型 低 脂 血 症 [5]: 发 现 致 病 基 因 ANGPTL3; 孤独症 [6]:发现 11 个新生突变 ……
癌症研究
卵巢癌 [7]:发现致癌基因 ARID1A; 白血病 [8]:发现致癌基因 DNMT3A; 小细胞肺癌 [9]:发现致癌基因 SOX2 ……
群体研究
藏族人高原适应性研究 ; [10] 深度解析人类罕见遗传变异 ; [11] ……
[13] Chesi A, Staahl B T, Jovicic A, et al. Exome sequencing to identify de novo mutations in sporadic ALS trios [J]. Nature Neuroscience, 2013, 16(7): 851-855.
[4] Sanna-Cherchi S, Sampogna R V, Papeta N, et al. Mutations in DSTYK and dominant urinary tract malformations [J]. New England Journal of Medicine, 2013, 369(7): 621-629.
[5] Musunuru K, Pirruccello J P, Do R, et al. Exome sequencing, ANGPTL3 mutations, and familial combined hypolipidemia [J]. New England Journal of Medicine, 2010, 363(23): 2220-2227.
[14] Zhang J, Fujimoto J, Zhang J, et al. Intratumor heterogeneity in localized lung adenocarcinomas delineated by multiregion sequencing [J]. Science, 2014, 346: 256-259.
4
5. 家系连锁分析
4.1. de novo mutation 筛选
7. 高频 CNV 分布及重现性分析
6. 纯合子区域(ROH)分析
4.2. 新生突变速率计算
8. 肿瘤纯度/倍性分析
5. 候选基因功能富集
9. 异质性/克隆结构分析
6. 蛋白互作网络分析(PPI)
10. NovoDrug 高频突变基因靶向用药预测
[2] Liu Y, Gao M, Lv YM, et al. Confirmation by exome sequencing of the pathogenic role of NCSTN mutations in acne inversa (hidradenitis suppurativa) [J]. Journal of Investigative Dermatology,2011, 131(7): 1570-1572.
外显子组测序
外显子组测序(Whole Exome Sequencing,WES)是利用探针杂交富集外显子区域的 DNA 序列, 通过高通量测序,发现与蛋白质功能变异相关遗传突变的技术手段。相比于全基因组测序,外显子组测序更 加经济、高效。
技术优势
1. 直接对蛋白编码序列进行测序,找出影响蛋白结构的变异 2. 高深度测序,可发现常见变异及频率低于 1% 的罕见变异 3. 针对外显子组区域测序,约占基因组的 1%,有效降低费用,周期和工作量
2.1. 显性遗传模式分析
3. 已知驱动基因筛选
2.2. 隐性遗传模式分析
2.2. 隐性遗传模式分析
4. 高频突变基因统计及通路富集分析
3. 候选基因功能注释
3. 候选基因功能注释
5. MRT 高频突变基因相关性分析
4. 基因功能及通路分析
4. 新生突变筛选及分析(成三 / 成四家系)
6. OncodriveCLUST 驱动基因预测
测序深度 1)单基因病 / 复杂疾病有效测序深度 50X 以上 2)肿瘤有效测序深度 100X 以上 注:可根据老师研究目的进行更高深度测序
项目周期 37 天
1. 数据质控:去除接头污染和低质量数据 2. 与参考序列进行比对、统计测序深度及覆盖度 3. SNP / InDel 检测、注释及统计 4. Somatic SNV / InDel 检测、注释及统计(成对样本)
[9] Rudin C M, Durinck S, Stawiski E W, et al. Comprehensive genomic analysis identifies SOX2 as a frequently amplified gene in small-cell lung cancer [J]. Nature Genetics, 2012, 44(10): 1111-1116.
标准信息分析
高级信息分析(单基因病)
高级信息分析(复杂疾病)
高级信息分析(癌症)
1. 突变位点过滤
1. 突变位点过滤
1. 易感基因筛查
2. 显 / 隐性遗传模式分析(需老师提供家系信息) 2. 显 / 隐性遗传模式分析(需老师提供家系信息)
2. NMF 突变特征及突变频谱分析
2.1. 显性遗传模式分析
案例解析
案例一 单基因病研究——外显子测序解析卵巢早衰的遗传因素 [12]
卵巢早衰通常是指女性 40 岁之前闭经,1% 的妇女患有此病,病因复杂,被认为受到遗传因素的影响。这项研究利用 外显子测序技术首次在中东家系 1(MO1DA)的卵巢早衰病人中发现了减数分裂基因中的 STAG3 基因突变可以导致隐性 遗传卵巢早衰,也在小鼠动物模型和卵巢早衰病患中得到了证实。为探索卵巢早衰或卵巢功能不全的发生机理,以及阐明 该病的临床高度异质性和遗传病因复杂性开辟了一个新的研究途径。
图 1 MO1DA 家系图谱 2
图2 STAG3 基因结构图(红色箭头为 STAG3 基因突变位置)
wenku.baidu.com
案例二 复杂疾病研究——外显子测序鉴定肌萎缩性脊髓侧索硬化症(ALS)的致病基因 [13]
肌萎缩性脊髓侧索硬化症(ALS),又称为渐冻症,是一种成年型的神经退行性疾病。本研究选取了 47 个父母 + 患病 儿的 ALS 家系,利用全外显子测序寻找 De novo mutation。发现了 25 个 de novo 突变基因,进行功能聚类分析,锁定 了 1 个与染色质包装、神经树突生长相关的基因 CREST,后期通过细胞试验验证了该基因突变会影响神经元的伸展,证实 CREST 突变与 ALS 相关。
图 4 对 11 位患者多区域采样的肿瘤组织进行测序揭示瘤内异质性
3
参考文献
[1] Krawitz PM, Schweiger MR, Rödelsperger C, et al. Identity-by-descent filtering of exome sequence data identifies PIGV mutations in hyperphosphatasia mental retardation syndrome [J]. Nature Genetics, 2010, 42(10): 827-829.
[7] Jones S, Wang T L, Shih I M, et al. Frequent mutations of chromatin remodeling gene ARID1A in ovarian clear cell carcinoma [J]. Science, 2010, 330(6001): 228-231.
图 3 ALS 家系图及 CREST 突变功能验证
案例三 癌症研究——外显子测序研究局限性肺腺癌瘤内异质性 [14]
本研究采用多区域取样分析瘤内异质性的研究思路,对 11 位患者的局限性肺腺癌的 48 个肿瘤样品进行了外显子测序。 共鉴定出 7269 个体突变,其中 21 个是已知的与癌症相关的基因突变,76% 的体突变及 21 个已知癌症基因突变中的 20 个都可以在同一肿瘤的所有区域样品中检测到,表明对肿瘤的某一区域进行单次活检,以适当的深度对其测序,可以鉴别 出绝大多数突变。而前期关于肾透明细胞癌的研究结果表明,肿瘤不同区域样品的共有突变仅占突变总数的 31%~37%, 说明肿瘤异质性在不同癌种间存在差异。
[6] O'Roak B J, Deriziotis P, Lee C, et al. Exome sequencing in sporadic autism spectrum disorders identifies severe de novo mutations [J]. Nature genetics, 2011, 43(6): 585-589.
7. 基因显著性分析(推荐 20 对 Case/Control or trios 样本) 11. NovoDR 耐药突变筛选
12. 基因组变异 Circos 图展示
1
应用方向
孟德尔疾病研究
马布里综合症 [1]: 发现致病基因 PIGV; 逆向性痤疮 [2]:发现致病基因 NCSTN; 眼皮肤白化病 [3]:发现致病基因 SLC24A5; 先天性肾脏和尿道畸形 [4]:发现致病基因 DSTYK;
技术流程
技术参数
样本检测 外显子捕获建库
上机测序 数据质控 SNP/InDel 检测 高级信息分析
生物信息分析
样品要求 样品类型:DNA 样品 样品总量:≥ 1.0 μg DNA (提取自新鲜及冻存样本)
≥ 1.5 μg DNA (提取自 FFPE 样本) 样品浓度:≥ 20 ng/µl
测序平台 HiSeq 4000 PE150