人全基因组全外显子组全外显子组和全转录组测序及其临床应用
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.无义突变(nonsense mutation)
即一个核苷酸突变后,产生了一个终止密码(stop condon),截断了转录和翻译,从而形成新的蛋白质分子。 新的蛋白质分子很可能丧失原来蛋白质分子的功能。
2.错义突变(missense mutation)
即一个核苷酸突变后,产生了一个不同的密码子,从而编 码出不同的氨基酸。根据该氨基酸对蛋白质空间结构的影响, 新的蛋白质功能可能保持或改变,因此错义突变又分为保守 突变和非保守突变。
人基因组中编码蛋白质的基因序列约占全基因组序列的 1.5%,有20 000~25 000个蛋白质编码基因,剩余的部分 包括RNA编码基因,调控序列与伪基因(pseudogene) 等,以及各种重复序列。重复序列占人全基因组的60%左右, 无转录活性,包括成簇存在于染色体特定区域的串联重复序 列(tandem repeat),
(二)基因(gene)
基因是具有遗传信息的DNA片段。通过转录形成功能RNA 分子。人的所有基因在23对染色体上呈线性排列,每一个 染色体含有数百个基因,大多数基因包含多个外显子 (exon),相邻外显子的中间是内含子(intron)。在基 因与基因之间,通常是调控序列和非编码的基因间片段(图 2-5-1)。
(三)结构性变异(structural variation,SV)
通常包括长度在50bp以上的DNA序列的插入、缺失、倒位、 重复,移动元件,染色体内部或染色体之间的序列易位,以 及更为复杂的组合变异。基因中出现这种变异,会影响转录、 翻译以及蛋白质分子结构和性质,乃至生物体的表型。
(四)拷贝数变异(copy number variation,CNV)
4)重复上面三个步骤,进行第二个碱基的信号收集,直至 完成所有循环。
(4)序列比对(sequence alignment)与数据分析(图 2-5-4A-d)
1)荧光信号数据分析:
将每个循环中拍摄的照片按时间顺序排列,然后对每个扩 增簇进行坐标定位,根据每个簇的颜色变化,进行碱基识别 并读取一条序列。读取序列的长度取决于测序的循环次数, 并用分析软件对每个碱基进行质量评估,给予每个碱基一个 质量分值(quality score,Q-score)。
人全基因组全外显子组和全转录组测序 及其临床应用
演讲人:卢老师
日期:2021.xx.xx
目录 CONTENTS
第一节 人全基因组、全外显子组和全转录组的基 本结构 第二节 人全基因组、全外显子组和全转录组测序 的基本原理和基本步骤及其检测报告
第三节 新一代测序与临床
第一节 人全基因组、全外显子组和全转录组 的基本结构
(二)全基因组重测序(resequencing)
参考基因组序列已知的物种的不同个体进行基因组测序, 然后在个体或群体水平上进行差异性分析的测序方法。将某 个体测序后获得的大量序列,与该物种的已知参考基因组序 列比对,可以确定该个体包含的各种类型的突变,包括单碱 基变异、插入缺失、结构变异及拷贝数变化。
提取基因组DNA,随机打断后,通过连接酶在每个DNA片 段的两端加上测序接头,经PCR扩增后,纯化并回收有接头 的DNA片段(图2-5-4A-a)。
(2)簇生成(cluster generation )(图2-5-4A-b)NA后,引入流动槽,与流
1.全基因组重测序的两个前提条件 (1)已知该物种的参考基因组序列。 (2)所测定群体的个体之间遗传相似度很高(>99 %)。 2.全基因组重测序的基本步骤 以Illumina的双末端测序方法(pair-end sequencing)
on):
而非编码外显子在转录并剪接后,不能翻译成蛋白质分子。 非编码外显子主要包括5'端的非翻译区(5'-UTR),3'端 的非翻译区(3'-UTR)。非编码外显子的主要功能是保持 mRNA的稳定性,延长其半衰期,并保证mRNA翻译过程 正确进行。
(四)内含子(intron)
基因中的非编码区可被转录,但是在mRNA加工过程中被 剪接,因此在成熟mRNA中并无内含子的编码序列。
(一)单碱基变异
(single nucleotide variation,SNV)
DNA分子中一个核苷酸被另外一个核苷酸替换而产生的变 异,又称点突变(point mutation)。按照碱基类型的变 化,单碱基变异可以分为转换(transition),即嘌呤和嘌 呤之间,或嘧啶和嘧啶之间的替换;置换 (transversion),即嘌呤和嘧啶之间的替换。按照核苷 酸突变是否引起蛋白质功能的相应变化,单碱基突变可分为 以下类型:
由于基因序列重排,导致1kb以上的大片段DNA的拷贝数增加 或减少。CNV的发生频率远远高于SNP,而且稳定并可遗传到 下一代,是导致人类疾病的重要分子机制之一。CNV通常是由非 等位基因同源重组(non-allelic homologous recombination,NAHR)所致。在同源重复序列之间,基因 发生大片段的结构变异和染色体重排,从而导致基因组的稳定性 下降,并诱发疾病。非同源重组也可以造成CNV,是较小片段的 CNV形成的主要机制(图2-5-3)。
图2-5-1 人类基因的结构及其转录和翻译示意
(三)外显子(exome)
人基因组中的外显子在转录并剪接(splicing)后,通过蛋 白质翻译过程表达为蛋白质。外显子分为编码外显子 (coding exon)和非编码外显子(noncoding exon) 两类。编码外显子是基因中的编码序列,经过转录并剪接后, 出现成熟的RNA分子即信使RNA(messengerRNA, mRNA),最后mRNA翻译表达为蛋白质。
动槽纳米孔表面的接头序列(adapter)杂交,固定在流动 槽的表面。
2)桥式扩增:
固定在纳米孔表面的DNA单链的另一端与纳米孔表面的相 应接头杂交,形成桥状结构。然后每条单链经DNA聚合酶 催化,合成互补链,形成桥式双链。双链再变性成两条单链, 进入下一个桥式扩增,重复多个循环后,每条单链扩增至上 千条,形成一簇。大量的簇在纳米孔表面的内壁上随机分布, 呈超高密度簇。
通过对个体间基因差异的分析对比,并结合不同个体的表 型,可做遗传进化分析,确定重要性状以及功能的相关基因。 近年来,随着二代测序技术的迅速发展和成熟,测序试剂成 本降低至1000美元以下,人全基因组重测序已成为研究人 类疾病快速有效的方法之一。可以在全基因组水平上检测与 疾病相关基因突变位点及结构变异等信息,开发精准治疗药 物。
四、基因突变
基因突变(gene mutation)是指细胞中的基因序列发生 碱基对组成、排列顺序以及拷贝数量的改变。基因突变可能 导致编码的氨基酸的变化,进而改变蛋白质的功能,引起生 物体表型变化。基因突变包括种系突变(germline mutation)和体细胞突变(somatic mutation)。种系 突变发生在生殖系细胞(精子和卵子)中,这类突变可传递 给后代;体细胞突变发生在体细胞中,体细胞突变不会遗传 给后师
日期:2021.xx.xx
一、人全基因组
(一)染色体
人类细胞核内有两套染色体,是“二倍体”(haploid), 分别来自父母。人全基因组(human whole genome) 由23对染色体组成,包括22对体染色体,1条X染色体和1 条Y染色体。人全基因组约含30亿DNA碱基对,即60亿个 DNA碱基。DNA碱基包括胞嘧啶(C)、鸟嘌呤(G)、胸 腺嘧啶(T)、腺嘌呤(A)四种,它们通过氢键配对,G与 C通过三个氢键配对连接,A与T通过两个氢键配对连接。
如卫星DNA序列、微卫星等;分散于染色体各处的分散重 复序列(interspersed repeat),如DNA转座子 (transposons)、长末端重复序列(long terminal repeat,LTR)、短分散重复序列(short interspersed nuclear elements,SINEs),以及长分散重复序列 (long interspersed nuclear elements,LINEs)。
伸。所用d NTP带有四种荧光基团之一和终止基团,因此每 个循环只能延伸1个碱基。洗去未结合的荧光标记的核苷酸。 2)荧光信号激发与采集:荧光基团经激光激发后,产生荧 光信号,用特殊相机拍摄。
3)末端切除:拍照后,用酶切除末端碱基的荧光基团和终 止基团。单链3'末端碱基不再产生荧光,恢复到可延伸的状 态。
SNP是人类可遗传的变异中最常见的一种。SNP在人类基 因组中广泛存在,根据国际人类基因组单体型图谱 (International Hap-Map Project),任何两人之间 SNP平均差别有350万之多,约占整个双倍体基因组30亿 DNA碱基对的0.1%,平均1000个碱基对中有1个。单倍型 (hyploid genotype,haplotype),即单倍体基因型, 同一条染色体中一组相互关联的SNP或其他基因型通常一起 遗传。
通过确定单倍型,并对单倍型进行关联统计学分析,可以 探索疾病的基因基础。比如将患者与健康人(对照)的单倍 型进行比较,如果某一种单倍型在患者组与对照组的出现频 率有显著差异,那么影响该疾病的基因可能就与这个单倍型 密切相关。国际Hap Map计划的目的之一就是通过单倍型 图谱Hap Map,更多地了解常见疾病与基因的关系(图25-2)。
图2-5-2 人单核苷酸多态性和单倍体基因型示意
(二)插入与缺失突变(insertion and deletion,In Del)
1.插入突变(insertion) 一个基因的DNA中插入其他DNA片段,使基因序列发生变
化,改变其编码的蛋白质的结构,进而影响蛋白质分子的功 能。 2.缺失突变(deletion) 在基因中缺失DNA片段,改变基因编码的蛋白质分子的功 能。
3)单链化: 簇由DNA双链构成,定向切断接头序列上的 切割位点,产生一条单链,游离单链经碱变性后,冲洗去除。
4)末端封闭: DNA单链3'游离末端加上一个dd NTP, 封闭末端,以防测序时的随机延伸。
5)引物结合: 加入测序引物,与每条单链DNA的相应位 点结合。
(3)测序(图2-5-4 A-c): 在Illumina测序仪上进行。 1)碱基延伸:将流动槽反应物转移到测序仪上进行碱基延
2-5-3
图 构 性 变 异人 示类 意基
因 结
第二节 人全基因组、全外显子组和全转录组测 序的基本原理和基本步骤及其检测报告
演讲人:卢老师
日期:2021.xx.xx
一、人全基因组测序
(一)全基因组从头测序(de novo sequencing)
如果某物种的参考基因组(reference genome)的序列 未知,对其全基因组进行序列测定,然后运用生物信息学, 对所得的大量序列进行拼接、组装,从而获得该物种的全基 因组序列图谱的测序方法称为全基因组从头测序。例如,通 过2003年完成的人类基因组计划,获得了第一个人的参考 基因组。
3.沉默突变(silent mutation) 一个核苷酸突变后,并没有密码子的改变,编码出相同的
氨基酸,并不影响蛋白质的功能。 如果在特定群体(population)中,某个单碱基变异的出
现频率超过1%,该单碱基变异就称为单核苷酸多态性 (single nucleotide polymorphism,SNP)。
二、全外显子组
全外显子组(whole exome)是人全基因组中所有外显子 区域DNA序列的集合。虽然人类全外显子组只占人类基因 组长度的1%~2%,但是85%以上因DNA变异引起的疾病, 是由于外显子组的变异。
三、全转录组
人全转录组(whole transcriptome)是在某一生理条件 下,人全基因组经过转录后,细胞内所有的转录产物,包括 mRNA、核糖体RNA(ribosome RNA,rRNA)、转运 RNA(transferRNA,t RNA)及非编码RNA(noncoding RNA)。狭义是指所有mRNA。转录组是基因组 遗传信息与生物体功能之间的桥梁。