最新基因组学试题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2017基因组学试题
1.什么是基因组(5分)?什么是转录组(5分),简述基因组和转录组的关系和异同
之处(15分)?
基因组(Genome):在生物学中,一个生物体的基因组是指包含在该生物的DNA(部分病毒是RNA)中的全部遗传信息,这种遗传信息以核苷酸序列形式存储。

基因组包括基因和非编码DNA。

因此,基因组应该指单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子。

说的更确切些,核基因组是单倍体细胞核内的全部DNA分子;线粒体基因组则是一个线粒体所包含的全部DNA分子;叶绿体基因组则是一个叶绿体所包含的全部DNA分子。

转录组(transcriptome):广义上指某一生理条件下,细胞内所有转录产物的集合,包括信使RNA、核糖体RNA、转运RNA及非编码RNA;狭义上指所有细胞中转录出的所有信使RNA的集合。

转录组和基因组之间的关系:转录组是通过基因组序列在转录因子的调控下转录形成,但并不是所有的基因都能够转录形成RNA,且基因组中序列的转录并不同步,不同组织差异和不同发育阶段基因组的转录情况不同。

基因组和转录组的不同之处:基因组是生物体(细胞或病毒)中所有DNA的总和,包括所有的基因和基因间区域,包括染色体之外的遗传物质,如线粒体、叶绿体、质粒等。

基因组在物种内恒定,生物体或细胞内恒定,没有时空变化,但是存在一定的特例,例如盲鳗的性细胞和体细胞DNA量存在差异,部分昆虫的性细胞和体细胞染色体数目存在差异,动物的雌雄个体之间存在差异。

2.原核生物基因组相比,真核生物基因组的复杂性表现在哪些方面(15分)?
原核生物基因组小,结构简单,只有一个环状DNA,一个复制起始点,有操纵子结构,结构基因无重叠现象,基因组中任何一个DNA不会用于编码两种蛋白质,基因是连续的,无内含子,转录后不剪接,重复序列少,蛋白质基因一般为单拷贝基因,但编码rRNA
的基因一般为多拷贝,有利于核糖体快速组装,仅少量的非编码核苷酸序列构成调控元件。

而真核生物基因组具有复杂的染色体结构,其复杂性具体表现在:
在结构上:
1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。

2.真核细胞基因转录产物为单顺反子。

一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。

3.存在大量重复序列,即在整个DNA中有许多重复出现的核苷酸顺序,重复序列长度可长可短,短的仅含两个核苷酸,长的多达数百、乃至上千。

重复频率也不尽相同;高度重复序列重复频率可达106次,包括卫星DNA、反向重复序列和较复杂的重复单位组成的重复序列;中度重复序列可达103~104次,如为数众多的Alu家族序列,KpnI家族,Hinf家族序列,以及一些编码区序列如rRNA基因、tRNA基因、组蛋白基因等;单拷贝或低度重复序列,指在整个基因组中只出现一次或很少几次的核苷酸序列,主要是编码蛋白质的结构基因,在人基因组中占约60~65%,因此所含信息量最大
4.真核生物基因组中存在着大量的不编码基因产物的DNA序列,且基因组中不编码的区域多于编码区域。

5.基因一般是不连续的,即真核生物基因一般是断裂基因,在真核生物结构基因的内部存在许多不编码蛋白质的间隔序列(interveningsequences),称为内含子(intron),编码区则称为外显子(exon)。

内含子与外显子相间排列,转录时一起被转录下来,然后RNA中的内含子被切掉,外显子连接在一起成为成熟的mRNA,作为指导蛋白质合成的模板。

6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小
存在可移动遗传单元,又称为自私基因
7、
8、真核生物基因由一个结构基因和相关的调控区域组成,转录生成一条信使RNA。

真核生物基因组存在DNA多态性,具体表现在···真核生物基因组具有端粒结构,
3.简述遗传连锁图谱的构建方法(10分),说明遗传图谱在基因组组装和研究中的意
义(10分)。

遗传图谱的构建是利用遗传学原理和方法,连锁分析是遗传作图的基础,遗传图谱的构建主要有三步,1.选用合适的遗传标记2.测定群体中不同个体的遗传标记3.对遗传标记数据进行连锁分析,构建连锁图。

构建分子遗传图谱的步骤包括:构建合适的遗传群体,包括亲本的选择;分离群体类型的选择及群体大小的确定;利用合适的分子标记进行分析;利用计算机软件进行图谱构建;建立标记间的连锁排序和遗传距离;利用计算机软件绘出遗传图谱。

遗传图谱的构建在基因组组装和研究中的意义:利用遗传图谱可以对多种疾病及性状进行遗传分析与基因定位。

分子遗传图谱是植物基因组结构分析和比较的有力工具,已被广泛应用于基因定位、图位克隆、比较基因组学和分子标记辅助育种等研究。

····
4.什么是物理图谱(5分)?简述大片段文库的物理图谱如何构建(15分)?
物理图谱:是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。

物理图谱是利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离碱基对(bp)或千碱基(kb)或兆碱基(Mb)的图谱。

可以确定该种海洋生物基因组中有关基因的遗传信息及其在每条染色体上的相对位置。

物理图谱描绘DNA上可以识别的标记的位置和相互之间的距离(以碱基对的数目为衡量单位),这些可以识别的标记包括限制性内切酶的酶切位点,基因等。

物理图谱不考虑两个标记共同遗传的概率等信息。

对于人类基因组来说,最粗的物理图谱是染色体的条带染色模式,最精细的图谱是测出DNA的完整碱基序列。

大片段文库的物理图谱构建:先把庞大的无从下手的基因组DNA“敲碎”,再进行拼接。

以Mb、kb、bp作为图距,以分子标记(主要是指STS,sequencetagssite)序列为路标,确定克隆之间的重叠关系,建立一个可覆盖染色体某个区域甚至整个染色体区域的片段重叠群(contig)。

5.简述第二代测序和第三代测序的技术特点(10分)。

第二代测序:
第二代测序技术得到的片段读长短,数量巨大,且片段间的重叠度高,因此也给序列比对方法了提出挑战.对于第二代测序平台数据的分析,最为重要的一步是将所产生读段通过序列比对形式完成序列相似性比较.由于第二代测序平台数据通量高,因此,第二代序列比对方法一般分为两步:首先对读段数或者参考基因组进行归类整理等预处理;然后通过适当的算法,将短读段序列进行比对和定位.
第二代测序平台性能方面的缺陷,给当前的序列比对技术带来了一些隐忧,例如:第二代测序数据每个读段中的碱基都有一定的质量分数来衡量该碱基可靠程度,通常的做法是一旦其质量分数低于某一特定值就忽略.这种做法固然能够达到一定的准确性,但是结果终究有一定的偏差,因此人们希望通过单分子技术进行测序,对每个待测碱基进行实时观测,以确保每个碱基测试的准确性.第二代测序数据量大,读段相对较短,通常要求计算机具有较高的硬件配置.
第二代测序技术也叫做高通量测序,有通量大,可以同时进行平行测序;可定量,样品中DNA被测序的次数就反映了它的丰度;成本低廉,耗资不到传统测序法的1%的优点。

第二代测序技术平台的应用,包括罗氏公司454测序平台、ABI公司的Solid测序平台,以及Illumina公司的Solexa测序平台,他们对宏基因组的研究起到了重大影响。

第三代测序:
第三代测序技术是指单分子测序技术。

DNA测序时,不需要经过PCR扩增,实现了对每一条DNA分子的单独测序。

第三代测序技术也叫从头测序技术,即单分子实时DNA测序。

目前正在兴起的第三代测序是单分子测序,这种技术无需PCR扩增,这种方法测序通量更高,操作过程更简单,成本更低。

另外它还具有3个显著的特点:第一,单分子测序技术可以直接对RNA进行序列,这样大幅度降低体外逆转录产生的系统误差;第二,可以直接检测甲基化的DNA序列,为表观遗传学研究奠定了基础;第三,可以对特定序列的SNP进行检测,实现对稀有突变及其频率的测定。

目前市面上单分子测序平台有SMS 技术SMRT技术FRET技术以及纳米孔技术
6.有一种有经济价值的海洋鱼类,其遗传学和基因组学研究基础较为薄弱。

根据你对海
洋生物基因组特点的了解,你如何设计该物种的全基因组测序研究(10分)。

鱼类基因组大小差异存在着复杂性,并不完全与染色体数目相关,随着鱼类的进化,其基因组演化的总体趋势是倾向于使基因组组成更为简约。

由于硬骨鱼类之间基因组差别极大,杂合度高并且缺乏合适的物种作为模式参考基因组,
提取基因组DNA,然后随机打断,电泳回收所需长度的DNA片段(0.2~5Kb),加上接头, 进行DNA簇(Cluster)制备,最后利用Paired-End(Solexa)或者Mate-Pair(SOLiD)的方法对插入片段进行测序。

然后对测得的序列组装成Contig,通过Paired-End的距离可进一步组装成Scaffold,进而可组装成染色体等。

生物的基因组十分庞大,不能通过直接读取生物的基因组DNA序列的方式进行测序。

因此,大规模基组测序必须通过一套完整测序组装策略。

相关文档
最新文档