生物信息学复习题已附答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

本卷的答案仅做参考,如有疑问欢迎提出。后面的补充复习题要靠你们

自己整理答案了。

生物信息学复习题

一、填空题

1、识别基因主要有两个途径即基因组DNA外显子识别和基于EST策略的基因鉴定。

2、表达序列标签是从mRNA 中生成的一些很短的序列(300-500bp),它们代表在特定组织或发育阶段表达的基因。

3、序列比对的基本思想,是找出检测基因和目标序列的相似性,就是通过在序列中插入空位的方法使所比较的序列长度达到一致。比对的数学模型大体分为两类,分别是整体比对和局部比对。

4、2-DE的基本原理是根据蛋白质等电点和分子量不同,进行两次电泳将之分离。第一向是等电聚焦分离,第二向是SDS-PAGE分离。

5、蛋白质组研究的三大关键核心技术是双向凝胶电泳技术、

质谱鉴定技术、计算机图像数据处理与蛋白质数据库。

二、判断题

1、生物体的结构和功能越复杂的种类就越多,所需要的基因也越多,C值越大,这是真核生物基因组的特点之一。(对)

2、CDS一定就是ORF。(对)

3、两者之间有没有共同的祖先,可以通过序列的同源性来确定,如果两个基因或蛋白质有着几乎一样的序列,那么它们高度同源,就具有共同的祖先。(错)

4、STS,是一段200-300bp的特定DNA序列,它的序列已知,并且在基因组中属于单拷贝。(对)

5、非编码DNA是“垃圾DNA”,不具有任何的分析价值,对于细胞没有多大的作用。(错)

6、基因树和物种树同属于系统树,它们之间可以等同。(错)

7、基因的编码序列在DNA分子上是被不编码的序列隔开而不连续排列的。( 对)

8、对任意一个DNA序列,在不知道哪一个碱基代表CDS的起始时,可用6框翻译法,获得6个潜在的蛋白质序列。(对)

9、一个机体只有一个确定的基因组,但基因组内各个基因表达的条件和表达的程度随时间、空间和环境条件而不同。(对)

10、外显子和内含子之间没有绝对的区分,一个基因的内含子可以是另一个基因的外显子,同一个基因在不同的生理状况或生长发育的不同阶段,外显子组成也可以不同。(对)

11、比较是科学研究中最常见的方法,在生物信息学研究中,比对是最常用和最经典的研究方法。(对)

12、ORF一定就是CDS。(错)

13、用不同的方法可以构建不同的系统发育树,为保证分析结果的可靠性,需要对进化树进行评估。(对)

14、相似性是一种很直接的数量关系,无需实验验证。(错)

15、基因树和物种树同属于系统树,它们之间可以等同。(错)

16、蛋白质和DNA的同源性常常通过它们序列的相似性来判定,如果两个基因或蛋白质有着几乎一样的序列,具有高度的相似性,那么它们一定是同源。(错)

17、所谓局部比对是找出两个被比较序列的最类似片段。(对)

三、不定项选择题

1、(ABC )是现在国际上最主要的三大核酸序列数据库

A. EMBL

B. DDBJ

C. GenBank

D. NCBI

E. EBI

2、RFLP是DNA多态性中最多见的一种,它产生的机制包括(ABE )

A.DNA分子产生突变,使某些酶切位点数增加

B. DNA分子产生突变,使某些酶切位点数减少

C. 限制性酶切位点之间重复序列数目变异

D. 限制性酶星活性

E. 限制性酶切位点前后的DNA片断发生插入或删除

3、下面序列哪些为反向重复序列( BD )

A. …GCACTTG…GCACTTG…

B. …GCACTTGCAAGTGC……CGTGAAC…CGTGAAC……CGTGAACGTTCACG…

C. …GCACTTG…CAAGTGC…

D. …GCACTAGCTAGCGG……CGTGAAC…GTTCACG……CGTGATCGATCGCC…

4、分析EST序列时首要注意以下几点(ACDE )

A.EST序列中除了A\G\T\C外,可能出现未知碱基

B.EST只是单次测序,得出的结果没有可信度

C.EST序列中可能出现错误的插入和缺失,导致读码框移位

D.某个EST序列是数据库中另一序列的一个片段

E.某个EST序列不在基因的编码区内

5、人类基因组计划要完成的几张图谱分别是(ABCE )

A. 物理图谱

B. 遗传图谱

C. 序列图谱

D. 生物图谱

E. 基因图谱

6、最常用的序列相似性查询工具是(AB )

A.FASTA

B.BLAST

C.SWISS-PROT

D.PDB

E.PIR

7、下列哪些分子类型属于非蛋白质编码区(ABCDE )

A.内含子

B.卫星DNA

C.伪基因

D.启动子

E.增强子

8、卫星DNA的多态性是由( D )所决定的。

A. DNA点突变个数

B. 限制性内切酶识别序列个数不同

C. DNA的二级结构不同

D. 重复单位不同E.重复次数不同

9、真核基因组特点包括(ABCDE )

A. 基因组大,巨大的非编码序列,重复序列占了绝大部分

B. 基因结构复杂,无显著长度的开放阅读框

C. 存在可变剪接

D. CpG岛

E. 等值区

10、20世纪三大著名计划包括(ACE)

A.阿波罗登月计划

B.卫星计划

C.HGP

D.肿瘤计划

E.曼哈顿原子弹计划

四、名词解释

1、生物信息学:广义的生物信息学是指从事对基因组研究相关的生物信息的获取、加工、储存、分配、分析和解释。而狭义的生物信息学是指综合应用信息科学、数学的理论、方法和技术,管理、分析和利用生物分子数据的科学。

2、蛋白质组:指由一个基因组,或一个细胞、组织表达的所有蛋白质。

3、Contig:就是叠连群,是指彼此间可通过重叠序列而连接成较长片段的一组短片段,也指彼此间可通过重叠序列而连接成较长片段的一组短片段。

4、序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。

五、简答题(共30分)

1、下面的粗体部分是从GenBank中查出的记录的部分内容,你从中得到什么信息?(8分)

LOCUS AF486325 477bp DNA linear VRL 12-AUG-2002

相关文档
最新文档