生物信息学复习题已附答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本卷的答案仅做参考,如有疑问欢迎提出。后面的补充复习题要靠你们
自己整理答案了。
生物信息学复习题
一、填空题
1、识别基因主要有两个途径即基因组DNA外显子识别和基于EST策略的基因鉴定。
2、表达序列标签是从mRNA 中生成的一些很短的序列(300-500bp),它们代表在特定组织或发育阶段表达的基因。
3、序列比对的基本思想,是找出检测基因和目标序列的相似性,就是通过在序列中插入空位的方法使所比较的序列长度达到一致。比对的数学模型大体分为两类,分别是整体比对和局部比对。
4、2-DE的基本原理是根据蛋白质等电点和分子量不同,进行两次电泳将之分离。第一向是等电聚焦分离,第二向是SDS-PAGE分离。
5、蛋白质组研究的三大关键核心技术是双向凝胶电泳技术、
质谱鉴定技术、计算机图像数据处理与蛋白质数据库。
二、判断题
1、生物体的结构和功能越复杂的种类就越多,所需要的基因也越多,C值越大,这是真核生物基因组的特点之一。(对)
2、CDS一定就是ORF。(对)
3、两者之间有没有共同的祖先,可以通过序列的同源性来确定,如果两个基因或蛋白质有着几乎一样的序列,那么它们高度同源,就具有共同的祖先。(错)
4、STS,是一段200-300bp的特定DNA序列,它的序列已知,并且在基因组中属于单拷贝。(对)
5、非编码DNA是“垃圾DNA”,不具有任何的分析价值,对于细胞没有多大的作用。(错)
6、基因树和物种树同属于系统树,它们之间可以等同。(错)
7、基因的编码序列在DNA分子上是被不编码的序列隔开而不连续排列的。( 对)
8、对任意一个DNA序列,在不知道哪一个碱基代表CDS的起始时,可用6框翻译法,获得6个潜在的蛋白质序列。(对)
9、一个机体只有一个确定的基因组,但基因组内各个基因表达的条件和表达的程度随时间、空间和环境条件而不同。(对)
10、外显子和内含子之间没有绝对的区分,一个基因的内含子可以是另一个基因的外显子,同一个基因在不同的生理状况或生长发育的不同阶段,外显子组成也可以不同。(对)
11、比较是科学研究中最常见的方法,在生物信息学研究中,比对是最常用和最经典的研究方法。(对)
12、ORF一定就是CDS。(错)
13、用不同的方法可以构建不同的系统发育树,为保证分析结果的可靠性,需要对进化树进行评估。(对)
14、相似性是一种很直接的数量关系,无需实验验证。(错)
15、基因树和物种树同属于系统树,它们之间可以等同。(错)
16、蛋白质和DNA的同源性常常通过它们序列的相似性来判定,如果两个基因或蛋白质有着几乎一样的序列,具有高度的相似性,那么它们一定是同源。(错)
17、所谓局部比对是找出两个被比较序列的最类似片段。(对)
三、不定项选择题
1、(ABC )是现在国际上最主要的三大核酸序列数据库
A. EMBL
B. DDBJ
C. GenBank
D. NCBI
E. EBI
2、RFLP是DNA多态性中最多见的一种,它产生的机制包括(ABE )
A.DNA分子产生突变,使某些酶切位点数增加
B. DNA分子产生突变,使某些酶切位点数减少
C. 限制性酶切位点之间重复序列数目变异
D. 限制性酶星活性
E. 限制性酶切位点前后的DNA片断发生插入或删除
3、下面序列哪些为反向重复序列( BD )
A. …GCACTTG…GCACTTG…
B. …GCACTTGCAAGTGC……CGTGAAC…CGTGAAC……CGTGAACGTTCACG…
C. …GCACTTG…CAAGTGC…
D. …GCACTAGCTAGCGG……CGTGAAC…GTTCACG……CGTGATCGATCGCC…
4、分析EST序列时首要注意以下几点(ACDE )
A.EST序列中除了A\G\T\C外,可能出现未知碱基
B.EST只是单次测序,得出的结果没有可信度
C.EST序列中可能出现错误的插入和缺失,导致读码框移位
D.某个EST序列是数据库中另一序列的一个片段
E.某个EST序列不在基因的编码区内
5、人类基因组计划要完成的几张图谱分别是(ABCE )
A. 物理图谱
B. 遗传图谱
C. 序列图谱
D. 生物图谱
E. 基因图谱
6、最常用的序列相似性查询工具是(AB )
A.FASTA
B.BLAST
C.SWISS-PROT
D.PDB
E.PIR
7、下列哪些分子类型属于非蛋白质编码区(ABCDE )
A.内含子
B.卫星DNA
C.伪基因
D.启动子
E.增强子
8、卫星DNA的多态性是由( D )所决定的。
A. DNA点突变个数
B. 限制性内切酶识别序列个数不同
C. DNA的二级结构不同
D. 重复单位不同E.重复次数不同
9、真核基因组特点包括(ABCDE )
A. 基因组大,巨大的非编码序列,重复序列占了绝大部分
B. 基因结构复杂,无显著长度的开放阅读框
C. 存在可变剪接
D. CpG岛
E. 等值区
10、20世纪三大著名计划包括(ACE)
A.阿波罗登月计划
B.卫星计划
C.HGP
D.肿瘤计划
E.曼哈顿原子弹计划
四、名词解释
1、生物信息学:广义的生物信息学是指从事对基因组研究相关的生物信息的获取、加工、储存、分配、分析和解释。而狭义的生物信息学是指综合应用信息科学、数学的理论、方法和技术,管理、分析和利用生物分子数据的科学。
2、蛋白质组:指由一个基因组,或一个细胞、组织表达的所有蛋白质。
3、Contig:就是叠连群,是指彼此间可通过重叠序列而连接成较长片段的一组短片段,也指彼此间可通过重叠序列而连接成较长片段的一组短片段。
4、序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。
五、简答题(共30分)
1、下面的粗体部分是从GenBank中查出的记录的部分内容,你从中得到什么信息?(8分)
LOCUS AF486325 477bp DNA linear VRL 12-AUG-2002