生物信息学习题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、蛋白质得分矩阵类型有 、
、、

等。
2、对位排列主要有局部比对和 三、运算题 1、画出下面两条序列的简单点阵图。将第一条序列放在 x 坐标轴上,将第二条序列放在 y
坐标轴上。 TGAACTCCCTCAGATATTA CGAACCCTCACATATTAGCG
2、对两个核酸序列 ACACACTA 和 AGCACACA 进行全局比对
GTATCACACG ACTCAGCGCA GCATTTGCCC
GTATCACATA GCTCAGCGCA GCATTTGCCC
6、对于下列距离矩阵,用 UPGMA 构建系统发生树。
ABCDE
A0
B3 0
C6 5 0
D 9 9 10 0
E 12 11 13 9 0 7、对下面距离矩阵,用 UPGMA 法构建系统发生树
正确的树的可能性比前一种情况大还是小?
5、对于下列 5 条序列的比对构造一个距离矩阵,其中序列之间的距离值为比对中失配的碱
基数目,但是颠换的权值为转换的两倍。
GTGCTGCACG GCTCAGTATA GCATTTACCC
ACGCTGCACG GCTCAGTGCG GTGCTTACCC
GTGCTGCACG GCTCGGCGCA GCATTTACCC
5 '- ATGCTTGCGGATAGA-3 '。
2、若一条 mRNA 序列 5 '-AUG GGA UGU CGC CGA AAC-3 '被核糖体翻译,将形成怎样
的氨基酸的序列?若将第一个核苷酸删掉而将另一个 A 加到 mRNA 序列的 3 ' - 端,又
将形成怎样的氨基酸序列?
三、问答题
1、 有哪些信息可用于发现基因?
第一章 生物信息学引论(问题与练习)
1、 什么是生物信息学? 2、 生物信息学的主要研究任务是什么? 3、 我国生物信息学的ቤተ መጻሕፍቲ ባይዱ要发展方向是什么? 4、 简述你所了解的人类基因组计划 5、 简述你所了解的生物信息学的基本方法和前沿技术 6、 生物信息学目前的主要研究内容
第二章 生物学基础(问题与练习)
5、试陈述 GenBank 数据库中一条记录下的主要信息
6、 解释正则表达式 C-Y-X2-[DG]-G-X-[ST]的含义
三、 填空题
1、目前国际上最常用的核酸序列数据库有 、


2、列举至少四种权威的蛋白质二级数据库 、 、 和

3、列举至少五种 NCBI 的服务项目 、 、
、和等
四、 名词解释
第八章 后基因组时代的生物信息学(问题与练习)
1、 比较生物还原论与生物综合论的异同 2、 简述“后基因组生物信息学”的基本研究思路 3、 后基因组生物信息学的主要挑战是什么? 4、 功能基因组系统学的基本特征是什么? 5、 说明后基因组生物信息学对信息流动的最新理解 6、 列举几种预测蛋白质-蛋白质相互作用的理论方法 7、 解释从基因表达水平关联预测蛋白质-蛋白质相互作用的理论方法 8、 解释基因保守近邻法预测蛋白质-蛋白质相互作用的理论方法 9、 解释基因融合法预测蛋白质-蛋白质相互作用的理论方法 10、解释种系轮廓发生法预测蛋白质-蛋白质相互作用的理论方法
ABCDE
A0
B8 0
C4 8 0
D6 8 6 0
E8 4 8 8 0 8、 对下面距离矩阵,用邻近归并法构建系统发生树
ABCDE F
A0 5 4 7 6 8
B
0 7 10 9 11
C
0768
D
059
E
08
F
0
9、为了发现最简约树,主要有哪几类搜索策略,各自有什么特点?
10、利用最大似然法构造系统发生树的本质是什么?
1、基序(motif) 2、SNP
3、基因家族
4、概念性翻译
第四章 序列分析(问题与练习)
一、名词解释
1、可读框(ORF) 2、剪切变体 3、表达标签序列(EST) 4、电子克隆
5、同义置换
6、“垃圾”DNA(junk DNA)
7、概念性翻译
二、运算题
1、按照 5 ' -端到 3 ' -端的顺序写出下列核苷酸的互补序列:
第三章 生物信息学资源与数据挖掘工具(问题与练习)
一、 单项选择题(从每题的 A、B、C、D 四个被选答案中选择一个最佳答案。)
1、 如果我们试图做蛋白质亚细胞定位分析,应使用
A、NDB 数据库 B、SWISS-PROT 数据库 C、GenBank 数据库 D、PDB 数据库
2、如果试图确定一个新蛋白质序列属于哪一个蛋白质家族,或该序列可能包含何种结构域
2、 陈述 BLASTn、BLASTp 和 BLASTx 软件的用途
3、 解释正则表达式 C-Y-X2-[DG]-G-X-[ST]的含义
4、 试从密码子使用偏向性角度说明编码区和非编码区的区别
第五章 序列比对(问题与练习)
一、名词解释 序列比对
二、问答题
直系同源
并系同源
序列对位排列的主要用途
三、填空题
或功能位点,应使用
A、PROSITE 数据库 B、DDBJ 数据库 C、PDB 数据库
D、PIR 数据库
3、在蛋白质一级数据库基础上,构建二级数据库应使用
A、近邻归并法
B、序列比对
C、基因融合法
D、Entrez
4、做 DNA 结构分析可使用
A、GenBank 数据库 B、PIR 数据库
C、NDB 数据库 D、BLOCKS 数据库
1、 细胞学说的基本内容 2、 简述细胞分裂周期的全过程 3、 细胞分裂有哪些方式? 4、 说明细胞的分类 5、 简述原核细胞的基本内容 6、 真核细胞的基本结构 7、 陈述蛋白质的生物学功能 8、 试按你的理解对 20 种氨基酸进行分类 9、 画图说明肽键的形成过程 10、 何谓蛋白质一级结构? 11、 何谓蛋白质二级结构? 12、 何谓蛋白质超二级结构? 13、 何谓蛋白质四级结构? 14、 描述核酸的基本组成 15、 叙述 DNA 结构的基本内容 16、 图示目前公认的中心法则 17、 何为蛋白质剪切 18、 何为 GT-AG 规则? 19、 说明原核、真核生物基因的结构特征 20、 阐述 DNA 复制机制的最新进展 21、 阐述基因转录调控模型 22、 总结蛋白质转译的基本机制 23、 总结遗传密码破译的过程 24、 何谓操纵子? 25、 叙述基因表达调控的几个层次
5、向核酸数据库 GenBank/EMBL/DDBJ 提交数据,应使用下列哪个软件
A、BLAST
B、Sequin
C、SRS
D、TreeBASE
6、在蛋白质序列数据库中比较查询蛋白质序列,应使用
A、BLASTn
B、BLASTp
C、tBLASTn
D、BLASTx
7、Profiles 数据库是
A、蛋白质序列数据库 B、核酸序列数据库 C、蛋白质二级数据库 D、蛋白质结构数据
第七章 生物芯片(问题与练习)
1、 解释生物芯片的概念 2、 陈述生物芯片产生的历史背景 3、 根据支持介质划分,生物芯片有哪几种? 4、 根据制备方法划分,生物芯片有哪几种? 5、 根据探针划分,生物芯片有哪几种? 6、 基因芯片的基本原理 7、 基因芯片技术的四个步骤 8、 进行探针设计时需要考虑的主要因素 9、 列举检测芯片杂交信号的主要仪器 10、列举生物芯片的应用领域

8、TreeBASE 系统主要用于
A、发现新基因 B、系统生物学研究 C、类群间系统发育关系研究 D、序列比对
二、 问答题
1、 为什么说 SWISS-PROT 是最重要的蛋白质一级数据库?
2、 构建蛋白质二级数据库的基本原则是什么?
3、 构建蛋白质二级数据库的主要方法有哪些?
4、 叙述 SCOP 数据库对蛋白质分类的主要依据
第六章 分子系统发生分析(问题与练习)
1、构建系统发生树,应使用
A、BLAST
B、FASTA
C、UPGMA
D、Entrez
2、构建系统树的主要方法有


等。
3、根据生物分子数据进行系统发生分析有哪些优点?
4、在 5 个分类单元所形成的所有可能的有根系统发生树中,随机抽取一棵树是反映真实关
系的树的可能性是多少?从这些分类单元所有可能的无根系统发生树中,随机选择一棵
相关文档
最新文档