生物信息学课程复习题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物信息学课程习题

第一章绪论

一、填空

1、在年,美国国会批准启动人类基因组计划,拟用年时间测定人类全部条染色体上共个碱基序列的测定。

2、是遗传信息的携带者。

3、蛋白质三维结构测定主要方法有和。

4、理想的抗生素靶标应为微生物细胞所必须,在病原体中高度,且在人体中或与人类基因有。

5、下图例举了一个计算机辅助药物设计的实例,从a图中我们得到了配体上R基团附近的受体上有和残基,具有性,因此可以将R基团设计为性基团,如图b中所示的基团,使得抑制活性比改造前提高了近5000倍。

二、名词

HGP(human genome project),EST(expressed sequence tag), SNP(single nucleotide polymorphism),生物信息学(Bioinformatics),药物基因组学(Pharmacogenomics),intron,“Junk DNA”,比较基因组学,蛋白质组学,分子进化树(evolutionary tree),基因组,基因组药物

三、简答

1、简述生物信息学在药物研究开发领域的应用可体现在哪些方面?

2、如何利用基因组信息寻找新的药物作用靶标?

3、如何利用人类基因组信息实现个性化治疗,其基于的原理是什么?

4、试叙述基因芯片用于疾病诊断的原理,并说明其优缺点。

5、最近甲型流感流行,请设计甲型流感的分子诊断方法,说明其原理。

第二、三章数据库

一、单选题

1、以下数据库不能用于检索核酸序列的是()

A. GenBank

B. PDB

C. EMBL

D.DDBJ

2、蛋白质结构数据常保存为下面哪一种格式为后缀的文件()

A. PDB

B. txt

C. Seq

D. mdb

3、下列格式属于FASTA格式的是()

A. >seq1

B.

C. ATGCCATA

D. > ATGCCATA

ATGCCATA ATGCCATA

二、填空题

1、阅读以下数据格式,写出以下标注的含义:

LOCUS是,DEFINITION是,ACCESSION是,VERSION是,SOURCE是

在论文中使用了NCBI数据库中的该序列,应标注该序列的编号,应填。

2、阅读以下Prosite中结构基序的示例,说明其中各符号含义:

-连字符用来。

[ ] 每个方括号中的残基代表序列基序中某一特殊位置的残基。

{ } 大括号中的符号代表序列基序中特定位置的残基。

X 表示。

(n) 代表某特定残基的。

3、下面是NCBI中SARS病毒的基因组,请根据以下图说明SARS基因组有个基因,编码个蛋白。

4、检索蛋白质序列可使用哪个数据库,试举两例、。

5、检索蛋白质结构常使用数据库。

6、根据以下检索结果说明该蛋白质结构在PDB数据库中的编号为,其结构测定方法为。

三、名词

一级数据库,二级数据库,Genbank,UniGene,PDB,MMDB格式,EMBL,NCBI,结构浏览器,Rasmal,swiss-pdbviewer,Swiss-model,Prints数据库,Prosite数据库,BankIt,Cn3D,PIR数据库,SCOP数据库,CATH数据库

第四章生物信息检索

一、填空题

1、请例举两个常用的搜索引擎、。

2、如果要搜索一个词组,如把人类基因组作为一个词组,搜索相关信息,应在搜索引擎的搜索栏中填入。

3、写出以下pubmed检索时常用的限制字段的含义:[au]

[ti] 、[dp] 、[affiliation] 、*

二、名词

Pubmed,Espacenet,USPTO

第五章序列比对

一、选择题

1、进行多序列比对常使用哪种软件( )

A. Dock

B. Compute pI/MW

C. Clustal

D. Rasmol

2、对于远源蛋白质序列,在进行多序列比对的时候应选用下面哪一种矩阵()

A. BLOSUM62

B. BLOSUM30

C.PAM100

D. 结合基序打分矩阵

二、填空题

1. 要搜索一段基因序列的同源基因序列,常使用。

2、下图示意的序列比对方法为

3、Needleman和Wunsch在1970年提出一种比对算法,算法实现主要分三步:首先求出一定积分系统下的,其次求出,最后寻找两个序列的,获得最佳比对形式。

三、名词

aligment,多重序列比对,Clustal,Blast,gap,局部比对,序列比对的E值,PAM矩阵,BLOSUM 矩阵,两条序列的identities,动态规划算法(dynamic programming algorithm)

四、简答

1、简述序列比对的用途。

2、某实验克隆表达了灰葡萄孢霉菌的HMGCoA还原酶,该菌中这一酶此前未被研究过,现在拟通过定点突变实验研究该酶的性质和功能,请问该使用哪些生物信息学手段设计合适的突变位点。

第六章核酸序列分析

一、填空题

1、对于任一DNA序列(或cDNA序列),可能存在种不同的阅读框,其中个为正向的,个为反向的。

2、原核生物启动子有两段保守序列,即左右的TATAAT,以及左右的TTGACA,它们为结合位点和识别位点。

二、名词

外显子,内含子,启动子,终止子,起始密码,终止密码,ORF,Kozak序列,密码子使用频度,ORF Finder,GT-AG法则,GeneSplicer,CpG岛,REBASE,Alu序列,RepBase,电子克隆,中度重复序列,高度重复序列

三、问答

1、真核生物基因结构与原核生物基因结构相比有哪些异同点。

2、试述基因结构分析的一般步骤。

第七章蛋白质序列分析

一、填空题

1、蛋白质二级结构预测算法可概括为哪三种类别、、。

2、蛋白质三级结构预测最常用也是精度最高的方法是。

3、分子力学的方法计算蛋白质三级结构的基本假设是:蛋白质天然构象是的构象。

4、蛋白质结构从头预测遇到的两大难题一是分子折叠态与非折叠态之间的能量,二是问题。

5、请例举两个二级结构预测方法、。

6、Chou-Fasman方法二级结构预测的基本出发点在于对于蛋白质中在不同的中出现的进行统计分析得出,然后在一定规则的指导下就可以进行预测。

7、蛋白质组学研究常使用技术,该方法首先是,然后是电泳。

8、1986年Von Heijine通过对各种跨膜蛋白的统计分析发现,带电荷的氨基酸主要分

相关文档
最新文档