生物信息学填空题(个人整理)

合集下载

生物信息学习题

生物信息学习题

一:名词解释1.生物信息学2.NCBI3.PubMed4.生物芯片5.BLAST6.UniProt7.电子克隆8.EMBL二:填空题1.基因芯片可以分为2. 人类基因组全序列分析分两大步骤即制图和测序,并最终绘制出四张图谱:3. 分子系统发生分析主要分为三个步骤即4. 国际上最主要的三大核酸序列数据库分别是5. 蛋白质得分矩阵有7. 文献是掌握科研进展的最直接方式,目前由NCBI维护的大型文献资源是。

3. 用于核酸序列比对中常见的三种得分矩阵,分别为4. 根据生物芯片探针分子类型的不同,可以将生物芯片哪三种,5. 核酸序列分析所获得的信息主要有(举例说明四个)6. 限制性酶切分析是分子生物学实验中的日常工作之一,这方面最好的限制酶数据库是三:选择题1、如果试图确定一个新蛋白质序列属于哪一个蛋白质家族,或该序列可能包含何种结构域或功能位点,应使用:()A: PROSITE数据库 B: DDBJ数据库C: PIR数据库 D: PDB数据库2、构建序列进化树的一般步骤不包括:()A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树3、BLAST教案所程序中,哪个方法是不存在的?()A:BLASTP B:BLASTN C:BLASTX D:BLASTQ4. 以下常见的几个物种,哪一个目前还没有完成全基因组测序:()A: 茶树 B: 玉米 C: 水稻 D: 小鼠5、向核酸序列数据库(GenBank/EMBL/DDBJ)提交数据,应该使用下面哪个软件:()。

A: Blast B:Sequin C:SRS D:Swiss-Model6、在蛋白质序列数据库中比较查询手头未知的蛋白质序列,应使用Blast中哪个具体的算法:()。

A:BLASTX B:tBLASTN C:BLASTP D:BLASTN7、下列中属于一级蛋白质结构数据库的是:()A:EMBL B:DDBJ C:PDB D:SWISS-PROT8、下面不属于SWISS-PROT蛋白质数据库的注释范畴的是:()A: 与其它蛋白质的相似性 B: 蛋白质的二级结构C: 由于缺乏该蛋白质而引起的疾病 D: 核酸的功能描述9、下列属于蛋白质二级结构预测的软件程序是()A: BLASTX B:SOPMA C:DNAstar D:GO10. 如果做DNA结构分析,应该考虑用下面哪个数据库:()A:GenBank B: PIR C:NDB D:UniProt四:简单题1.简述Entrez的设计概念和使用方法?2. 简述生物大分子PDB存储的生物分子种类和数据结构特点?3.简述生物信息学的研究意义?4 简述蛋白质序列分析的基本内容以及常用的软件?5. 简述Swiss-Prot的数据结构?6、简述序列多重比对的意义?7、简述生物信息学的发展历史?五:论述题1.论述蛋白质相互作用研究的意义,传统的实验方法和计算预测方法的应用?2.论述后基因组时代生物信息学面临的挑战和研究策略?3.论述生物信息学的应用?4. 论述如何利用基因芯片数据做聚类分析。

生物信息学考试试题

生物信息学考试试题

生物信息学考试试题生物信息学考试试题:一、选择题1. 以下哪种是常见的生物信息学数据库?A. NCBIB. AmazonC. GoogleD. Instagram2. 下列哪一个不是生物信息学中常见的序列比对软件?A. BLASTB. ClustalWC. PhotoshopD. MUSCLE3. 生物信息学中常用的数据分析工具是?A. Microsoft ExcelB. SPSSC. RD. Adobe Photoshop4. BLAST是用来做什么的?A. 序列比对B. 图像处理C. 文本编辑D. 网页设计5. NCBI是什么机构的缩写?A. National Center for Biotechnology InformationB. National Center for Business IntelligenceC. New York City Bureau of InvestigationD. North Carolina Biological Institute二、填空题1. 生物信息学的研究对象是________。

2. 为了识别蛋白质功能和结构,可以使用________软件进行序列比对。

3. 研究生物信息学常用的数据库之一是________。

4. 生物信息学中的图形工具有助于可视化________。

5. 生物信息学可以帮助人们理解________的基本原理。

三、简答题1. 请解释生物信息学在生物学研究中的重要性。

2. 什么是序列比对?它在生物信息学中有什么作用?3. 请举例说明生物信息学数据库的用途。

四、综合题根据以下序列,请使用BLAST软件进行在线比对,并分析结果:序列1:ATGGCCATAG序列2:ATGCCGATAG序列3:ATGGCTATAG序列4:ATGGTCATAG请写出每个序列与其他序列的比对结果,并解释相似性及差异性。

以上为生物信息学考试试题,希望您认真作答,祝您考试顺利!。

生物信息学习题

生物信息学习题

第六章 分子系统发生分析(问题与练习)
1、构建系统发生树,应使用
A、BLAST
B、FASTA
C、UPGMA
D、Entrez
2、构建系统树的主要方法有


等。
3、根据生物分子数据进行系统发生分析有哪些优点?
4、在 5 个分类单元所形成的所有可能的有根系统发生树中,随机抽取一棵树是反映真实关
系的树的可能性是多少?从这些分类单元所有可能的无根系统发生树中,随机选择一棵

8、TreeBASE 系统主要用于
A、发现新基因 B、系统生物学研究 C、类群间系统发育关系研究 D、序列比对
二、 问答题
1、 为什么说 SWISS-PROT 是最重要的蛋白质一级数据库?
2、 构建蛋白质二级数据库的基本原则是什么?
3、 构建蛋白质二级数据库的主要方法有哪些?
4、 叙述 SCOP 数据库对蛋白质分类的主要依据
第八章 后基因组时代的生物信息学(问题与练习)
1、 比较生物还原论与生物综合论的异同 2、 简述“后基因组生物信息学”的基本研究思路 3、 后基因组生物信息学的主要挑战是什么? 4、 功能基因组系统学的基本特征是什么? 5、 说明后基因组生物信息学对信息流动的最新理解 6、 列举几种预测蛋白质-蛋白质相互作用的理论方法 7、 解释从基因表达水平关联预测蛋白质-蛋白质相互作用的理论方法 8、 解释基因保守近邻法预测蛋白质-蛋白质相互作用的理论方法 9、 解释基因融合法预测蛋白质-蛋白质相互作用的理论方法 10、解释种系轮廓发生法预测蛋白质-蛋白质相互作用的理论方法
1、蛋白质得分矩阵类型有 、
、、

等。
2、对位排列主要有局部比对和 三、运算题 1、画出下面两条序列的简单点阵图。将第一条序列放在 x 坐标轴上,将第二条序列放在 y

生物信息学答案1111

生物信息学答案1111

一、名词解释(共15分,每个3分)1.生物信息学:(狭义)专指应用信息技术储存和分析基因组测序所产生的分子序列及其相关数据的学科;(广义)指生命科学与数学、计算机科学和信息科学等交汇融合所形成的一门交叉学科。

2.系统发生学:phylogenetics,研究物种之间的进化关系的一门学科,从生物信息的角度主要是利用核酸和蛋白质序列分析的方法进行。

3.BLAST:Basic Local Alignment Search Tool的缩写,基本的基于局部对准的搜索工具;一种快速查找与给定序列具有连续相同片断的序列的技术。

4.中心法则:是指遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,即完成遗传信息的转录和翻译的过程。

也可以从DNA传递给DNA,即完成DNA的复制过程。

这是所有有细胞结构的生物所遵循的法则。

5.CHIP:又称微阵列(microarray),有多种形式,主要由大量cDNA、寡核苷酸探针或蛋白质密集排列所形成的探针阵列,其工作的基本原理是通过核酸或蛋白质杂交的远离了检测表达信息。

二、填空题(共10分,每空1分)1. 目前三大主要综合性基因序列数据库是:Genebank;DDBJ和EMBL。

2. 蛋白质的折叠预测方法:同源建模,折叠识别和从头预测。

3. 在Pubmed中进行如下检索W ANG ym [au],表明检索是依据作者姓名;4. 进化树构建过程中采用的主要方法有:UPGMA;Neighbor joining;maximum likelihood;三、选择题(共10分,每个2分)1. 下列哪个选项不是微阵列实验设计的内容?(A)A:贝叶斯网络法B:对照组的选择C:重复样本的使用D:随机化原则2. 构建序列进化树的一般步骤不包括:(A)A:建立DNA文库B:建立数据模型C:建立取代模型D:建立进化树3. 下列中属于一级蛋白质结构数据库的是:(D)A. EMBLB. DDBJC. PDBD.SWISS-PROT4. 蛋白质结构预测分为:(C)A.一级和三级结构预测 B. 二级和空间结构预测C. 三级和空间结构预测D. 二级和三级结构预测5. Cy3/Cy5双色芯片主要用来研究:(D)A.蛋白的定位; B. 基因在染色体上的位置;C. 基因的可变剪接;D. 基因表达模式;四、简答题(共3题,15分)1.生物信息学分析的数据对象主要有哪几种?这些数据之间存在着什么关系?其研究重点主要落实在核酸和蛋白质两个方面,包括它们的序列、结构和功能(1分)。

生物信息学复习题

生物信息学复习题

生物信息学复习题### 生物信息学复习题#### 一、选择题1. 生物信息学主要研究的是什么?A. 生物学数据的收集和存储B. 生物学数据的分析和解释C. 生物学实验的设计和执行D. 生物学仪器的操作和维护2. 下列哪一项不是生物信息学中常用的数据库?A. GenBankB. PDBC. PubMedD. Google Scholar3. 序列比对的目的是什么?A. 确定序列间的同源性B. 预测蛋白质的三维结构C. 鉴定基因的功能D. 计算基因的表达量#### 二、填空题1. 生物信息学中的BLAST工具主要用于__________。

2. 基因表达分析中常用的芯片技术包括__________和__________。

3. 在蛋白质结构预测中,同源建模依赖于__________数据库中的已知结构。

4. 转录组测序(RNA-Seq)可以用于研究__________和__________。

#### 三、简答题1. 描述基因组注释的一般流程。

2. 阐述生物信息学在药物设计中的应用。

3. 解释什么是系统发育树,并说明其在进化研究中的意义。

#### 四、计算题1. 给定一段DNA序列,计算其GC含量。

(示例序列:ATCGTACGTAGCTAGCTAG)2. 如果一个蛋白质序列的分子量为12345 Da,其氨基酸的平均分子量为110 Da,计算该蛋白质序列中氨基酸的数量。

#### 五、论述题1. 讨论生物信息学在个性化医疗中的作用和挑战。

2. 分析高通量测序技术对生物信息学领域的影响。

通过以上题目的复习,可以帮助学生掌握生物信息学的基础知识和技能,包括对生物数据的分析、解释和应用。

这些知识点不仅涵盖了生物信息学的基础理论,还涉及到实际应用,如药物设计、个性化医疗等,为学生提供了一个全面的复习框架。

生物信息学_复习题及答案(打印)(1)

生物信息学_复习题及答案(打印)(1)

生物信息学_复习题及答案(打印)(1)一、名词解释:1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。

利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。

2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。

3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。

4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。

该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。

5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI 的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。

6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。

P947.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。

P988.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。

包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。

P299.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。

P2910.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。

生物信息学试题

生物信息学试题

生物信息学考题(2012版)一、填空题(共10分,每空一分)1、美国政府于1990年10月启动耗资30亿美元的15年研究计划,预期到2005年完成人类基因组大约30亿个碱基的全序列测定,这就是被称为生命科学“登月计划”的人类基因组计划。

2、生物信息学的研究目标:以核酸、蛋白质等生物大分子数据库为主要对象,以数学、信息学、计算机科学为主要手段,以计算机硬件、软件和计算机网络为主要工具,对浩瀚如海的原始数据进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。

3、随着生物信息学的诞生及应用,今后生物学研究项目的起点将是理论的,一位科学家将从理论推测开始,然后转向试验去追踪或检验该假设。

4、生物信息学作为一门交叉学科,已经成为当今生命科学乃至整个自然科学的重大前沿领域之一,也将是21世纪自然科学的核心领域之一。

5、人类基因组计划、“曼哈顿原子计划”和“阿波罗登月计划”并称为20世纪的三大著名计划,中国在1999年承担了1%的研究任务,即对第3号染色体上3000万碱基对的测定。

6、人类基因组的主要任务是:人类基因组以及一些模式生物(细菌、酵母、线虫、果蝇等)基因组作图、测序和基因识别。

二、是非题(共10分,每小题1分)1、生物学就是实验科学,所有的研究结论从实验中来,于实验中得到验证。

(错)2、比较是科学研究中最常见的方法,在生物信息学研究中,比对是最常用和最经典的研究手段。

(对)3、两个蛋白质序列相似性超过30%就是同源蛋白。

(错)4、蛋白质序列相似性指一级序列中氨基酸残基相同。

(错)5、蛋白质序列相似性指氨基酸残基具有相似特性:侧链基团大小电荷性、疏水性等相同。

(对)6、核酸序列相似性指序列中相同碱基所占的比例。

(对)7、对一段未知功能DNA片段进行功能预测需对其进行3位翻译。

(错)8、对一段未知功能DNA片段进行功能预测需对其进行6位翻译。

(对)9、相似性是指一种很直接的数量关系,无需实验验证。

(完整word版)生物信息学填空题(个人整理)

(完整word版)生物信息学填空题(个人整理)

1、BLAST教案所程序中,哪个方法是不存在的?(D)A:BLASTP B:BLASTN C:BLASTX D:BLASTQ2、下列哪个软件不是常用来观察蛋白质结构视图的?(D)A:AVS B:Chimera C:MICE D:HMM3、下列哪个不是点突变的类型?(A)A:染色体畸变 B:错义突变 C:无义突变 D:移码突变4、基因突变的效应不包括:(C)A:有利突变 B:中性突变 C:移码突变D:遗传多态现象5、人类基因组的结构特点不包括:(A)A:基因进化 B:基因数目 C:基因重复序列 D:基因组复制6、世界上三大数据库不包括:(B)A:NCBI B:BLAST C:UCSC D:Ensembl7、常用序列比对方法错误的是:(C)A:编辑距离 B:点阵描图 C:局部比对 D:记分模式8、下列哪个不是蛋白质结构模型?(D)A:同源性模型 B:折叠识别 C:ab initio折叠 D: MoLScript结构9、下列哪个选项不是微阵列实验设计的内容?(A)A:贝叶斯网络法 B:对照组的选择 C:重复样本的使用 D:随机化原则10、构建序列进化树的一般步骤不包括:(A)A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树11、下列中属于一级蛋白质结构数据库的是:(C)A. EMBLB. DDBJC. PDBD.SWISS-PROT12.蛋白质结构预测分为:(B)A.一级和三级结构预测 B. 二级和空间结构预测C. 三级和空间结构预测D. 二级和三级结构预测13.数据挖掘的四个步骤不包括下列哪个:(C)A. 数据选择B. 数据转换C. 数据记录D. 结果分析14.下列哪项不是生物学研究必备的工具:(A)A.数据分析B.数据统计C.因素分析D.多元回归分析15.Linux中rmdir 命令的功能是:(D)A.改变工作目录 B.删除工作目录C. 创建目录D.删除空目录16.BLAST教案所程序中,哪个方法是不存在的?(D)A:BLASTP B:BLASTN C:BLASTX D:BLASTQ17.下列哪个不是蛋白质结构模型?(D)A:同源性模型 B:折叠识别 C:ab initio折叠 D: MoLScript结构18.人类基因组的结构特点不包括:(A)A:基因进化 B:基因数目 C:基因重复序列 D:基因组复制19、下列哪个选项不是微阵列实验设计的内容?(A)A:贝叶斯网络法 B:对照组的选择 C:重复样本的使用 D:随机化原则20、构建序列进化树的一般步骤不包括:(A)A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树三、填空题1、数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。

生物信息学习题

生物信息学习题

1、基序(motif):通过多序列比对,将同源序列收集在一起,以得到保守区域。

这些保守区域称为基序(motifs)2、可读框(ORF):没有终止密码子(TGA,TAA或TAG)打断的阅读框。

3、剪切变体:从同一DNA,转录得到不同mRNA,并最终翻译成不同的蛋白质称为剪接变体4、表达标签序列(EST):是从cDNA文库中生成的一些很短的序列(300—500bp),它们代表在特定组织或发育阶段表达的基因,有时可代表特定的cDNA.5、系统发生学:通过比较五种的特征,认为特征相似的五种在遗传学上相近,研究五种之见的进化关系二、填空题(共20分,每空1分)l、列举至少2种权威的核酸序列数据库Genbank 、EMBL 等。

2、列举至少3种权威的蛋白质序列数据库PIR 、Swiss-prot 、MIPs 等。

3、核酸序列比对使用的得分矩阵类型有等价矩阵、BLAST 、和转换-颠换矩阵等。

4、蛋白质结构分类数据库主要有SCOP 和CAH 和PDBsum 等。

5、构建系统树的主要方法有UPGMA法、邻近归并法、Fitch-Margoliash法、最小进化法(ME)、最大似然法(ML)、等。

6、列举至少4中NCBI的服务功能Pubmed 、Entrez 、BLAST 和OMIM 等。

1、为什么说Swiss-Prot是重要的蛋白质序列数据库?SwissProt数据库中的所有序列条目都经过有经验的分子生物学家和蛋白质化学家通过计算机工具并查阅有关文献资料仔细核实。

SIB和EBI共有70多人的研究队伍,专门从事蛋白质序列数据的搜集、整理、分析、注释、发布,力图提供高质量的蛋白质序列和注释信息。

SwissProt数据库的每个条目都有详细的注释,包括结构域、功能位点、跨膜区域、二硫键位置、翻译后修饰、突变体等。

该数据库中还包括了与核酸序列数据库EMBL/GenBank/DDBJ、蛋白质结构数据库PDB以及Prosite、PRINTTS等十多个二次数据库的交叉引用代码。

《生物信息学》题集

《生物信息学》题集

《生物信息学》题集一、选择题(每题3分,共30分)1.生物信息学的主要研究对象是什么?A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术?A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中,进行多序列比对时常用的软件是什么?A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析?A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中,下列哪项不是常用的序列分析技术?A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用?A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测?A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中,下列哪项不是基因注释的内容?A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术?A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用?A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题(每题2分,共20分)1.生物信息学是一门交叉学科,它主要涉及______、计算机科学和数学等领域。

2.在生物信息学中,______技术常用于基因序列的相似性搜索。

3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。

4.在基因表达数据分析中,______是一种常用的数据标准化方法。

5.生物信息学中,______技术常用于蛋白质结构的预测和分析。

6.在生物信息学数据库中,GenBank主要存储的是______数据。

生物信息学填空题

生物信息学填空题

填空题:1、蛋白质结构数据来源:①实验测定方法: X-ray 、 NMR 、Cryo-EM ②理论预测:同源建模、折叠识别、从头计算2、一级数据库:①一级核酸数据库:Genbank(美国)、EMBL (欧洲)、DDBJ(日本) NCBI②一级蛋白质序列数据库:SWISS-PORT 、PIR 、 NCBI③一级蛋白质结构数据库:PDB、 pfam 、 prosite大分子序列格式:fasta数据库基本文件格式:genbank蛋白质分类数据库:SCOP、CATH 、 FSSP二次数据库: GDB 、 Prosite、 TRANSFAC3、本地软件: Clustal-x 、 BioEdit 、 Mega、 sequencher、 spdbv、 Discovery-studio4、本课程主要理论依据:相似性、同源性、序列比对(3D结构比对)、数学方法、分子动力、分子力学5、基因鉴定三步骤:①找到序列中的非编码区(低复杂度区)②找基因③鉴定找到的基因6、主要的生物大分子数据:①DNA:基因组序列、基因序列、cDNA、EST、碱基修饰DNA 功能模块 /位点(如启动子、剪接体、表达调控位点等)②蛋白质:氨基酸组成、氨基酸序列、理化性质、原子坐标;二级结构、核体、结构域、功能域 /位点; 3D 结构常见的生物信息数据记录格式:FASTA 、GenBank、EMBL、 PDBFASTA 格式:序列文件的第一行由大于符号>大头的任意文字说明,主要为标记序列用。

从第二行开始是序列本身,标准核苷酸符号或氨基酸单字母符号,通过核苷酸符号大小写均可,而氨基酸一般用大写字母。

文件中和每一行都不要超过80 个字符(通常60 个字符)GenBank格式:序列名称、长度。

日期;序列说明、编号、版本号;物种来源、学名、分类60学位置;相关文献作者、题目、刊物、日期;序列特征表;碱基组成;序列本身(每行个)二 .填空题1.常用的三种序列格式: NBRF/PIR,FASTA 和 GDE2.初级序列数据库: GenBank, EMBL 和 DDBJ3.蛋白质序列数据库: SWISS-PROT 和 TrEMBLPIR (蛋白4. 提供蛋白质功能注释信息的数据库:KEGG (京都基因和基因组百科全书)和质信息资源) 5. 目前由 NCBI 维护的大型文献资源是PubMed6.数据库常用的数据检索工具: Entrez, SRS, DBGET7.常用的序列搜索方法: FASTA 和 BLAST8.高分值局部联配的 BLAST 参数是 HSPs(高分值片段对), E(期望值) 9. 多序列联配的常用软件: Clustal10.蛋白质结构域家族的数据库有:Pfam, SMART11. 系统发育学的研究方法有:表现型分类法,遗传分类法和进化分类法12. 系统发育树的构建方法:距离矩阵法,最大简约法和最大似然法13. 常用系统发育分析软件:PHYLIP 14.检测系统发育树可靠性的技术: bootstrapping 和 Jack-knifing 15. 原核生物和真核生物基因组中的注释所涉及的问题是不同的16. 检测原核生物ORF 的程序: NCBI ORF finder17. 测试基因预测程序正确预测基因的能力的项目是GASP(基因预测评估项目)18.二级结构的三种状态:α螺旋,β折叠和β转角19.用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括输入层,隐含层和输出层20.通过比较建模预测蛋白质结构的软件有SWISS-PDBVIEWER ( SWISS — MODEL 网站) 21. 蛋白质质谱数据搜索工具:SEQUEST 22. 分子途径最广泛数据库:KEGG23. 聚类分析方法,分为有监督学习方法,无监督学习方法24. 质谱的两个数据库搜索工具:1、 SEQEST 和 Lutkefi 三大数据库:核酸序列数据库、蛋白质序列数据库、结构数据库世界三大核酸序列数据库:GenBank、 EMBL-Bank 、 DDBJ蛋白质序列数据库:Swiss-Prot、 TrEMBL 、UniProt蛋白质结构数据库:PDB 、SCOP、CATH2、 GenBank 文献、提供了提供的服务:提供了EntrezBLAST 序列类似性检索。

生物信息学考试试题

生物信息学考试试题

生物信息学考试试题一、选择题(每题 3 分,共 30 分)1、以下哪种不是常见的生物信息学数据库?()A GenBankB SWISSPROTC PubMedD Baidu2、在 DNA 序列分析中,以下哪个不是用于序列比对的算法?()A NeedlemanWunsch 算法B SmithWaterman 算法C BLAST 算法D Fourier 变换算法3、蛋白质结构预测的方法不包括()A 同源建模B 从头预测C 折叠识别D 随机模拟4、以下哪种不是基因表达数据分析的常用方法?()A 聚类分析B 主成分分析C 判别分析D 回归分析5、生物信息学中,用于预测蛋白质功能的方法有()A 基于序列相似性B 基于结构相似性C 基于基因共表达D 以上都是6、在基因组学中,以下哪个不是测序技术?()A Sanger 测序B 二代测序C 三代测序D 四代测序7、系统发生树构建的方法不包括()A 距离法B 最大简约法C 最大似然法D 最小二乘法8、以下哪种不是生物信息学中常用的编程语言?()A PythonB JavaC C++D Visual Basic9、以下哪个不是生物信息学在医学领域的应用?()A 疾病诊断B 药物研发C 医疗美容D 个性化医疗10、生物信息学中,处理大规模数据常用的工具是()A ExcelB R 语言C SPSSD Word二、填空题(每题 2 分,共 20 分)1、生物信息学是一门融合了生物学、计算机科学和()的交叉学科。

2、常见的核酸序列格式有 FASTA 和()。

3、蛋白质的二级结构包括α螺旋、β折叠和()等。

4、基因芯片技术是一种()分析技术。

5、序列比对的目的是寻找两个或多个序列之间的()。

6、人类基因组计划的主要目标是测定人类基因组的()序列。

7、生物信息学中的隐马尔可夫模型主要用于()。

8、系统发生分析中,外群的作用是()。

9、蛋白质相互作用网络分析有助于理解()。

10、生物信息学数据库可以分为一级数据库和()数据库。

《生物信息学》试卷(B)

《生物信息学》试卷(B)

武汉大学2007—2008学年度高校教师研修班《生物信息学》试卷(B)及答案一、翻译下列名词并解释。

(每题5分,共25分)1. HGP2. SRS3. Markov Chain4. ANN5. CDS二、填空(每空2分,共20分)1、生物信息学主要研究的两种信息载体是和。

2、目前国际上主要的核酸数据库是由建立和维护的、由维护的,和日本遗传研究所建立和维护的。

每个机构负责收集来自不同地理分布的数据, 3 个数据库所有信息并向世界开放,3、在进行序列两两比对时,有两方面问题直接影响相似性分值:和。

三、解释说明:请按要求对下列GenBank文件作解释说明。

(每小题4分,共20分)1、LOCUS行中的第3项mRNA linear表示,这里是。

2、DEFINITION行在GenBank记录中用以3 ACCESSION 是,是从数据库中检索一个记录的主要。

4. FEATURES后面部分是,直接表达了记录的生物背景知识,5 CDS 30…533 表示。

四、问答。

(共35分)1、DNA测序有哪些方法?其基本原理是什么?(10分)2、简述蛋白质结构预测的基本思想和方法。

(10分)3、试述人类基因组计划与生物信息学的关系。

(15分)《生物信息学》试卷(B)答案一、翻译下列名词并解释。

(每题5分,共25分)1. HGP Human genome project人类基因组计划2. SRS Sequence Retrieval System 序列检索系统3. 马尔科夫链(Markov Chain),对于生物分子序列分析,马尔科夫链是一个很好的数学统计模型,因为马尔科夫链本身就是相继发生事件的序列,其特征是对于事件序列中的任何一个事件都有一个发生概率,而这个概率依赖于该事件之前的若干个事件。

4. ANN Artificial Neural Network, 人工神经网络5. CDS指的是编码序列,从起始密码子到终止密码子二、填空(每空2分,共20分)1、生物信息学主要研究的两种信息载体是DNA分子和蛋白质分子2、目前国际上主要的核酸数据库是由美国国立生物技术信息中心建立和维护的Genbank库、由欧洲生物信息学研究所(EBI)维护的EMBL-Bank,和日本遗传研究所建立和维护的日本DNA 数据仓库(DDBJ)。

生物信息学复习题已附答案

生物信息学复习题已附答案

本卷的答案仅做参考,如有疑问欢迎提出。

后面的补充复习题要靠你们自己整理答案了。

生物信息学复习题一、填空题1、 识别基因主要有两个途径即2、 表达序列标签是从 mRNA 中生成的一些很短的序列( 300-500bp ),它们代表在特定组织或发育阶段表达的基因。

3、 序列比对的基本思想,是找出 检测基因 和 目标序列 的相似性,就是通过在序列中插入 空位的方法使所比较的序列长度达到一致。

比对的数学模型大体分 为两类,分别— 和局部比对 。

4、 2-DE 的基本原理是根据蛋白质 和 分子量 不同,进行两次电泳将之分 离。

第一向是 等电聚焦分离 ,第 —S D S-P AGE 分离 o5、 蛋白质组研究的三大关键核心技术是 质谱鉴定技术 、 计算机图像数据处理与蛋白质数据库二、 判断题1、 生物体的结构和功能越复杂的种类就越多,所需要的基因也越多,是真核生物基因组的特点之一。

(对)2、 CDS 一定就是 ORF 。

(对)3、 两者之间有没有共同的祖先,可以通过序列的同源性来确定,如果两个基因或蛋白质有着几乎一样的序列,那么它们高度同源 ,就具有共同的祖先。

(错)4、 STS,是一段 200-300bp 的特定 DNA 序列,它的序列已知,并且在基因组中属于 单拷贝。

(对)5、 非编码 DNA 是“垃圾 DNA',不具有任何的分析价值,对于细胞没有多大的作用。

(错)6、 基因树和物种树同属于系统树,它们之间可以等同。

(错)7、 基因的编码序列在 DNA 分子上是被不编码的序列隔开而不连续排列的。

&对任意一个 DNA 序列,在不知道哪一个碱基代表 CDS 的起始时,可用 获得6个潜在的蛋白质序列。

(对)9、 一个机体只有一个确定的基因组,但基因组内各个基因表达的条件和表达的程度随时间、空间和环境条件而不同。

(对)10、 外显子和内含子之间没有绝对的区分,一个基因的内含子可以是另一个基因的 外显子,同一个基因在不同的生理状况或生长发育的不同阶段,外显子组成也可以 不同。

生物信息学复习要点

生物信息学复习要点

如对您有帮助,欢迎下载支持,谢谢!如对您有帮助,欢迎下载支持,谢谢!一、名词解释(每小题3分,共30分)分)1.1. 生物信息学生物信息学2.2. 数据库技术数据库技术3.3. 数据仓库数据仓库4.4.EST5.5. 概念性翻译概念性翻译6.6. 同源性同源性7.7. 单系类群单系类群8.8. 全局排列全局排列9.9. 基因作图基因作图1010.直系同源体簇.直系同源体簇.直系同源体簇二、填空题(每空1分,共10分)分)1. 生物信息学主要研究的两种信息载体是生物信息学主要研究的两种信息载体是和 。

2. 国际上的三大核苷酸序列数据库分别是 、和 。

3. 数据挖掘的三大技术支柱是数据挖掘的三大技术支柱是、 和 。

4. 相同类型核苷酸的替换称为 ,不同类型核苷酸的替换称为 。

三、单项选择题(每小题1分,共10分)分)1.1. 在对模式生物进行全基因组的测定中,作为真菌模式生物的是在对模式生物进行全基因组的测定中,作为真菌模式生物的是。

A 、大肠杆菌、大肠杆菌B 、青霉菌、青霉菌C 、酵母菌、酵母菌D 、线虫、线虫2.NCBI 成立于成立于。

A 、1988年B 、1989年C 、1990年D 、1992年3.根据数据库管理系统所支持的基本数据模型的不同,可以将数据库分为五类,其中第二代数据库是代数据库是。

A 、层次数据库、层次数据库B 、网状数据库、网状数据库C 、关系数据库、关系数据库D 、分布式数据库、分布式数据库4.在向GenBank 投送序列的工具中,投送序列的工具中, 是标准的序列投送工具。

是标准的序列投送工具。

A 、Cn3DB 、tb12asnC 、BankItD 、Sequin5. 目前最为常用和注释最全的蛋白质序列数据库是目前最为常用和注释最全的蛋白质序列数据库是。

A 、Identify B 、OWLC 、PIRD 、SWISS-PROT6. 下列选项中根据蛋白质三维折叠模式和进化关系划分的结构分类数据库是下列选项中根据蛋白质三维折叠模式和进化关系划分的结构分类数据库是。

生物信息学试题

生物信息学试题

生物信息学考题(2012版)一、填空题(共10分,每空一分)1、美国政府于1990年10月启动耗资30亿美元的15年研究计划,预期到2005年完成人类基因组大约30亿个碱基的全序列测定,这就是被称为生命科学“登月计划”的人类基因组计划。

2、生物信息学的研究目标:以核酸、蛋白质等生物大分子数据库为主要对象,以数学、信息学、计算机科学为主要手段,以计算机硬件、软件和计算机网络为主要工具,对浩瀚如海的原始数据进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。

3、随着生物信息学的诞生及应用,今后生物学研究项目的起点将是理论的,一位科学家将从理论推测开始,然后转向试验去追踪或检验该假设。

4、生物信息学作为一门交叉学科,已经成为当今生命科学乃至整个自然科学的重大前沿领域之一,也将是21世纪自然科学的核心领域之一。

5、人类基因组计划、“曼哈顿原子计划”和“阿波罗登月计划”并称为20世纪的三大著名计划,中国在1999年承担了1%的研究任务,即对第3号染色体上3000万碱基对的测定。

6、人类基因组的主要任务是:人类基因组以及一些模式生物(细菌、酵母、线虫、果蝇等)基因组作图、测序和基因识别。

二、是非题(共10分,每小题1分)1、生物学就是实验科学,所有的研究结论从实验中来,于实验中得到验证。

(错)2、比较是科学研究中最常见的方法,在生物信息学研究中,比对是最常用和最经典的研究手段。

(对)3、两个蛋白质序列相似性超过30%就是同源蛋白。

(错)4、蛋白质序列相似性指一级序列中氨基酸残基相同。

(错)5、蛋白质序列相似性指氨基酸残基具有相似特性:侧链基团大小电荷性、疏水性等相同。

(对)6、核酸序列相似性指序列中相同碱基所占的比例。

(对)7、对一段未知功能DNA片段进行功能预测需对其进行3位翻译。

(错)8、对一段未知功能DNA片段进行功能预测需对其进行6位翻译。

(对)9、相似性是指一种很直接的数量关系,无需实验验证。

生物信息学课程复习题(南医大)

生物信息学课程复习题(南医大)

⽣物信息学课程复习题(南医⼤)⽣物信息学课程习题第⼀章绪论⼀、填空1、在年,美国国会批准启动⼈类基因组计划,拟⽤年时间测定⼈类全部条染⾊体上共个碱基序列的测定。

2、是遗传信息的携带者。

3、蛋⽩质三维结构测定主要⽅法有和。

4、理想的抗⽣素靶标应为微⽣物细胞所必须,在病原体中⾼度,且在⼈体中或与⼈类基因有。

5、下图例举了⼀个计算机辅助药物设计的实例,从a图中我们得到了配体上R基团附近的受体上有和残基,具有性,因此可以将R基团设计为性基团,如图b中所⽰的基团,使得抑制活性⽐改造前提⾼了近5000倍。

⼆、名词HGP(human genome project),EST(expressed sequence tag), SNP(single nucleotide polymorphism),⽣物信息学(Bioinformatics),药物基因组学(Pharmacogenomics),intron,“Junk DNA”,⽐较基因组学,蛋⽩质组学,分⼦进化树(evolutionary tree),基因组,基因组药物三、简答1、简述⽣物信息学在药物研究开发领域的应⽤可体现在哪些⽅⾯?2、如何利⽤基因组信息寻找新的药物作⽤靶标?3、如何利⽤⼈类基因组信息实现个性化治疗,其基于的原理是什么?4、试叙述基因芯⽚⽤于疾病诊断的原理,并说明其优缺点。

5、最近甲型流感流⾏,请设计甲型流感的分⼦诊断⽅法,说明其原理。

第⼆、三章数据库⼀、单选题1、以下数据库不能⽤于检索核酸序列的是( B )A. GenBankB. PDBC. EMBLD.DDBJ2、蛋⽩质结构数据常保存为下⾯哪⼀种格式为后缀的⽂件()A. PDBB. txtC. SeqD. mdb3、下列格式属于FASTA格式的是()A. >seq1B.C. ATGCCATAD. > ATGCCATAATGCCATA ATGCCATA⼆、填空题1、阅读以下数据格式,写出以下标注的含义:LOCUS是,DEFINITION是,ACCESSION是,VERSION是,SOURCE是在论⽂中使⽤了NCBI数据库中的该序列,应标注该序列的编号,应填。

生物信息学数据库答案

生物信息学数据库答案

生物信息学数据库答案一、名词解释1、生物信息学(bioinformatics):指应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。

通过收集、组织、管理生物分子数据,得到深层次的生物学知识,加深对生物世界的认识。

2、核磁共振(NMR):核磁共振是指原子核吸收外界能量而产生一种能级跃迁现象,其实质是共振吸收。

3、开放式阅读框(ORF):是基因的起始密码子开始到终止密码子为止的一个连续编码的序列。

4、外显子(exon):指导合成mRNA时的DNA片断,用于形成mRNA前体。

也就基因的编码序列。

5、中心法则:包括DNA的自我复制,转录形成RNA并翻译成蛋白质,RNA的自我复制和逆转录的过程。

6、算法分析:评价一个算法的优劣,通过时间复杂度和空间复杂度来确定。

7、数据库管理系统:(database management system,DBMS)对DB进行管理的系统工程,提供DB的建立、查询、更新以及各种数据控制功能。

8、数据库:统一管理的相关数据的集合。

9、搜索软件:对内容进行筛选,从中选择出符合用户的检索要求的内容同时进行分级排序,将结果显示出来。

10、人类基因组计划(HGP):是对人类24条染色体上的3X109个碱基对(base pair,bp)序列进行测定,完成图谱绘制、测序、基因识别,及信息系统的建立。

二、选择题(20分)1、GenBank数据库的网址是( B)A. B: C: D: 2、PDB蛋白质数据库结构文件中上标的表示S2+方法是( D)A: S^ 2+ B S=2+C: S<2+> D: S= =2+ = =3、生物学文献数据库中可免费使用的是(C )A:OVID B:CBIC:PUB D: BIOSIS Previews4、GBFF的数据格式中结尾标识是( A)A:// B: !C: * D: <5、NCBI数据库中查询使用的是(D )。

A: Google B:BaiDUC:Yahoo D:EntreZ6、遗传密码特点(D )A: 密码无标点。

生物信息学(期末)-生技08

生物信息学(期末)-生技08

齐齐哈尔大学试卷考试科目: 生物信息学适用对象: 生物技术08本使用学期: 2011—2012—1 第七学期课程编码: 05113019 总分80分共 2 页1)考生须知:2)姓名必须写在装订线左侧, 其它位置一律作废。

3)请先检查是否缺页, 如缺页应向监考教师声明, 否则后果由考生负责。

4)答案一律写在答题纸上, 可不抄题, 但要标清题号。

5)用蓝色或黑色的钢笔、圆珠笔答题。

监考须知: 请将两份题签放在上层随答题纸一起装订。

一、名词解释(每小题3分, 共4小题12分)表达序列标签, 外类群, 开放阅读框, 蛋白质组学二、选择题(每小题1分, 共10小题10分)1.下列哪项不属于人类基因组计划的研究内容()A.绘制化学图谱、物理图谱B.获得全部人类基因组的序列C.获得转录图谱D.获得人体内全部的蛋白质序列2.图中哪一项为直系同源()A.HA1和HA2B.HA1和WA2C.HA1和HBD.WA1和WA23.下列软件中哪一个能够用来构建系统发育树的()A CLUSTALB BLASTC AssemblerD Treeview4.核酸序列增长最快是在哪一时期()A 1970-1980年B 1980-1990年C 1990-2000年D 2000-2008年5. 研究一条测序获得的DNA序列时首先需要()A.屏蔽重复序列B.去除序列污染C.查找开放阅读框D.查找密码子偏好性6. 对于序列ATGCCCCGA和序列ATCCGA哪一种是正确的序列对位排列方式()A ATGCCCCGAAT_CC__GAB ATGCCCCGAAT_CCG__AC ATGCCCCGAAT_CC_G_AD ATGCCCCGAAT_C__G_A7.BLAST系列软件与下列哪一项能够在同一网站中检索到()A GeneBank数据库B DDBJ数据库C EMBL数据库D CLUSTAL W8.生物信息学数据以什么形式存储()A.文件系统B.程序软件C.数据库D.手工管理9.下列陈述哪一项是错误的()A PIR-PSD是国际上最大的蛋白质序列数据库B 数据库的检索分为关键词检索和序列检索C STS是基因组作图时常用的一种图标D ACeDB仅储存秀丽新小杆线虫数据10.在使用CLUSTAL软件进行比对时, 多序列的比对结构中几条序列都相同的核苷酸位点用什么标注()A 不同的颜色B “*”C “-”D “_”三、判断题(每小题1分, 共10小题10分, 对的画“√”, 错的画“×”)1.华盛顿大学的Phred软件是用来处理数据冗余的()2.NCBI网站不能用来查询文章()3.CLUSTAL X有汉化版()4.EcoCyc是大肠杆菌的知识体系数据库系统()5. 文昌鱼是人类的五种模式生物之一()6.生物信息学研究物种信息, 不包括序列()7.研究一条测序获得的DNA序列时首先应该去除污染序列()8.双向凝胶电泳技术是蛋白质组研究的关键技术()9.CAP3是EST序列的拼接软件()10.氨基酸的顺序决定蛋白质的构象,即蛋白质的一级结构决定蛋白质的二级结构。

《生物信息学》练习题及答案

《生物信息学》练习题及答案

《生物信息学》练习题及答案1、在Genbank中查找以下6个植物蛋白序列:protein1:NP_974673.2;protein2:NP_187969.1;protein3: NP_190855.1;protein4:NP_565618.1;protein5: NP_200511.1;protein6:NP_191407.1(以FASTA格式)。

(1)用EBI上的ClustalW2工具对其进行多序列比对,分析各蛋白序列之间的同源性。

序列比对结果比对结果表明:protein1:NP_974673.2和protein4: NP_565618.1的亲缘关系最近。

(2)利用Phylip软件,选择距离法构建其进化树(要求写出具体的建树步骤)。

1.将蛋白序列保存为FASTA格式,存于txt文档;2.用Clustalx打开txt文本,保存为*.phy文件;3.用seqboot程序打开phy文件,输出结果文件*_seqboot4.用protdist程序打开*_seqboot文件,输出为*_protdist文件5.用neighbor程序打开*_protdist文件,输出为*_neighbor 文件6.用consense程序打开*_neighbor文件,输出为*_consense 文件7.用dratree程序打开*_consense文件得到进化树。

(注:由于seqboot软见无法正常运行,因此进化树无法显示)(3)任意选取其中的一个蛋白进行蛋白质一级序列分析、二级结构预测及三维结构的模拟。

选择protein3:NP_190855.1一级结构网址:/doc/479b86d06edb6f1afe001f6e.html /tools/protparam.htmlNumber of amino acids:456氨基酸数目Molecular weight:51154.5相对分子质量Theoretical pI:8.69理论pI值Amino acid composition氨基酸组成Ala(A)306.6%Arg(R)286.1%Asn(N)153.3%Asp(D)275.9%Cys(C)51.1%Gln(Q)183.9%Glu(E)286.1%Gly(G)378.1%His(H)163.5%Ile(I)163.5%Leu(L)429.2%Lys(K)327.0%Met(M)51.1%Phe(F)173.7%Pro(P)163.5%Ser(S)4610.1%Thr(T)214.6%Trp(W)81.8%Tyr(Y)194.2%Val(V)306.6%Pyl(O)00.0%Sec(U)00.0%(B)00.0%(Z)00.0%(X)00.0%正/负电荷残基数Total number of negatively charged residues(Asp+Glu): 55Total number of positively charged residues(Arg+Lys): 60Atomic composition:原子组成Carbon C2270Hydrogen H3531Nitrogen N645Oxygen O686Sulfur S10Formula:C2270H3531N645O686S10分子式Total number of atoms:7142总原子数Extinction coefficients:消光系数Extinction coefficients are in units of M-1cm-1,at280 nm measured in water.Ext.coefficient72560Abs0.1%(=1g/l)1.418,assuming all pairs of Cys residues form cystines Ext.coefficient72310Abs0.1%(=1g/l) 1.414,assuming all Cys residues are reducedEstimated half-life:半衰期The N-terminal of the sequence considered is M(Met). The estimated half-life is:30hours(mammalian reticulocytes,in vitro).>20hours(yeast,in vivo).>10hours(Escherichia coli,in vivo).Instability index:不稳定系数The instability index(II)is computed to be48.99This classifies the protein as unstable.Aliphatic index:75.26脂肪系数Grand average of hydropathicity(GRAVY):-0.554总平均亲水性蛋白质亲疏水性分析所用氨基酸标度信息Ala:1.800Arg:-4.500Asn:-3.500Asp:-3.500Cys:2.500 Gln:-3.500Glu:-3.500Gly:-0.400His:-3.200Ile:4.500 Leu:3.800Lys:-3.900Met:1.900Phe:2.800Pro:-1.600 Ser:-0.800Thr:-0.700Trp:-0.900Tyr:-1.300Val: 4.200:-3.500:-3.500:-0.490分析所用参数信息Weights for window positions1,..,9,using linear weight variation model:1234567891.001.001.001.001.001.001.001.001.00edge center edge跨膜结构预测结果(没有跨膜结构)信号肽分析:二级结构预测三级结构预测网站/doc/479b86d06edb6f1afe001f6e.html/~phyre2、在拟南芥基因组数据库中(/doc/479b86d06edb6f1afe001f6e.ht ml/)查找编号分别为At4G33050,At3G13600,At3G52870或At2G26190基因,针对所查找的基因进行初步的生物信息学分析(每人任选其中一个基因)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、BLAST教案所程序中,哪个方法是不存在的?(D)
A:BLASTP B:BLASTN C:BLASTX D:BLASTQ
2、下列哪个软件不是常用来观察蛋白质结构视图的?(D)
A:AVS B:Chimera C:MICE D:HMM
3、下列哪个不是点突变的类型?(A)
A:染色体畸变 B:错义突变 C:无义突变 D:移码突变
4、基因突变的效应不包括:(C)
A:有利突变 B:中性突变 C:移码突变D:遗传多态现象
5、人类基因组的结构特点不包括:(A)
A:基因进化 B:基因数目 C:基因重复序列 D:基因组复制
6、世界上三大数据库不包括:(B)
A:NCBI B:BLAST C:UCSC D:Ensembl
7、常用序列比对方法错误的是:(C)
A:编辑距离 B:点阵描图 C:局部比对 D:记分模式
8、下列哪个不是蛋白质结构模型?(D)
A:同源性模型 B:折叠识别 C:ab initio折叠 D: MoLScript结构9、下列哪个选项不是微阵列实验设计的内容?(A)
A:贝叶斯网络法 B:对照组的选择 C:重复样本的使用 D:随机化原则10、构建序列进化树的一般步骤不包括:(A)
A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树
11、下列中属于一级蛋白质结构数据库的是:(C)
A. EMBL
B. DDBJ
C. PDB
D.SWISS-PROT
12.蛋白质结构预测分为:(B)
A.一级和三级结构预测 B. 二级和空间结构预测
C. 三级和空间结构预测
D. 二级和三级结构预测
13.数据挖掘的四个步骤不包括下列哪个:(C)
A. 数据选择
B. 数据转换
C. 数据记录
D. 结果分析
14.下列哪项不是生物学研究必备的工具:(A)
A.数据分析B.数据统计C.因素分析D.多元回归分析
15.Linux中rmdir 命令的功能是:(D)
A.改变工作目录 B.删除工作目录
C. 创建目录
D.删除空目录
16.BLAST教案所程序中,哪个方法是不存在的?(D)
A:BLASTP B:BLASTN C:BLASTX D:BLASTQ
17.下列哪个不是蛋白质结构模型?(D)
A:同源性模型 B:折叠识别 C:ab initio折叠 D: MoLScript结构18.人类基因组的结构特点不包括:(A)
A:基因进化 B:基因数目 C:基因重复序列 D:基因组复制
19、下列哪个选项不是微阵列实验设计的内容?(A)
A:贝叶斯网络法 B:对照组的选择 C:重复样本的使用 D:随机化原则20、构建序列进化树的一般步骤不包括:(A)
A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树三、填空题
1、数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。

2、按碱基配对原则将DNA分子的遗传信息拷贝到mRNA分子中,称为转录。

3、线粒体基因组含有细胞核基因组之外的遗传信息,有其独特的遗传特点表现为:mtDNA具有半自主性、线粒体基因组所用的遗传密码与核基因的通用密码有所不同、mtDNA呈母系遗传、mtDNA具有异质性与均质性、mtDNA具有阀值效应、mtDNA的进化率极高。

4、分子生物学数据库中的信息可以是DNA序列,保守的DNA结构域、基因组、基因表达、蛋白质序列、蛋白质家族、基因突变、基因多态性和代谢途径。

5、BLAST是一种快速序列比较工具,采用启发式方法根据优化的局部相似性构建比对关系。

6.药物基因组学中的三大技术平台:SNP分型,基因表达芯片和生物信息学7.数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。

8.蛋白质的折叠预测方法:同源性模型,折叠识别和从头开始折叠
9.生物膜的特性:流动性和不对称性
10.分子生物学数据库中的信息可以是DNA序列,保守的DNA结构域、基因组、基因表达、蛋白质序列、蛋白质家族、基因突变、基因多态性和代谢途径。

1. 常用的三种序列格式:NBRF/PIR,FASTA和GDE
2. 初级序列数据库:GenBank,EMBL和DDBJ
3. 蛋白质序列数据库:SWISS-PROT和TrEMBL
4. 提供蛋白质功能注释信息的数据库:KEGG(京都基因和基因组百科全书)和PIR(蛋白
质信息资源)
5. 目前由NCBI维护的大型文献资源是PubMed
6. 数据库常用的数据检索工具:Entrez,SRS,DBGET
7. 常用的序列搜索方法:FASTA和BLAST
8. 高分值局部联配的BLAST参数是HSPs(高分值片段对),E(期望值)
9. 多序列联配的常用软件:Clustal
10. 蛋白质结构域家族的数据库有:Pfam,SMART
11. 系统发育学的研究方法有:表现型分类法,遗传分类法和进化分类法
12. 系统发育树的构建方法:距离矩阵法,最大简约法和最大似然法
13. 常用系统发育分析软件:PHYLIP
14. 检测系统发育树可靠性的技术:bootstrapping和Jack-knifing
15. 原核生物和真核生物基因组中的注释所涉及的问题是不同的
16.检测原核生物ORF的程序:NCBI ORF finder
17. 测试基因预测程序正确预测基因的能力的项目是GASP(基因预测评估项目)
18. 二级结构的三种状态:α螺旋,β折叠和β转角
19. 用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括输入层,隐含层
和输出层
20. 通过比较建模预测蛋白质结构的软件有SWISS-PDBVIEWER(SWISS—MODEL网站)
21. 蛋白质质谱数据搜索工具:SEQUEST
22. 分子途径最广泛数据库:KEGG
23.聚类分析方法,分为有监督学习方法,无监督学习方法
24. 质谱的两个数据库搜索工具:SEQEST和Lutkefish
二填空题
1生物信息学的发展大致经历了3个阶段,分别为(前基因组时代)(基因组时代)和(后基因组时代)p2
2后基因组时代的标志性工作是(基因组分析)(蛋白质组分析)以及(各种数据的比较和整合)p3
3前基因组时代的标志性工作是(生物数据库的建立)(检索工具的开发)以及(DNA和蛋白质的序列分析)p2
4基因组时代的标志性工作是(基因寻找和识别)(网络数据库系统的建立)以及(交互界面的开发)p2
5遗传图谱的图距单位是(厘摩)代表(1%)的交换值,物理图谱的图距以(物理长度)为单位p155-156 如果两个遗传标记之间的重组率是1%,则他们之间的遗传距离就是(1cM)
6 人类基因组中大小约(3×109)对核苷酸,含(30000)个基因,人类基因组中编码DNA的序列占(10%),junkDNA占()p151
7 人类基因组计划的目标是完成四张图,分别是(遗传图谱)(物理图谱)(序列图谱)和(基因图谱)
8 HGP由(六)个国家完成,我国完成了HGP的(1%,即3号染色体上3000万个碱基)的测序工作。

9蛋白质组分析的关键技术主要有(双向凝胶电泳)和(蛋白质鉴定方法)p183 10国际著名的三大公共核苷酸数据库为(GenBank)(DDBJ)(EMBL)p56
11 Genebank由(NCBI)管理运行,(BLAST)是一种快速检索相似性序列的工具,(Entrez)是一个整合的数据查询系统p56
12最常用的序列相似性查询工具是(BLAST)和(FASTA),两个系统的服务分别由(NCBI)和(EBI)维护p73
13 BLAST系列程序有(序列对位排列)(序列同源性)(相似性记分)和(全局排列)p73
14 NCBI中主要的数据库有(DDBJ )(EMBL)和(GenBank)?
15基因组浏览的数据库主要有()和()?
16蛋白质序列数据库主要有(PIR)和(SWISS-PROT)等,蛋白质结构数据库主要有(PDB)
17生物信息数据库分为(核酸和蛋白质一级结构数据库)(基因组数据库)和(生物大分子三维空间结构数据库)
18生物分子数据库专集每年均在(Nucleic Acids Research)杂志的第一期看出p52
19生物信息学数据常见的数据格式主要有(FASTA)(GenBank)和(SwissProt)等
20生物信息学数据库之间的联系方式有(相似性)和(硬链接)
21真核生物基因内含子一般以(GT)两个基因开始,以(AG)两个基因结束22生物信息学识别基因两种途径为(基因组外显子识别)和(EST策略的基因鉴定)
23人类基因组计划具体任务是建立四张图谱,分别为(遗传图谱)(物理图谱)(序列图谱)和(基因图谱)
24建立人类遗传图谱的关键是要有足够的高度多肽的遗传标记。

第一代遗传标
记为(RFLP),第二代遗传标记为(STR),第三代遗传标记为(SNP)。

25大规模基因组测序的基本策略主要有(逐个克隆法)和(全基因组鸟枪法)26距离矩阵法主要有(UPGMA)和(邻接法)
27基因诊断常用技术方法有(核酸分子杂交技术)(PCR技术)和(生物芯片)(基因测序)
28基因治疗的总体策略主要有(基因矫正)(基因置换)(基因增补)(基因失活)29序列比对相似性分支主要取决(取代矩阵)(空位罚分)
30构建系统树的三种主要方法是(距离矩阵法)(最大简约法)(最大似然法)31构建系统树的常用软件(PHYLIP)(TREE-PUZZLE)(MEGA)(PAUP)(课件上还有PAML和TreeView)。

相关文档
最新文档