生物信息学试题A卷2010

合集下载

生物信息学考试试卷

生物信息学考试试卷

一、名词解释(每小题4分,共20分)1、生物信息学广义:生命科学中的信息科学。

生物体系和过程中信息的存贮、传递和表达;细胞、组织、器官的生理、病理、药理过程的中各种生物信息。

狭义:生物分子信息的获取、存贮、分析和利用。

2、人类基因组计划人类基因组计划准备用15年时间,投入30亿美元,完成人类全部24条染色体的3×109脱氧核苷酸对(bp)的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。

其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立.作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息.3、蛋白质的一级结构蛋白质的一级结构是指多肽链中氨基酸的序列4、基因基因——有遗传效应的DNA片断,是控制生物性状的基本遗传单位。

5、中心法则是指遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,即完成遗传信息的转录和翻译的过程.也可以从DNA传递给DNA,即完成DNA的复制过程。

这是所有有细胞结构的生物所遵循的法则.6 、DNA序列比较序列比较的根本任务是:(1)发现序列之间的相似性;(2)辨别序列之间的差异目的:相似序列 相似的结构,相似的功能判别序列之间的同源性推测序列之间的进化关系7、一级数据库数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释8、基因识别基因识别,是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别DNA 序列上的具有生物学特征的片段。

基因识别的对象主要是蛋白质编码基因,也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。

9、系统发生学系统发生学(phylogenetics)——研究物种之间的进化关系。

10、基因芯片基因芯片(gene chip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。

生物信息考试题及答案

生物信息考试题及答案

生物信息考试题及答案生物信息学是一门结合生物学、计算机科学、信息技术和数学的交叉学科,它利用计算机技术来分析和解释生物数据。

以下是一份生物信息学考试题及答案的示例。

生物信息学考试题一、选择题(每题2分,共20分)1. 生物信息学中,用于存储DNA序列的文件格式是:A. FASTAB. JPEGC. MP3D. DOCX2. 以下哪项不是生物信息学分析的基本步骤?A. 数据收集B. 数据预处理C. 数据解释D. 数据存储3. 在蛋白质序列分析中,BLAST工具用于:A. 序列比对B. 序列组装C. 序列克隆D. 序列合成4. 以下哪个数据库不是用于存储基因表达数据的?A. NCBIB. GEOC. PDBD. ArrayExpress5. 以下哪个算法不是用于基因预测的?A. GeneMarkB. BLASTC. GlimmerD. Fgenesh二、简答题(每题10分,共30分)6. 简述生物信息学在现代生物学研究中的重要性。

7. 解释什么是基因组学,并说明其在医学研究中的应用。

8. 描述序列比对的基本原理及其在生物信息学中的作用。

三、计算题(每题15分,共30分)9. 假设你有一个DNA序列,其组成为:ATCGTA。

请计算其互补序列。

10. 给定两个蛋白质序列,序列A:A-B-C-D-E,序列B:A-C-E-B-D。

请使用Needleman-Wunsch算法计算它们的全局比对得分。

四、论述题(每题20分,共20分)11. 论述生物信息学在新药开发中的作用及其面临的挑战。

答案一、选择题1. A2. C3. A4. C5. B二、简答题6. 生物信息学在现代生物学研究中的重要性体现在它能够处理和分析大量的生物数据,如基因组序列、蛋白质结构等,帮助科学家快速发现生物现象的规律,推动生物学的发展。

7. 基因组学是研究生物基因组的结构、功能和演化的科学。

在医学研究中,基因组学可以帮助我们了解疾病的遗传基础,为个性化医疗提供理论基础。

生物信息学试题

生物信息学试题

生物信息学试题一、选择题1. 生物信息学主要研究的是:A. 生物实验技术B. 生物统计学C. 生物大数据分析与计算D. 生物体内生化反应2. 在生物信息学中,常用的序列比对工具是:A. BLASTB. PCRC. ELISAD. SDS-PAGE3. 下列哪个数据库主要用于存储核酸序列信息?A. PDBB. GenBankC. UniProtD. KEGG4. 以下哪种方法不是用于蛋白质结构预测的?A. 同源建模B. 折叠识别C. 从头预测D. 实验测定5. 生物信息学中的“基因家族”是指:A. 一组具有相似序列和功能的基因B. 一组来自同一物种的基因C. 一组通过基因复制产生的基因D. 一组控制同一生物过程的基因二、简答题1. 简述生物信息学在现代医学研究中的应用。

2. 描述PCR技术的原理及其在分子生物学中的重要性。

3. 解释什么是基因编辑技术,以及CRISPR-Cas9系统是如何工作的。

三、论述题1. 论述生物信息学在新药发现和开发中的作用。

2. 分析比较RNA测序技术与DNA测序技术的优势和局限性。

四、计算题1. 给定一个DNA序列:“ATGCGATACCTGAGCTG”,计算其碱基组成的比例。

2. 假设某种生物的基因组大小为200 Mb,每个碱基对的平均质量为650 Da,计算该基因组的大致质量。

五、案例分析题1. 根据给定的某种疾病的基因组数据,分析可能的致病基因,并讨论其可能的生物机制。

2. 通过分析某物种的转录组数据,探讨其在特定环境下的适应性变化。

请注意,以上试题仅供参考,具体题目应根据实际教学大纲和考试要求进行调整。

在实际考试中,题目可能会包含更多的细节和复杂性,要求考生具备扎实的生物信息学知识和分析能力。

生物信息学习题(2010-7)

生物信息学习题(2010-7)

生物信息学练习题(2009-2010学年第2学期)姓名:性别:班级:学号:说明:(1)此作业主要是让大家熟悉一下生物信息学的基本知识点,并真正练习一下生物信息软件的使用。

(2)此作业将作为我们的成绩,不交者将没有成绩,请认真对待;(3)作业统一用A4纸打印,并装订;(4)在7月10日前,各班学委收起后,交到新生化大楼C615房间;(5)如有问题可与我联系,一.问答题:1. 当今世界上主要的三大生物数据库是指哪些数据库?答:当今世界上主要的三大生物数据库是美国国家生物技术信息中心NCBI(National Center for Biotechnology Information),EBI(European Bioinformatics Institute)欧洲生物信息研究所,DDBJ(DNA Data Bank of Japan)日本核酸数据库2. 人类基因组计划的完成将绘制出“四张图“,请问这四张图是指哪些图?答:人类基因组计划的完成将绘制出“四张图“是指:1遗传图谱,又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组。

2物理图谱,是以一段已知核酸序列的片段STS序列为路标,以碱基对数目的多少为图距来表示两个遗传标记之间的物理距离[基本单位是Mb、kb、bp]的图谱。

3序列图谱,是分别将各染色体全部碱基序列绘制的图谱。

包括转录序列和非转录序列。

4转录图谱谱也叫基因表达图谱,以表达序列标签(expressed sequence tag , EST )为位标,反映基因在不同条件下的表达情况的图谱。

3. 生物信息学的定义有狭义与广义之分,请问狭义的生物信息学定义是什么?答:目前生物信息学可以狭义地定义为:将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科。

《生物信息学》试卷(A)

《生物信息学》试卷(A)

武汉大学2007—2008学年度高校教师研修班《生物信息学》试卷(A)及答案一、翻译下列名词并解释。

(每题5分,共25分)1. EST2. ORF3. BLAST4. ANN5. HGP二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有和二维核磁共振技术。

2、BLAST对序列格式的要求是常见的格式。

3、系统发育树由一系列和组成,其中每个代表一个分类单元,而代表物种之间的进化关系。

、、等。

6. 目前已经是最广泛使用的系统发育程序。

三、解释说明: 请按要求对下列GenBank文件作解释说明。

(每小题4分,共20分)1、LOCUS行中的第3项mRNA linear表示,这里是。

2、DEFINITION行在GenBank记录中用以3 ACCESSION 是,是从数据库中检索一个记录的主要。

4. FEATURES后面部分是,直接表达了记录的生物背景知识,5 CDS 30…533 表示。

四、问答。

(共35分)1简述国际上有哪几个著名的核酸序列数据库?(10分)2何谓序列比对的相似性和同源性,它们之间有何联系和区别(10分)3试述发现基因的一般过程(15分)《生物信息学》试卷(A)答案一、翻译下列名词并解释。

(每题5分,共25分)1. EST expressed sequence tag 表达序列标签2. ORF Open Reading Frame, 开放阅读框3. BLAST Basic Local Alignment Search T ool 局部相似性基本查询工具4. ANN Artificial Neural Network, 人工神经网络5. HGP Human genome project 人类基因组计划二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有X射线晶体衍射法和二维核磁共振技术。

2、BLAST对序列格式的要求是常见的FASTA格式。

3、系统发育树由一系列节点和分支组成,其中每个节点代表一个分类单元,而节点之间的连线代表物种之间的进化关系。

生物信息技术考试试题

生物信息技术考试试题

生物信息技术考试试题一、选择题(每题 3 分,共 30 分)1、以下哪个不是生物信息学的主要研究内容?()A 基因组学B 蛋白质组学C 细胞学D 代谢组学2、生物信息学中用于序列比对的常用算法是()A 动态规划算法B 贪心算法C 分治算法D 回溯算法3、在基因表达数据分析中,常用的标准化方法是()A RPKMB TPMC FPKMD 以上都是4、以下哪种数据库主要用于存储蛋白质结构信息?()A GenBankB PDBC UniProtD Ensembl5、进行系统发育分析时,常用的构建进化树的方法是()A 邻接法B 最大简约法C 最大似然法D 以上都是6、以下哪个软件不是用于基因序列分析的?()A Primer PremierB SPSSC DNAStarD Vector NTI7、生物信息学中,预测蛋白质二级结构的方法不包括()A 基于同源建模B 基于机器学习C 基于物理化学原理D 基于经验规则8、在生物信息学中,BLAST 程序主要用于()A 序列比对B 进化分析C 基因预测D 蛋白质结构预测9、以下哪种编程语言在生物信息学中应用较为广泛?()A JavaB PythonC C++D Fortran10、用于分析基因芯片数据的软件包是()A R 语言中的 BioconductorB MATLABC StataD SAS二、填空题(每题 3 分,共 30 分)1、生物信息学中的三大核心数据库是_____、_____、_____。

2、基因序列的相似性搜索常用的工具是_____。

3、蛋白质的一级结构是指_____。

4、常见的基因注释数据库有_____、_____等。

5、系统发育树的构建基于_____的原理。

6、生物信息学中常用的数据格式有_____、_____等。

7、预测蛋白质三级结构的方法主要有_____、_____。

8、基因表达数据的差异分析常用的方法有_____、_____。

9、用于分析高通量测序数据的软件有_____、_____。

生物信息学期末作业

生物信息学期末作业

题目:了解Pubmed的使用及文献检索方法,以“saline-alkali soil和microbial ecology”或“microbial”相关的关键词查找相关文献,并翻译一片全文。

答:1.PubMed是一个免费的搜寻引擎,提供生物医学方面的论文搜寻以及摘要。

它的数据库来源为MEDLINE。

其核心主题为医学,但亦包括其他与医学相关的领域。

该搜寻引擎是由美国国立医学图书馆提供,作为Entrez资讯检索系统的一部分。

PubMed的资讯并不包括期刊论文的全文,但可能提供指向全文提供者(付费或免费)的链接。

PubMed界面提供与综合分子生物学数据库的链接,其内容包括:DNA 与蛋白质序列,基因图数据,3D蛋白构象,人类孟德尔遗传在线,也包含着与提供期刊全文的出版商网址的链接等。

目前,PubMed已有汉化版。

2.PubMed的使用(文献检索为例):(1)主题检索:在PubMed主页的检索框中键入英文单词或短语(大写或小写均可),PubMed即使用其词汇自动转换功能进行检索,并将检索结果直接显示在主页下方。

例如:键入“saline-alkali soil”后回车或点击“Go”,PubMed开始检索并将检索结果显示出来。

(2)著者检索:当所要查询的是著作者时,在检索框中键入著者姓氏全称和名字的首字母缩写,格式为“著者姓空格名字首字母缩写”,例如smith ja,系统会自动到著者字段去检索,并显示检索结果。

(3)刊名检索:在检索框中键入刊名全称或MEDLINE形式的简称、ISSN号,例如:molecular biology of the cell, 或mol biol cell,或1059-1524,系统将在刊名字段检索,并显示检索结果。

(4)日期或日期范围检索可以在检索框中键入日期或日期范围,系统会按日期段检索,并将符合条件的记录予以显示。

日期的录入格式为YYYY/MM/DD;如:1999/09/08。

生物工程信息考试题及答案

生物工程信息考试题及答案

生物工程信息考试题及答案一、单项选择题(每题2分,共20分)1. 生物工程中常用的基因克隆载体是:A. 质粒B. 噬菌体C. 病毒D. 细菌答案:A2. 基因工程中常用的限制性内切酶的作用是:A. 连接DNA片段B. 切割DNA片段C. 复制DNA片段D. 转录DNA片段答案:B3. 以下哪种技术不属于细胞工程范畴?A. 细胞培养B. 基因编辑C. 组织工程D. 蛋白质纯化答案:D4. 植物组织培养中,脱分化过程是指:A. 细胞分化为特定类型的细胞B. 细胞失去分化状态,恢复到未分化状态C. 细胞死亡D. 细胞分裂答案:B5. 在动物细胞培养中,以下哪种细胞类型通常用于生产目的?A. 原代细胞B. 传代细胞C. 干细胞D. 癌细胞答案:D6. 以下哪种技术可以用于大规模生产重组蛋白?A. 基因克隆B. 细胞培养C. 蛋白质纯化D. 转基因动物答案:D7. 基因治疗中,最常用的基因传递载体是:A. 质粒B. 病毒载体C. 脂质体D. 纳米粒子答案:B8. 以下哪种生物反应器不适合用于大规模细胞培养?A. 搅拌式生物反应器B. 固定床生物反应器C. 流化床生物反应器D. 微囊生物反应器答案:B9. 以下哪种物质不是细胞培养基的组成部分?A. 氨基酸B. 维生素C. 抗生素D. 激素答案:C10. 以下哪种技术不涉及细胞核的操纵?A. 核移植B. 细胞融合C. 基因枪D. 电穿孔答案:B二、多项选择题(每题3分,共15分)1. 以下哪些因素会影响细胞培养的成功?A. 培养基的组成B. 温度和pH值C. 氧气供应D. 细胞密度答案:ABCD2. 基因工程中,常用的基因表达系统包括:A. 原核表达系统B. 真核表达系统C. 植物表达系统D. 动物表达系统答案:ABCD3. 以下哪些是生物反应器设计时需要考虑的因素?A. 搅拌速度B. 温度控制C. 气体交换D. 压力答案:ABCD4. 以下哪些是基因治疗中可能遇到的挑战?A. 基因传递效率B. 免疫反应C. 基因稳定性D. 伦理问题答案:ABCD5. 以下哪些是植物组织培养中常用的激素?A. 生长素B. 细胞分裂素C. 赤霉素D. 乙烯答案:ABC三、判断题(每题1分,共10分)1. 基因编辑技术CRISPR-Cas9可以用于精确地修改基因组中的特定基因。

生物信息学考试题

生物信息学考试题

生物信息学bioinformatics一、名词解释Silicon cloning:利用公共数据库信息, 借助计算机软件分析, 推测目的基因的编码区序列, 辅助全长cDNA克隆的方法BLAST:即基本局域联配搜索工具,Basic Local Alignment Search Tool,是一个局部比对搜索工具,用来确定一条查询序列和一个数据库的比对,最早的版本不引入间隙,但现在所用的版本已经允许比对中引入间隙。

Entrez :是由NCBI 主持的一个数据库检索系统,它包括核酸,蛋白以及Medline 文摘数据库,在这三个数据库中建立了非常完善的联系。

因此,可以从一个DNA 序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。

Entrez 中的数据库包括:Entrez 中核酸数据库为:GenBank, EMBL, DDBJ 蛋白质数据库为:Swiss-Prot, PIR, PFR, PDBPSI-BLAST:是一种迭代的搜索方法,可以提高BLAST 和FASTA 的相似序列发现率。

ORF:开放阅读框(ORF)是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。

编码一个蛋白质的外显子连接成为一个连续的ORF。

当一个新基因被识别,其DNA 序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。

这是因为在没有其它信息的前提下,DNA 序列可以按六种框架阅读和翻译(每条链三种,对应三种不同的起始密码子)ORF 识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA 。

序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。

ORF 的识别是证明一个新的DNA 序列为特定的蛋白质编码基因的部分或全部的先决条件。

相似性(similarity)/(identify):相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。

生物信息学测试题

生物信息学测试题

生物信息学测试题1. 1以下哪一个是mRNA条目序列号() [单选题]2. 如果你需要查询文献信息,下列哪个数据库是你最佳选择() [单选题]3. EMBL的含义是() [单选题]4. accession number的含义是() [单选题]5. 5以下关于PubMed的描述错误的是() [单选题]6. NCBI的含义是() [单选题]7. 7GenBank中分类码PLN表示是() [单选题]8. PIR是() [单选题]9. 1以下数据库不能用于检索核酸序列的是() [单选题]10. 蛋白质结构数据库常保存为下面哪一种格式为后缀的文件() [单选题]11. 进行多序列对比常使用哪种软件() [单选题]12. 对于蛋白质同源结构模建,通常要求待模建序列与模板序列一致性超过()[单选题]13. 5人类基因组大小大约是多少Mb() [单选题]14. 如果有一段DNA序列,它可能编码多少种蛋白质序列() [单选题]15. UTR的含义是() [单选题]16. 如果你需要查询文献信息,下列哪个数据库是你最佳选择() [单选题]17. 给定一段核酸序列,可通过什么方法查找上面蛋白质编码区() [单选题]18. 构建进化树最直接的错误来源是() [单选题]19. 1初级序列数据库 [填空题]_________________________________(答案:undefined) 20. 2,OMIM是 [填空题]_________________________________(答案:undefined) 21. 1常用的序列搜索方法 [填空题]_________________________________(答案:undefined) 22. 2人类基因组计划完成的四张图是 [填空题]_________________________________(答案:undefined) 23. 3系统发育树的构建方法 [填空题]_________________________________(答案:undefined) 24. 4系统发育树的两个特征是 [填空题]_________________________________(答案:undefined) 25. 5初级序列数据库是 [填空题]_________________________________(答案:undefined) 26. 6蛋白质二级结构的三种状态 [填空题]_________________________________(答案:undefined)。

生物信息学基础考试试题

生物信息学基础考试试题

生物信息学基础考试试题生物信息学基础考试试题回答一、选择题(每题5分,共20题)1. 生物信息学的定义是什么?A. 研究生物的基本信息B. 利用计算机科学分析生物学数据C. 研究生物的遗传编码D. 生物学的一个分支学科答案:B2. 以下哪个是常用的生物信息学数据库?A. NCBIB. C++C. DNAD. Photosynthesis答案:A3. 在DNA序列中,碱基A配对的是?A. TB. CC. GD. U答案:A4. 以下哪个是生物信息学中常用的序列比对算法?A. BLASTB. MATLABC. PCRD. ELISA答案:A5. 基因组学是研究什么的科学?A. 蛋白质结构B. DNA修复C. 基因组DNA的组成和功能D. 细胞分裂答案:C6. 哪种技术可用于测定DNA序列?A. 单克隆抗体技术B. RNA干扰技术C. 半制备列序法D. 高效液相色谱法答案:C7. 生物信息学中的序列模拟是指什么?A. 通过计算机模拟生物进化过程B. 利用计算机模拟DNA合成过程C. 模拟生物对某种药物的反应D. 利用计算机模拟细胞分裂过程答案:A8. 以下哪个是生物信息学的一个重要应用领域?A. 化学合成B. 建筑设计C. 新药研发D. 环境保护答案:C9. 哪个工具常用于分析生物信息中的调控网络?A. PhotoshopB. CytoscapeC. ExcelD. SPSS答案:B10. 蛋白质结构预测是生物信息学的一个重要研究方向,以下哪种是蛋白质的一级结构?A. α螺旋B. 葡萄糖C. 多肽链D. 抗原答案:C11. 生物信息学与生物医学工程有什么相似之处?A. 都研究细胞生物学B. 都属于理学院系C. 都涉及到计算机科学D. 都使用相同的实验方法答案:C12. 在基因组测序中,什么是基因组装?A. 利用计算机将碎片序列拼接成连续的基因组B. 测定基因组中的突变位点C. 研究基因间的调控关系D. 将RNA转录为蛋白质的过程答案:A13. 以下哪个不属于生物信息学的软件工具?A. BLASTB. PhotoshopC. RD. Python答案:B14. 哪种常见的DNA测序技术被广泛应用于基因组学研究?A. Sanger测序B. 吉姆斯法则C. CRISPR-Cas9技术D. 免疫印迹法答案:A15. 生物信息学中的反向遗传学用于研究什么?A. DNA复制B. 基因的转录和翻译C. RNA干扰D. 基因组的组装答案:B16. 哪种方法可用于鉴定基因表达谱中的关键基因?A. 蛋白质降解法B. 基因芯片技术C. 聚合酶链式反应D. 免疫组化技术答案:B17. 生物信息学研究中常用的基因表达定量方法是什么?A. Western BlotB. ELISAC. qPCRD. 蛋白质组学答案:C18. 生物信息学中的系统生物学研究的是什么?A. 各个细胞器的功能B. 化学元素与生物体的相互作用C. 生物学过程中的相互关系D. 各个动物种群的遗传特征答案:C19. 下面哪个数据库不是用于蛋白质结构预测的?A. PDBB. UniProtC. Swiss-ProtD. Entrez Gene答案:D20. 生物信息学中常用的序列对比方法是什么?A. 水平基因转移B. Smith-Waterman算法C. 单克隆抗体制备D. RNA干扰技术答案:B二、简答题(每题10分,共5题)1. 编程语言在生物信息学中的作用是什么?编程语言在生物信息学中扮演着重要角色。

《生物信息学》题集

《生物信息学》题集

《生物信息学》题集一、选择题(每题3分,共30分)1.生物信息学的主要研究对象是什么?A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术?A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中,进行多序列比对时常用的软件是什么?A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析?A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中,下列哪项不是常用的序列分析技术?A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用?A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测?A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中,下列哪项不是基因注释的内容?A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术?A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用?A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题(每题2分,共20分)1.生物信息学是一门交叉学科,它主要涉及______、计算机科学和数学等领域。

2.在生物信息学中,______技术常用于基因序列的相似性搜索。

3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。

4.在基因表达数据分析中,______是一种常用的数据标准化方法。

5.生物信息学中,______技术常用于蛋白质结构的预测和分析。

6.在生物信息学数据库中,GenBank主要存储的是______数据。

生物信息学考试试题

生物信息学考试试题

生物信息学考试试题一、选择题(每题 3 分,共 30 分)1、以下哪种不是常见的生物信息学数据库?()A GenBankB SWISSPROTC PubMedD Baidu2、在 DNA 序列分析中,以下哪个不是用于序列比对的算法?()A NeedlemanWunsch 算法B SmithWaterman 算法C BLAST 算法D Fourier 变换算法3、蛋白质结构预测的方法不包括()A 同源建模B 从头预测C 折叠识别D 随机模拟4、以下哪种不是基因表达数据分析的常用方法?()A 聚类分析B 主成分分析C 判别分析D 回归分析5、生物信息学中,用于预测蛋白质功能的方法有()A 基于序列相似性B 基于结构相似性C 基于基因共表达D 以上都是6、在基因组学中,以下哪个不是测序技术?()A Sanger 测序B 二代测序C 三代测序D 四代测序7、系统发生树构建的方法不包括()A 距离法B 最大简约法C 最大似然法D 最小二乘法8、以下哪种不是生物信息学中常用的编程语言?()A PythonB JavaC C++D Visual Basic9、以下哪个不是生物信息学在医学领域的应用?()A 疾病诊断B 药物研发C 医疗美容D 个性化医疗10、生物信息学中,处理大规模数据常用的工具是()A ExcelB R 语言C SPSSD Word二、填空题(每题 2 分,共 20 分)1、生物信息学是一门融合了生物学、计算机科学和()的交叉学科。

2、常见的核酸序列格式有 FASTA 和()。

3、蛋白质的二级结构包括α螺旋、β折叠和()等。

4、基因芯片技术是一种()分析技术。

5、序列比对的目的是寻找两个或多个序列之间的()。

6、人类基因组计划的主要目标是测定人类基因组的()序列。

7、生物信息学中的隐马尔可夫模型主要用于()。

8、系统发生分析中,外群的作用是()。

9、蛋白质相互作用网络分析有助于理解()。

10、生物信息学数据库可以分为一级数据库和()数据库。

生物信息学习题

生物信息学习题

GTATCACACG ACTCAGCGCA GCATTTGCCC
GTATCACATA GCTCAGCGCA GCATTTGCCC
6、对于下列距离矩阵,用 UPGMA 构建系统发生树。
ABCDE
A0
B3 0
C6 5 0
D 9 9 10 0
E 12 11 13 9 0 7、对下面距离矩阵,用 UPGMA 法构建系统发生树
1、蛋白质得分矩阵类型有 、
、、

等。
2、对位排列主要有局部比对和 三、运算题 1、画出下面两条序列的简单点阵图。将第一条序列放在 x 坐标轴上,将第二条序列放在 y
坐标轴上。 TGAACTCCCTCAGATATTA CGAACCCTCACATATTAGCG
2、对两个核酸序列 ACACACTA 和 AGCACACA 进行全局比对
第八章 后基因组时代的生物信息学(问题与练习)
1、 比较生物还原论与生物综合论的异同 2、 简述“后基因组生物信息学”的基本研究思路 3、 后基因组生物信息学的主要挑战是什么? 4、 功能基因组系统学的基本特征是什么? 5、 说明后基因组生物信息学对信息流动的最新理解 6、 列举几种预测蛋白质-蛋白质相互作用的理论方法 7、 解释从基因表达水平关联预测蛋白质-蛋白质相互作用的理论方法 8、 解释基因保守近邻法预测蛋白质-蛋白质相互作用的理论方法 9、 解释基因融合法预测蛋白质-蛋白质相互作用的理论方法 10、解释种系轮廓发生法预测蛋白质-蛋白质相互作用的理论方法
正确的树的可能性比前一种情况大还是小?
5、对于下列 5 条序列的比对构造一个距离矩阵,其中序列之间的距离值为比对中失配的碱
基数目,但是颠换的权值为转换的两倍。
GTGCTGCACG GCTCAGTATA GCATTTACCC

生物信息学A卷答案

生物信息学A卷答案

一、名词辨析(每题5分,共20分)1、基因与基因组:Gene 基因:遗传功能的单位。

它是一种DNA序列,在有些病毒中则是一种RNA 序列,它编码功能性蛋白质或RNA分子。

Genome 基因组:染色体组,一个生物体、细胞器或病毒的整套基因;例如,细胞核基因组,叶绿体基因组,噬菌体基因组。

2、相似性与同源性:所谓同源序列,简单地说,是指从某一共同祖先经趋异进化而形成的不同序列。

同源性可以用来描述染色体—“同源染色体”、基因—“同源基因”和基因组的一个片断—“同源片断”必须指出,相似性(similarity)和同源性(homology)是两个完全不同的概念。

相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。

相似性本身的含义,并不要求与进化起源是否同一、与亲缘关系的远近、甚至于结构与功能有什么联系。

3、CDS与cDNA:cDNA序列:互补DNA序列,指的是mRNA为在逆转录酶的作用下将形成DNA 的过程。

CDS序列:编码序列,从起始密码子到终止密码子的所有序列。

4、数据库搜索和数据库查询:数据库查询:对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找(又称数据库检索)。

数据库搜索:通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。

搜索对象不是数据库的注释信息,而是序列信息。

二、判断题(20分)1、生物信息学可以理解为生命科学中的信息科学。

(√)2、DNA分子和蛋白质分子都含有进化信息。

(√)3、目前生命科学研究的重点和突破点的已完全转移到生物信息学上,已不需要实验做支撑。

(×)4、生物信息学的发展大致经历了三个阶段:前基因组时代、基因组时代和后基因组时代。

(√)5、基因组与蛋白质组一样,都处于动态变化之中。

(×)6、蛋白质三维结构都是静态的,在行使功能的过程中其结构不会改变。

(×)7、生物信息学中研究的生物大分子主要是脂类和多糖。

生物信息学 考试答案

生物信息学 考试答案

Bioinformatics (包括陈老师6道题和师兄的四道题)1.什么是生物信息学?你怎么理解它的含义?(或者问什么是生物信息学,为什么生物信息学研究是重要的)答:生物信息学含义主要答3点:(1)它是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。

(2)生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测。

(3)生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。

它是本世纪自然科学和技术科学领域中“基因组”、“信息结构”和“复杂性”这三个重大科学问题的有机结合。

第二问:2.发现新基因的两种方法是什么?算法的本质是?(或者问通过DB如何发现新基因,通过何种途径)3.研究生物进化的步骤有哪些,当前面临的困难是什么?如何解决?答:步骤:(1)序列相似性比较。

就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。

完成这一工作只需要使用两两序列比较算法。

常用的程序包有BLAST、FASTA等;(2)序列同源性分析。

是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。

这是理论分析方法中最关键的一步。

完成这一工作必须使用多序列比较算法。

常用的程序包有CLUSTAL等;(3)构建系统进化树。

根据序列同源性分析的结果,重建反映物种间进化关系的进化树。

为完成这一工作已发展了多种软件包,象PYLIP、MEGA等;(4)稳定性检验。

为了检验构建好的进化树的可靠性,需要进行统计可靠性检验,通常构建过程要随机地进行成百上千次,只有以大概率(70%以上)出现的分支点才是可靠的。

通用的方法使用Bootstrap算法,相应的软件已包括在构建系统进化树所用的软件包当中。

2010年全国统一高考生物试卷(全国卷ⅱ)(含解析版)(1)

2010年全国统一高考生物试卷(全国卷ⅱ)(含解析版)(1)

2010年全国统一高考生物试卷(全国卷ⅱ)(含解析版)(1)2010年全国统一高考生物试卷(全国卷Ⅱ)一、选择题(共5小题,每小题3分,满分15分)1.(3分)下列关于高尔基体的叙述,错误的是()A.高尔基体膜具有流动性 B.抗体从合成到分泌不经过高尔基体C.高尔基体膜主要由磷脂和蛋白质构成 D.高尔基体具有对蛋白质进行加工的功能2.(3分)下列关于免疫细胞的叙述,错误的是()A.效应T细胞可以释放淋巴因子B.T淋巴细胞可以产生多种抗体C.吞噬细胞和淋巴细胞均属于免疫细胞D.一个效应B淋巴细胞只能产生一种抗体3.(3分)下列关于生态系统的叙述,错误的是()A.草原生态系统比农田生态系统的群落结构复杂B.环境条件分布不均匀是形成群落水平结构的原因之一C.我国南方热带雨林中分解者的代谢活动比北方森林中的弱D.植物可通过呼吸作用和光合作用参与生态系统的碳循环4.(3分)已知某环境条件下某种动物的AA和Aa个体全部存活,aa个体在出生前会全部死亡,现该动物的一个大群体,只有AA、Aa两种基因型,其比例为1:2.假设每对亲本只交配一次且成功受孕,均为单胎.在上述环境条件下,理论上该群体随机交配产生的第一代中AA和Aa的比例是()A.1:1 B.1:2 C.2:1 D.3:15.(3分)下列叙述符合基因工程概念的是()A.B淋巴细胞与肿瘤细胞融合,杂交瘤细胞中含有B淋巴细胞中的抗体基因B.将人的干扰素基因重组到质粒后导入大肠杆菌,获得能产生人干扰素的菌株C.用紫外线照射青霉菌,使其DNA发生改变,通过筛选获得青霉素高产菌株D.自然界中天然存在的噬菌体自行感染细菌后其DNA整合到细菌DNA上二、非选择题(共4小题,满分42分)6.(10分)请回答下列问题:(1)氮、磷、镁3种元素中,构成生命活动所需直接能源物质的元素是,构成细胞膜的元素是。

(2)缺镁时植物叶片发黄,其原因是。

(3)在提取叶绿体色素的过程中,研磨叶片通常需加少量二氧化硅、碳酸钙及适量丙酮。

生物信息学考试试题

生物信息学考试试题

生物信息学考试试题1. 选择题1. DNA序列中哪种碱基与腺嘌呤形成碱基对?A. 腺嘌呤B. 胸腺嘧啶C. 钝甲嘧啶D. 尿嘧啶2. 下列哪种不属于生物信息学中常用的序列比对软件?A. BLASTB. ClustalWC. PhotoshopD. MEGA3. 在生物信息学中,什么是基因组装?A. 把基因组序列和蛋白质序列对应起来B. 把已知的DNA序列分析并组装成完整的基因组C. 把DNA序列和RNA序列对比分析D. 把基因组序列转录为RNA序列4. 下列哪个软件主要用于预测DNA序列中的基因结构?A. BLASTB. ClustalWC. FGENESD. MEGA5. 在生物信息学中,什么是密码子?A. DNA序列中的重复单元B. 氨基酸序列C. tRNA分子上的核苷酸组合D. mRNA上的三联体核苷酸序列2. 简答题1. 请简要解释生物信息学在基因组学中的应用。

2. 什么是序列比对?序列比对的意义是什么?3. 解释基因组装和基因注释在生物信息学中的作用。

4. 生物信息学中常用的两种序列分析方法分别是什么?简要描述它们的原理。

5. 请简要介绍生物信息学在进化比较基因组学中的应用。

3. 计算题1. 给定以下两条序列,求它们的相似度:序列1: ATCGTCCGATT序列2: ATCGACCGTTA2. 已知一个DNA序列长度为1000bp,其中AT含量为60%,求该序列中GC含量百分比。

4. 应用题1. 请利用BLAST软件对一组已知DNA序列进行序列比对,并解释结果。

2. 请使用ClustalW对两个已知蛋白质序列进行多序列比对,并分析比对结果。

3. 选取一个基因组装软件,对一个已知基因组序列进行装配,并解释装配结果。

以上是生物信息学考试试题,希望您认真作答,祝您考试顺利!。

生物信息学试题及个人答案(非参考答案)

生物信息学试题及个人答案(非参考答案)

生物信息学答题卷考题一:到蛋白质序列数据库中查询一条杆状病毒(Baculovirus)DNA聚合酶(DNA polymerase)的完整序列,写出序列名称、登录号及来源物种的分类情况,然后用Blast(注意:写出所用程序及所搜索的数据库名称)搜索到数据库中和它相似程度较高的10条序列(写出这些序列的名称和登陆号及来源物种的分类情况。

要求至少包括3-4个属,每个属中选择1-2个种),对这10条序列进行多序列比对后(写出比对所用程序及比对结果),使用phylip软件,用距离法对它们进行分子进化分析(包括对进化树进行统计评估),说明这种蛋白质的进化历程(60分)。

答:(1)到蛋白质序列数据库中查询一条杆状病毒(Baculovirus)DNA聚合酶(DNA polymerase)的完整序列如下:完整序列(ORIGIN):1 mastdsldtr tfdyasdssf eviiitnaph dydgyielga aarllapfqk nisalwtnaa61 pshkltrnnk nylhvfglfk ylqnynlntk khppeyytik svicdlmmga qgktfdplce121 iktqlcaiqe slneaivtln ghaaadpapr tearelvesl hseyskkltf atdtildhvk181 sikdlvclnk序列名称: capsid protein [Choristoneura fumiferana MNPV]即:云杉卷叶蛾(虎尾松卷叶蛾)颗粒体病毒具体信息:LOCUS NP_848433 190 aa linear VRL06-MAY-2009登录号(ACCESSION): NP_848433来源物种的分类情况SOURCE Choristoneura fumiferana MNPVORGANISM Choristoneura fumiferana MNPVViruses; dsDNA viruses, no RNA stage; Baculoviridae;Alphabaculovirus.FEATURES Location/Qualifierssource 1..190/organism="Choristoneura fumiferana MNPV"/db_xref="taxon:208973"/country="Ireland"(2)然后用Blast搜索和它相似程度较高的10条序列如下:说明:所用程序:blosum62所搜索的数据库名称:swissprot数据库中和它相似程度较高的10条序列1、RecName: Full=Capsid protein p24名称:RecName: Full=Capsid protein p24LOCUS VP24_NPVOP 192 aa linear VRL 11-JAN-2011登录号:P24078来源物种的分类情况:SOURCE Orgyia pseudotsugata MNPVORGANISM Orgyia pseudotsugata MNPVViruses; dsDNA viruses, no RNA stage; Baculoviridae;Alphabaculovirus.FEATURES Location/Qualifierssource 1..192/organism="Orgyia pseudotsugata MNPV"/host="Orgyia pseudotsugata (Douglas fir tussock moth)"/db_xref="taxon:262177"2、RecName: Full=Capsid protein p24名称:RecName: Full=Capsid protein p24LOCUS VP24_NPVAC 198 aa linear VRL 11-JAN-2011登录号:P41678来源物种的分类情况:SOURCE Autographa californica nucleopolyhedrovirusORGANISM Autographa californica nucleopolyhedrovirusViruses; dsDNA viruses, no RNA stage; Baculoviridae;Alphabaculovirus.FEATURES Location/Qualifierssource 1..198/organism="Autographa californica nucleopolyhedrovirus"/host="Lepidoptera (butterflies and moths)"/db_xref="taxon:46015"3、RecName: Full=Flagellar motor switch phosphatase FliY; AltName: Full=CheY-P phosphatase FliY; AltName: Full=Flagellar motor switch protein FliY名称:RecName: Full=Flagellar motor switch phosphatase FliY; AltName: Full=CheY-P phosphatase FliY; AltName: Full=Flagellar motor switch protein FliYLOCUS FLIY_BACSU 378 aa linear BCT 08-FEB-2011登录号:P24073来源物种的分类情况:SOURCE Bacillus subtilisORGANISM Bacillus subtilisBacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus.FEATURES Location/Qualifierssource 1..378/organism="Bacillus subtilis"/db_xref="taxon:1423"4、RecName: Full=Uncharacterized protein YjeA名称:RecName: Full=Uncharacterized protein YjeALOCUS YJEA_HAEGA 322 aa linear BCT 30-NOV-2010登录号:Q9ZIY0来源物种的分类情况:SOURCE Avibacterium paragallinarumORGANISM Avibacterium paragallinarumBacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales;Pasteurellaceae; Avibacterium.FEATURES Location/Qualifierssource 1..322/organism="Avibacterium paragallinarum"/db_xref="taxon:728"5、RecName: Full=Protein YOP1名称:RecName: Full=Protein YOP1LOCUS YOP1_USTMA 172 aa linear PLN 08-MAR-2011 登录号:Q4P0H0来源物种的分类情况:SOURCE Ustilago maydisORGANISM Ustilago maydisEukaryota; Fungi; Dikarya; Basidiomycota; Ustilaginomycotina;Ustilaginomycetes; Ustilaginales; Ustilaginaceae; Ustilago. FEATURES Location/Qualifierssource 1..172/organism="Ustilago maydis"/db_xref="taxon:5270"6、RecName: Full=Protein anon-37Cs名称:RecName: Full=Protein anon-37CsLOCUS A37C_DROLE 544 aa linear INV 10-AUG-2010 登录号:O96570来源物种的分类情况:SOURCE Scaptodrosophila lebanonensisORGANISM Scaptodrosophila lebanonensisEukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota;Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha;Ephydroidea; Drosophilidae; Scaptodrosophila.FEATURES Location/Qualifierssource 1..544/organism="Scaptodrosophila lebanonensis"/db_xref="taxon:7225"7、RecName: Full=Photosystem I P700 chlorophyll a apoprotein A1; Short=PsaA名称:RecName: Full=Photosystem I P700 chlorophyll a apoprotein A1; Short=PsaA LOCUS PSAA_SYNPW 767 aa linear BCT 08-FEB-2011登录号:Q9R6U0来源物种的分类情况:SOURCE Synechococcus sp. WH 7803ORGANISM Synechococcus sp. WH 7803Bacteria; Cyanobacteria; Chroococcales; Synechococcus.FEATURES Location/Qualifierssource 1..767/organism="Synechococcus sp. WH 7803"/db_xref="taxon:32051"8、RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenase名称:RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenaseLOCUS MURB_CAMJE 258 aa linear BCT 08-FEB-2011登录号:Q9PM01来源物种的分类情况:SOURCE Campylobacter jejuniORGANISM Campylobacter jejuniBacteria; Proteobacteria; Epsilonproteobacteria; Campylobacterales;Campylobacteraceae; Campylobacter.FEATURES Location/Qualifierssource 1..258/organism="Campylobacter jejuni"/db_xref="taxon:197"9、RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenase名称:RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenaseLOCUS MURB_CAMJR 258 aa linear BCT 08-FEB-2011登录号:Q5HSB7来源物种的分类情况:SOURCE Campylobacter jejuni RM1221ORGANISM Campylobacter jejuni RM1221Bacteria; Proteobacteria; Epsilonproteobacteria; Campylobacterales;Campylobacteraceae; Campylobacter.FEATURES Location/Qualifierssource 1..258/organism="Campylobacter jejuni RM1221"10、RecName: Full=Probable molybdopterin-guanine dinucleotide biosynthesis protein A 名称:RecName: Full=Probable molybdopterin-guanine dinucleotide biosynthesis protein A LOCUS MOBA_METAC 225 aa linear BCT 03-MAY-2011登陆号:Q8TPD6来源物种的分类情况:SOURCE Methanosarcina acetivorans C2AORGANISM Methanosarcina acetivorans C2AArchaea; Euryarchaeota; Methanomicrobia; Methanosarcinales;Methanosarcinaceae; Methanosarcina.FEATURES Location/Qualifierssource 1..225/organism="Methanosarcina acetivorans C2A"/db_xref="taxon:188937"搜索过程附图:(3)对这10条序列进行多序列比对:写出比对所用程序:clustalx比对结果分析:比对所得的以phy为后缀的文件用写字板格式打开后得如下结果: 10 771P24078.1 ---------- ---------- ------MANA DSLDAR-AFS YAPDASFEVIP41678.1 ---------- ---------- ---------- ----TR-NFM YSPDSSLEVVQ9R6U0 ---------- TAKTQVEKVD NPATFELFGK PGHFDR-ALA KGPKTTTWVWQ3AMS5.1 MTISPPERGS DAKSQVEKVD NPATFELFGK PGHFDR-ALA KGPKTTTWVWQ9PM01.1 ------MIID FKKYSSVRIG NEFEVLVLDQ ICDFDG-FLI GGANN----LQ4P0H0 ---------- ---------- -KVEYFVAQI DKELSRYPAL KKFEQTVPVPQ9ZIY0.1 ------SIQT LLSRAKIIAE IRQFFSERGL LEVETPILSE FGVTDVHLSTP24073.2 --IDALLNGT GSTLDEPEIP EVDDLSEMER DAIGEIGNIS FGSSATALSTO96570 ---------E SLSFSGYKLT RRNLYNAPAL KVMGRSVNNS SSNNNDQQQYQ8TPD6.1 ---------- ---------- MSGKTELKPG RTKSRSAIVL AGGRGRRMGMIITNAPNDHD GY---LELNA AARL-LAPFQ KN-ISALWTS ----------IITNSDGDHD GY---LELTA AAKV-MSPFL SNGSSAVWTN ----------NLHANAHDFD SHTSDLEEVS RKIF-SAHFG HLAVIFIWLS GAFFHGARFSNLHANAHDFD AHTSDLQEVS RRIF-SAHFG HLAVIFIWLS GAFFHGARFSLVSPKPKNIG ILGDGFNFIQ ILDR-NKDFI HLRIGCKTKS S---------KAYAALGAFG IFTLFVFFNI AAGF-LTNLL GFFVPAYFS- ----------FSTKLISPFQ KKEKTLWLST SPEYPMKRLL SAGSGAIFQL CKVFRN---ELLNQKVDITT PSVTVIPRSK ISDAFPEPYV AIEVNYTEGF SG--------NLESAKQNTQ IVVIGAGLAG LSAAQHLLRH GFRSTIVLEA TDRYGG---RVEKALLEFEG KTILERLLEN LFRVVDEVIL SVRDIPQKEK ----------……(此处省略约9KB的数据分析结果)以上是多序列比对的纯数据结果,部分数据省略,因为可以从下面的进化树得到具体的分析。

生物信息学试题A卷2010

生物信息学试题A卷2010

4、构建系统发生树,应使用 A、BLAST C、UPGMA B、FASTA D、Entrez
□□□□□□□□□□□□学生姓名:________________
5、在蛋白质一级数据库基础上,构建二级数据库应使用 A、近邻归并法 C、基因融合法 B、序列比对 D、Entrez
一、名词解释(每题 2 分,共 10 分) 1、基序(motif) 2、可读框(ORF) 5、 系统发生学 3、剪切变体
S 0.0 0.0 1.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
Q 0.0 0.0 0.0 2.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
Y 0.0 0.0 0.0 0.0 3.0 0.0 0.0 0.0 0.0 0.0 0.0
H 0.0 0.0 0.0 0.0 0.0 4.0 0.0 0.0 0.0 0.0 0.0
E
12
11
13
9
0
exon
159465..159895 /gene="rpl2" /number=2
ORIGIN 1 atgggcgaac gacgggaatt gaacccgcga atggtggatt cacaatccac taccttaatc 61 cacttggcta catccgcccc tactctgact caattaagag tcatgtcata tttcgtttta
7、欧洲生物信息研究所简称: A、SIB C、NCBI B、EBI D、MIPS
8、在蛋白质序列数据库中比较查询蛋白质序列,应使用 A、BLASTn C、tBLASTn 9、Profiles 数据库是 A、蛋白质序列数据库 C、蛋白质二级数据库 10、TreeBASE 系统主要用于 A、发现新基因 C、类群间系统发育关系研究 B、系统生物学研究 D、序列比对 B、核酸序列数据库 D、蛋白质结构数据库 B、BLASTp D、BLASTx
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

局部排列可以鉴定蛋白质和核苷酸序列中潜在的序列和功能基序。 4). 功能预测(function prediction) 蛋白质序列间的高度相似性通常意味着同源序列间的功能相似性。 5). 数据库搜索(database search)
X I S Q Y H A E K R P
X 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
4、构建系统发生树,应使用 A、BLAST C、UPGMA B、FASTA D、Entrez
□□□□□□□□□□□□学生姓名:________________
5、在蛋白质一级数据库基础上,构建二级数据库应使用 A、近邻归并法 C、基因融合法 B、序列比对 D、Entrez
一、名词解释(每题 2 分,共 10 分) 1、基序(motif) 2、可读框(ORF) 5、 系统发生学 3、剪切变体
学生班级________________学生学号:
3、 核酸序列比对使用的得分矩阵类型有 等价矩阵 、 BLAST 、和 转换-颠换矩阵 等。 4、蛋白质结构分类数据库主要有 SCOP 和 CAH 和 PDBsum 等。 邻近归并法 、 Fitch-Margoliash法 、
5、构建系统.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 3.0 2.3
P 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 4.0 --------4 分
接下来进行递推,用两个函数分别计算由二条路径到达该单元的分值并找出其中 的最大值,若此分值小于 0,则用 0 替代。这两个函数分别计算: (I) 当前行前面各分值与相应空位罚分值之差,并取最大值;求空位罚分值的函数为 W =1.0+0.333 k,k 表示连续的第 k 个空位。 (II) 当前列前面各分值与相应的空位罚分值之差,并取最大值。出现负值就用 0 代替, 表示没有相似性比对可以延续到当前位置。 X I S Q Y H A E K R P X 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 S 0.0 0.0 1.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 Q 0.0 0.0 0.0 2.0 0.7 0.3 0.0 0.0 0.0 0.0 0.0 Y 0.0 0.0 0.0 0.7 3.0 1.7 1.0 0.7 0.3 0.0 0.0 H 0.0 0.0 0.0 0.3 1.7 4.0 2.7 2.3 2.0 1.7 1.3 D 0.0 0.0 0.0 0.0 1.3 2.7 3.7 2.3 2.0 1.7 1.3 W 0.0 0.0 0.0 0.0 1.0 2.3 2.3 3.3 2.0 1.7 1.3 E 0.0 0.0 0.0 0.0 0.7 2.0 2.0 1.9 3.0 1.7 1.3 K 0.0 0.0 0.0 0.0 0.3 1.7 1.7 1.7 2.0 2.7 1.3 R 0.0 0.0 0.0 0.0 0.0 1.3 1.3 1.3 0.7 3.0 2.3 P 0.0 0.0 0.0 0.0 0.0 1.0 1.0 1.0 0.3 1.7 4.0 -------7 分 一旦矩阵中所有单元的分值计算完毕,就可以找出具有最高分值的单元,也就是 代表两个序列间高分匹配的终点。到达这个单元的其他矩阵元素可以通过回溯方法确 定。然后根据回溯路径求得一个片段的比对。如果需要,还可以找出在上述回溯范围
第 3 页 共 1 页
□□□□□□□□□□□□学生姓名:________________
一、 名词解释(每题 2 分,共 10 分) 1、基序(motif) :通过多序列比对,将同源序列收集在一起,以得到保守区域。这 些保守区域称为基序(motifs) 2、可读框(ORF) :没有终止密码子(TGA,TAA 或 TAG)打断的阅读框。 3、剪切变体:从同一 DNA,转录得到不同 mRNA,并最终翻译成不同的蛋白质称 为剪接变体 4、表p), 它们代表在特定组织或发育阶段表达的基因,有时可代表特定的 cDNA. 5、系统发生学:通过比较五种的特征,认为特征相似的五种在遗传学上相近,研究 五种之见的进化关系 二、 填空题(共 20 分,每空 1 分) l、 列举至少 2 种权威的核酸序列数据库 Genbank 、 EMBL 等。 2、列举至少 3 种权威的蛋白质序列数据库 PIR 、 Swiss-prot 、
7、欧洲生物信息研究所简称: A、SIB C、NCBI B、EBI D、MIPS
8、在蛋白质序列数据库中比较查询蛋白质序列,应使用 A、BLASTn C、tBLASTn 9、Profiles 数据库是 A、蛋白质序列数据库 C、蛋白质二级数据库 10、TreeBASE 系统主要用于 A、发现新基因 C、类群间系统发育关系研究 B、系统生物学研究 D、序列比对 B、核酸序列数据库 D、蛋白质结构数据库 B、BLASTp D、BLASTx
6、做 DNA 结构分析可使用 A、GenBank 数据库 C、NDB 数据库 B、PIR 数据库 D、BLOCKS 数据库
4、表达标签序列(EST)
二、填空题(共 20 分,每空 1 分) l、 列举至少 2 种权威的核酸序列数据库 2、列举至少 3 种权威的蛋白质序列数据库 3、核酸序列比对使用的得分矩阵类型有 4、蛋白质结构分类数据库主要有 5、构建系统树的主要方法有 6、列举至少 4 中 NCBI 的服务功能 、 、 、 、 、 、 、 、 和 、 和 等。 、 、和 等。 、 等。 等。 等。 等。
D 0.0 0.0 0.0 0.0 0.0 0.0 3.7 0.0 0.0 0.0 0.0
W 0.0 0.0 0.0 0.0 0.0 0.0 0.0 3.4 0.0 0.0 0.0
E 0.0 0.0 0.0 0.0 0.0 0.0 0.0 1.0 3.0 0.0 0.0
K 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 2.0 2.7 0.0
3、下列哪一数据库是表达序列标签数据库? A、PROSITE C、dbEST B、dbSNP D、PDB
Nymphaea alba chloroplast, complete genome.
ACCESSION VERSION KEYWORDS SOURCE REFERENCE AUTHORS TITLE JOURNAL PUBMED FEATURES source
五、计算题(共 30 分)
l、 对两条序列“SQYHDEKRPW”和“ISQYHAEKRP”进行局部比对。 (15 分) 2、对于下列距离矩阵,用 UPGMA 构建系统发生树。 (15 分) A A B C D 0 3 6 9 0 5 9 0 10 0
第 2 页 共 1 页
B
C
D
E
………………装订线………装订线………装订线…………试卷须与答题纸一并交监考教师…………装订线………装订线………装订线………………
……
159841 gagtaggaaa aggaataaat atagtgatat ttttattctt cgtcgccgta agtaaataga 159901 aagagaaata ataaataatg aatgatgtga //
3、构建蛋白质二级数据库的主要方法有哪些? 4、概括总结序列比较的主要用途。
………………装订线………装订线………装订线…………试卷须与答题纸一并交监考教师…………装订线………装订线………装订线………………
内蒙古科技大学 2010/2011 学年第一学期 《生物信息学》考试试题
课程号:66149304 使用专业、年级:生工 08、生技 07 考试时间:2010 年 12 月 考试方式:开卷 任课教师:蔡禄 备 注:A 卷
AJ627251 AJ627251.1 GI:50250306 complete genome. chloroplast Nymphaea alba 1 Goremykin,V.V., Hirsch-Ernst,K.I., Wolfl,S. and Hellwig,F.H. The chloroplast genome of Nymphaea alba: whole-genome analyses and the problem of identifying the most basal angiosperm Mol. Biol. Evol. 21 (7), 1445-1454 (2004) 15084683 Location/Qualifiers 1..159930 /organism="Nymphaea alba" /organelle="plastid:chloroplast" /mol_type="genomic DNA" /db_xref="taxon:34301"
2、下列那一数据库是核酸序列数据库 A、PROSITE 数据库 C、PDB 数据库 B、DDBJ 数据库 D、PIR 数据库
四、问答题(每题 5 分,共 20 分) 1、为什么说 Swiss-Prot 是重要的蛋白质序列数据库? 2、下面是 Genbank 中一条记录,是解释其主要含义
LOCUS DEFINITION 第 1 页 共 1 页 AJ627251 159930 bp DNA circular PLN 15-APR-2005
S 0.0 0.0 1.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
Q 0.0 0.0 0.0 2.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
Y 0.0 0.0 0.0 0.0 3.0 0.0 0.0 0.0 0.0 0.0 0.0
H 0.0 0.0 0.0 0.0 0.0 4.0 0.0 0.0 0.0 0.0 0.0
三、选择题(从每题的 A、B、C、D 四个被选答案中选择一个最佳答案。共 20 分,每 小题 2 分) 1、下列那一数据库最有可能存放蛋白质跨膜区信息 A、NDB 数据库 C、GenBank 数据库 B、SWISS-PROT 数据库 D、PDB 数据库
相关文档
最新文档