生物信息学考试试卷修订稿

合集下载

大学生生物信息学考试模拟题及解析

大学生生物信息学考试模拟题及解析一、单选题（每题 3 分，共 30 分）1、生物信息学中，用于分析 DNA 序列的常见软件是（）A BLASTB ClustalWC Primer PremierD MEGA2、以下哪种数据库主要存储蛋白质结构信息（）A GenBankB PDBC UniProtD SWISSPROT3、在基因预测中，开放阅读框（ORF）是指（）A 从起始密码子到终止密码子的一段序列B 具有特定功能的一段基因序列C 编码蛋白质的基因序列D 以上都不对4、进行系统发育分析时，常用的构建进化树的方法是（）A 邻接法B 最大简约法C 最大似然法D 以上都是5、以下哪种算法常用于序列比对（）A 动态规划算法B 贪心算法C 分治法D 回溯算法6、生物信息学中，用于分析基因表达数据的常用方法是（）A 聚类分析B 回归分析C 方差分析D 以上都是7、以下哪个不是常见的生物信息学文件格式（）A FASTAB GenBankC PDBD CSV8、在蛋白质序列分析中，用于预测蛋白质二级结构的方法是（）A 同源建模B 从头预测C 基于机器学习的方法D 以上都是9、进行基因功能注释时，常用的数据库是（）A GOB KEGGC ReactomeD 以上都是10、以下哪种技术可以用于大规模测序（）A Sanger 测序B 二代测序C 三代测序D 以上都是答案及解析：1、答案：A解析：BLAST（Basic Local Alignment Search Tool）是用于比较生物序列相似性的工具，常用于分析 DNA 序列。

ClustalW 主要用于多序列比对；Primer Premier 常用于设计引物；MEGA 用于构建进化树。

2、答案：B解析：PDB（Protein Data Bank）是主要存储蛋白质结构信息的数据库。

GenBank 主要存储核酸序列；UniProt 和 SWISSPROT 主要存储蛋白质序列信息。

生物信息技术考试试题

生物信息技术考试试题一、选择题（每题 3 分，共 30 分）1、以下哪个不是生物信息学的主要研究内容？（）A 基因组学B 蛋白质组学C 细胞学D 代谢组学2、生物信息学中用于序列比对的常用算法是（）A 动态规划算法B 贪心算法C 分治算法D 回溯算法3、在基因表达数据分析中，常用的标准化方法是（）A RPKMB TPMC FPKMD 以上都是4、以下哪种数据库主要用于存储蛋白质结构信息？（）A GenBankB PDBC UniProtD Ensembl5、进行系统发育分析时，常用的构建进化树的方法是（）A 邻接法B 最大简约法C 最大似然法D 以上都是6、以下哪个软件不是用于基因序列分析的？（）A Primer PremierB SPSSC DNAStarD Vector NTI7、生物信息学中，预测蛋白质二级结构的方法不包括（）A 基于同源建模B 基于机器学习C 基于物理化学原理D 基于经验规则8、在生物信息学中，BLAST 程序主要用于（）A 序列比对B 进化分析C 基因预测D 蛋白质结构预测9、以下哪种编程语言在生物信息学中应用较为广泛？（）A JavaB PythonC C+＋D Fortran10、用于分析基因芯片数据的软件包是（）A R 语言中的 BioconductorB MATLABC StataD SAS二、填空题（每题 3 分，共 30 分）1、生物信息学中的三大核心数据库是_____、＿____、＿____。

2、基因序列的相似性搜索常用的工具是_____。

3、蛋白质的一级结构是指_____。

4、常见的基因注释数据库有_____、＿____等。

5、系统发育树的构建基于_____的原理。

6、生物信息学中常用的数据格式有_____、＿____等。

7、预测蛋白质三级结构的方法主要有_____、＿____。

8、基因表达数据的差异分析常用的方法有_____、＿____。

9、用于分析高通量测序数据的软件有_____、＿____。

生物信息学试题及答案

广东海洋大学 2013—— 2014 学年第一学期《生物信息学》课程试题答案课程号： 13432210 √ 考试 √ A 卷 √ 闭卷 □ 考查□ B 卷□ 开卷一、简答题(一) 生物信息学及主要内容？(3)生物信息学是生物和信息技术的结合，这一学科包括了用来管理、分析和操作大量生物数据集的任何计算工具和方法。

(二) 生物信息学主要由哪三个组成部分？(6)1、建立可以存放和管理大量生物信息学数据集的数据库；2、开发确定大数据集中各成员关系的算法和统计方法；3、使用这些工具来分析和解释不同类型的生物数据，包括DNA ，RNA 和蛋白质序列、蛋白质结构、基因表达以及生化途径。

(三) 存储在GenBank 中DNA 序列的类型？(6) 1、基因组DNA 2、cDNA 3、重组DNA(四) 解释下图说明基因组测序的策略？(6)1、霰弹测序法(shot gun sequencing)：随机打碎大DNA 分子，通过很多测序反应来覆盖整个分子，完整的序列通过使用计算机搜索重叠区来重新拼接。

2、克隆重叠群(clone contig)的方法中，DNA 片段用推理的方法亚克隆，并且进行系统的测序直到整个序列完成。

(五) 按制备方式分DNA 芯片的主要类型？(6)1、原位合成芯片：采用显微光蚀刻等技术在特定部位原位合成寡核苷酸而制备的芯片。

探针较短；2、 DNA 微集阵列：将预先制备的DNA 片段以显微打印的方式有序地固化于支持物表面而制成的芯班级：姓名：学号：试题共页加白纸 2张密封线GDOU-B-11-302片。

探针的来源较灵活。

(六) 解释下图说明用芯片如何测定不同组织中基因表达的差异？(8)1、将要检测的基因用芯片点样仪芯片上2、提取待测样品和对照样品的RNA，分别用用Cy3标定一种RNA，而用Cy5标定另一种RNA。

Cy3发红色荧光，Cy5发绿色荧光。

3、用不同的激发光照射，测定两种样品中DNA的表达量。

生物信息学试题

生物信息学考题（2012版）一、填空题（共10分，每空一分）1、美国政府于1990年10月启动耗资30亿美元的15年研究计划，预期到2005年完成人类基因组大约30亿个碱基的全序列测定，这就是被称为生命科学“登月计划”的人类基因组计划。

2、生物信息学的研究目标：以核酸、蛋白质等生物大分子数据库为主要对象，以数学、信息学、计算机科学为主要手段，以计算机硬件、软件和计算机网络为主要工具，对浩瀚如海的原始数据进行存储、管理、注释、加工，使之成为具有明确生物意义的生物信息。

3、随着生物信息学的诞生及应用，今后生物学研究项目的起点将是理论的，一位科学家将从理论推测开始，然后转向试验去追踪或检验该假设。

4、生物信息学作为一门交叉学科，已经成为当今生命科学乃至整个自然科学的重大前沿领域之一，也将是21世纪自然科学的核心领域之一。

5、人类基因组计划、“曼哈顿原子计划”和“阿波罗登月计划”并称为20世纪的三大著名计划，中国在1999年承担了1%的研究任务，即对第3号染色体上3000万碱基对的测定。

6、人类基因组的主要任务是：人类基因组以及一些模式生物（细菌、酵母、线虫、果蝇等）基因组作图、测序和基因识别。

二、是非题（共10分，每小题1分）1、生物学就是实验科学，所有的研究结论从实验中来，于实验中得到验证。

（错）2、比较是科学研究中最常见的方法，在生物信息学研究中，比对是最常用和最经典的研究手段。

（对）3、两个蛋白质序列相似性超过30%就是同源蛋白。

（错）4、蛋白质序列相似性指一级序列中氨基酸残基相同。

（错）5、蛋白质序列相似性指氨基酸残基具有相似特性：侧链基团大小电荷性、疏水性等相同。

（对）6、核酸序列相似性指序列中相同碱基所占的比例。

（对）7、对一段未知功能DNA片段进行功能预测需对其进行3位翻译。

（错）8、对一段未知功能DNA片段进行功能预测需对其进行6位翻译。

（对）9、相似性是指一种很直接的数量关系，无需实验验证。

生物信息学基础考试试题

生物信息学基础考试试题生物信息学基础考试试题回答一、选择题（每题5分，共20题）1. 生物信息学的定义是什么？A. 研究生物的基本信息B. 利用计算机科学分析生物学数据C. 研究生物的遗传编码D. 生物学的一个分支学科答案：B2. 以下哪个是常用的生物信息学数据库？A. NCBIB. C++C. DNAD. Photosynthesis答案：A3. 在DNA序列中，碱基A配对的是？A. TB. CC. GD. U答案：A4. 以下哪个是生物信息学中常用的序列比对算法？A. BLASTB. MATLABC. PCRD. ELISA答案：A5. 基因组学是研究什么的科学？A. 蛋白质结构B. DNA修复C. 基因组DNA的组成和功能D. 细胞分裂答案：C6. 哪种技术可用于测定DNA序列？A. 单克隆抗体技术B. RNA干扰技术C. 半制备列序法D. 高效液相色谱法答案：C7. 生物信息学中的序列模拟是指什么？A. 通过计算机模拟生物进化过程B. 利用计算机模拟DNA合成过程C. 模拟生物对某种药物的反应D. 利用计算机模拟细胞分裂过程答案：A8. 以下哪个是生物信息学的一个重要应用领域？A. 化学合成B. 建筑设计C. 新药研发D. 环境保护答案：C9. 哪个工具常用于分析生物信息中的调控网络？A. PhotoshopB. CytoscapeC. ExcelD. SPSS答案：B10. 蛋白质结构预测是生物信息学的一个重要研究方向，以下哪种是蛋白质的一级结构？A. α螺旋B. 葡萄糖C. 多肽链D. 抗原答案：C11. 生物信息学与生物医学工程有什么相似之处？A. 都研究细胞生物学B. 都属于理学院系C. 都涉及到计算机科学D. 都使用相同的实验方法答案：C12. 在基因组测序中，什么是基因组装？A. 利用计算机将碎片序列拼接成连续的基因组B. 测定基因组中的突变位点C. 研究基因间的调控关系D. 将RNA转录为蛋白质的过程答案：A13. 以下哪个不属于生物信息学的软件工具？A. BLASTB. PhotoshopC. RD. Python答案：B14. 哪种常见的DNA测序技术被广泛应用于基因组学研究？A. Sanger测序B. 吉姆斯法则C. CRISPR-Cas9技术D. 免疫印迹法答案：A15. 生物信息学中的反向遗传学用于研究什么？A. DNA复制B. 基因的转录和翻译C. RNA干扰D. 基因组的组装答案：B16. 哪种方法可用于鉴定基因表达谱中的关键基因？A. 蛋白质降解法B. 基因芯片技术C. 聚合酶链式反应D. 免疫组化技术答案：B17. 生物信息学研究中常用的基因表达定量方法是什么？A. Western BlotB. ELISAC. qPCRD. 蛋白质组学答案：C18. 生物信息学中的系统生物学研究的是什么？A. 各个细胞器的功能B. 化学元素与生物体的相互作用C. 生物学过程中的相互关系D. 各个动物种群的遗传特征答案：C19. 下面哪个数据库不是用于蛋白质结构预测的？A. PDBB. UniProtC. Swiss-ProtD. Entrez Gene答案：D20. 生物信息学中常用的序列对比方法是什么？A. 水平基因转移B. Smith-Waterman算法C. 单克隆抗体制备D. RNA干扰技术答案：B二、简答题（每题10分，共5题）1. 编程语言在生物信息学中的作用是什么？编程语言在生物信息学中扮演着重要角色。

《生物信息学》题集

《生物信息学》题集一、选择题（每题3分，共30分）1.生物信息学的主要研究对象是什么？A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术？A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中，进行多序列比对时常用的软件是什么？A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析？A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中，下列哪项不是常用的序列分析技术？A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用？A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测？A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中，下列哪项不是基因注释的内容？A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术？A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用？A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题（每题2分，共20分）1.生物信息学是一门交叉学科，它主要涉及______、计算机科学和数学等领域。

2.在生物信息学中，______技术常用于基因序列的相似性搜索。

3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。

4.在基因表达数据分析中，______是一种常用的数据标准化方法。

5.生物信息学中，______技术常用于蛋白质结构的预测和分析。

6.在生物信息学数据库中，GenBank主要存储的是______数据。

生物信息学考试试题

生物信息学考试试题一、选择题（每题 3 分，共 30 分）1、以下哪种不是常见的生物信息学数据库？（）A GenBankB SWISSPROTC PubMedD Baidu2、在 DNA 序列分析中，以下哪个不是用于序列比对的算法？（）A NeedlemanWunsch 算法B SmithWaterman 算法C BLAST 算法D Fourier 变换算法3、蛋白质结构预测的方法不包括（）A 同源建模B 从头预测C 折叠识别D 随机模拟4、以下哪种不是基因表达数据分析的常用方法？（）A 聚类分析B 主成分分析C 判别分析D 回归分析5、生物信息学中，用于预测蛋白质功能的方法有（）A 基于序列相似性B 基于结构相似性C 基于基因共表达D 以上都是6、在基因组学中，以下哪个不是测序技术？（）A Sanger 测序B 二代测序C 三代测序D 四代测序7、系统发生树构建的方法不包括（）A 距离法B 最大简约法C 最大似然法D 最小二乘法8、以下哪种不是生物信息学中常用的编程语言？（）A PythonB JavaC C+＋D Visual Basic9、以下哪个不是生物信息学在医学领域的应用？（）A 疾病诊断B 药物研发C 医疗美容D 个性化医疗10、生物信息学中，处理大规模数据常用的工具是（）A ExcelB R 语言C SPSSD Word二、填空题（每题 2 分，共 20 分）1、生物信息学是一门融合了生物学、计算机科学和（）的交叉学科。

2、常见的核酸序列格式有 FASTA 和（）。

3、蛋白质的二级结构包括α螺旋、β折叠和（）等。

4、基因芯片技术是一种（）分析技术。

5、序列比对的目的是寻找两个或多个序列之间的（）。

6、人类基因组计划的主要目标是测定人类基因组的（）序列。

7、生物信息学中的隐马尔可夫模型主要用于（）。

8、系统发生分析中，外群的作用是（）。

9、蛋白质相互作用网络分析有助于理解（）。

10、生物信息学数据库可以分为一级数据库和（）数据库。

《生物信息学》试卷(B)

武汉大学2007—2008学年度高校教师研修班《生物信息学》试卷（B）及答案一、翻译下列名词并解释。

(每题5分，共25分)1. HGP2. SRS3. Markov Chain4. ANN5. CDS二、填空(每空2分，共20分)1、生物信息学主要研究的两种信息载体是和。

2、目前国际上主要的核酸数据库是由建立和维护的、由维护的，和日本遗传研究所建立和维护的。

每个机构负责收集来自不同地理分布的数据， 3 个数据库所有信息并向世界开放，3、在进行序列两两比对时，有两方面问题直接影响相似性分值：和。

三、解释说明：请按要求对下列GenBank文件作解释说明。

(每小题4分，共20分)1、LOCUS行中的第3项mRNA linear表示，这里是。

2、DEFINITION行在GenBank记录中用以3 ACCESSION 是，是从数据库中检索一个记录的主要。

4. FEATURES后面部分是，直接表达了记录的生物背景知识，5 CDS 30…533 表示。

四、问答。

（共35分）1、DNA测序有哪些方法？其基本原理是什么？（10分）2、简述蛋白质结构预测的基本思想和方法。

（10分）3、试述人类基因组计划与生物信息学的关系。

（15分）《生物信息学》试卷（B）答案一、翻译下列名词并解释。

(每题5分，共25分)1. HGP Human genome project人类基因组计划2. SRS Sequence Retrieval System 序列检索系统3. 马尔科夫链（Markov Chain），对于生物分子序列分析，马尔科夫链是一个很好的数学统计模型，因为马尔科夫链本身就是相继发生事件的序列，其特征是对于事件序列中的任何一个事件都有一个发生概率，而这个概率依赖于该事件之前的若干个事件。

4. ANN Artificial Neural Network, 人工神经网络5. CDS指的是编码序列,从起始密码子到终止密码子二、填空(每空2分，共20分)1、生物信息学主要研究的两种信息载体是DNA分子和蛋白质分子2、目前国际上主要的核酸数据库是由美国国立生物技术信息中心建立和维护的Genbank库、由欧洲生物信息学研究所(EBI)维护的EMBL-Bank，和日本遗传研究所建立和维护的日本DNA 数据仓库(DDBJ)。

生物信息学与计算生物学出版考核试卷

生物信息学与计算生物学出版考核试卷
考生姓名：__________答题日期：__________得分：__________判卷人：__________
一、单项选择题（本题共20小题，每小题1分，共20分，在每小题给出的四个选项中，只有一项是符合题目要求的）
1.生物信息学的主要研究内容是：（）
A.生物数据的收集
4.基因表达分析的常用技术之一是______。（）
5.在生物信息学中，______是指通过计算机分析生物学数据，以发现新的生物学知识的过程。（）
6.生物信息学中，用于存储和检索生物学文献的数据库是______。（）
7.蛋白质组学研究中，______技术可以用来鉴定蛋白质及其修饰。（）
8.基因敲除技术的核心是利用______系统来特异性地去除目标基因的功能。（）
C. MODELLER
D. Swiss-Model
16.关于系统生物学，以下哪个描述是正确的？（）
A.仅关注单个基因或蛋白质的功能
B.不涉及数学模型与计算方法
C.研究生物系统中各组成部分的相互作用
D.与生物信息学无关
17.以下哪个数据库主要用于存储疾病相关基因信息？（）
A. OMIM
B. Orphanet
A. Clustal Omega
B. MUSCLE
C. TM-align
D. PSIBLAST
19.在生物信息学中，以下哪些方法可以用于识别非编码RNA？（）
A. RNAz
B. CPC
C. RNAmmer
D. BLAST
20.以下哪些是生物信息学中用于机器学习的常见算法？（）
A.支持向量机
B.随机森林
10.同源搜索
四、判断题

生物信息学考试答案

Bioinformatics （包括陈老师6道题和师兄的四道题）1.什么是生物信息学？你怎么理解它的含义？（或者问什么是生物信息学，为什么生物信息学研究是重要的）答：生物信息学含义主要答3点：（1）它是一个学科领域，包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。

（2）生物信息学是把基因组DNA序列信息分析作为源头，破译隐藏在DNA序列中的遗传语言，特别是非编码区的实质；同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测。

（3）生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。

它是本世纪自然科学和技术科学领域中“基因组”、“信息结构”和“复杂性”这三个重大科学问题的有机结合。

第二问：2.发现新基因的两种方法是什么？算法的本质是？（或者问通过DB如何发现新基因，通过何种途径）3.研究生物进化的步骤有哪些，当前面临的困难是什么？如何解决？答：步骤：（1）序列相似性比较。

就是将待研究序列与DNA或蛋白质序列库进行比较，用于确定该序列的生物属性，也就是找出与此序列相似的已知序列是什么。

完成这一工作只需要使用两两序列比较算法。

常用的程序包有BLAST、FASTA等；（2）序列同源性分析。

是将待研究序列加入到一组与之同源，但来自不同物种的序列中进行多序列同时比较，以确定该序列与其它序列间的同源性大小。

这是理论分析方法中最关键的一步。

完成这一工作必须使用多序列比较算法。

常用的程序包有CLUSTAL等；（3）构建系统进化树。

根据序列同源性分析的结果，重建反映物种间进化关系的进化树。

为完成这一工作已发展了多种软件包，象PYLIP、MEGA等；（4）稳定性检验。

为了检验构建好的进化树的可靠性，需要进行统计可靠性检验，通常构建过程要随机地进行成百上千次，只有以大概率（70％以上）出现的分支点才是可靠的。

通用的方法使用Bootstrap算法，相应的软件已包括在构建系统进化树所用的软件包当中。

生物信息学试题及个人答案(非参考答案)

生物信息学答题卷考题一：到蛋白质序列数据库中查询一条杆状病毒(Baculovirus)DNA聚合酶（DNA polymerase)的完整序列，写出序列名称、登录号及来源物种的分类情况，然后用Blast（注意：写出所用程序及所搜索的数据库名称）搜索到数据库中和它相似程度较高的10条序列（写出这些序列的名称和登陆号及来源物种的分类情况。

要求至少包括3-4个属，每个属中选择1-2个种），对这10条序列进行多序列比对后（写出比对所用程序及比对结果），使用phylip软件，用距离法对它们进行分子进化分析(包括对进化树进行统计评估)，说明这种蛋白质的进化历程（60分）。

答：（1）到蛋白质序列数据库中查询一条杆状病毒(Baculovirus)DNA聚合酶（DNA polymerase)的完整序列如下：完整序列（ORIGIN）：1 mastdsldtr tfdyasdssf eviiitnaph dydgyielga aarllapfqk nisalwtnaa61 pshkltrnnk nylhvfglfk ylqnynlntk khppeyytik svicdlmmga qgktfdplce121 iktqlcaiqe slneaivtln ghaaadpapr tearelvesl hseyskkltf atdtildhvk181 sikdlvclnk序列名称: capsid protein [Choristoneura fumiferana MNPV]即：云杉卷叶蛾(虎尾松卷叶蛾)颗粒体病毒具体信息：LOCUS NP_848433 190 aa linear VRL06-MAY-2009登录号(ACCESSION): NP_848433来源物种的分类情况SOURCE Choristoneura fumiferana MNPVORGANISM Choristoneura fumiferana MNPVViruses; dsDNA viruses, no RNA stage; Baculoviridae;Alphabaculovirus.FEATURES Location/Qualifierssource 1..190/organism="Choristoneura fumiferana MNPV"/db_xref="taxon:208973"/country="Ireland"（2）然后用Blast搜索和它相似程度较高的10条序列如下：说明：所用程序:blosum62所搜索的数据库名称:swissprot数据库中和它相似程度较高的10条序列1、RecName: Full=Capsid protein p24名称：RecName: Full=Capsid protein p24LOCUS VP24_NPVOP 192 aa linear VRL 11-JAN-2011登录号：P24078来源物种的分类情况：SOURCE Orgyia pseudotsugata MNPVORGANISM Orgyia pseudotsugata MNPVViruses; dsDNA viruses, no RNA stage; Baculoviridae;Alphabaculovirus.FEATURES Location/Qualifierssource 1..192/organism="Orgyia pseudotsugata MNPV"/host="Orgyia pseudotsugata (Douglas fir tussock moth)"/db_xref="taxon:262177"2、RecName: Full=Capsid protein p24名称：RecName: Full=Capsid protein p24LOCUS VP24_NPVAC 198 aa linear VRL 11-JAN-2011登录号：P41678来源物种的分类情况：SOURCE Autographa californica nucleopolyhedrovirusORGANISM Autographa californica nucleopolyhedrovirusViruses; dsDNA viruses, no RNA stage; Baculoviridae;Alphabaculovirus.FEATURES Location/Qualifierssource 1..198/organism="Autographa californica nucleopolyhedrovirus"/host="Lepidoptera (butterflies and moths)"/db_xref="taxon:46015"3、RecName: Full=Flagellar motor switch phosphatase FliY; AltName: Full=CheY-P phosphatase FliY; AltName: Full=Flagellar motor switch protein FliY名称：RecName: Full=Flagellar motor switch phosphatase FliY; AltName: Full=CheY-P phosphatase FliY; AltName: Full=Flagellar motor switch protein FliYLOCUS FLIY_BACSU 378 aa linear BCT 08-FEB-2011登录号：P24073来源物种的分类情况：SOURCE Bacillus subtilisORGANISM Bacillus subtilisBacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus.FEATURES Location/Qualifierssource 1..378/organism="Bacillus subtilis"/db_xref="taxon:1423"4、RecName: Full=Uncharacterized protein YjeA名称：RecName: Full=Uncharacterized protein YjeALOCUS YJEA_HAEGA 322 aa linear BCT 30-NOV-2010登录号：Q9ZIY0来源物种的分类情况：SOURCE Avibacterium paragallinarumORGANISM Avibacterium paragallinarumBacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales;Pasteurellaceae; Avibacterium.FEATURES Location/Qualifierssource 1..322/organism="Avibacterium paragallinarum"/db_xref="taxon:728"5、RecName: Full=Protein YOP1名称：RecName: Full=Protein YOP1LOCUS YOP1_USTMA 172 aa linear PLN 08-MAR-2011 登录号：Q4P0H0来源物种的分类情况：SOURCE Ustilago maydisORGANISM Ustilago maydisEukaryota; Fungi; Dikarya; Basidiomycota; Ustilaginomycotina;Ustilaginomycetes; Ustilaginales; Ustilaginaceae; Ustilago. FEATURES Location/Qualifierssource 1..172/organism="Ustilago maydis"/db_xref="taxon:5270"6、RecName: Full=Protein anon-37Cs名称：RecName: Full=Protein anon-37CsLOCUS A37C_DROLE 544 aa linear INV 10-AUG-2010 登录号：O96570来源物种的分类情况：SOURCE Scaptodrosophila lebanonensisORGANISM Scaptodrosophila lebanonensisEukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota;Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha;Ephydroidea; Drosophilidae; Scaptodrosophila.FEATURES Location/Qualifierssource 1..544/organism="Scaptodrosophila lebanonensis"/db_xref="taxon:7225"7、RecName: Full=Photosystem I P700 chlorophyll a apoprotein A1; Short=PsaA名称：RecName: Full=Photosystem I P700 chlorophyll a apoprotein A1; Short=PsaA LOCUS PSAA_SYNPW 767 aa linear BCT 08-FEB-2011登录号：Q9R6U0来源物种的分类情况：SOURCE Synechococcus sp. WH 7803ORGANISM Synechococcus sp. WH 7803Bacteria; Cyanobacteria; Chroococcales; Synechococcus.FEATURES Location/Qualifierssource 1..767/organism="Synechococcus sp. WH 7803"/db_xref="taxon:32051"8、RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenase名称：RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenaseLOCUS MURB_CAMJE 258 aa linear BCT 08-FEB-2011登录号：Q9PM01来源物种的分类情况：SOURCE Campylobacter jejuniORGANISM Campylobacter jejuniBacteria; Proteobacteria; Epsilonproteobacteria; Campylobacterales;Campylobacteraceae; Campylobacter.FEATURES Location/Qualifierssource 1..258/organism="Campylobacter jejuni"/db_xref="taxon:197"9、RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenase名称：RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenaseLOCUS MURB_CAMJR 258 aa linear BCT 08-FEB-2011登录号：Q5HSB7来源物种的分类情况：SOURCE Campylobacter jejuni RM1221ORGANISM Campylobacter jejuni RM1221Bacteria; Proteobacteria; Epsilonproteobacteria; Campylobacterales;Campylobacteraceae; Campylobacter.FEATURES Location/Qualifierssource 1..258/organism="Campylobacter jejuni RM1221"10、RecName: Full=Probable molybdopterin-guanine dinucleotide biosynthesis protein A 名称：RecName: Full=Probable molybdopterin-guanine dinucleotide biosynthesis protein A LOCUS MOBA_METAC 225 aa linear BCT 03-MAY-2011登陆号：Q8TPD6来源物种的分类情况：SOURCE Methanosarcina acetivorans C2AORGANISM Methanosarcina acetivorans C2AArchaea; Euryarchaeota; Methanomicrobia; Methanosarcinales;Methanosarcinaceae; Methanosarcina.FEATURES Location/Qualifierssource 1..225/organism="Methanosarcina acetivorans C2A"/db_xref="taxon:188937"搜索过程附图：（3）对这10条序列进行多序列比对:写出比对所用程序:clustalx比对结果分析：比对所得的以phy为后缀的文件用写字板格式打开后得如下结果： 10 771P24078.1 ---------- ---------- ------MANA DSLDAR-AFS YAPDASFEVIP41678.1 ---------- ---------- ---------- ----TR-NFM YSPDSSLEVVQ9R6U0 ---------- TAKTQVEKVD NPATFELFGK PGHFDR-ALA KGPKTTTWVWQ3AMS5.1 MTISPPERGS DAKSQVEKVD NPATFELFGK PGHFDR-ALA KGPKTTTWVWQ9PM01.1 ------MIID FKKYSSVRIG NEFEVLVLDQ ICDFDG-FLI GGANN----LQ4P0H0 ---------- ---------- -KVEYFVAQI DKELSRYPAL KKFEQTVPVPQ9ZIY0.1 ------SIQT LLSRAKIIAE IRQFFSERGL LEVETPILSE FGVTDVHLSTP24073.2 --IDALLNGT GSTLDEPEIP EVDDLSEMER DAIGEIGNIS FGSSATALSTO96570 ---------E SLSFSGYKLT RRNLYNAPAL KVMGRSVNNS SSNNNDQQQYQ8TPD6.1 ---------- ---------- MSGKTELKPG RTKSRSAIVL AGGRGRRMGMIITNAPNDHD GY---LELNA AARL-LAPFQ KN-ISALWTS ----------IITNSDGDHD GY---LELTA AAKV-MSPFL SNGSSAVWTN ----------NLHANAHDFD SHTSDLEEVS RKIF-SAHFG HLAVIFIWLS GAFFHGARFSNLHANAHDFD AHTSDLQEVS RRIF-SAHFG HLAVIFIWLS GAFFHGARFSLVSPKPKNIG ILGDGFNFIQ ILDR-NKDFI HLRIGCKTKS S---------KAYAALGAFG IFTLFVFFNI AAGF-LTNLL GFFVPAYFS- ----------FSTKLISPFQ KKEKTLWLST SPEYPMKRLL SAGSGAIFQL CKVFRN---ELLNQKVDITT PSVTVIPRSK ISDAFPEPYV AIEVNYTEGF SG--------NLESAKQNTQ IVVIGAGLAG LSAAQHLLRH GFRSTIVLEA TDRYGG---RVEKALLEFEG KTILERLLEN LFRVVDEVIL SVRDIPQKEK ----------……（此处省略约9KB的数据分析结果）以上是多序列比对的纯数据结果，部分数据省略，因为可以从下面的进化树得到具体的分析。

生物信息学测试题(蓝墨云)

第一单元生物信息学引论1人基因组大小约为:BA. 3.1*10A10bpB.3.1*10A9bpC.3.1*10A8bpD.3.1*10A7bp2（单选题|1分）人基因组大约有多少是编码蛋白的基因区间:CA.10%B.30%C.不足5%D.90%3（单选题|1分）Genbank数据库存储的数据是什么AA.核酸序列B.蛋白结构C.核酸结构D.蛋白序列4（单选题|1分）SRA数据库存储的数据是什么CA.存储基因芯片的数据B.存储Sanger测序数据C.存储新一代测序技术的数据5（单选题|1分）高通量测序错误率和传统Sanger测序相比AA.低B.高C.差不多6（单选题|1分）生物信息学对数据的处理一般是一个什么样的过程AA.数据管理-数据计算-数据挖掘-建立模型/进行预测B.数据挖掘-数据管理-建立模型/进行预测-数据计算C.数据挖掘-数据管理-数据计算-建立模型/进行预测D.建立模型/进行预测-数据挖掘-数据管理-数据计算7（单选题|1分）Sanger测序哪年发表DA.1965B.2002C.1970D.19778（单选题|1分）人基因组计划哪年启动?哪一年发表草图?CA.1988-2004B.1977-2001C.1988-2001D.1990-20039（单选题|1分）PAM打分矩阵是为什么设计的AA.氨基酸替换B.核苷酸替换10（单选题|1分）序列匹配（比对）算法哪年出现：DA.1991B.1977C.1988D.1970第二单元生物学基础、数据库基础和网络与数学及算法基础）1•以下哪一个是mRNA条目序列号：BA.J01536B.NM_15392C.NP_52280D.AAB1345062（单选题|1分）确定某个基因在哪些组织中表达的最直接获取相关信息方式是：AA.UnigeneB.EntrezC.LocusLinkD.PCR3（单选题|1分）一个基因可能对应两个Unigene簇吗？：AA.可能B.不可能4（单选题|1分）下面哪种数据库源于mRNA信息：AA.dbESTB.PDBC.OMIMD.HTGS5（单选题|1分）下面哪个数据库面向人类疾病构建：CA.ESTB.PDBC.OMIMD.HTGS6（单选题|1分）Refseq和GenBank有什么区别：CA.Refseq包括了全世界各个实验室和测序项目提交的DNA序列B.GenBank提供的是非冗余序列C.Refseq源于GenBank，提供非冗余序列信息D.GenBank源于Refseq7（单选题|1分）如果你需要查询文献信息，下列哪个数据库是你最佳选择：CA.OMIMB.EntrezC.PubMedD.PROSITE8（单选题|1分）比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法，下列哪种说法正确：CA.因为GenBank的数据比EMBL更多，Entrez给出的搜索结果将更多B.搜索结果很可能一样，因为GenBank和EMBL的序列数据实际一样C.搜索结果应该相当，但是ExPASy中的SwissProt记录的输出格式不同1口49（单选题|1分）天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于：AA.N/W/YB.Q/W/YC.F/W/YD.Q/N/W10（单选题|1分）直系同源定义为：AA.不同物种中具有共同祖先的同源序列B.具有较小的氨基酸一致性但是有较大的结构相似性的同源序列C.同一物种中由基因复制产生的同源序列D.同一物种中具有相似的并且通常是冗余的功能的同源序列11（单选题|1分）下列那个氨基酸最不容易突变：DA.丙氨酸B.谷氨酰胺C.甲硫氨酸D.半胱氨酸12（单选题|1分）PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变：DA.1%B.20%C.80%D.250%13（单选题|1分）下列哪个句子最好的描述了两个序列全局比对和局部比对的不同：DA.全局比对通常用于比对DNA序列，而局部比对通常用于比对蛋白质序列B.全局比对允许间隙，而局部比对不允许C.全局比对寻找全局最大化，而局部比对寻找局部最大化D.全局比对比对整体序列，而局部比对寻找最佳匹配子序列14（单选题|1分）假设你有两条远源相关蛋白质序列。

生物信息学考试试题

生物信息学考试试题1. 选择题1. DNA序列中哪种碱基与腺嘌呤形成碱基对？A. 腺嘌呤B. 胸腺嘧啶C. 钝甲嘧啶D. 尿嘧啶2. 下列哪种不属于生物信息学中常用的序列比对软件？A. BLASTB. ClustalWC. PhotoshopD. MEGA3. 在生物信息学中，什么是基因组装？A. 把基因组序列和蛋白质序列对应起来B. 把已知的DNA序列分析并组装成完整的基因组C. 把DNA序列和RNA序列对比分析D. 把基因组序列转录为RNA序列4. 下列哪个软件主要用于预测DNA序列中的基因结构？A. BLASTB. ClustalWC. FGENESD. MEGA5. 在生物信息学中，什么是密码子？A. DNA序列中的重复单元B. 氨基酸序列C. tRNA分子上的核苷酸组合D. mRNA上的三联体核苷酸序列2. 简答题1. 请简要解释生物信息学在基因组学中的应用。

2. 什么是序列比对？序列比对的意义是什么？3. 解释基因组装和基因注释在生物信息学中的作用。

4. 生物信息学中常用的两种序列分析方法分别是什么？简要描述它们的原理。

5. 请简要介绍生物信息学在进化比较基因组学中的应用。

3. 计算题1. 给定以下两条序列，求它们的相似度：序列1: ATCGTCCGATT序列2: ATCGACCGTTA2. 已知一个DNA序列长度为1000bp，其中AT含量为60%，求该序列中GC含量百分比。

4. 应用题1. 请利用BLAST软件对一组已知DNA序列进行序列比对，并解释结果。

2. 请使用ClustalW对两个已知蛋白质序列进行多序列比对，并分析比对结果。

3. 选取一个基因组装软件，对一个已知基因组序列进行装配，并解释装配结果。

以上是生物信息学考试试题，希望您认真作答，祝您考试顺利！。

生物信息学(期末)-生技08

齐齐哈尔大学试卷考试科目: 生物信息学适用对象: 生物技术08本使用学期: 2011—2012—1 第七学期课程编码: 05113019 总分80分共 2 页１）考生须知:２）姓名必须写在装订线左侧, 其它位置一律作废。

３）请先检查是否缺页, 如缺页应向监考教师声明, 否则后果由考生负责。

４）答案一律写在答题纸上, 可不抄题, 但要标清题号。

５）用蓝色或黑色的钢笔、圆珠笔答题。

监考须知: 请将两份题签放在上层随答题纸一起装订。

一、名词解释（每小题3分, 共4小题12分）表达序列标签, 外类群, 开放阅读框, 蛋白质组学二、选择题（每小题1分, 共10小题10分）1.下列哪项不属于人类基因组计划的研究内容（）A.绘制化学图谱、物理图谱B.获得全部人类基因组的序列C.获得转录图谱D.获得人体内全部的蛋白质序列2.图中哪一项为直系同源（）A.HA1和HA2B.HA1和WA2C.HA1和HBD.WA1和WA23.下列软件中哪一个能够用来构建系统发育树的（）A CLUSTALB BLASTC AssemblerD Treeview4.核酸序列增长最快是在哪一时期（）A 1970-1980年B 1980-1990年C 1990-2000年D 2000-2008年5. 研究一条测序获得的DNA序列时首先需要（）A.屏蔽重复序列B.去除序列污染C.查找开放阅读框D.查找密码子偏好性6. 对于序列ATGCCCCGA和序列ATCCGA哪一种是正确的序列对位排列方式（）A ATGCCCCGAAT_CC__GAB ATGCCCCGAAT_CCG__AC ATGCCCCGAAT_CC_G_AD ATGCCCCGAAT_C__G_A7.BLAST系列软件与下列哪一项能够在同一网站中检索到（）A GeneBank数据库B DDBJ数据库C EMBL数据库D CLUSTAL W8.生物信息学数据以什么形式存储（）A.文件系统B.程序软件C.数据库D.手工管理9.下列陈述哪一项是错误的（）A PIR-PSD是国际上最大的蛋白质序列数据库B 数据库的检索分为关键词检索和序列检索C STS是基因组作图时常用的一种图标D ACeDB仅储存秀丽新小杆线虫数据10.在使用CLUSTAL软件进行比对时, 多序列的比对结构中几条序列都相同的核苷酸位点用什么标注（）A 不同的颜色B “*”C “-”D “_”三、判断题（每小题1分, 共10小题10分, 对的画“√”, 错的画“×”）1.华盛顿大学的Phred软件是用来处理数据冗余的（）2.NCBI网站不能用来查询文章（）3.CLUSTAL X有汉化版（）4.EcoCyc是大肠杆菌的知识体系数据库系统（）5. 文昌鱼是人类的五种模式生物之一（）6.生物信息学研究物种信息, 不包括序列（）7.研究一条测序获得的DNA序列时首先应该去除污染序列（）8.双向凝胶电泳技术是蛋白质组研究的关键技术（）9.CAP3是EST序列的拼接软件（）10.氨基酸的顺序决定蛋白质的构象，即蛋白质的一级结构决定蛋白质的二级结构。

河南农业大学《生物信息学》2020-2021学年第一学期期末试卷

河南农业大学《生物信息学学 2020-2021学年第一学期期末试卷《《《《《《《《《《《生物信息学》院/系——年纪——专业——姓名——学号——《《《一．选择题（每2分，共20分）1.《物信息学学主要关注的是（《）。

A.《物信大分子的合成B.《物信数据的收集、存储、分析和解释C.《物信系统的物态学关系D.《物信分子的信理性质2.《下列哪个不是物信息学学的主要应用领域？A.《基因组学B.《转录组学C.《蛋白质组学D.《分子物信学实验技术3.《在物信息学学中，用于描述物信序列中特定区域的特性的语言称为（《）。

A.《序列分析B.《序列比对C.《序列模式D.《序列注释4.《在进行基因组分析时，通常使用的数据库是（《）。

A.《PubMedB.《GenBankC.《PDBD.《UniProt5.《物信息学学中，BLAST是一种常用的（《）。

A.《序列比对工具B.《结构模拟软件C.《蛋白质功能预测方法D.《基因调控网络分析工具6.物信息学学是（《）。

《A.《研究物信大分子合成和降解的学科《B.《专门研究基因编辑技术的学科《C.《物信学与计算机科学的交叉学科，主要关注物信数据的收集、管理和分析《D.《研究物信进化历史的学科7.在物信息学学中，用于描述DNA序列中基因位置的数据库通常是（《）。

《A.《UniProt《B.《PDB《C.《Ensembl《D.《KEGG8.BLAST是一个常用的（《）。

《A.《蛋白质三维结构模拟软件《B.《基因表达谱分析工具《C.《局部序列比对搜索工具《D.《基因组组装软件9.下列哪个不是物信息学学在基因组学中的主要应用？（《）《A.《基因定位《B.《基因表达分析《C.《蛋白质结构预测《D.《基因编辑实验设计10.物信息学学中，用于预测蛋白质功能的常见方法不包括（《）。

《A.《序列比对《B.《结构域分析《C.《蛋白质-蛋白质相互作用网络《D.《分子物信学实验二、填空题（每题2分，共10分）1.《在物信息学学中，用于存储和检索核酸序列的数据库是___________。

生物信息学应用开发考核试卷

13. ABC
14. ABC
15. ABC
16. ABC
17. ABC
18. ABC
19. ABC
20. ABC
三、填空题
1.计算机科学
2.外显子
3. 24
4.芯片杂交
5.同源建模
6.相关性分析
7. RNA干扰
8.基因电路
9.荧光共振能量转移
10.数据整合
四、判断题
1. √
2. ×
3. ×
4. √
5. ×
1.生物信息学的研究领域包括以下哪些？（）
A.基因组学
B.蛋白质组学
C.系统生物学
D.物理学
2.以下哪些是生物信息学中常用的数据库类型？（）
A.序列数据库
B.结构数据库
C.功能数据库
D.文献数据库
3.以下哪些工具可以用于基因表达数据分析？（）
A. R
B. Python
C. microarray analysis software
8.合成生物学中，【】是一种设计合成基因线路的方法，用于控制细胞行为。
9.【】是一种用于研究蛋白质在细胞中定位和迁移的成像技术。
10.在生物信息学中，【】是指利用计算机算法对生物学数据进行整合、解释和可视化的过程。
四、判断题（本题共10小题，每题1分，共10分，正确的请在答题括号中画√，错误的画×）
A. RNASeq
B. STAR
C. DARNED
D. TopHat
17.以下哪个生物信息学方法用于识别miRNA？（）
A. miRBase
B. miRanda
C. TargetScan
D. All of the above

word版信息学试题（答案）

word版信息学试题（答案）一、名解1.生物信息学：（狭义）专指应用信息技术储存和分析基因组测序所产生的分子序列及其相关数据的学科；（广义）指生命科学与数学、计算机科学和信息科学等交汇融合所形成的一门交叉学科。

2.人类基因组测序计划：3基因组学p150：以基因组分析为手段，研究基因组的结构组成、时序表达模式和功能，并提供有关生物物种及其细胞功能的进化信息。

4基因组p150：是指一个生物体、细胞器或病毒的整套基因。

5.比较基因组学p166：是指基因组学与生物信息学的一个重要分支。

通过模式生物基因组之间或模式生物基因组与人类基因组之间的比较与鉴别，可以为研究生物进化和分离人类遗传病的候选基因以及预测新的基因功能提供依据。

6功能基因组：表达一定功能的全部基因所组成的DNA序列，包括编码基因和调控基因。

功能基因组学：利用结构基因组学研究所得的各种来源的信息，建立与发展各种技术和实验模型来测定基因及基因组非编码序列的生物学功能。

7蛋白质组p179：是指一个基因组中各个基因编码产生的蛋白质的总体，即一个基因组的全部蛋白产物及其表达情况。

8蛋白质组学：指应用各种技术手段来研究蛋白质组的一门新兴科学，其目的是从整体的角度分析细胞内动态变化的蛋白质组成成分、表达水平与修饰状态，了解蛋白质之间的相互作用与联系，揭示蛋白质功能与细胞生命活动规律。

9功能蛋白质组学：（课件上只能找到功能蛋白质组，即细胞在一定阶段或与某一生理现象相关的所有蛋白）。

10序列对位排列：通过插入间隔的方法使不同长度的序列对齐，达到长度一致。

11分子系统树：是表达类群（或序列）间系统发育关系的一种树状图。

12 BLAST搜索p73：是一种基本的局部对位排列搜索工具。

13 SNP p152：即单核酸多态性，是指基因组内特定核苷酸位点上存在两种不同碱基，其中每种在群体中的频率不小于1%。

SNP大多数为转换置换。

14 EST p91：即表达序列标签，是从cDNA文库中生成的一些很短的序列（300~500bp)，它们代表在特定组织或发育阶段表达的基因，有时可代表特定的cDNA。

疫苗研发中的生物信息学与计算生物学考核试卷

D.疫苗生产成本效益分析
13.以下哪些技术可用于疫苗研发中的计算生物学分析？（）
A.云计算
B.大数据分析
C.高性能计算
D.疫苗接种技术
14.生物信息学在疫苗研发中，以下哪些方面的研究有助于预测疫苗的副作用？（）
A.蛋白质结构分析
B.免疫反应模拟
C.疫苗成分分析
D.疫苗接种后监测数据
15.计算生物学在疫苗研发中，以下哪些方面的研究有助于优化疫苗设计？（）
A. BioPython
B. BioPerl
C. RStudio
D. MATLAB
7.计算生物学在疫苗研发中，以下哪些方面的研究有助于提高疫苗设计的准确性？（）
A.抗原结构的预测
B.抗体结合位点的分析
C.疫苗免疫原性的评估
D.疫苗的冷链物流管理
8.生物信息学在疫苗研发中，以下哪些方面的应用有助于加速疫苗研发进程？（）
2.分子动力学模拟
3.同源性分析
4.抗原表位
5. BLAST
6.计算机模拟
7.系统生物学
8.基因片段
9.进化历程
10.免疫预测
四、判断题
1. ×
2. √
3. ×
4. √
5. ×
6. ×
7. √
8. ×
9. ×
10. √
五、主观题（参考）
1.生物信息学通过分析病毒的基因序列和蛋白质结构，帮助识别疫苗候选抗原。例如，通过同源性分析和抗原表位预测，研究者可以快速筛选出具有潜力的疫苗抗原。
B.蛋白质结构预测
C.疫苗免疫效果评估
D.疫苗生产工艺优化
2.计算生物学在疫苗研发中的作用包括以下哪些？（）
A.疫苗候选抗原的筛选

生物信息学试卷(名词解释)

生物信息学试卷（名词解释）生物信息学:狭义的专指应用信息技术储存和分析基因组测序所产生的分子序列及相关数据的学科，也称分子生物信息学。

广义的是指生命科学与数学、计算机科学和信息科学等交汇融合所形成的一门交叉学科。

生物信息学广义:生命科学中的信息科学。

生物体系和过程中信息的存贮、传递和表达;细胞、组织、器官的生理、病理、药理过程的中各种生物信息。

狭义:生物分子信息的获取、存贮、分析和利用。

算法(algorithm)是在有限步骤内求解某一问题所使用的一组定义明确的规则笛卡尔积:在数学上把所有可能的配对组合叫“笛卡尔积”序列比对:为评价相似性(similarity)的程度或同源性(homology)的可能,将两个或更多的序列排列起来以得到最大一致性(identity)的过程功能位点(functional site):DNA序列中,除基因外,还包含其它信息，存放这些信息的DNA片段称为功能位点马尔科夫链(Markov chain):是一种数学模型，是一种随机过程，马尔科夫链中的每一环表示系统的一个状态，马尔科夫链实际上表示了系统状态的演化。

CpG岛:是一类长度在几百bp的DNA序列，其中CG核苷酸对出现的频率非常高功能域:在核酸序列中,各种功能位点共存,协同作用,形成功能域隐马尔科夫模型:包括两个集合，状态集合，字母表;还包括两个矩阵，状态转移矩阵，字母释放矩阵系统发生学(phylogenetics):亦称系统学,种系发生学,种系发生系统学，研究生物群体之间的进化关系系统发生树(phylogenetic tree):也叫系统树,进化树(evolutionary tree),生命树(tree of life)。

对物种之间的进化关系的一种描述,这些物种被认为有共同祖先穷尽法:搜索整个空间(所有可能的树),然后根据评价标准选择一棵最优的树分支约束方法:根据一定的约束条件将搜索空间限制在一定范围内启发式或经验性方法:根据目前的搜索情况指导下一步的搜索方向,根据先验知识或一定的指导性规则压缩搜索空间基因组:一个细胞、细胞器或病毒中的所有DNA(或RNA)功能基因组学:以解释基因组的功能及控制机制为目标比较基因组学:将不同物种基因组进行比较基因芯片(gene chip):也叫DNA chip或microarray(微阵列)，是由大量DNA 或寡核苷酸探针密集排列所形成的探针阵列，其工作的基本原理是通过杂交检测信息基因识别:是生物信息学的一个重要分支，使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

生物信息学考试试卷 WEIHUA system office room 【WEIHUA 16H-WEIHUA WEIHUA8Q8-
一、名词解释(每小题4分,共20分)
1、生物信息学
广义：生命科学中的信息科学。

生物体系和过程中信息的存贮、传递和表达；细胞、组织、器官的生理、病理、药理过程的中各种生物信息。

狭义：生物分子信息的获取、存贮、分析和利用。

2、人类基因组计划
人类基因组计划准备用15年时间，投入30亿美元，完成人类全部24条染色体的3×109脱氧核苷酸对(bp)的序列测定，主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。

其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序，以及信息系统的建立。

作图和测序是基本的任务，在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息。

3、蛋白质的一级结构
蛋白质的一级结构是指多肽链中氨基酸的序列
4、基因
基因--有遗传效应的DNA片断,是控制生物性状的基本遗传单位。

5、中心法则
是指遗传信息从传递给，再从RNA传递给，即完成遗传信息的转录和翻译的过程。

也可以从DNA传递给DNA，即完成DNA的复制过程。

这是所有有细胞结构的生物所遵循的法则。

6 、DNA序列比较
序列比较的根本任务是：（1）发现序列之间的相似性；（2）辨别序列之间的差异
目的：
相似序列相似的结构，相似的功能
判别序列之间的同源性
推测序列之间的进化关系
7、一级数据库
数据库中的数据直接来源于实验获得的原始数据，只经过简单的归类整理和注释
8、基因识别
基因识别，是生物信息学的一个重要分支，使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。

基因识别的对象主要是蛋白质编码基因，也包括其他具有一定生物学功能的因子，如RNA基因和调控因子。

9、系统发生学
系统发生学(phylogenetics)——研究物种之间的进化关系。

10、基因芯片
基因芯片（gene chip），又称DNA微阵列（microarray），是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列，其工作的基本原理是通过杂交检测信息。

二、综合题(共60分)
1 生物信息学分析的数据对象主要有哪几种这些数据之间存在着什么关系
其研究重点主要落实在核酸和蛋白质两个方面，包括它们的序列、结构和功能。

生物信息学以基因组DNA序列信息分析作为出发点，破译遗传语言，认识遗传信息的组织规律，辨别隐藏在DNA序列中的基因，掌握基因调控信息，对蛋白质空间结构进行模拟和预测，依据蛋白质结构和功能的关系进行药物分子设计。

2 生物信息学的主要研究任务是什么目前生物信息学的主要研究内容是什么
A．收集和管理生物分子数据；数据分析和挖掘；开发分析工具和实用软件：生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具。

B．（1）生物分子数据的收集与管理；（2）数据库搜索及序列比较；（3）基因组序列分析；（4）基因表达数据的分析与处理；（5）蛋白质结构预测。

5 在基因组序列分析方面，科学家关注哪些信息？
就人类基因组而言，编码区域在人类基因组所占的比例不超过3%。

其余97%是非编码序列。

对于非编码序列，人们了解得比较少，尚不清楚其含义或功能。

然而，非编码区域对于生命活动具有重要的意义。

这部分序列主要包括内含子、简单重复序列、移动元件（mobile element）及其遗留物、伪基因（pseudo gene）等。

6掌握蛋白质结构有什么意义为什么要进行蛋白质结构预测
（1）研究蛋白质的结构意义重大，分析蛋白质结构、功能及其关系是蛋白质组计划中的一个重要组成部分。

研究蛋白质结构，有助于了解蛋白质的作用，了解蛋白质如何行使其生物功能，认识蛋白质与蛋白质（或其它分子）之间的相互作用，这无论是对于生物学还是对于医学和药学，都是非常重要的。

（2）对于未知功能或者新发现的蛋白质分子，通过结构分析，可以进行功能注释，指导设计进行功能确认的生物学实验。

通过分析蛋白质的结构，确认功能单位或者结构域，可以为遗传操作提供目标，为设计新的蛋白质或改造已有蛋白质提供可靠的依据，同时为新的药物分子设计提供合理的靶分子结构。

简述分子生物学中的“中心法则”。

“中心法则”的核心是什么
（1）DNA是遗传物质，是携带遗传信息的载体。

信息从基因的核苷酸序列中被提取出，用来指导蛋白质合成的过程对地球上的所有生物都是相同的，分子生物学家称之为中心法则(central dogma)。

（2）“中心法则”的核心：DNA分子中的遗传信息转录（transcription）到RNA分子中（即RNA聚合酶以DNA为模板合成RNA），再由RNA翻译（translation）生成体内各种蛋白质，行使特定的生物功能。

若一条 mRNA 序列 5 '－ AUG GGA UGU CGC CGA AAC － 3 '被核糖体翻译，将形成怎样的氨基酸的序列若将第一个核苷酸删掉而将另一个 A 加到 mRNA 序列的 3 ' - 端，又将形成怎样的氨基酸序列
(1) 画出下面两条序列的简单点阵图。

将第一条序列放在 x 坐标轴上，将第二条序列放在 y 坐标轴上。

TGAACTCCCTCAGATATTA
CGAACCCTCACATATTAGCG
(11) 为什么要进行序列片段组装在进行序列片段组装时会遇到哪些问题
大规模基因组测序得到待测序列的一系列序列片段，这些序列片段覆盖待测序列，序列片段之间也存在着相互覆盖或者重叠。

遇到的问题：碱基标识错误；不知道片段的方向；存在重复区域；缺少覆盖。

(1) 国际上有哪几个着名的核酸序列数据库
（1）欧洲分子生物学实验室的EMBL 。

（2）美国生物技术信息中心的GenBank。

（3）日本遗传研究所的DDBJ
(3) 具有简并性的密码子一共有多少个什么是基因的密码子使用偏性造成密码子使用偏性可能的原因有哪些
(9) 假设给你一条蛋白质序列，要求预测该蛋白质的结构。

你计划采用什么策略来预测该蛋白质的结构
画出四个分类单元 A 、 B 、 C 和 D 所有可能的无根树和有根树。

三、论述题(两个小题,共20分)
1、简述人类基因组计划与生物信息学之间的相互促进关系。

人类基因组计划(Human Genome Project, HGP)是美国在1990年提出实施的一项伟大的科学计划，与阿波罗登月计划、曼哈顿原子弹计划同称为人类自然科学史上的三大计划。

自实施以来，该计划在世界各国引起了很大反响。

在人类基因组计划中，人们准备用15年时间，投入30亿美元，完成人类全部24条染色体中3×109个碱基对(bp，base pair)的序列测定，其主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别，还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序，以及信息系统的建立。

随着人类基因组计划的提出和实施，实验数据和可利用信息急剧增加，人类基因组计划提供了以往不可想象的巨量的生物学信息资源。

基因组信息的收集、储存、分发、分析显得越来越紧迫和重要，信息的管理和分析成为人类基因组计划实施过程中的一项重要工作，人类基因组计划向信息学提出了巨大的挑战。

值得庆幸的是，人类基因组计划一开始就与计算机技术、信息高速公路同步发展，信息技术为生物信息学的发展提供了非常好的条件，为生物信息学的研究和应用提供了非常好的支撑。

生物信息学与人类基因组计划紧密结合，互相渗透，生物信息学成为基因组计划不可分割的一部分。

事实证明，人类基因组计划在生物信息学的支持下，前进步伐大大加快，已经提前完成计划，功能基因组研究也已经全面展开。

而人类基因组计划反过来又大大促进了生物信息学的发展，HGP丰富了生物信息学的研究内容，促进生物信息学新思想、新方法的产生，生物信息学在最近10年迅速发展的历程证明了这一点。

生物信息学考试试卷修订稿

大学生生物信息学考试模拟题及解析

生物信息技术考试试题

生物信息学试题及答案

生物信息学试题

生物信息学基础考试试题

《生物信息学》题集

生物信息学考试试题

《生物信息学》试卷(B)

生物信息学与计算生物学出版考核试卷

生物信息学 考试答案

生物信息学试题及个人答案(非参考答案)

生物信息学测试题(蓝墨云)

生物信息学考试试题

生物信息学(期末)-生技08

河南农业大学《生物信息学》2020-2021学年第一学期期末试卷

生物信息学应用开发考核试卷

word版信息学试题（答案）

疫苗研发中的生物信息学与计算生物学考核试卷

生物信息学试卷(名词解释)

生物信息学考试答案