2012生物信息学题库

合集下载

生物信息学复习题

生物信息学复习题生物信息学是一门结合生物学、计算机科学、信息学和数学的交叉学科，它利用计算机技术来处理和分析生物数据。

以下是一些生物信息学复习题，供同学们参考：1. 生物信息学的定义和应用领域- 生物信息学是如何定义的？- 生物信息学在哪些领域有应用？2. 基因组学基础- 什么是基因组学？- 基因组测序的基本原理是什么？3. 序列比对- 序列比对的目的是什么？- 简述局部比对和全局比对的区别。

4. BLAST算法- BLAST算法的原理是什么？- 如何使用BLAST进行序列相似性搜索？5. 基因表达数据分析- 基因表达数据有哪些类型？- 描述基因表达数据的预处理步骤。

6. 蛋白质结构预测- 蛋白质结构预测的重要性是什么？- 简述几种常见的蛋白质结构预测方法。

7. 系统生物学和网络分析- 系统生物学研究的是什么？- 网络分析在系统生物学中的应用。

8. 生物信息学中的数据库- 列举几个常见的生物信息学数据库。

- 解释数据库在生物信息学研究中的作用。

9. 生物信息学中的编程语言- 哪些编程语言在生物信息学中常用？- 简述Python在生物信息学中的应用。

10. 伦理和隐私问题- 在生物信息学研究中可能遇到哪些伦理问题？- 如何保护生物信息数据的隐私？11. 案例研究- 描述一个生物信息学在医学研究中的应用案例。

- 分析该案例中使用的方法和技术。

12. 未来趋势- 预测生物信息学未来的发展趋势。

- 讨论生物信息学如何影响未来的科学研究和医疗保健。

通过这些问题的复习，同学们可以更全面地了解生物信息学的基础概念、关键技术和应用领域。

希望这些复习题能够帮助同学们更好地准备考试和理解生物信息学的重要性。

生物信息考试题及答案

生物信息考试题及答案生物信息学是一门结合生物学、计算机科学、信息技术和数学的交叉学科，它利用计算机技术来分析和解释生物数据。

以下是一份生物信息学考试题及答案的示例。

生物信息学考试题一、选择题（每题2分，共20分）1. 生物信息学中，用于存储DNA序列的文件格式是：A. FASTAB. JPEGC. MP3D. DOCX2. 以下哪项不是生物信息学分析的基本步骤？A. 数据收集B. 数据预处理C. 数据解释D. 数据存储3. 在蛋白质序列分析中，BLAST工具用于：A. 序列比对B. 序列组装C. 序列克隆D. 序列合成4. 以下哪个数据库不是用于存储基因表达数据的？A. NCBIB. GEOC. PDBD. ArrayExpress5. 以下哪个算法不是用于基因预测的？A. GeneMarkB. BLASTC. GlimmerD. Fgenesh二、简答题（每题10分，共30分）6. 简述生物信息学在现代生物学研究中的重要性。

7. 解释什么是基因组学，并说明其在医学研究中的应用。

8. 描述序列比对的基本原理及其在生物信息学中的作用。

三、计算题（每题15分，共30分）9. 假设你有一个DNA序列，其组成为：ATCGTA。

请计算其互补序列。

10. 给定两个蛋白质序列，序列A：A-B-C-D-E，序列B：A-C-E-B-D。

请使用Needleman-Wunsch算法计算它们的全局比对得分。

四、论述题（每题20分，共20分）11. 论述生物信息学在新药开发中的作用及其面临的挑战。

答案一、选择题1. A2. C3. A4. C5. B二、简答题6. 生物信息学在现代生物学研究中的重要性体现在它能够处理和分析大量的生物数据，如基因组序列、蛋白质结构等，帮助科学家快速发现生物现象的规律，推动生物学的发展。

7. 基因组学是研究生物基因组的结构、功能和演化的科学。

在医学研究中，基因组学可以帮助我们了解疾病的遗传基础，为个性化医疗提供理论基础。

生物信息学考试试题

生物信息学考试试题生物信息学考试试题：一、选择题1. 以下哪种是常见的生物信息学数据库？A. NCBIB. AmazonC. GoogleD. Instagram2. 下列哪一个不是生物信息学中常见的序列比对软件？A. BLASTB. ClustalWC. PhotoshopD. MUSCLE3. 生物信息学中常用的数据分析工具是？A. Microsoft ExcelB. SPSSC. RD. Adobe Photoshop4. BLAST是用来做什么的？A. 序列比对B. 图像处理C. 文本编辑D. 网页设计5. NCBI是什么机构的缩写？A. National Center for Biotechnology InformationB. National Center for Business IntelligenceC. New York City Bureau of InvestigationD. North Carolina Biological Institute二、填空题1. 生物信息学的研究对象是________。

2. 为了识别蛋白质功能和结构，可以使用________软件进行序列比对。

3. 研究生物信息学常用的数据库之一是________。

4. 生物信息学中的图形工具有助于可视化________。

5. 生物信息学可以帮助人们理解________的基本原理。

三、简答题1. 请解释生物信息学在生物学研究中的重要性。

2. 什么是序列比对？它在生物信息学中有什么作用？3. 请举例说明生物信息学数据库的用途。

四、综合题根据以下序列，请使用BLAST软件进行在线比对，并分析结果：序列1：ATGGCCATAG序列2：ATGCCGATAG序列3：ATGGCTATAG序列4：ATGGTCATAG请写出每个序列与其他序列的比对结果，并解释相似性及差异性。

以上为生物信息学考试试题，希望您认真作答，祝您考试顺利！。

2012生物信息学复习题

2012生物信息学复习题一、选择题1. 根据PAM打分矩阵，下列哪个氨基酸最不容易突变？A) 丙氨酸 B) 谷氨酰胺 C) 甲硫氨酸 D) 半胱氨酸2. 下列哪个句子最好描述了两序列全局比对和局部比对的不同？A) 全局比对通常用于DNA序列，而局部比对通常用于蛋白质序列；B) 全局比对允许间隙，而局部比对不允许间隙；C) 全局比对寻求全局最大化，而局部比对寻求局部最大化；D) 全局比对比对整条序列，而局部比对寻找最佳匹配子序列3. 与PAM打分矩阵比较，BLOSUM打分矩阵的最大区别在哪里？A) 它最好用于比对相关性很近的序列； B) 它是基于近相关蛋白的全局多序列比对；C) 它是基于远相关蛋白的局部多序列比对； D) 它结合了局部和全局比对信息4. 全局比对算法（如Needleman-Wunsch算法）是这样一种算法：A) 把两条比较的蛋白质放到一个矩阵中，然后通过穷尽搜索每一个可能的比对组合来寻找最佳分值的比对；B) 把两条比较的蛋白质放到一个矩阵中，然后通过迭代递归的方法找到最佳的分值；C) 把两条比较的蛋白质放到一个矩阵中，然后通过寻找最佳子序列的方法来找到最佳的比对；D) 能用于蛋白质，但不能用于DNA序列5. 数据库搜索中或双序列比对中，敏感性定义为：A) 搜索算法寻找真阳性（即同源序列）和避免假阳性（即不相干序列，但具有高相似分值）的能力；B) 搜索算法寻找真阳性（即同源序列）和避免假阳性（即没有被搜索算法报告的同源序列）的能力；C) 搜索算法寻找真阳性（即同源序列）和避免假阴性（即不相干序列，但具有高相似分值）的能力；D ) 搜索算法寻找真阳性（即同源序列）和避免假阴性（即没有被搜索算法报告的同源序列）的能力；6. 如有一小段DNA序列，基本上它能编码多少种蛋白？A）1 B）2 C）3 D）67. 有一段DNA序列，如想知道在主要的蛋白质数据库中哪一个与该DNA编码的蛋白最接近，你会选择用哪一个程序？A）blastn B）blastp C）blastx D）tblastx E）tblastn8. blast检索的哪一种输出估计了假阳性的数目？A）E值 B）Bit score C）Percent identity D）Percent positives9. 将下面哪个blast参数改变后会得到更少的检索结果？A）关闭low-complexity filter B）将期望值从1变为0C）提高极限值 D）将打分矩阵从PAM30改为PAM7010.极值分布A）描述了对数据库的query的scores的分布 B）比正态分布的总面积大C）对称 D）形状可用两个参数来描述，即 µ（平均值）和 λ（衰减系数）11.当blast检索的E值减小时A）K值也减小 B）score变大 C）概率p值变大 D）极值分布偏斜率减小12.标准化的blast score（也称为bit scores）A）是没有单位 B）可在不同的blast检索之间比较，即使使用了不同的打分矩阵C）与使用的打分矩阵无关 D）可在不同的blast检索之间比较，但前提是使用相同的打分矩阵13.在EMBL和NCBI数据库中未加工的DNA序列（与注释序列相比）是A）完全重叠了 B）很大程度上重叠了，不过序列不同 C）相对只有一点重叠14.下面的哪种工作，PSI-BLAST搜索最为有效A）在老鼠中找一个人类蛋白质的同源蛋白 B）在数据库查询中找到更多的匹配蛋白 C）在数据库查询中找到更多的匹配DNA序列 D）用模式序列或者信号序列加强数据库搜索15.下面的哪种blast程序是用氨基酸的信号序列在一个蛋白质家族中寻找匹配的？A）PSI-BLAST B）PHI-BLAST C）MS BLAST D）WormBLAST16.下面的哪种blast 程序用来分析免疫球蛋白最好？A）RPS-BLAST B）PHI-BLAST C）IgBLAST D）ProDom17.在一个位点特异性打分矩阵中，列中可以有20种氨基酸。

生物信息技术考试试题

生物信息技术考试试题一、选择题（每题 3 分，共 30 分）1、以下哪个不是生物信息学的主要研究内容？（）A 基因组学B 蛋白质组学C 细胞学D 代谢组学2、生物信息学中用于序列比对的常用算法是（）A 动态规划算法B 贪心算法C 分治算法D 回溯算法3、在基因表达数据分析中，常用的标准化方法是（）A RPKMB TPMC FPKMD 以上都是4、以下哪种数据库主要用于存储蛋白质结构信息？（）A GenBankB PDBC UniProtD Ensembl5、进行系统发育分析时，常用的构建进化树的方法是（）A 邻接法B 最大简约法C 最大似然法D 以上都是6、以下哪个软件不是用于基因序列分析的？（）A Primer PremierB SPSSC DNAStarD Vector NTI7、生物信息学中，预测蛋白质二级结构的方法不包括（）A 基于同源建模B 基于机器学习C 基于物理化学原理D 基于经验规则8、在生物信息学中，BLAST 程序主要用于（）A 序列比对B 进化分析C 基因预测D 蛋白质结构预测9、以下哪种编程语言在生物信息学中应用较为广泛？（）A JavaB PythonC C+＋D Fortran10、用于分析基因芯片数据的软件包是（）A R 语言中的 BioconductorB MATLABC StataD SAS二、填空题（每题 3 分，共 30 分）1、生物信息学中的三大核心数据库是_____、＿____、＿____。

2、基因序列的相似性搜索常用的工具是_____。

3、蛋白质的一级结构是指_____。

4、常见的基因注释数据库有_____、＿____等。

5、系统发育树的构建基于_____的原理。

6、生物信息学中常用的数据格式有_____、＿____等。

7、预测蛋白质三级结构的方法主要有_____、＿____。

8、基因表达数据的差异分析常用的方法有_____、＿____。

9、用于分析高通量测序数据的软件有_____、＿____。

2012生物信息学考试试题

1. 生物信息学：1）生物信息学包含了生物信息的获取、处理、分析、和解释等在内的一门交叉学科；2）它综合运用了数学、计算机学和生物学的各种工具来进行研究；3）目的在于阐明大量生物学数据所包含的生物学意义。

2. BLAST（Basic Local Alignment Search Tool）直译：基本局部排比搜索工具意译：基于局部序列排比的常用数据库搜索工具含义：蛋白质和核酸序列数据库搜索软件系统及相关数据库3. PSI-BLAST：是一种迭代的搜索方法，可以提高BLAST和FASTA的相似序列发现率。

4. 一致序列：这些序列是指把多序列联配的信息压缩至单条序列，主要的缺点是除了在特定位置最常见的残基之外，它们不能表示任何概率信息。

5. HMM 隐马尔可夫模型：一种统计模型，它考虑有关匹配、错配和间隔的所有可能的组合来生成一组序列排列。

（课件定义）是蛋白质结构域家族序列的一种严格的统计模型，包括序列的匹配，插入和缺失状态，并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。

6. 信息位点：由位点产生的突变数目把其中的一课树与其他树区分开的位点。

7. 非信息位点：对于最大简约法来说没有意义的点。

8. 标度树：分支长度与相邻节点对的差异程度成正比的树。

9. 非标度树：只表示亲缘关系无差异程度信息。

10. 有根树：单一的节点能指派为共同的祖先，从祖先节点只有唯一的路径历经进化到达其他任何节点。

11. 无根树：只表明节点间的关系，无进化发生方向的信息，通过引入外群或外部参考物种，可以在无根树中指派根节点。

12. 注释：指从原始序列数据中获得有用的生物学信息。

这主要是指在基因组DNA中寻找基因和其他功能元件（结构注释），并给出这些序列的功能（功能注释）。

13. 聚类分析：一种通过将相似的数据划分到特定的组中以简化大规模数据集的方法。

14. 无监督分析法：这种方法没有内建的分类标准，组的数目和类型只决定于所使用的算法和数据本身的分析方法。

生物信息学试题

生物信息学考题（2012版）一、填空题（共10分，每空一分）1、美国政府于1990年10月启动耗资30亿美元的15年研究计划，预期到2005年完成人类基因组大约30亿个碱基的全序列测定，这就是被称为生命科学“登月计划”的人类基因组计划。

2、生物信息学的研究目标：以核酸、蛋白质等生物大分子数据库为主要对象，以数学、信息学、计算机科学为主要手段，以计算机硬件、软件和计算机网络为主要工具，对浩瀚如海的原始数据进行存储、管理、注释、加工，使之成为具有明确生物意义的生物信息。

3、随着生物信息学的诞生及应用，今后生物学研究项目的起点将是理论的，一位科学家将从理论推测开始，然后转向试验去追踪或检验该假设。

4、生物信息学作为一门交叉学科，已经成为当今生命科学乃至整个自然科学的重大前沿领域之一，也将是21世纪自然科学的核心领域之一。

5、人类基因组计划、“曼哈顿原子计划”和“阿波罗登月计划”并称为20世纪的三大著名计划，中国在1999年承担了1%的研究任务，即对第3号染色体上3000万碱基对的测定。

6、人类基因组的主要任务是：人类基因组以及一些模式生物（细菌、酵母、线虫、果蝇等）基因组作图、测序和基因识别。

二、是非题（共10分，每小题1分）1、生物学就是实验科学，所有的研究结论从实验中来，于实验中得到验证。

（错）2、比较是科学研究中最常见的方法，在生物信息学研究中，比对是最常用和最经典的研究手段。

（对）3、两个蛋白质序列相似性超过30%就是同源蛋白。

（错）4、蛋白质序列相似性指一级序列中氨基酸残基相同。

（错）5、蛋白质序列相似性指氨基酸残基具有相似特性：侧链基团大小电荷性、疏水性等相同。

（对）6、核酸序列相似性指序列中相同碱基所占的比例。

（对）7、对一段未知功能DNA片段进行功能预测需对其进行3位翻译。

（错）8、对一段未知功能DNA片段进行功能预测需对其进行6位翻译。

（对）9、相似性是指一种很直接的数量关系，无需实验验证。

《生物信息学》题集

《生物信息学》题集一、选择题（每题3分，共30分）1.生物信息学的主要研究对象是什么？A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术？A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中，进行多序列比对时常用的软件是什么？A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析？A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中，下列哪项不是常用的序列分析技术？A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用？A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测？A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中，下列哪项不是基因注释的内容？A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术？A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用？A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题（每题2分，共20分）1.生物信息学是一门交叉学科，它主要涉及______、计算机科学和数学等领域。

2.在生物信息学中，______技术常用于基因序列的相似性搜索。

3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。

4.在基因表达数据分析中，______是一种常用的数据标准化方法。

5.生物信息学中，______技术常用于蛋白质结构的预测和分析。

6.在生物信息学数据库中，GenBank主要存储的是______数据。

生物信息学考试试题

生物信息学考试试题一、选择题（每题 3 分，共 30 分）1、以下哪种不是常见的生物信息学数据库？（）A GenBankB SWISSPROTC PubMedD Baidu2、在 DNA 序列分析中，以下哪个不是用于序列比对的算法？（）A NeedlemanWunsch 算法B SmithWaterman 算法C BLAST 算法D Fourier 变换算法3、蛋白质结构预测的方法不包括（）A 同源建模B 从头预测C 折叠识别D 随机模拟4、以下哪种不是基因表达数据分析的常用方法？（）A 聚类分析B 主成分分析C 判别分析D 回归分析5、生物信息学中，用于预测蛋白质功能的方法有（）A 基于序列相似性B 基于结构相似性C 基于基因共表达D 以上都是6、在基因组学中，以下哪个不是测序技术？（）A Sanger 测序B 二代测序C 三代测序D 四代测序7、系统发生树构建的方法不包括（）A 距离法B 最大简约法C 最大似然法D 最小二乘法8、以下哪种不是生物信息学中常用的编程语言？（）A PythonB JavaC C+＋D Visual Basic9、以下哪个不是生物信息学在医学领域的应用？（）A 疾病诊断B 药物研发C 医疗美容D 个性化医疗10、生物信息学中，处理大规模数据常用的工具是（）A ExcelB R 语言C SPSSD Word二、填空题（每题 2 分，共 20 分）1、生物信息学是一门融合了生物学、计算机科学和（）的交叉学科。

2、常见的核酸序列格式有 FASTA 和（）。

3、蛋白质的二级结构包括α螺旋、β折叠和（）等。

4、基因芯片技术是一种（）分析技术。

5、序列比对的目的是寻找两个或多个序列之间的（）。

6、人类基因组计划的主要目标是测定人类基因组的（）序列。

7、生物信息学中的隐马尔可夫模型主要用于（）。

8、系统发生分析中，外群的作用是（）。

9、蛋白质相互作用网络分析有助于理解（）。

10、生物信息学数据库可以分为一级数据库和（）数据库。

生物信息学题库.doc

生物信息学题库一、名词解释1、生物信息学:生物分子信息的获取、存贮、分析和利用;以数学为基础，应用计算机技术，研究生物学数据的科学。

2、相似性(similarity):相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。

3、同源性(homology):生物进化过程中源于同一祖先的分支之间的关系。

4、BLAST(Basic Local Alignment Search Tool):基本局部比对搜索工具，用于相似性搜索的工具，对需要进行检索的序列与数据库中的每个序列做相似性比较。

5、HMM隐马尔可夫模型:是蛋白质结构域家族序列的一种严格的统计模型，包括序列的匹配，插入和缺失状态，并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。

6、一级数据库:一级数据库中的数据直接来源于实验获得的原始数据，只经过简单的归类整理和注释(投稿文章首先要将核苷酸序列或蛋白质序列提交到相应的数据库中)7、二级数据库:对原始生物分子数据进行整理、分类的结果，是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。

8、GenBank: 是具有目录和生物学注释的核酸序列综合公共数据库，由NCBI构建和维护。

9、EMBL:EMBL 实验室——欧洲分子生物学实验室，EMBL 数据库——是非盈利性学术组织 EMBL 建立的综合性数据库，EMBL 核酸数据库是欧洲最重要的核酸序列数据库，它定期地与美国的 GenBank、日本的 DDBJ 数据库中的数据进行交换，并同步更新。

10、DDBJ: 日本核酸序列数据库，是亚洲唯一的核酸序列数据库。

11、Entrez:是由 NCBI 主持的一个数据库检索系统，它包括核酸，蛋白以及Medline 文摘数据库，在这三个数据库中建立了非常完善的联系。

12、SRS(sequence retrieval system):序列查询系统，是 EBI 提供的多数据库查询工具之一。

生物信息考试题及答案

生物信息考试题及答案一、选择题（每题2分，共20分）1. 基因组学研究的核心是（）。

A. 基因克隆B. 基因表达C. 基因组序列D. 基因功能答案：C2. 下列哪项不是生物信息学的主要研究内容？（）A. 基因组序列分析B. 蛋白质结构预测C. 植物分类学D. 基因表达分析答案：C3. 转录组学研究的是（）。

A. 基因组中的所有基因B. 特定细胞或组织中的所有RNA分子C. 特定细胞或组织中的所有蛋白质分子D. 特定细胞或组织中的所有DNA分子答案：B4. 下列哪个数据库主要用于存储蛋白质序列信息？（）A. GenBankB. PDBC. Swiss-ProtD. EMBL答案：C5. 以下哪个不是生物信息学中常用的序列比对工具？（）A. BLASTB. FASTAC. ClustalWD. PCR答案：D6. 以下哪个是用于蛋白质三维结构预测的软件？（）A. Swiss-ProtB. PDBC. MODELLERD. GenBank答案：C7. 以下哪个是用于基因表达分析的高通量技术？（）A. Sanger测序B. 微阵列C. PCRD. 质谱分析答案：B8. 下列哪个是用于基因组关联研究的统计方法？（）A. 聚类分析B. 系统发育分析C. 连锁不平衡分析D. 多态性分析答案：C9. 以下哪个是用于蛋白质-蛋白质相互作用网络分析的工具？（）A. STRINGB. BLASTC. ClustalWD. GenBank答案：A10. 下列哪个是用于生物信息学数据可视化的工具？（）A. R语言B. PythonC. CytoscapeD. Perl答案：C二、填空题（每题2分，共20分）1. 生物信息学是一门结合了__________、__________和__________的交叉学科。

答案：生物学、计算机科学、信息技术2. 基因组学中的“组”指的是__________的集合。

答案：基因3. 转录组学研究的RNA分子包括__________、__________和__________。

生物信息学试题

3、随着生物信息学的诞生及应用，今后生物学研究项目的起点将是理论的，一位科学家将从理论推测开始，然后转向试验去追踪或检验该假设。

4、生物信息学作为一门交叉学科，已经成为当今生命科学乃至整个自然科学的重大前沿领域之一，也将是21世纪自然科学的核心领域之一。

6、人类基因组的主要任务是：人类基因组以及一些模式生物（细菌、酵母、线虫、果蝇等）基因组作图、测序和基因识别。

二、是非题（共10分，每小题1分）1、生物学就是实验科学，所有的研究结论从实验中来，于实验中得到验证。

（错）2、比较是科学研究中最常见的方法，在生物信息学研究中，比对是最常用和最经典的研究手段。

（对）3、两个蛋白质序列相似性超过30%就是同源蛋白。

（错）4、蛋白质序列相似性指一级序列中氨基酸残基相同。

（错）5、蛋白质序列相似性指氨基酸残基具有相似特性：侧链基团大小电荷性、疏水性等相同。

（对）6、核酸序列相似性指序列中相同碱基所占的比例。

（对）7、对一段未知功能DNA片段进行功能预测需对其进行3位翻译。

（错）8、对一段未知功能DNA片段进行功能预测需对其进行6位翻译。

（对）9、相似性是指一种很直接的数量关系，无需实验验证。

生物信息试题及答案

生物信息试题及答案一、选择题（每题2分，共20分）1. 生物信息学的主要研究对象是（）。

A. 蛋白质结构B. 基因组序列C. 细胞信号传导D. 生物分子相互作用答案：B2. 以下哪项不是生物信息学的主要任务？（）A. 基因预测B. 蛋白质功能预测C. 疾病诊断D. 植物分类学研究答案：D3. 人类基因组计划的主要目标是（）。

A. 确定人类基因组中的所有基因B. 确定人类基因组中的所有蛋白质C. 确定人类基因组中的所有核苷酸序列D. 确定人类基因组中的所有代谢途径答案：C4. 以下哪种生物信息数据库不是公共数据库？（）A. GenBankB. Swiss-ProtC. PDBD. Myriad Genetics答案：D5. 在生物信息学中，BLAST是一种（）。

A. 基因克隆技术B. 基因表达分析软件C. 序列比对工具D. 蛋白质结构预测方法答案：C6. 以下哪种序列分析方法不适用于大规模基因组数据？（）A. 多重序列比对B. 单序列比对C. 基因预测D. 基因家族分析答案：B7. 以下哪种技术不是用于蛋白质结构预测的？（）A. 同源建模B. 从头预测C. 基因克隆D. 蛋白质折叠模拟答案：C8. 以下哪种生物信息学工具主要用于蛋白质功能预测？（）A. PfamB. BLASTC. ClustalWD. Swiss-Prot答案：A9. 以下哪种生物信息学数据库专门存储蛋白质结构数据？（）A. GenBankB. Swiss-ProtC. PDBD. KEGG答案：C10. 在生物信息学中，以下哪种数据类型不是高通量数据？（）A. 基因表达数据B. 蛋白质组数据C. 代谢组数据D. 单个基因序列答案：D二、填空题（每题2分，共20分）1. 生物信息学是应用__________和__________技术，研究生物大分子结构、功能和相互作用的科学。

答案：计算机；信息技术2. 人类基因组计划完成于__________年。

生物信息学试题

3、随着生物信息学的诞生及应用，今后生物学研究项目的起点将是理论的，一位科学家将从理论推测开始，然后转向试验去追踪或检验该假设。

4、生物信息学作为一门交叉学科，已经成为当今生命科学乃至整个自然科学的重大前沿领域之一，也将是21世纪自然科学的核心领域之一。

6、人类基因组的主要任务是：人类基因组以及一些模式生物（细菌、酵母、线虫、果蝇等）基因组作图、测序和基因识别。

二、是非题（共10分，每小题1分）1、生物学就是实验科学，所有的研究结论从实验中来，于实验中得到验证。

（错）2、比较是科学研究中最常见的方法，在生物信息学研究中，比对是最常用和最经典的研究手段。

（对）3、两个蛋白质序列相似性超过30%就是同源蛋白。

（错）4、蛋白质序列相似性指一级序列中氨基酸残基相同。

（错）5、蛋白质序列相似性指氨基酸残基具有相似特性：侧链基团大小电荷性、疏水性等相同。

（对）6、核酸序列相似性指序列中相同碱基所占的比例。

（对）7、对一段未知功能DNA片段进行功能预测需对其进行3位翻译。

（错）8、对一段未知功能DNA片段进行功能预测需对其进行6位翻译。

（对）9、相似性是指一种很直接的数量关系，无需实验验证。

生物信息学(期末)-生技08

齐齐哈尔大学试卷考试科目: 生物信息学适用对象: 生物技术08本使用学期: 2011—2012—1 第七学期课程编码: 05113019 总分80分共 2 页１）考生须知:２）姓名必须写在装订线左侧, 其它位置一律作废。

３）请先检查是否缺页, 如缺页应向监考教师声明, 否则后果由考生负责。

４）答案一律写在答题纸上, 可不抄题, 但要标清题号。

５）用蓝色或黑色的钢笔、圆珠笔答题。

监考须知: 请将两份题签放在上层随答题纸一起装订。

一、名词解释（每小题3分, 共4小题12分）表达序列标签, 外类群, 开放阅读框, 蛋白质组学二、选择题（每小题1分, 共10小题10分）1.下列哪项不属于人类基因组计划的研究内容（）A.绘制化学图谱、物理图谱B.获得全部人类基因组的序列C.获得转录图谱D.获得人体内全部的蛋白质序列2.图中哪一项为直系同源（）A.HA1和HA2B.HA1和WA2C.HA1和HBD.WA1和WA23.下列软件中哪一个能够用来构建系统发育树的（）A CLUSTALB BLASTC AssemblerD Treeview4.核酸序列增长最快是在哪一时期（）A 1970-1980年B 1980-1990年C 1990-2000年D 2000-2008年5. 研究一条测序获得的DNA序列时首先需要（）A.屏蔽重复序列B.去除序列污染C.查找开放阅读框D.查找密码子偏好性6. 对于序列ATGCCCCGA和序列ATCCGA哪一种是正确的序列对位排列方式（）A ATGCCCCGAAT_CC__GAB ATGCCCCGAAT_CCG__AC ATGCCCCGAAT_CC_G_AD ATGCCCCGAAT_C__G_A7.BLAST系列软件与下列哪一项能够在同一网站中检索到（）A GeneBank数据库B DDBJ数据库C EMBL数据库D CLUSTAL W8.生物信息学数据以什么形式存储（）A.文件系统B.程序软件C.数据库D.手工管理9.下列陈述哪一项是错误的（）A PIR-PSD是国际上最大的蛋白质序列数据库B 数据库的检索分为关键词检索和序列检索C STS是基因组作图时常用的一种图标D ACeDB仅储存秀丽新小杆线虫数据10.在使用CLUSTAL软件进行比对时, 多序列的比对结构中几条序列都相同的核苷酸位点用什么标注（）A 不同的颜色B “*”C “-”D “_”三、判断题（每小题1分, 共10小题10分, 对的画“√”, 错的画“×”）1.华盛顿大学的Phred软件是用来处理数据冗余的（）2.NCBI网站不能用来查询文章（）3.CLUSTAL X有汉化版（）4.EcoCyc是大肠杆菌的知识体系数据库系统（）5. 文昌鱼是人类的五种模式生物之一（）6.生物信息学研究物种信息, 不包括序列（）7.研究一条测序获得的DNA序列时首先应该去除污染序列（）8.双向凝胶电泳技术是蛋白质组研究的关键技术（）9.CAP3是EST序列的拼接软件（）10.氨基酸的顺序决定蛋白质的构象，即蛋白质的一级结构决定蛋白质的二级结构。

生物信息学试题及个人答案(非参考答案)

生物信息学答题卷考题一：到蛋白质序列数据库中查询一条杆状病毒(Baculovirus)DNA聚合酶（DNA polymerase)的完整序列，写出序列名称、登录号及来源物种的分类情况，然后用Blast（注意：写出所用程序及所搜索的数据库名称）搜索到数据库中和它相似程度较高的10条序列（写出这些序列的名称和登陆号及来源物种的分类情况。

要求至少包括3-4个属，每个属中选择1-2个种），对这10条序列进行多序列比对后（写出比对所用程序及比对结果），使用phylip软件，用距离法对它们进行分子进化分析(包括对进化树进行统计评估)，说明这种蛋白质的进化历程（60分）。

答：（1）到蛋白质序列数据库中查询一条杆状病毒(Baculovirus)DNA聚合酶（DNA polymerase)的完整序列如下：完整序列（ORIGIN）：1 mastdsldtr tfdyasdssf eviiitnaph dydgyielga aarllapfqk nisalwtnaa61 pshkltrnnk nylhvfglfk ylqnynlntk khppeyytik svicdlmmga qgktfdplce121 iktqlcaiqe slneaivtln ghaaadpapr tearelvesl hseyskkltf atdtildhvk181 sikdlvclnk序列名称: capsid protein [Choristoneura fumiferana MNPV]即：云杉卷叶蛾(虎尾松卷叶蛾)颗粒体病毒具体信息：LOCUS NP_848433 190 aa linear VRL06-MAY-2009登录号(ACCESSION): NP_848433来源物种的分类情况SOURCE Choristoneura fumiferana MNPVORGANISM Choristoneura fumiferana MNPVViruses; dsDNA viruses, no RNA stage; Baculoviridae;Alphabaculovirus.FEATURES Location/Qualifierssource 1..190/organism="Choristoneura fumiferana MNPV"/db_xref="taxon:208973"/country="Ireland"（2）然后用Blast搜索和它相似程度较高的10条序列如下：说明：所用程序:blosum62所搜索的数据库名称:swissprot数据库中和它相似程度较高的10条序列1、RecName: Full=Capsid protein p24名称：RecName: Full=Capsid protein p24LOCUS VP24_NPVOP 192 aa linear VRL 11-JAN-2011登录号：P24078来源物种的分类情况：SOURCE Orgyia pseudotsugata MNPVORGANISM Orgyia pseudotsugata MNPVViruses; dsDNA viruses, no RNA stage; Baculoviridae;Alphabaculovirus.FEATURES Location/Qualifierssource 1..192/organism="Orgyia pseudotsugata MNPV"/host="Orgyia pseudotsugata (Douglas fir tussock moth)"/db_xref="taxon:262177"2、RecName: Full=Capsid protein p24名称：RecName: Full=Capsid protein p24LOCUS VP24_NPVAC 198 aa linear VRL 11-JAN-2011登录号：P41678来源物种的分类情况：SOURCE Autographa californica nucleopolyhedrovirusORGANISM Autographa californica nucleopolyhedrovirusViruses; dsDNA viruses, no RNA stage; Baculoviridae;Alphabaculovirus.FEATURES Location/Qualifierssource 1..198/organism="Autographa californica nucleopolyhedrovirus"/host="Lepidoptera (butterflies and moths)"/db_xref="taxon:46015"3、RecName: Full=Flagellar motor switch phosphatase FliY; AltName: Full=CheY-P phosphatase FliY; AltName: Full=Flagellar motor switch protein FliY名称：RecName: Full=Flagellar motor switch phosphatase FliY; AltName: Full=CheY-P phosphatase FliY; AltName: Full=Flagellar motor switch protein FliYLOCUS FLIY_BACSU 378 aa linear BCT 08-FEB-2011登录号：P24073来源物种的分类情况：SOURCE Bacillus subtilisORGANISM Bacillus subtilisBacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus.FEATURES Location/Qualifierssource 1..378/organism="Bacillus subtilis"/db_xref="taxon:1423"4、RecName: Full=Uncharacterized protein YjeA名称：RecName: Full=Uncharacterized protein YjeALOCUS YJEA_HAEGA 322 aa linear BCT 30-NOV-2010登录号：Q9ZIY0来源物种的分类情况：SOURCE Avibacterium paragallinarumORGANISM Avibacterium paragallinarumBacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales;Pasteurellaceae; Avibacterium.FEATURES Location/Qualifierssource 1..322/organism="Avibacterium paragallinarum"/db_xref="taxon:728"5、RecName: Full=Protein YOP1名称：RecName: Full=Protein YOP1LOCUS YOP1_USTMA 172 aa linear PLN 08-MAR-2011 登录号：Q4P0H0来源物种的分类情况：SOURCE Ustilago maydisORGANISM Ustilago maydisEukaryota; Fungi; Dikarya; Basidiomycota; Ustilaginomycotina;Ustilaginomycetes; Ustilaginales; Ustilaginaceae; Ustilago. FEATURES Location/Qualifierssource 1..172/organism="Ustilago maydis"/db_xref="taxon:5270"6、RecName: Full=Protein anon-37Cs名称：RecName: Full=Protein anon-37CsLOCUS A37C_DROLE 544 aa linear INV 10-AUG-2010 登录号：O96570来源物种的分类情况：SOURCE Scaptodrosophila lebanonensisORGANISM Scaptodrosophila lebanonensisEukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota;Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha;Ephydroidea; Drosophilidae; Scaptodrosophila.FEATURES Location/Qualifierssource 1..544/organism="Scaptodrosophila lebanonensis"/db_xref="taxon:7225"7、RecName: Full=Photosystem I P700 chlorophyll a apoprotein A1; Short=PsaA名称：RecName: Full=Photosystem I P700 chlorophyll a apoprotein A1; Short=PsaA LOCUS PSAA_SYNPW 767 aa linear BCT 08-FEB-2011登录号：Q9R6U0来源物种的分类情况：SOURCE Synechococcus sp. WH 7803ORGANISM Synechococcus sp. WH 7803Bacteria; Cyanobacteria; Chroococcales; Synechococcus.FEATURES Location/Qualifierssource 1..767/organism="Synechococcus sp. WH 7803"/db_xref="taxon:32051"8、RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenase名称：RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenaseLOCUS MURB_CAMJE 258 aa linear BCT 08-FEB-2011登录号：Q9PM01来源物种的分类情况：SOURCE Campylobacter jejuniORGANISM Campylobacter jejuniBacteria; Proteobacteria; Epsilonproteobacteria; Campylobacterales;Campylobacteraceae; Campylobacter.FEATURES Location/Qualifierssource 1..258/organism="Campylobacter jejuni"/db_xref="taxon:197"9、RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenase名称：RecName: Full=UDP-N-acetylenolpyruvoylglucosamine reductase; AltName:Full=UDP-N-acetylmuramate dehydrogenaseLOCUS MURB_CAMJR 258 aa linear BCT 08-FEB-2011登录号：Q5HSB7来源物种的分类情况：SOURCE Campylobacter jejuni RM1221ORGANISM Campylobacter jejuni RM1221Bacteria; Proteobacteria; Epsilonproteobacteria; Campylobacterales;Campylobacteraceae; Campylobacter.FEATURES Location/Qualifierssource 1..258/organism="Campylobacter jejuni RM1221"10、RecName: Full=Probable molybdopterin-guanine dinucleotide biosynthesis protein A 名称：RecName: Full=Probable molybdopterin-guanine dinucleotide biosynthesis protein A LOCUS MOBA_METAC 225 aa linear BCT 03-MAY-2011登陆号：Q8TPD6来源物种的分类情况：SOURCE Methanosarcina acetivorans C2AORGANISM Methanosarcina acetivorans C2AArchaea; Euryarchaeota; Methanomicrobia; Methanosarcinales;Methanosarcinaceae; Methanosarcina.FEATURES Location/Qualifierssource 1..225/organism="Methanosarcina acetivorans C2A"/db_xref="taxon:188937"搜索过程附图：（3）对这10条序列进行多序列比对:写出比对所用程序:clustalx比对结果分析：比对所得的以phy为后缀的文件用写字板格式打开后得如下结果： 10 771P24078.1 ---------- ---------- ------MANA DSLDAR-AFS YAPDASFEVIP41678.1 ---------- ---------- ---------- ----TR-NFM YSPDSSLEVVQ9R6U0 ---------- TAKTQVEKVD NPATFELFGK PGHFDR-ALA KGPKTTTWVWQ3AMS5.1 MTISPPERGS DAKSQVEKVD NPATFELFGK PGHFDR-ALA KGPKTTTWVWQ9PM01.1 ------MIID FKKYSSVRIG NEFEVLVLDQ ICDFDG-FLI GGANN----LQ4P0H0 ---------- ---------- -KVEYFVAQI DKELSRYPAL KKFEQTVPVPQ9ZIY0.1 ------SIQT LLSRAKIIAE IRQFFSERGL LEVETPILSE FGVTDVHLSTP24073.2 --IDALLNGT GSTLDEPEIP EVDDLSEMER DAIGEIGNIS FGSSATALSTO96570 ---------E SLSFSGYKLT RRNLYNAPAL KVMGRSVNNS SSNNNDQQQYQ8TPD6.1 ---------- ---------- MSGKTELKPG RTKSRSAIVL AGGRGRRMGMIITNAPNDHD GY---LELNA AARL-LAPFQ KN-ISALWTS ----------IITNSDGDHD GY---LELTA AAKV-MSPFL SNGSSAVWTN ----------NLHANAHDFD SHTSDLEEVS RKIF-SAHFG HLAVIFIWLS GAFFHGARFSNLHANAHDFD AHTSDLQEVS RRIF-SAHFG HLAVIFIWLS GAFFHGARFSLVSPKPKNIG ILGDGFNFIQ ILDR-NKDFI HLRIGCKTKS S---------KAYAALGAFG IFTLFVFFNI AAGF-LTNLL GFFVPAYFS- ----------FSTKLISPFQ KKEKTLWLST SPEYPMKRLL SAGSGAIFQL CKVFRN---ELLNQKVDITT PSVTVIPRSK ISDAFPEPYV AIEVNYTEGF SG--------NLESAKQNTQ IVVIGAGLAG LSAAQHLLRH GFRSTIVLEA TDRYGG---RVEKALLEFEG KTILERLLEN LFRVVDEVIL SVRDIPQKEK ----------……（此处省略约9KB的数据分析结果）以上是多序列比对的纯数据结果，部分数据省略，因为可以从下面的进化树得到具体的分析。

2012生物信息学考试试题剖析

4. 一致序列：这些序列是指把多序列联配的信息压缩至单条序列，主要的缺点是除了在特定位置最常见的残基之外，它们不能表示任何概率信息。

5. HMM 隐马尔可夫模型：一种统计模型，它考虑有关匹配、错配和间隔的所有可能的组合来生成一组序列排列。

6. 信息位点：由位点产生的突变数目把其中的一课树与其他树区分开的位点。

7. 非信息位点：对于最大简约法来说没有意义的点。

8. 标度树：分支长度与相邻节点对的差异程度成正比的树。

9. 非标度树：只表示亲缘关系无差异程度信息。

10. 有根树：单一的节点能指派为共同的祖先，从祖先节点只有唯一的路径历经进化到达其他任何节点。

11. 无根树：只表明节点间的关系，无进化发生方向的信息，通过引入外群或外部参考物种，可以在无根树中指派根节点。

12. 注释：指从原始序列数据中获得有用的生物学信息。

这主要是指在基因组DNA中寻找基因和其他功能元件（结构注释），并给出这些序列的功能（功能注释）。

13. 聚类分析：一种通过将相似的数据划分到特定的组中以简化大规模数据集的方法。

14. 无监督分析法：这种方法没有内建的分类标准，组的数目和类型只决定于所使用的算法和数据本身的分析方法。

生物信息学试题及答案

生物信息学试题及答案一、单项选择题（每题2分，共20分）1. 生物信息学的主要研究对象是（）。

A. 生物数据B. 生物实验C. 生物模型D. 生物技术答案：A2. 下列哪项不是生物信息学中的常用数据库（）。

A. GenBankB. Swiss-ProtC. PubMedD. Google Scholar答案：D3. 蛋白质序列比对的主要目的是（）。

A. 确定蛋白质的三维结构B. 预测蛋白质的功能C. 比较蛋白质的氨基酸序列D. 计算蛋白质的分子量答案：B4. 在生物信息学中，以下哪种算法不是用于序列比对的（）。

A. BLASTB. FASTAC. Smith-WatermanD. Hidden Markov Model答案：D5. 下列哪种生物信息学工具主要用于基因表达分析（）。

A. ClustalWB. Primer3C. R语言D. PDB答案：C6. 以下哪种技术不是用于蛋白质结构预测的（）。

A. 同源建模B. 从头预测C. 序列比对D. 折叠识别答案：C7. 以下哪种生物信息学工具主要用于基因组注释（）。

A. BLASTC. GATKD. Primer3答案：B8. 在生物信息学中，以下哪种方法不用于基因表达数据的聚类分析（）。

A. K-meansB. Hierarchical clusteringC. Principal component analysisD. Multiple sequence alignment答案：D9. 下列哪种生物信息学工具主要用于蛋白质-蛋白质相互作用网络分析（）。

A. STRINGB. BLASTD. Primer3答案：A10. 在生物信息学中，以下哪种数据库不包含蛋白质结构信息（）。

A. PDBB. UniProtC. RCSBD. GenBank答案：D二、多项选择题（每题3分，共15分）11. 生物信息学中常用的序列比对工具包括（）。

A. BLASTB. FASTAC. ClustalWD. Pfam答案：ABC12. 以下哪些是生物信息学中常用的基因表达分析软件（）。

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、选择题:1.以下哪一个是mRNA条目序列号：A. J01536B. NM_15392C. NP_52280D. AAB1345062.确定某个基因在哪些组织中表达的最直接获取相关信息方式是：A. UnigeneB. EntrezC. LocusLinkD. PCR3.一个基因可能对应两个Unigene簇吗？A. 可能B. 不可能4.下面哪种数据库源于mRNA信息：A. dbESTB. PDBC. OMIMD. HTGS5.下面哪个数据库面向人类疾病构建：A. ESTB. PDBC. OMIMD. HTGS6.Refseq和GenBank有什么区别：A. Refseq包括了全世界各个实验室和测序项目提交的DNA序列B. GenBank提供的是非冗余序列C. Refseq源于GenBank，提供非冗余序列信息D. GenBank源于Refseq7.如果你需要查询文献信息，下列哪个数据库是你最佳选择：A. OMIMB. EntrezC. PubMedD. PROSITE8.比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法，下列哪种说法正确：A. 因为GenBank的数据比EMBL更多，Entrez给出的搜索结果将更多B. 搜索结果很可能一样，因为GenBank和EMBL的序列数据实际一样C. 搜索结果应该相当，但是ExPASy中的SwissProt记录的输出格式不同9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于：A. N/W/YB. Q/W/YC. F/W/YD. Q/N/W10.直系同源定义为：A. 不同物种中具有共同祖先的同源序列B. 具有较小的氨基酸一致性但是有较大的结构相似性的同源序列C. 同一物种中由基因复制产生的同源序列D. 同一物种中具有相似的并且通常是冗余的功能的同源序列11.下列那个氨基酸最不容易突变：A. 丙氨酸B. 谷氨酰胺C. 甲硫氨酸D.半胱氨酸12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变：A. 1%B. 20%C. 80%D. 250%13.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同：A. 全局比对通常用于比对DNA序列，而局部比对通常用于比对蛋白质序列B. 全局比对允许间隙，而局部比对不允许C. 全局比对寻找全局最大化，而局部比对寻找局部最大化D. 全局比对比对整体序列，而局部比对寻找最佳匹配子序列14.假设你有两条远源相关蛋白质序列。

为了比较它们，最好使用下列哪个BLOSUM和PAM矩阵：A. BLOSUM45和PAM250B. BLOSUM45和PAM1C. BLOSUM80和PAM250D. BLOSUM10和PAM115.与PAM打分矩阵比较，BLOSUM打分矩阵的最大区别是：A. 最好用于比对相关性高的蛋白B. 它是基于近相关蛋白的全局多序列比对C. 它是基于远相关蛋白的局部多序列比对D. 它结合了全局比对和局部比对16.如果有一段DNA序列，它可能编码多少种蛋白质序列：A. 1B. 2C. 3D. 617.要在数据库查询一段与某DNA序列编码蛋白质最相似的序列，应选择：A. blastnB. blastpC. tblastnD. tblastpE. blastx18.为什么ClustalW（一个采用了Feng-Doolittle渐进比对算法的程序）不报告E值：A. ClustalW报告E值B. 使用了全局比对C. 使用了局部比对D. 因为是多序列比对19.Feng-Doolittle方法提出“一旦是空隙，永远是空隙”规则的依据是：A. 保证空隙不会引物序列加入而填充B. 假定进化早期分歧的序列有较高优先级别C. 假定最近序列空隙应该保留D. 假定最远序列空隙应该保留20.根据分子钟假说：A. 所有蛋白质都保持一个相同的恒定进化速率B. 所有蛋白质的进化速率都与化石记录相符合C. 对于每一个给定的蛋白质，分子进化的速率是逐渐减慢的，就如同不准时的钟D. 对于每一个给定的蛋白质，其分子进化的速率在所有的进化分支上大致是恒定的21.系统发生树的两个特征是：A. 进化分支和进化节点B. 树的拓扑结构和分支长度C. 进化分支和树根D. 序列比对和引导检测方法22.下列哪一个是基于字母特征的系统发生分析的算法：A. 邻位连接法（NJ法）B. Kimura算法C. 最大似然法（ML）D. 非加权平均法（UPGMA）23.基于字母特征和基于距离的系统发生分析的算法的基本差异是：A. 基于字母特征的算法没有定义分支序列的中间数据矩阵1B. 基于字母特征的算法可应用于DNA或者蛋白质序列，而基于距离仅能用于DNAC. 基于字母特征的算法无法运用简约算法D. 基于字母特征的算法的进化分支与进化时间无关24.一个操作分类单元（OTU）可指：A. 多序列比对B. 蛋白质序列C. 进化分支D. 进化节点25.构建进化树最直接的错误来源是：A. 多序列比对错误B. 采样的算法差异C. 假设进化分支是单一起源D. 尝试推测基因的进化关系26.第一个被完整测定的基因组序列是：A. 啤酒酵母的3号染色体B. 流感病毒C.ФX174 D. 人类基因组27.普通的真核生物线粒体基因组编码大约多少个蛋白质：A. 10B. 100C. 1000D. 1000028.根据基因组序列预测蛋白质编码基因的算法的最大问题是：A. 软件太难使用B. 假阳性率太高，许多不是外显子的序列部分被错误指定C. 假阳性率太高，许多不是外显子功能未知D. 假阴性率太高，丢失太多外显子位点29.HIV病毒亚型的系统演化研究可以：A. 证实HIV病毒是由牛病毒演化而来B. 用于指导开发针对保守蛋白的疫苗C. 证实哪些人类组织最容易遭受病毒侵染30.一个典型的细菌基因组大小约为多少bp：A. 20000B. 200,000C. 2000000D. 2000000031.细菌基因组与真核生物基因组分析工具存在较大差异的主要原因是：A. 细菌拥有不同的密码子B. 细菌没有细胞核C. 细菌很少有基因与真核同源D. 细菌DNA的基因含量、组成结构很不一样32.下列具有最小基因组的原核生物可能是：A. 嗜极生物B. 病毒C. 胞内细菌D. 杆菌33.要证明某大肠杆菌中的某个基因是水平转移而来，需要：A. 分析该大肠杆菌中该基因的GC含量与其他基因是否有很大差异B. 分析该大肠杆菌中该基因的密码子使用与其他基因是否有很大差异C. 系统发生分析该基因与其他物种中基因的同源关系D. 获取以上三个方面的信息34.C值矛盾是指：A. 某些基因组中核苷酸C的含量少B. 真核生物基因组大小同编码蛋白质的基因个数没有相关性C. 真核生物基因组大小同屋中的复杂性相关性很小D.真核生物基因组大小同进化上的年龄相关性小35.成百上千个4~8bp的重复序列单元最可能出现在：A. 散布性重复序列中B. 假基因中C. 端粒中D. 片段复制区域36.从头预测真核基因的原因有：A. 外显子/内含子边界难以确定B. 内含子长度可能只有几个碱基对C. 编码区域的GC含量并不总是与非编码区相同D. 以上三个方面的原因37.人类基因组大小大约是多少Mb：A. 130B. 300C. 3000D. 3000038.各种重复元件在人类基因组中大约占的百分比为：A. 5%B. 25%C. 50%D. 95%39.蛋白质编码区域占人类基因组百分比是：A. 1-5%B. 5-10%C. 10-20%D. 20-4-%40.人类基因组中GC含量高的区域：A. 基因密度相对较低B. 基因密度相对较高C. 基因密度多变 D. 基因所含密码子相对较少41.人类复合孟德尔遗传的基因疾病约占疾病基因的：A. 1%B. 10%C. 50%D. 60%42.单基因疾病趋向于：A. 在普通人群较少见，并且发生时间较早B. 在普通人群较常见，并且发生时间较早C. 在普通人群较少见，并且发生时间较晚D. 在普通人群较常见，并且发生时间较晚名词解释1.生物信息学：是一门结合生物技术和信息技术从而揭示生物学中新原理的科学。

2.鸟枪法测序：一种测序方法，包括从基因组中获得随机的、已测序的克隆片段，并且对初始基因的位置一无所知。

3.BLAST：基本局部相似性比对搜索工具。

在序列数据库中快速查找与给定的序列具有最优局部对准结果的序列的一种序列对算法。

4.整体联配：对两个核苷酸或蛋白质序列的全长所进行的比对。

5.FASTA：是第一个被广泛使用的数据库相似性搜索算法，这个程序通过扫描序列中“词”的小配对，从而寻找最优局部比对。

6.算法：在计算机程序中包含的一种固定过程。

7.序列比对：将两个或多个序列排在一起，以达到最大一致性的过程（对于氨基酸序列是比较他们的保守性），这样评估序列间的相似性和同源性。

8.多序列比对：三个或多个序列之间的比对，如果序列在同一列有相同结构位置的残基和（或）祖传的残基，则会在该位置插入空位。

9.最佳联配：两个序列之间有最高打分值的排列。

10.空位：在两条序列比对过程中需要在检测序列或目标序列中引入空位，以表示插入或删除。

11.模块替换矩阵：在替换矩阵中，每个位置的打分是在相关蛋白局部比对模块中观察到的替换的频率而获得的，每个矩阵被修改成一个特殊的进化距离。

12.可接受点突变：一个用于衡量蛋白质序列的进化突变程度的单位。

13.互补序列：能够与其他DNA片段根据碱基互补序列（A与T配对，G与C配对）形成两练结构的核苷酸序列。

14.保守序列：指DNA分子中的一个核苷酸片段或者蛋白质中氨基酸片段，它们在进化过程中基本保持不变。

215.邻接片段：一组在染色体上有重叠区域的DNA片段的克隆；16.支架：由序列重叠群拼接而成。

17.注释：对数据库中原始的DNA碱基序列添加相关信息（比如编码的基因，氨基酸序列等）或其他的注解。

18.基因预测：用计算机程序对可能的基因所做的预测，它是基于DNA片段与已知基因序列的匹配程度的。

19.直系同源：指不同种类的同源序列，他们是在物种的形成事件中从一个祖先序列独立进化而成的，可能有相似功能，也可能没有。

20.旁系同源：是通过类似基因复制的机制产生的同源序列。

21.替换：在指定的位置不相同的氨基酸进行连配，如果联配的残基有相似的物化性质，那么替换是保守的。

22.表达序列标签（EST）：一种短的DNA片段，是cDNA分子的一部分，可用来鉴定基因，通常用于基因定位和基因图谱中。

23.多态性：多个个体之间DNA的差异叫多态性。

24.序列模式：蛋白质序列中短的保守区域，它们是结构域中保守性很高的部分。

25.结构域：蛋白质在折叠时候与其它部分相独立的一个不连续部分，他有自己独特的功能。