生物信息学及应用复习题

合集下载

生物信息学复习题

生物信息学复习题

生物信息学复习题生物信息学是一门结合生物学、计算机科学、信息学和数学的交叉学科,它利用计算机技术来处理和分析生物数据。

以下是一些生物信息学复习题,供同学们参考:1. 生物信息学的定义和应用领域- 生物信息学是如何定义的?- 生物信息学在哪些领域有应用?2. 基因组学基础- 什么是基因组学?- 基因组测序的基本原理是什么?3. 序列比对- 序列比对的目的是什么?- 简述局部比对和全局比对的区别。

4. BLAST算法- BLAST算法的原理是什么?- 如何使用BLAST进行序列相似性搜索?5. 基因表达数据分析- 基因表达数据有哪些类型?- 描述基因表达数据的预处理步骤。

6. 蛋白质结构预测- 蛋白质结构预测的重要性是什么?- 简述几种常见的蛋白质结构预测方法。

7. 系统生物学和网络分析- 系统生物学研究的是什么?- 网络分析在系统生物学中的应用。

8. 生物信息学中的数据库- 列举几个常见的生物信息学数据库。

- 解释数据库在生物信息学研究中的作用。

9. 生物信息学中的编程语言- 哪些编程语言在生物信息学中常用?- 简述Python在生物信息学中的应用。

10. 伦理和隐私问题- 在生物信息学研究中可能遇到哪些伦理问题?- 如何保护生物信息数据的隐私?11. 案例研究- 描述一个生物信息学在医学研究中的应用案例。

- 分析该案例中使用的方法和技术。

12. 未来趋势- 预测生物信息学未来的发展趋势。

- 讨论生物信息学如何影响未来的科学研究和医疗保健。

通过这些问题的复习,同学们可以更全面地了解生物信息学的基础概念、关键技术和应用领域。

希望这些复习题能够帮助同学们更好地准备考试和理解生物信息学的重要性。

生物信息考试题及答案

生物信息考试题及答案

生物信息考试题及答案生物信息学是一门结合生物学、计算机科学、信息技术和数学的交叉学科,它利用计算机技术来分析和解释生物数据。

以下是一份生物信息学考试题及答案的示例。

生物信息学考试题一、选择题(每题2分,共20分)1. 生物信息学中,用于存储DNA序列的文件格式是:A. FASTAB. JPEGC. MP3D. DOCX2. 以下哪项不是生物信息学分析的基本步骤?A. 数据收集B. 数据预处理C. 数据解释D. 数据存储3. 在蛋白质序列分析中,BLAST工具用于:A. 序列比对B. 序列组装C. 序列克隆D. 序列合成4. 以下哪个数据库不是用于存储基因表达数据的?A. NCBIB. GEOC. PDBD. ArrayExpress5. 以下哪个算法不是用于基因预测的?A. GeneMarkB. BLASTC. GlimmerD. Fgenesh二、简答题(每题10分,共30分)6. 简述生物信息学在现代生物学研究中的重要性。

7. 解释什么是基因组学,并说明其在医学研究中的应用。

8. 描述序列比对的基本原理及其在生物信息学中的作用。

三、计算题(每题15分,共30分)9. 假设你有一个DNA序列,其组成为:ATCGTA。

请计算其互补序列。

10. 给定两个蛋白质序列,序列A:A-B-C-D-E,序列B:A-C-E-B-D。

请使用Needleman-Wunsch算法计算它们的全局比对得分。

四、论述题(每题20分,共20分)11. 论述生物信息学在新药开发中的作用及其面临的挑战。

答案一、选择题1. A2. C3. A4. C5. B二、简答题6. 生物信息学在现代生物学研究中的重要性体现在它能够处理和分析大量的生物数据,如基因组序列、蛋白质结构等,帮助科学家快速发现生物现象的规律,推动生物学的发展。

7. 基因组学是研究生物基因组的结构、功能和演化的科学。

在医学研究中,基因组学可以帮助我们了解疾病的遗传基础,为个性化医疗提供理论基础。

生物技术应用与生物信息学测试 选择题 60题

生物技术应用与生物信息学测试 选择题 60题

1. 生物技术的核心技术之一是:A. 基因工程B. 细胞工程C. 发酵工程D. 酶工程2. 下列哪项不是生物信息学的研究内容?A. 基因组测序B. 蛋白质结构预测C. 生物伦理学D. 分子进化3. 基因克隆的主要步骤包括:A. 基因分离B. 基因扩增C. 基因表达D. 以上都是4. 下列哪种软件主要用于DNA序列分析?A. BLASTB. PymolC. MATLABD. R5. CRISPR-Cas9技术主要用于:A. 基因编辑B. 基因表达C. 基因测序D. 基因克隆6. 下列哪项不是高通量测序技术的应用?A. 全基因组重测序B. 转录组分析C. 蛋白质组分析D. 代谢组分析7. 生物信息学中的BLAST工具主要用于:A. 序列比对B. 结构预测C. 功能注释D. 进化分析8. 下列哪种技术可以用于检测单个细胞的基因表达?A. RNA-SeqB. ChIP-SeqC. 单细胞测序D. 微阵列9. 蛋白质结构预测的主要方法包括:A. 同源建模B. 从头预测C. 折叠识别D. 以上都是10. 下列哪项不是生物信息学数据库?A. GenBankB. PDBC. PubMedD. KEGG11. 基因组学研究的主要内容包括:A. 基因组结构B. 基因组功能C. 基因组进化D. 以上都是12. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学13. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是14. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是15. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是16. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列17. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是18. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学19. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是20. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学21. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是22. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是23. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是24. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列25. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是26. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学27. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是28. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学29. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是30. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是31. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是32. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列33. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是34. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学35. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是36. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学37. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是38. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是39. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是40. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列41. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是42. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学43. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是44. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学45. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是46. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是47. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是48. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列49. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是50. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学51. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是52. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学53. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是54. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是55. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是56. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列57. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是58. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学59. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是60. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学答案:1. A2. C3. D4. A5. A6. C7. A9. D10. C11. D12. A13. A14. D15. A16. A17. A18. D19. A20. A21. A22. D23. A24. A25. A26. D27. A28. A29. A30. D31. A32. A33. A34. D35. A36. A37. A38. D39. A40. A41. A42. D43. A44. A45. A46. D47. A48. A49. A50. D51. A52. A53. A54. D55. A56. A57. A59. A60. A。

生物信息学复习题

生物信息学复习题

生物信息学复习题### 生物信息学复习题#### 一、选择题1. 生物信息学主要研究的是什么?A. 生物学数据的收集和存储B. 生物学数据的分析和解释C. 生物学实验的设计和执行D. 生物学仪器的操作和维护2. 下列哪一项不是生物信息学中常用的数据库?A. GenBankB. PDBC. PubMedD. Google Scholar3. 序列比对的目的是什么?A. 确定序列间的同源性B. 预测蛋白质的三维结构C. 鉴定基因的功能D. 计算基因的表达量#### 二、填空题1. 生物信息学中的BLAST工具主要用于__________。

2. 基因表达分析中常用的芯片技术包括__________和__________。

3. 在蛋白质结构预测中,同源建模依赖于__________数据库中的已知结构。

4. 转录组测序(RNA-Seq)可以用于研究__________和__________。

#### 三、简答题1. 描述基因组注释的一般流程。

2. 阐述生物信息学在药物设计中的应用。

3. 解释什么是系统发育树,并说明其在进化研究中的意义。

#### 四、计算题1. 给定一段DNA序列,计算其GC含量。

(示例序列:ATCGTACGTAGCTAGCTAG)2. 如果一个蛋白质序列的分子量为12345 Da,其氨基酸的平均分子量为110 Da,计算该蛋白质序列中氨基酸的数量。

#### 五、论述题1. 讨论生物信息学在个性化医疗中的作用和挑战。

2. 分析高通量测序技术对生物信息学领域的影响。

通过以上题目的复习,可以帮助学生掌握生物信息学的基础知识和技能,包括对生物数据的分析、解释和应用。

这些知识点不仅涵盖了生物信息学的基础理论,还涉及到实际应用,如药物设计、个性化医疗等,为学生提供了一个全面的复习框架。

生物信息技术考试试题

生物信息技术考试试题

生物信息技术考试试题一、选择题(每题 3 分,共 30 分)1、以下哪个不是生物信息学的主要研究内容?()A 基因组学B 蛋白质组学C 细胞学D 代谢组学2、生物信息学中用于序列比对的常用算法是()A 动态规划算法B 贪心算法C 分治算法D 回溯算法3、在基因表达数据分析中,常用的标准化方法是()A RPKMB TPMC FPKMD 以上都是4、以下哪种数据库主要用于存储蛋白质结构信息?()A GenBankB PDBC UniProtD Ensembl5、进行系统发育分析时,常用的构建进化树的方法是()A 邻接法B 最大简约法C 最大似然法D 以上都是6、以下哪个软件不是用于基因序列分析的?()A Primer PremierB SPSSC DNAStarD Vector NTI7、生物信息学中,预测蛋白质二级结构的方法不包括()A 基于同源建模B 基于机器学习C 基于物理化学原理D 基于经验规则8、在生物信息学中,BLAST 程序主要用于()A 序列比对B 进化分析C 基因预测D 蛋白质结构预测9、以下哪种编程语言在生物信息学中应用较为广泛?()A JavaB PythonC C++D Fortran10、用于分析基因芯片数据的软件包是()A R 语言中的 BioconductorB MATLABC StataD SAS二、填空题(每题 3 分,共 30 分)1、生物信息学中的三大核心数据库是_____、_____、_____。

2、基因序列的相似性搜索常用的工具是_____。

3、蛋白质的一级结构是指_____。

4、常见的基因注释数据库有_____、_____等。

5、系统发育树的构建基于_____的原理。

6、生物信息学中常用的数据格式有_____、_____等。

7、预测蛋白质三级结构的方法主要有_____、_____。

8、基因表达数据的差异分析常用的方法有_____、_____。

9、用于分析高通量测序数据的软件有_____、_____。

生物信息学复习题及答案(打印)

生物信息学复习题及答案(打印)

生物信息学复习题及答案(打印)一、名词解释:1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。

利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。

2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。

3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。

4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。

该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。

5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI 的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。

6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。

P947.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。

P988.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。

包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。

P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。

P2910.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。

林业有害生物防治中的生物信息学应用考核试卷

林业有害生物防治中的生物信息学应用考核试卷
3.基因组测序技术可以直接用于害虫的种群遗传结构分析。()
4.生物信息学分析中,所有的统计方法都是通用的,无需根据数据类型选择合适的分析方法。()
5.在进行有害生物的基因表达数据分析时,不需要考虑样本间的批次效应。()
6.生物信息学数据库中的数据都是经过严格审核的,不需要用户自己验证数据的准确性。()
林业有害生物防治中的生物信息学应用考核试卷
考生姓名:__________答题日期:__________得分:__________判卷人:__________
一、单项选择题(本题共20小题,每小题1分,共20分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列哪项不是生物信息学在林业有害生物防治中的主要应用?()
4.讨论生物信息学在新型害虫防治药物发现中的作用。描述生物信息学在药物发现过程中的关键步骤,并举例说明这些步骤如何帮助研究人员识别和验证潜在的药物靶标。
标准答案
一、单项选择题
1. D
2. C
3. D
4. C
5. B
6. A
7. B
8. C
9. A
10. A
11. B
12. C
13. D
14. C
15. D
A.害虫的生理数据
B.气候数据
C.遥感图像
D.土壤类型数据
12.下列哪种方法在生物信息学中较少用于害虫防治?()
A.机器学习
B.生物统计分析
C.分子对接
D.系统发育分析
13.生物信息学在分析林业有害生物的基因表达数据时,通常需要哪种类型的分析?()
A.差异表达分析
B.聚类分析
C.主成分分析
D.所有以上
6.基因组学研究中,以下哪些技术可以用于有害生物的基因识别?()

《生物信息学》题集

《生物信息学》题集

《生物信息学》题集一、选择题(每题3分,共30分)1.生物信息学的主要研究对象是什么?A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术?A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中,进行多序列比对时常用的软件是什么?A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析?A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中,下列哪项不是常用的序列分析技术?A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用?A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测?A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中,下列哪项不是基因注释的内容?A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术?A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用?A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题(每题2分,共20分)1.生物信息学是一门交叉学科,它主要涉及______、计算机科学和数学等领域。

2.在生物信息学中,______技术常用于基因序列的相似性搜索。

3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。

4.在基因表达数据分析中,______是一种常用的数据标准化方法。

5.生物信息学中,______技术常用于蛋白质结构的预测和分析。

6.在生物信息学数据库中,GenBank主要存储的是______数据。

生物信息学复习题已附答案

生物信息学复习题已附答案

本卷的答案仅做参考,如有疑问欢迎提出。

后面的补充复习题要靠你们自己整理答案了。

生物信息学复习题一、填空题1、 识别基因主要有两个途径即2、 表达序列标签是从 mRNA 中生成的一些很短的序列( 300-500bp ),它们代表在特定组织或发育阶段表达的基因。

3、 序列比对的基本思想,是找出 检测基因 和 目标序列 的相似性,就是通过在序列中插入 空位的方法使所比较的序列长度达到一致。

比对的数学模型大体分 为两类,分别— 和局部比对 。

4、 2-DE 的基本原理是根据蛋白质 和 分子量 不同,进行两次电泳将之分 离。

第一向是 等电聚焦分离 ,第 —S D S-P AGE 分离 o5、 蛋白质组研究的三大关键核心技术是 质谱鉴定技术 、 计算机图像数据处理与蛋白质数据库二、 判断题1、 生物体的结构和功能越复杂的种类就越多,所需要的基因也越多,是真核生物基因组的特点之一。

(对)2、 CDS 一定就是 ORF 。

(对)3、 两者之间有没有共同的祖先,可以通过序列的同源性来确定,如果两个基因或蛋白质有着几乎一样的序列,那么它们高度同源 ,就具有共同的祖先。

(错)4、 STS,是一段 200-300bp 的特定 DNA 序列,它的序列已知,并且在基因组中属于 单拷贝。

(对)5、 非编码 DNA 是“垃圾 DNA',不具有任何的分析价值,对于细胞没有多大的作用。

(错)6、 基因树和物种树同属于系统树,它们之间可以等同。

(错)7、 基因的编码序列在 DNA 分子上是被不编码的序列隔开而不连续排列的。

&对任意一个 DNA 序列,在不知道哪一个碱基代表 CDS 的起始时,可用 获得6个潜在的蛋白质序列。

(对)9、 一个机体只有一个确定的基因组,但基因组内各个基因表达的条件和表达的程度随时间、空间和环境条件而不同。

(对)10、 外显子和内含子之间没有绝对的区分,一个基因的内含子可以是另一个基因的 外显子,同一个基因在不同的生理状况或生长发育的不同阶段,外显子组成也可以 不同。

生物信息学期末复习题与答案

生物信息学期末复习题与答案

一、单选题1、总的来说,位于染色体内超过( )个碱基的DNA,构成了人类基因组。

A.30000000000B.3000000000C.300000000D.30000000正确答案:B2、人类镰刀型红细胞贫血症是由于血红蛋白β链N端第6个氨基酸由谷氨酸突变为( )造成的。

A.苏氨酸B.缬氨酸C.赖氨酸D.谷氨酸正确答案:B3、RefSeq数据库是由哪个组织开发和维护的?( )A.NIGB.NCBIC.EMBLD.SIB正确答案:B4、Long non-coding RNA长链非编码RNA是长度大于( )个核苷酸的非编码RNA。

A.150B.250C.300D.200正确答案:D5、tBLASTx分析是用核酸序列检索核酸序列数据库,下列说法正确的是?()A.核酸序列和核酸序列数据库都不需要翻译成蛋白质序列B.只有核酸序列数据库需要翻译成蛋白质序列C.只有核酸序列需要翻译成蛋白质序列D.核酸序列和核酸序列数据库都需要翻译成蛋白质序列正确答案:D6、要搜索编码蛋白质序列的核酸序列,适宜的分析方法是?()A.BLASTxB.BLASTnC.tBLASTnD.BLASTp正确答案:A7、下列对于PCR引物修饰的说法正确的是?()A.PCR引物的5’末端和3’末端均能进行修饰B.PCR引物的5’末端和3’末端均不能进行修饰C.只有PCR引物的5’末端能进行修饰D.只有PCR引物的3’末端能进行修饰正确答案:C8、下列哪个在线分析工具可以预测DNA的外显子-内含子?()A.AugustusB.PLACEC.ORFfinderD.Entrez正确答案:A9、Smith-Waterman动态规划算法矩阵中的每个单元格有几条路径?()A.1B.2C.3D.4正确答案:D10、下列关于Needleman-Wunsch算法和Smith-Waterman算法提出早晚的论述正确的是?()A.Needleman-Wunsch算法提出时间较早B.不确定C.Smith-Waterman算法提出时间较早D.二者提出时间相当正确答案:A11、当分类单元至少为3时,下列对“有根树与无根树的数目”判断正确的是?()A.有根树的数目要少于无根树的数目B.有根树的数目与无根树的数目一样多C.有根树的数目要多于无根树的数目D.二者数目无法判断正确答案:C12、下列哪种算法建树时,选择代价最小或者枝长最短的树?A.最大似然值法B.最大简约法C.邻接法D.UPGMA法正确答案:B二、多选题1、生物信息学是由( )等学科相互交叉而形成的一门新兴学科。

生物信息学考试试题

生物信息学考试试题

生物信息学考试试题一、选择题(每题 3 分,共 30 分)1、以下哪种不是常见的生物信息学数据库?()A GenBankB SWISSPROTC PubMedD Baidu2、在 DNA 序列分析中,以下哪个不是用于序列比对的算法?()A NeedlemanWunsch 算法B SmithWaterman 算法C BLAST 算法D Fourier 变换算法3、蛋白质结构预测的方法不包括()A 同源建模B 从头预测C 折叠识别D 随机模拟4、以下哪种不是基因表达数据分析的常用方法?()A 聚类分析B 主成分分析C 判别分析D 回归分析5、生物信息学中,用于预测蛋白质功能的方法有()A 基于序列相似性B 基于结构相似性C 基于基因共表达D 以上都是6、在基因组学中,以下哪个不是测序技术?()A Sanger 测序B 二代测序C 三代测序D 四代测序7、系统发生树构建的方法不包括()A 距离法B 最大简约法C 最大似然法D 最小二乘法8、以下哪种不是生物信息学中常用的编程语言?()A PythonB JavaC C++D Visual Basic9、以下哪个不是生物信息学在医学领域的应用?()A 疾病诊断B 药物研发C 医疗美容D 个性化医疗10、生物信息学中,处理大规模数据常用的工具是()A ExcelB R 语言C SPSSD Word二、填空题(每题 2 分,共 20 分)1、生物信息学是一门融合了生物学、计算机科学和()的交叉学科。

2、常见的核酸序列格式有 FASTA 和()。

3、蛋白质的二级结构包括α螺旋、β折叠和()等。

4、基因芯片技术是一种()分析技术。

5、序列比对的目的是寻找两个或多个序列之间的()。

6、人类基因组计划的主要目标是测定人类基因组的()序列。

7、生物信息学中的隐马尔可夫模型主要用于()。

8、系统发生分析中,外群的作用是()。

9、蛋白质相互作用网络分析有助于理解()。

10、生物信息学数据库可以分为一级数据库和()数据库。

生物信息学及应用复习题

生物信息学及应用复习题

生物信息学及应用复习题《生物信息学及应用》课程复习题1、生物信息学的基本定义,阐述它的主要研究目标、研究内容及研究方法。

生物信息学:Bioinformatics is the combination of biology and information technology. It is the branch of science that deals with the computer-based analysis of large biological data sets.生物信息学研究的最终目的--揭示蕴藏在DNA和蛋白质氨基酸序列中具有普遍性、真实性的生物遗传本质,掌握复杂的生命现象——生命起源、生物进化以及细胞、器官和个体的发生、发育、病变、衰亡的规律和时空联系.生物信息学的主要研究内容1. 生物信息的收集、存储、管理与提供;2. 基因组序列信息的提取和分析;3. 功能基因组相关信息分析;4. 生物大分子结构模拟和药物设计;5. 生物信息分析的技术与方法研究;6. 应用与发展研究方面方法:(1)建立生物数据库:核苷酸顺序数据库(GENBANK)、Protein Data Bank(PDB)、氨基酸顺序数据库(SWISS-PRO)、酵母基因组数据库(YEASTS)、美国种质保藏中心(ATCC)、美国专利局数据库(USPO)等;(2)数据库检索:如Blast等;(3)序列分析:序列对位排列、同源比较、进化分析等;(4)统计模型:如隐马尔可夫模型(hidden Markov model, HMM)――基因识别、药物设计;最大似然模型(maximun likelihood model, ML)、最大简约法(Maximun Parsimony, MP)――分子进化分析等;(5)算法:如自动序列拼接、外显子预测和同源比较、遗传算法、人工神经网络(artificial neural network)等。

生物信息学复习要点

生物信息学复习要点

一、名词解释(每小题3分,共30分)1.生物信息学2.数据库技术3.数据仓库4.EST5.概念性翻译6.同源性7.单系类群8.全局排列9.基因作图10.直系同源体簇二、填空题(每空1分,共10分)1.生物信息学主要研究的两种信息载体是和。

2.国际上的三大核苷酸序列数据库分别是、和。

3.数据挖掘的三大技术支柱是、和。

4.相同类型核苷酸的替换称为,不同类型核苷酸的替换称为。

三、单项选择题(每小题1分,共10分)1.在对模式生物进行全基因组的测定中,作为真菌模式生物的是。

A、大肠杆菌B、青霉菌C、酵母菌D、线虫2.NCBI成立于。

A、1988年B、1989年C、1990年D、1992年3.根据数据库管理系统所支持的基本数据模型的不同,可以将数据库分为五类,其中第二代数据库是。

A、层次数据库B、网状数据库C、关系数据库D、分布式数据库4.在向GenBank投送序列的工具中,是标准的序列投送工具。

A、Cn3DB、tb12asnC、BankItD、Sequin5. 目前最为常用和注释最全的蛋白质序列数据库是。

A、IdentifyB、OWLC、PIRD、SWISS-PROT6. 下列选项中根据蛋白质三维折叠模式和进化关系划分的结构分类数据库是。

A、PDBsumB、GDBC、SCOPD、CATH7. 构建系统发生树的方法很多,其中耗时最短的是。

A、进化简约法B、最大简约法C、最大似然法D、距离矩阵法8. 下列数据库选项中不属于蛋白质序列二次数据库的是。

A、PROSITEB、PRINTSC、BLOCKSD、PDB9. 在系统发生树的检验中,较为常用的方法是。

A、MP法B、重复取样法C、NJ法D、ML法10. 下列工具中用于发现开放阅读框的软件是。

A、Translate ToolB、ORF FinderC、Gene WiseD、E-PCR四、多项选择题(每小题2分,共20分)1.生物大分子携带的三种信息是。

A、遗传信息B、功能信息C、调控信息D、进化信息2. 为实现3个抽象级别间的数据转换,DBMS提供的两层映射是。

生物信息考试题及答案

生物信息考试题及答案

生物信息考试题及答案一、选择题(每题2分,共20分)1. 基因组学研究的核心是()。

A. 基因克隆B. 基因表达C. 基因组序列D. 基因功能答案:C2. 下列哪项不是生物信息学的主要研究内容?()A. 基因组序列分析B. 蛋白质结构预测C. 植物分类学D. 基因表达分析答案:C3. 转录组学研究的是()。

A. 基因组中的所有基因B. 特定细胞或组织中的所有RNA分子C. 特定细胞或组织中的所有蛋白质分子D. 特定细胞或组织中的所有DNA分子答案:B4. 下列哪个数据库主要用于存储蛋白质序列信息?()A. GenBankB. PDBC. Swiss-ProtD. EMBL答案:C5. 以下哪个不是生物信息学中常用的序列比对工具?()A. BLASTB. FASTAC. ClustalWD. PCR答案:D6. 以下哪个是用于蛋白质三维结构预测的软件?()A. Swiss-ProtB. PDBC. MODELLERD. GenBank答案:C7. 以下哪个是用于基因表达分析的高通量技术?()A. Sanger测序B. 微阵列C. PCRD. 质谱分析答案:B8. 下列哪个是用于基因组关联研究的统计方法?()A. 聚类分析B. 系统发育分析C. 连锁不平衡分析D. 多态性分析答案:C9. 以下哪个是用于蛋白质-蛋白质相互作用网络分析的工具?()A. STRINGB. BLASTC. ClustalWD. GenBank答案:A10. 下列哪个是用于生物信息学数据可视化的工具?()A. R语言B. PythonC. CytoscapeD. Perl答案:C二、填空题(每题2分,共20分)1. 生物信息学是一门结合了__________、__________和__________的交叉学科。

答案:生物学、计算机科学、信息技术2. 基因组学中的“组”指的是__________的集合。

答案:基因3. 转录组学研究的RNA分子包括__________、__________和__________。

(完整word版)生物信息学复习资料(word文档良心出品)

(完整word版)生物信息学复习资料(word文档良心出品)

一、名词解释(31个)1.生物信息学:广义:应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。

狭义:应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。

2.二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。

3.多序列比对:研究的是多个序列的共性。

序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。

4.系统发育分析:是研究物种进化和系统分类的一种方法,其常用一种类似树状分支的图形来概括各种(类)生物之间的亲缘关系,这种树状分支的图形称为系统发育树。

5.直系同源:如果由于进化压力来维持特定模体的话,模体中的组成蛋白应该是进化保守的并且在其他物种中具有直系同源性。

指的是不同物种之间的同源性,例如蛋白质的同源性,DNA序列的同源性。

(来自百度)6.旁系(并系)同源:是那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的功能。

用来描述在同一物种内由于基因复制而分离的同源基因。

(来自百度)7.FASTA序列格式:将一个DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或氨基酸字符串。

8.开放阅读框(ORF):是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。

(来自百度)9.结构域:大分子蛋白质的三级结构常可分割成一个或数个球状或纤维状的区域,折叠得较为紧密,各行其功能,称为结构域。

10.空位罚分:序列比对分析时为了反映核酸或氨基酸的插入或缺失等而插入空位并进行罚分,以控制空位插入的合理性。

(来自百度)11.表达序列标签:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分cDNA的3’或5’端序列。

生物信息学课程复习题(南医大)

生物信息学课程复习题(南医大)

⽣物信息学课程复习题(南医⼤)⽣物信息学课程习题第⼀章绪论⼀、填空1、在年,美国国会批准启动⼈类基因组计划,拟⽤年时间测定⼈类全部条染⾊体上共个碱基序列的测定。

2、是遗传信息的携带者。

3、蛋⽩质三维结构测定主要⽅法有和。

4、理想的抗⽣素靶标应为微⽣物细胞所必须,在病原体中⾼度,且在⼈体中或与⼈类基因有。

5、下图例举了⼀个计算机辅助药物设计的实例,从a图中我们得到了配体上R基团附近的受体上有和残基,具有性,因此可以将R基团设计为性基团,如图b中所⽰的基团,使得抑制活性⽐改造前提⾼了近5000倍。

⼆、名词HGP(human genome project),EST(expressed sequence tag), SNP(single nucleotide polymorphism),⽣物信息学(Bioinformatics),药物基因组学(Pharmacogenomics),intron,“Junk DNA”,⽐较基因组学,蛋⽩质组学,分⼦进化树(evolutionary tree),基因组,基因组药物三、简答1、简述⽣物信息学在药物研究开发领域的应⽤可体现在哪些⽅⾯?2、如何利⽤基因组信息寻找新的药物作⽤靶标?3、如何利⽤⼈类基因组信息实现个性化治疗,其基于的原理是什么?4、试叙述基因芯⽚⽤于疾病诊断的原理,并说明其优缺点。

5、最近甲型流感流⾏,请设计甲型流感的分⼦诊断⽅法,说明其原理。

第⼆、三章数据库⼀、单选题1、以下数据库不能⽤于检索核酸序列的是( B )A. GenBankB. PDBC. EMBLD.DDBJ2、蛋⽩质结构数据常保存为下⾯哪⼀种格式为后缀的⽂件()A. PDBB. txtC. SeqD. mdb3、下列格式属于FASTA格式的是()A. >seq1B.C. ATGCCATAD. > ATGCCATAATGCCATA ATGCCATA⼆、填空题1、阅读以下数据格式,写出以下标注的含义:LOCUS是,DEFINITION是,ACCESSION是,VERSION是,SOURCE是在论⽂中使⽤了NCBI数据库中的该序列,应标注该序列的编号,应填。

生物信息试题及答案

生物信息试题及答案

生物信息试题及答案一、选择题(每题2分,共20分)1. 生物信息学的主要研究对象是()。

A. 蛋白质结构B. 基因组序列C. 细胞信号传导D. 生物分子相互作用答案:B2. 以下哪项不是生物信息学的主要任务?()A. 基因预测B. 蛋白质功能预测C. 疾病诊断D. 植物分类学研究答案:D3. 人类基因组计划的主要目标是()。

A. 确定人类基因组中的所有基因B. 确定人类基因组中的所有蛋白质C. 确定人类基因组中的所有核苷酸序列D. 确定人类基因组中的所有代谢途径答案:C4. 以下哪种生物信息数据库不是公共数据库?()A. GenBankB. Swiss-ProtC. PDBD. Myriad Genetics答案:D5. 在生物信息学中,BLAST是一种()。

A. 基因克隆技术B. 基因表达分析软件C. 序列比对工具D. 蛋白质结构预测方法答案:C6. 以下哪种序列分析方法不适用于大规模基因组数据?()A. 多重序列比对B. 单序列比对C. 基因预测D. 基因家族分析答案:B7. 以下哪种技术不是用于蛋白质结构预测的?()A. 同源建模B. 从头预测C. 基因克隆D. 蛋白质折叠模拟答案:C8. 以下哪种生物信息学工具主要用于蛋白质功能预测?()A. PfamB. BLASTC. ClustalWD. Swiss-Prot答案:A9. 以下哪种生物信息学数据库专门存储蛋白质结构数据?()A. GenBankB. Swiss-ProtC. PDBD. KEGG答案:C10. 在生物信息学中,以下哪种数据类型不是高通量数据?()A. 基因表达数据B. 蛋白质组数据C. 代谢组数据D. 单个基因序列答案:D二、填空题(每题2分,共20分)1. 生物信息学是应用__________和__________技术,研究生物大分子结构、功能和相互作用的科学。

答案:计算机;信息技术2. 人类基因组计划完成于__________年。

生物信息学考试试题

生物信息学考试试题

生物信息学考试试题1. 选择题1. DNA序列中哪种碱基与腺嘌呤形成碱基对?A. 腺嘌呤B. 胸腺嘧啶C. 钝甲嘧啶D. 尿嘧啶2. 下列哪种不属于生物信息学中常用的序列比对软件?A. BLASTB. ClustalWC. PhotoshopD. MEGA3. 在生物信息学中,什么是基因组装?A. 把基因组序列和蛋白质序列对应起来B. 把已知的DNA序列分析并组装成完整的基因组C. 把DNA序列和RNA序列对比分析D. 把基因组序列转录为RNA序列4. 下列哪个软件主要用于预测DNA序列中的基因结构?A. BLASTB. ClustalWC. FGENESD. MEGA5. 在生物信息学中,什么是密码子?A. DNA序列中的重复单元B. 氨基酸序列C. tRNA分子上的核苷酸组合D. mRNA上的三联体核苷酸序列2. 简答题1. 请简要解释生物信息学在基因组学中的应用。

2. 什么是序列比对?序列比对的意义是什么?3. 解释基因组装和基因注释在生物信息学中的作用。

4. 生物信息学中常用的两种序列分析方法分别是什么?简要描述它们的原理。

5. 请简要介绍生物信息学在进化比较基因组学中的应用。

3. 计算题1. 给定以下两条序列,求它们的相似度:序列1: ATCGTCCGATT序列2: ATCGACCGTTA2. 已知一个DNA序列长度为1000bp,其中AT含量为60%,求该序列中GC含量百分比。

4. 应用题1. 请利用BLAST软件对一组已知DNA序列进行序列比对,并解释结果。

2. 请使用ClustalW对两个已知蛋白质序列进行多序列比对,并分析比对结果。

3. 选取一个基因组装软件,对一个已知基因组序列进行装配,并解释装配结果。

以上是生物信息学考试试题,希望您认真作答,祝您考试顺利!。

生物信息学应用开发考核试卷

生物信息学应用开发考核试卷
13. ABC
14. ABC
15. ABC
16. ABC
17. ABC
18. ABC
19. ABC
20. ABC
三、填空题
1.计算机科学
2.外显子
3. 24
4.芯片杂交
5.同源建模
6.相关性分析
7. RNA干扰
8.基因电路
9.荧光共振能量转移
10.数据整合
四、判断题
1. √
2. ×
3. ×
4. √
5. ×
1.生物信息学的研究领域包括以下哪些?()
A.基因组学
B.蛋白质组学
C.系统生物学
D.物理学
2.以下哪些是生物信息学中常用的数据库类型?()
A.序列数据库
B.结构数据库
C.功能数据库
D.文献数据库
3.以下哪些工具可以用于基因表达数据分析?()
A. R
B. Python
C. microarray analysis software
8.合成生物学中,【】是一种设计合成基因线路的方法,用于控制细胞行为。
9.【】是一种用于研究蛋白质在细胞中定位和迁移的成像技术。
10.在生物信息学中,【】是指利用计算机算法对生物学数据进行整合、解释和可视化的过程。
四、判断题(本题共10小题,每题1分,共10分,正确的请在答题括号中画√,错误的画×)
A. RNASeq
B. STAR
C. DARNED
D. TopHat
17.以下哪个生物信息学方法用于识别miRNA?()
A. miRBase
B. miRanda
C. TargetScan
D. All of the above

生物信息学试题及答案

生物信息学试题及答案

生物信息学试题及答案一、单项选择题(每题2分,共20分)1. 生物信息学的主要研究对象是()。

A. 生物数据B. 生物实验C. 生物模型D. 生物技术答案:A2. 下列哪项不是生物信息学中的常用数据库()。

A. GenBankB. Swiss-ProtC. PubMedD. Google Scholar答案:D3. 蛋白质序列比对的主要目的是()。

A. 确定蛋白质的三维结构B. 预测蛋白质的功能C. 比较蛋白质的氨基酸序列D. 计算蛋白质的分子量答案:B4. 在生物信息学中,以下哪种算法不是用于序列比对的()。

A. BLASTB. FASTAC. Smith-WatermanD. Hidden Markov Model答案:D5. 下列哪种生物信息学工具主要用于基因表达分析()。

A. ClustalWB. Primer3C. R语言D. PDB答案:C6. 以下哪种技术不是用于蛋白质结构预测的()。

A. 同源建模B. 从头预测C. 序列比对D. 折叠识别答案:C7. 以下哪种生物信息学工具主要用于基因组注释()。

A. BLASTC. GATKD. Primer3答案:B8. 在生物信息学中,以下哪种方法不用于基因表达数据的聚类分析()。

A. K-meansB. Hierarchical clusteringC. Principal component analysisD. Multiple sequence alignment答案:D9. 下列哪种生物信息学工具主要用于蛋白质-蛋白质相互作用网络分析()。

A. STRINGB. BLASTD. Primer3答案:A10. 在生物信息学中,以下哪种数据库不包含蛋白质结构信息()。

A. PDBB. UniProtC. RCSBD. GenBank答案:D二、多项选择题(每题3分,共15分)11. 生物信息学中常用的序列比对工具包括()。

A. BLASTB. FASTAC. ClustalWD. Pfam答案:ABC12. 以下哪些是生物信息学中常用的基因表达分析软件()。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物信息学及应用复习题————————————————————————————————作者: ————————————————————————————————日期:《生物信息学及应用》课程复习题1、生物信息学的基本定义,阐述它的主要研究目标、研究内容及研究方法。

生物信息学:Bioinformatics is the combinationof biology and information technology. It is the branch ofscience that deals with the computer-basedanalysisof largebiological data sets.生物信息学研究的最终目的--揭示蕴藏在DNA和蛋白质氨基酸序列中具有普遍性、真实性的生物遗传本质,掌握复杂的生命现象——生命起源、生物进化以及细胞、器官和个体的发生、发育、病变、衰亡的规律和时空联系.生物信息学的主要研究内容1. 生物信息的收集、存储、管理与提供;2.基因组序列信息的提取和分析;3. 功能基因组相关信息分析;4. 生物大分子结构模拟和药物设计;5. 生物信息分析的技术与方法研究;6.应用与发展研究方面方法:(1)建立生物数据库:核苷酸顺序数据库(GENBANK)、Protein Data Bank(PDB)、氨基酸顺序数据库(SWISS-PRO)、酵母基因组数据库(YEASTS)、美国种质保藏中心(A TCC)、美国专利局数据库(USPO)等;(2)数据库检索:如Blast等;(3)序列分析:序列对位排列、同源比较、进化分析等;(4)统计模型:如隐马尔可夫模型(hidden Markov model, HMM)――基因识别、药物设计;最大似然模型(maximun likelihood model,ML)、最大简约法(Maximun Parsimony, MP)――分子进化分析等;(5)算法:如自动序列拼接、外显子预测和同源比较、遗传算法、人工神经网络(artific ial neural network)等。

2、生物信息学的发展经历了哪几个阶段,生物信息学的研究在生命科学中的意义。

生物信息学从产生至今经历了两个历史时代:前基因组时代,也被称为测序基因组时代后基因组时代,也被称为功能基因组时代第一个阶段是前基因组时代。

这一阶段主要是以各种算法法则的建立、生物数据库的建立以及DNA和蛋白质序列分析为主要工作;第二阶段是基因组时代。

这一阶段以各种基因组计划测序、网络数据库系统的建立和基因寻找为主要工作。

第三阶段是后基因组时代。

这一阶段的主要工作是进行大规模基因组分析、蛋白质组分析以及其他各种基因组学研究。

3、分子生物信息数据库的主要类别,分别举例说明它们的功能。

一级数据库数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释。

二级数据库对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。

分为四类:a)基因组数据库;b)核酸和蛋白质一级结构序列数据库;c)生物大分子(主要是蛋白质)三维空间结构数据库;d)由上述三类数据库和文献资料为基础构建的二次数据库(Secondary database)。

4、简介下列著名的生物信息数据库:GenBank,Swiss-Prot,PDB,PROSITE,人类基因组数据库5、简介NCBI;Entrez 集成于哪个数据库平台?主要功能是什么?在应用中可以访问哪些子数据库(请列举5个以上)?Entrez 是由NCBI主持的一个数据库检索系统,它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。

因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。

6、解释BLAST及其用途,它分为哪些类型?BLAST是目前常用的数据库搜索程序,它是 BasicLocal Alignment SearchTool 的缩写,意为“基本局部相似性比对搜索工具”。

BLAST(Basic Local Alignment Search Tool)是一个基本的序列比对工具,以从数据库中找到与查询序列相似的序列。

BLAST 算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片断,并作为内核向两端延伸,以找出尽可能长的相似序列片段。

7、序列的相似性与同源性有什么区别与联系?如果两个序列有一个共同的进化祖先,那么它们是同源的。

这里不存在同源性的程度问题。

这两条序列之间要么是同源的,要么是不同源的。

所谓同源序列,简单地说,是指从某一共同祖先经趋异进化而形成的不同序列。

同源蛋白质的氨基酸序列具有明显的相似性,这种相似性称为序列同源性。

相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。

相似性本身的含义,并不要求与进化起源是否同一,与亲缘关系的远近、甚至于结构与功能有什么联系。

当相似程度高于50%时,比较容易推测检测序列和目标序列可能是同源序列;而当相似性程度低于20%时,就难以确定或者根本无法确定其是否具有同源性。

8、序列比对原理,在大分子序列分析中,为何局部比对比全局比对更有意义?多序列比对的主要应用。

通过将两个或多个核酸序列或蛋白序列进行比对,显示其中相似的结构域,这是进一步相似性分析的基础。

通过比较未知序列与已知序列的一致性或相似性,可以预测未知序列功能。

局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。

此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。

BLAST和FastA等常用的数据库搜索程序均采用局部相似性比对的方法,具有较快的运行速度,而基于整体相似性比对的数据库搜索程序则需要超级计算机或专用计算机才能实现。

多重序列比对:用于描述一组序列之间的相似性关系,以便了解一个基因家族的基本特征,寻找motif,保守区域等。

用于描述一个同源基因之间的亲缘关系的远近,应用到分子进化分析中。

其他应用,如构建profile,打分矩阵等。

9、假设你得到一段未知基因的DNA序列,从你学习到的生物信息学分析方法和软件,设计一个分析流程来分析该未知基因的功能和家族类别。

基因/蛋白质的功能预测(1)一级序列的比较:相似的序列具有相似的功能同源物的鉴定:不同物种中的直系、旁系同源物的预测主要工具:BLAST(2)保守的功能结构域:保守的功能常用工具:Interpro/Pfam/SMART/PROSITE/ProDom/CDD(3)三级结构的比较:相似的结构具有相似的功能Ubiquitin: 泛素,主要负责蛋白质的降解SUMO:小的类泛素蛋白质,基因转录 &信号通路催化反应通路的分子机制相似序列相似性:不显著!10、试述SWISS-PROT中的数据来源。

已获得编码某个基因的DNA序列,请设计和论述(a)怎样得到其蛋白质序列?(b)如何分析该基因编码的蛋白质序列?数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰位点、特殊位点和区域、二级结构、四级结构、与其他序列的相似性、序列残缺与疾病的关系、序列变异体等信息。

11、研究蛋白质结构有什么意义?为什么要进行蛋白质结构预测?试述蛋白质三维结构预测的三类方法。

同源建模法(Homology)同源蛋白质具有相似的结构和功能根据序列同源性推断目标蛋白的结构折叠识别/穿线法(Threading)根据现有的蛋白质折叠类型来推断目标蛋白的折叠方式从头算预测法(ab initio)从序列到结构根据物理模型进行分子动力学模拟12、基于核酸和蛋白质序列如何研究生物进化?主要步骤是什么?蛋白质序列分析主要内容:(1)蛋白质序列的基本性质分析理化性质分析,疏水性分析,跨膜区分析,信号肽预测,Coil区分析,亚细胞定位(2)序列数据库搜索相似性搜索,模体的搜索(3)结构域定位(4)多序列比对序列比对为解决下列问题提供重要信息:-确定新发现基因的功能;- 确定基因间、蛋白质间乃至物种之间的进化关系;-预测蛋白质的结构和功能:即可以提供结构域相应的信息,蛋白质功能位点的残基、蛋白质亲水性和疏水性的氨基酸残基,从比对结果中得到更多的同源模建或二级结构预测的模板(5)空间结构预测二级结构及三级结构预测,结构预测方法评价1、构建系统进化树。

2、主要步骤如下:A、序列相似性比较。

就是将待研究序列与DNA 或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。

完成这一工作只需要使用两两序列比较算法。

常用的程序包有BLAST、FASTA 等;B、序列同源性分析。

是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。

这是理论分析方法中最关键的一步。

完成这一工作必须使用多序列比较算法。

常用的程序包有CLUSTAL等; C、构建系统进化树。

根据序列同源性分析的结果,重建反映物种间进化关系的进化树。

为完成这一工作已发展了多种软件包,象PYLIP、MEGA等;D、稳定性检验。

为了检验构建好的进化树的可靠性,需要进行统计可靠性检验,通常构建过程要随机地进行成百上千次,只有以大概率(70%以上)出现的分支点才是可靠的。

通用的方法使用Bootstrap算法,相应的软件已包括在构建系统进化树所用的软件包当中。

13、试述基因芯片的工作原理;基因芯片对于生物分子信息检测的作用和意义?14、试述计算机辅助药物设计;什么是分子对接,它依据的原理是什么?计算机辅助药物设计将合理药物设计的思路与方法计算机化,综合和借助多学科的先进技术、方法和成果,为合理药物设计提供了强有力的基本工具和手段。

离开计算机的辅助,合理药物设计是寸步难行的。

分子对接是指受体和配体之间通过能量匹配和空间匹配而相互识别形成分子复合物,并预测复合物结构的操作过程。

分子对接就是配体分子在受体活性部位的定位。

分子对接是研究三维定量构效关系及基于结构的药物设计的一个关键步骤。

分子对接是依据配体与受体作用的“锁-钥原理”,模拟小分子配体与受体生物大分子相互作用。

配体与受体相互作用是分子识别的过程,主要包括静电作用、氢键作用、疏水作用、范德华作用等。

通过计算,可以预测两者间的结合模式和亲和力,从而进行药物的虚拟筛选。

15、简述人类基因组计划与生物信息学之间的相互促进关系。

16、生物信息学分析的数据对象主要有哪几种?这些数据之间存在着什么关系?其研究重点主要落实在核酸和蛋白质两个方面,包括它们的序列、结构和功能。

相关文档
最新文档