《生物信息学》复习提纲

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《生物信息学》主要知识点

一、基本名词和概念

1、bioinformatics 生物信息学,狭义的生物信息学是指将计算机科学和数学应用于生物大分子信息的获

取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的一门

交叉学科。广义上的生物信息学是指运用计算机技术,处理、分析生物学数据,以揭示生物

学数据背后蕴藏的意义的所有知识体系。

2、ORF Open Reading Frame,开放阅读框,是指在给定的阅读框架中,不包含终止密码子的一串

DNA序列

3、CDS Coding sequence,基因的编码区(也叫Coding region),是指DNA或RNA中由外

显子组成,编码蛋白质的部分。

4、UTR Untranslated Regions,即非翻译区,是指mRNA分子两端的非编码片段,包括5'-UTR(或

称“前导序列”)和3'-UTR(或称“尾随序列”)

5、genome 基因组,是指包含在一种生物的单倍体细胞中的全套染色体DNA(部分病毒是RNA)中的

全部遗传信息,包括基因和非编码DNA。

6、proteomics 蛋白质组学,对特定的通路、细胞器、细胞、组织、器官和肌体中包含的所有蛋白质,进

行鉴定、表征和定量,提供关于该系统准确和全面数据的学科。

7、transcriptome 转录组,也称为“转录物组”,广义上指在相同环境(或生理条件)下的一个细胞、组织

或生物体中出现的所有RNA的总和,包括mRNA、rRNA、tRNA及非编码RNA;狭义

上则指细胞所能转录出的所有mRNA。

8、metabonomics 代谢组学,属于系统生物学的一个重要组成部分,效仿基因组学和蛋白质组学的研究思

想,对生物体内所有代谢物进行定量分析,从而研究生命体对外界刺激、病理生理变化、

以及本身基因突变而产生的其体内代谢物水平的多元动态反应。其研究对象大都是相对

分子质量1000以内的小分子物质。

9、functional genomics 功能基因组学,是一门利用结构基因组学研究所得到的各种信息,建立和发展

各种技术和实验模型来测定基因和基因组非编码序列的生物学功能的学科。10、genomic mapping 基因组作图,就是确定界标或基因在构成基因组的每条染色体上的位置,以及同

条染色体上各个界标或基因之间的相对距离。

11、microarray DNA微阵列,又称基因芯片(gene chip),是由大量DNA或寡核苷酸探针密集排列所形

成的探针阵列,其工作的基本原理是通过杂交检测信息。

12、nucleotide 核苷酸,是指核苷(Nucleoside)和磷酸(Phosphate groups)结合的化学物质,包括单

核苷酸(如AMP、CMP等)、寡核苷酸(ADP、ATP、GTP等)和多核苷酸(DNA、RNA

等)。

13、Linux 是一种自由和开放源代码的类UNIX操作系统。

14、Perl Practical Extraction and Report Language,实用报表提取语言,是一种特别擅长处理字符串文

本数据的计算机编程语言,兼具脚本语言和高级语言的特征。

15、alignment 序列比对,或叫联配,是指在两条或多条序列中寻找按照相同次序排布的一连串单字符或

字符模块的过程

16、BLAST basic local alignmeng search tools 同源序列比对工具的一个集合,也是一种两两序列比对

算法的名称

17、phylogeny 系统发生(或系统发育),是指生物形成或进化的历史

18、Orthologs 直系同源指来自于不同物种的由垂直家系(物种形成)进化而来的基因或蛋白,并且典

型的保留与原始基因或蛋白有相同的功能。

19、Paralogs 旁系同源,是指是指同一基因组(或同系物种的基因组)中,由于始祖基因的加倍而横向

(horizontal)产生的几个同源基因。

20、CADD Computer Aided Drug Design 计算机辅助药物设计

21、HMM Hidden Markov model,隐马尔科夫模型,一种用来描述含有隐含未知参数的马尔可夫

过程的统计模型。

22、CpG岛是指哺乳类生物基因组中长度为0.5~4kb的一段富含胞嘧啶(C)、鸟嘌呤(G)及使两者

相连的磷酸酯键(p)成分的DNA序列,几乎都位于基因的启动子区。

二、常用生物信息学软件或在线工具

1. Clustal(或Clustal X)多序列比对软件(X为视窗版,W为命令行版)

2. Phylip 一种命令行格式的分子系统发育分析软件,包含多种算法

3. BioEdit 一种以序列编辑与分析为主的功能比较全面的综合性软件

4. Mega 一种视窗版的序列统计和进化分析的工具包(具备web序列数据库检索和多序列比对功能)

5. Treeview 进化树图形编辑软件

6. RASMOL 三维分子结构显示和分析软件

7. Primer Premier PCR引物设计软件

8. RNAstructure 建立在Turner热力学数据基础上的RNA二级结构预测软件

9. PromoterScan 一个预测分析启动子区域的在线工具

10. CpGPlot 预测CpG岛的在线平台

11. TMHMM 一个在线分析蛋白质跨膜区的工具

12、PSIPED 采用双层反馈神经网络通过对PST-BLAST搜索同源序列来预测蛋白质二级结构的在线工具。

三、常用生物信息学数据库平台及其支撑机构

1、NCBI National Center of Biotechnology Information,美国国立生物技术信息中心,其下建立的

GenBank是世界三大DNA数据库之一。

2、EBI European Bioinformatics Institute 欧洲生物信息研究所,其下的EMBL(European Molecular

Biology Laboratory)数据库是世界三大DNA数据库之一。

3、DDBJ DNA Data Bank of Japan日本DNA数据库

4、AceDB 最初是为秀丽新小杆线虫建立的基因组数据库,现已发展成为一个灵活和通用的数据库管

理系统,可用于包括从细菌、真菌、寄生虫、植物、昆虫、动物到人类的基因组数据库的数

据分析。

5、PDB Protein Data Bank,是一个专门收录蛋白质及核酸等大分子三维结构资料的数据库。

6、KEGG Kyoto Encyclopedia of Genes and Genomes京都基因与基因组百科全书,是一个以基因与分

子网络为特色的一个数据库,帮助研究者了解生物系统(如细胞,生物和生态系统)的高

层次功能,优势在于它所具有的PA THW AY,将各种生化反应以网络图的形式展现。

7、ExPASy Expert Protein Analysis System,蛋白质分析专家系统,是由瑞士生物信息学研究所(Swiss

Institute of Bioinformatics )维护的一个提供从序列到结构以及二维电泳等全套蛋白质组学

相关操作的综合性在线服务平台。

8、CDD The Conserved Domain Database ,NCBI下的蛋白质保守结构域数据库

四、常用分子系统发育分析算法及其工具

相关文档
最新文档