生物信息学名词解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.计算生物信息学(Computational Bioinformatics)是生命科学与计算机科学、数理科学、化学等领域相互交叉而形成的一门新兴学科,以生物数据作为研究对象,研究理论模型和计算方法,开发分析工具,进而达到揭示这些数据蕴含的生物学意义的目的。
2.油包水PCR (Emulsion PCR) : 1) DNA片段和捕获磁珠混合; 2) 矿物油和水相的剧烈震荡产生油包水环境; 3) DNA片段在油包水环境中扩增;4) 破油并富集有效扩增磁珠。
3.双碱基编码技术:在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。代表测序方法:solid 测序。
4.焦磷酸测序法:焦磷酸测序技术是由4种酶催化的同一反应体系中的酶级联化学发光反应,适于对已知的短序列的测序分析,其可重复性和精确性能与SangerDNA测序法相媲美,而速度却大大的提高。焦磷酸测序技术不需要凝胶电泳,也不需要对DNA样品进行任何特殊形式的标记和染色,具备同时对大量样品进行测序分析的能力。在单核苷酸多态性、病原微生物快速鉴定、病因学和法医鉴定研究等方面有着越来越广泛的应用。例如:454测序仪
5.tblastn:用蛋白质序列查找核苷酸序列。
6.STS:STS是序列标记位点(sequence-tagged site)的缩写,是指染色体上位置已定的、核苷酸序列已知的、且在基因组中只有一份拷贝的DNA短片断,一般长200bp-500bp。它可用PCR方法加以验证。将不同的STS依照它们在染色体上的位置依次排列构建的图为STS图。在基因组作图和测序研究时,当各个实验室发表其DNA测序数据或构建成的物理图时,可用STS来加以鉴定和验证,并确定这些测序的DNA片段在染色体上的位置;还有利于汇集分析各实验室发表的数据和资料,保证作图和测序的准确性。
7.EST:表达序列标签技术(EST,Expressed Sequence Tags)EST技术直接起源于人类基因组计划。
8.Unigene:生物信息学数据库。UniGene试图通过计算机程序对GeneBank中的序列数据进行适当处理,剔除冗余部分,将同一基因的序列,包括EST序列片段搜集到一起,以便研究基因的转录图谱。UniGene除了包括人的基因外,也包括小鼠、大鼠等其它模式生物的基因。
9.ORF:开放阅读框(ORF,open reading frame )是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。编码一个蛋白质的外显子连接成为一个连续的ORF。
10.分子钟检验:只有分子钟的,没听过分子钟检验。一种关于分子进化的假说,认为两个物种的同源基因之间的差异程度与它们的共同祖先的存在时间(即两者的分歧时间)有一定的数量关系
(一家之言,仅供参考)
1) 什么是生物信息学所谓的基本数据库,你所知的核酸、蛋白质、结构基本数据库有哪些?答:生物信息学中的数据是指生物分子的信息,具体表现为DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功能数据(包括蛋白质功能的定性描述、蛋白质之间的相互作用描述、基因表达数据、代谢路径、调控网络等)。所有类型的数据中,序列与结构是基本的数据,储存这些数据的数据库,就是生物信息学中的基本数据库。
核酸序列数据库:EBI的EMBL数据库、NCBI的GenBank数据库、日本国立遗传学研究所的DDBJ数据。这三者间数据共享,每天更新。
蛋白质数据库:SWISS-PROT蛋白质序列数据库、PDB生物大分子结构数据库、HSSP蛋白质二级结构数据库。
以上这些数据库是全世界分子生物学和医学研究人员获取生物分子的序列、结构和其他信息的基本来源,而且是发表自己序列或结构测定结果的重要媒体。围绕这三大核心数据库还有众多面向各种特定应用的衍生数据库和分析软件,这些数据库分别从不同角度、以不同方式对各类生物信息学数据进行归纳、总结和注释,而各种分析软件为挖掘这些数据提供了有力的工具。
2)什么是生物信息学所谓的二次数据库,你所知的核酸、蛋白质、结构二次数据库有哪些?答:根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释而构建的具有特殊生物学意义和专门用途的数据库就是生物信息学中的二次数据库。
二次数据库种类繁多,以核酸数据库为基础构建的二次数据库有基因调控转录因子数据库TransFac,真核生物启动子数据库EPD,克隆载体数据库Vector,密码子使用表数据库CUTG等。以蛋白质序列数据库为基础构建的二次数据库有蛋白质功能位点数据库Prosite,蛋白质功能位点序列片段数据库Prints,同源蛋白家族数据库Pfam,同源蛋白结构域数据库Blocks。以具有特殊功能的蛋白为基础构建的二次数据库有免疫球蛋白数据库Kabat,蛋白激酶数据库PKinase 等。以三维结构原子坐标为基础构建的数据库如蛋白质二级结构构象参数数据库DSSP,已知空间结构的蛋白质家族数据库FSSP,已知空间结构的蛋白质及其同源蛋白数据库HSSP等。
3)什么是生物信息学所谓的演绎数据库或知识库,你所知道的著名演绎数据库或知识库有哪些,分别解决那些生物学问题?
答:生物信息学中的演绎数据库(Deductive Database)或知识库(Knowledgebase)是指能对已有的生物大分子基本信息进行数据挖掘的数据库,它建立在基本数据库的数据基础之上。
比较著名的演绎数据库(系统)有:
KEGG(京都基因与基因组百科全书),里面包括代谢途径、生物系统功能等级、生物大分子互作等等信息,它可以从基因组及相关分子的信息预测细胞代谢过程与生物行为。
Swiss-Prot,它是一个蛋白质序列数据库,在整合其他数据库信息的基础上以较低的冗余度实现对蛋白质的评注功能,如功能描述、结构域、翻译后修饰、变体等等。
4)什么是生物信息学所谓的文献数据库,你所知道的著名的文献数据库是什么,如何运用文献数据库查找生物科学文献?答:生物信息学中的文献数据库(bibliographic database)含有大量的生命科学领域的文献资料,其来源为各种的杂志及期刊,是生命科学研究者的重要资料库。
其中一个著名的文献数据库是PubMed,其主要信息来源于Medline。PubMed是美国国立医学图书馆中生物医学及生命科学杂志文献的电子文档库,可在NCBI或PMC上通过用关键字及关