应用于天然产物研究与开发的代谢组学数据库
浅谈代谢组学常用数据库类型
![浅谈代谢组学常用数据库类型](https://img.taocdn.com/s3/m/4573e2000029bd64793e2c46.png)
代谢组是指某一生物或细胞、组织在一特定生理时期内所有的低分子量代谢产物的集合,主要是指分子量小1000 Da的内源性小分子。
根据不同的理化属性可以将代谢组学所包含的物质主要分为氨基酸类(amino acid)、肽类(peptide)、碳水化合物类(carbohydrate)、能量类(energy)、脂类(lipid)、核苷酸(nucleotide)、维生素和辅助因子(cofactors andvitamins)及外源化合物(xenobiotics),面对种类如此繁多复杂的物质,代谢物鉴定成为代谢组学研究的重点,也是目前主要的技术瓶颈。
代谢物的鉴定高度依赖于代谢物标准品库,今天小编就主要介绍下代谢组学常用数据库。
1、HMDBHMDB即人类代谢组数据库于2007年发布,目前是世界上较大、较全面的特定生物体代谢组学数据库。
该数据库包含或链接三种数据:化学数据、临床数据和分子生物学/生物化学数据。
数据库中含有114162个代谢物条目,包括水溶性和脂溶性代谢物,以及被视为丰富(> 1 uM)或相对稀有(<1 nM)的代谢物,涉及25770个代谢途径、18192个代谢反应。
2、METLINMETLIN起源于表征已知代谢物的数据库,目前已扩展为用于鉴定已知和未知代谢物及其他化学实体的技术平台。
该数据库超过一百万个分子,包括脂质、氨基酸、碳水化合物、毒素、小肽和天然产物等。
METLIN的高分辨率串联质谱(MS/MS)数据库来自于标准品及其标记的稳定同位素类似物生成的数据,在鉴定代谢物过程中起着关键作用。
并且METLIN可通过MS/MS数据和片段相似度搜索功能识别未知代谢物。
3、MassBankMassBank,一个高质量质谱数据库,旨在公开分享从代谢物的化学标准品得到的质谱图以方便用户进行代谢物的鉴定。
MassBank包含了代谢物的质谱信息以及采集情况,这些信息来自于不同的质谱仪设置,包括不同的电离技术例如ESI(60%,占总数据量的百分比)、EI(31%)、CI(2%)、APCI(1.6%)以及MALDI。
代谢组学在乳酸菌研究中的应用
![代谢组学在乳酸菌研究中的应用](https://img.taocdn.com/s3/m/feed220054270722192e453610661ed9ad5155ae.png)
代谢组学在乳酸菌研究中的应用杨慧; 步雨珊; 易华西【期刊名称】《《天然产物研究与开发》》【年(卷),期】2019(031)008【总页数】7页(P1474-1479,1349)【关键词】乳酸菌; 代谢组学; 研究; 应用【作者】杨慧; 步雨珊; 易华西【作者单位】中国海洋大学食品科学与工程学院青岛266000【正文语种】中文【中图分类】Q939.97代谢组学(metabolomics)是“组学”科学中的一个新兴领域,也称为代谢物组分析或代谢谱分析[1],涉及到某一生物或细胞在特定时期里的所有低分子量代谢物(<1 500 Da)的定性定量分析[2],这些代谢物包括内源性和外源性小分子化合物,例如肽、氨基酸、核酸、碳水化合物、有机酸、维生素、多酚,生物碱和矿物质等。
代谢组学最初应用于植物科学和毒理学领域[3],近年来也逐渐成为现代食品科学研究的重要工具[4],特别是解决与食品安全、质量和营养相关的问题[4-7]。
随着代谢组学在食品科学中应用的逐渐深入,在乳酸菌发酵过程和功能研究中应用代谢组学也成为一个引人关注的课题[8]。
乳酸菌(lactic acid bacteria,LAB)是一种工业价值极高的兼性厌氧菌,在食品工业中广泛用于发酵乳、肉制品、果蔬加工等,某些物种的乳酸菌可以产生抗微生物剂以用于食品的保藏[9],另外还可用于治疗肠道疾病、作为疫苗抗原的传送载体等[10]。
代谢组学可能成为乳酸菌相关研究的一个有效工具,目前已经在乳酸菌发酵代谢产物、代谢通路与调控以及乳酸菌对人和动物肠道作用的评估等研究方向有了新的进展。
本文综述了代谢组学的研究技术及其在乳酸菌领域的应用,并探讨了目前存在的问题及发展前景。
1 代谢组学分析技术代谢组学分析通常被分类为靶向(特异性)或非靶向性(非选择性或整体性)分析。
靶向分析更专注于一组特定代谢物的鉴定和定量,对于评估某些条件下样品中特定化合物组的作用非常重要,通常需要更高水平的代谢物提取和纯化。
中国天然产物数据库使用方法
![中国天然产物数据库使用方法](https://img.taocdn.com/s3/m/2c9ecb04f6ec4afe04a1b0717fd5360cba1a8df2.png)
中国天然产物数据库使用方法1.引言1.1 概述概述部分的内容可以介绍中国天然产物数据库的背景和重要性。
可以简要介绍一下天然产物的定义和意义,以及中国天然产物数据库作为一个重要的研究工具所起到的作用。
以下是一个示例:概述:天然产物是从自然界中提取的具有药理活性的化学物质,广泛应用于药物研发、农业保健、食品添加剂等领域。
中国作为一个资源丰富的国家,拥有丰富多样的天然产物资源。
为了更好地利用和研究这些宝贵的资源,中国天然产物数据库应运而生。
中国天然产物数据库是一个全面收集和记录中国各地区天然产物信息的数据库。
它包含了大量关于植物、动物和微生物等来源的天然产物的详细信息,包括化学结构、生物活性、药理学特性等。
通过对中国天然产物数据库的使用,研究人员可以快速获取到所需的天然产物信息,进而加速天然产物的发现和开发过程。
中国天然产物数据库的使用方法非常简单和便捷。
用户只需通过网络平台访问数据库,并按照关键词、化合物名称或文献引用等进行搜索,即可获得相关信息。
该数据库还提供了结构搜索、相似性搜索等高级功能,方便用户更精确地定位和获取所需的天然产物信息。
总之,中国天然产物数据库的建立和使用为天然产物研究者和科研人员提供了一个宝贵的资源。
通过利用这个数据库,我们能够更全面地了解和利用中国的天然产物资源,从而推动天然产物研究的发展,为药物开发和其他相关领域的进展做出贡献。
1.2 文章结构文章结构部分的内容可以包括以下内容:文章结构部分旨在介绍本文的整体框架和内容安排,读者可通过该部分获得对文章内容的整体把握。
本文主要分为引言、正文和结论三个部分。
引言部分为文章的开端,包括概述、文章结构和目的三个小节。
在概述部分,将简要介绍中国天然产物数据库(可以提及数据库的来源、建立目的等),并强调其在科学研究和工程实践中的重要性。
文章结构部分将在下文详述。
正文部分是本文的核心内容,主要包括数据库介绍和数据库的使用方法两个小节。
在数据库介绍部分,将对数据库进行详细阐述,包括数据库的特点、数据来源、数据内容、数据库的组织结构等。
lc-ms的应用案例
![lc-ms的应用案例](https://img.taocdn.com/s3/m/a0d9e7e7d05abe23482fb4daa58da0116c171fc9.png)
lc-ms的应用案例LC-MS(液相色谱-质谱联用)是一种常用的分析技术,在许多领域都有广泛的应用。
下面列举了十个液相色谱-质谱联用的应用案例。
1. 药物代谢研究:LC-MS可用于药物代谢研究,通过分析药物在体内的代谢产物,可以了解药物的代谢途径和代谢动力学,为药物研发提供重要参考。
2. 食品安全检测:LC-MS可以用于检测食品中的农药残留、兽药残留、食品添加剂等有害物质。
通过分析样品中的目标物质和其代谢产物,可以评估食品的安全性。
3. 环境分析:LC-MS可用于环境样品中有机污染物的分析,如水体中的有机污染物、大气中的挥发性有机物等。
通过确定目标物质的种类和含量,可以评估环境的污染程度。
4. 蛋白质组学研究:LC-MS在蛋白质组学研究中起到重要作用。
通过分析样品中的蛋白质组成和修饰信息,可以了解蛋白质在生物学过程中的功能和调控机制。
5. 代谢组学研究:LC-MS可用于代谢组学研究,通过分析生物体内的代谢产物,可以了解代谢物的种类和变化规律,为疾病诊断和治疗提供依据。
6. 药物残留检测:LC-MS在药物残留检测中有广泛应用。
通过分析样品中的目标物质和其代谢产物,可以准确测定药物的残留水平,保障药品的安全使用。
7. 生物样品分析:LC-MS可用于生物样品中目标化合物的定量分析,如血液、尿液、组织等。
通过分析样品中的目标物质和其代谢产物,可以了解生物样品的化学组成和代谢过程。
8. 天然产物分析:LC-MS在天然产物研究中有重要应用。
通过分析植物、动物等样品中的天然产物,可以鉴定和定量目标化合物,为天然产物的开发和利用提供科学依据。
9. 肽段分析:LC-MS可以用于肽段的分析和鉴定。
通过分析样品中的肽段组成和序列,可以了解肽段的结构和功能,为肽药物的研发和应用提供基础数据。
10. 新药研发:LC-MS在新药研发中有重要应用。
通过分析药物的质谱信息和代谢产物,可以了解药物的药代动力学、药效学和毒理学特性,为新药研发提供支持。
代谢组学 天然产物
![代谢组学 天然产物](https://img.taocdn.com/s3/m/38b253816037ee06eff9aef8941ea76e59fa4a55.png)
代谢组学天然产物1.引言1.1 概述代谢组学是一门研究生物体内代谢产物及其相关变化的领域,是系统生物学和代谢物组学的重要组成部分。
随着科技的进步和技术的不断完善,代谢组学在生物医学领域的应用越来越广泛。
代谢组学的研究对象主要包括生物体内代谢产物的种类、含量和变化规律,通过对这些信息的收集和分析,可以揭示代谢通路的调控机制以及相关疾病的发生机制。
代谢组学的研究手段主要包括质谱分析、核磁共振技术等高通量的分析方法。
这些高通量的分析手段可以快速地获取大量的代谢数据,为代谢组学的研究提供了强有力的工具。
天然产物是指生物体内自然存在的具有药理活性的化合物,广泛存在于植物、动物和微生物体内。
天然产物在药物研发、新药开发和生物技术研究领域具有重要的地位。
天然产物不仅具有多样的结构类型,还具有丰富的药理活性和生物活性。
因此,天然产物在代谢组学研究中具有重要的作用。
代谢组学与天然产物研究相结合,能够揭示生物体内代谢物的起源、转化途径以及与疾病相关的代谢异常。
通过对代谢组学数据和天然产物的综合分析,可以发现新的药物靶标、药物作用机制,为药物研发和新药发现提供新的途径和思路。
同时,代谢组学的应用也能够为天然产物的研究和开发提供重要的参考和依据。
总之,代谢组学在研究生物体代谢产物及其变化的过程中具有重要的意义,而天然产物是代谢组学研究中的重要研究对象。
代谢组学与天然产物的结合将为药物研发、疾病诊断和治疗等领域带来新的突破和进展。
相信随着科学技术的不断进步,代谢组学和天然产物研究必将在未来取得更加重要的成果。
1.2 文章结构文章结构部分的内容如下:本文分为引言、正文和结论三部分。
引言部分主要概述代谢组学和天然产物的背景和意义,并介绍了本文的结构和目的。
正文部分分为两个小节,分别讨论了代谢组学的概念和原理,以及天然产物在代谢组学中的重要性。
结论部分则对代谢组学与天然产物研究的前景进行展望,并对全文进行总结。
在引言部分,我们将首先概述代谢组学和天然产物的概念及其在科学研究和医学领域的重要性。
天然产物的生物合成与代谢途径研究
![天然产物的生物合成与代谢途径研究](https://img.taocdn.com/s3/m/e1a6b8e7a48da0116c175f0e7cd184254b351b97.png)
天然产物的生物合成与代谢途径研究天然产物在医学、化工、农业等领域有着广泛的应用和十分重要的地位。
而天然产物的生物合成和代谢途径的研究,对于人们更好地利用和生产这些物质具有十分重要的意义。
天然产物的生物合成主要是生物化学过程,在生物体内通过酶催化作用进行的。
生物合成的过程中,涉及到了大量的基因、酶和代谢途径,其中任何一个环节出现问题都可能导致后续的合成难以进行。
因此,对于天然产物的生物合成过程进行深入研究,有助于探究这些物质的生成和代谢规律,并对有关生物体和生物环境的研究提供帮助。
天然产物的代谢途径是指生物体中天然产物的分解和代谢过程。
这个过程同样也是基于生物化学过程进行的。
生物体内的代谢途径对于天然产物的吸收率和代谢能力有着非常重要的作用。
比如,人们对某些天然产物的吸收和消耗能力可能受到遗传因素的影响,因此了解这些天然产物的代谢途径有助于在医疗、健康、营养等方面提供更好的指导。
从分子结构的角度看,天然产物的生物合成和代谢途径的研究涉及到了化学和生物学两个领域。
在化学领域,主要是通过化学结构的研究来了解所研究的天然产物的合成和代谢规律。
在这个领域里,物质的结构解析和结构功能的研究是非常关键的。
物质的结构解析需要利用分析方法和仪器,比如常用的核磁共振技术、质谱分析技术等。
结构功能的研究则需要通过结构分析、分子动力学模拟等手段来探究结构与功能之间的关系。
在生物学领域里,主要是通过对生物体内基因、酶、代谢途径等方面的研究来揭示天然产物的生物合成和代谢规律。
在这个领域中,基因工程技术、蛋白质工程技术和代谢组学等技术的应用非常广泛。
比如,利用基因工程技术或蛋白质工程技术,可以增强某些酶的活性,从而提高天然产物的生产效率。
代谢组学则是利用高通量测定技术对生物体内代谢产物进行定性和定量分析,进而了解调控代谢途径的重要基因和酶的功能。
最近几年,人们对天然产物的生物合成和代谢途径的研究越来越重视。
这主要是因为新的研究技术的不断涌现,为探究这些途径提供了新的手段。
植物代谢组学数据分析和数据库
![植物代谢组学数据分析和数据库](https://img.taocdn.com/s3/m/adda4b06842458fb770bf78a6529647d27283406.png)
植物代谢组学数据分析和数据库 的方法与数据分析过程
植物代谢组学数据分析和数据库的方法主要包括实验设计、样品采集、数据 处理和数据分析等步骤。实验设计需根据研究目的来确定,如对植物不同组织或 不同生长条件下的代谢物进行比较。样品采集则需要选择合适的采样时间、采样 部位等。数据处理包括数据清洗、预处理和标准化等,以保证数据的准确性和可 靠性。数据分析则需要对处理后的数据进行深入挖掘,如聚类分析、主成分分析 等,以发现数据中的规律和特征。
1、高灵敏度和高分辨率的检测技术:提高检测技术的灵敏度和分辨率,有 助于发现更多微量的活性成分,揭示药用植物的复杂化学成分。
2、数据库的建立和完善:通过建立和完善药用植物代谢组学的数据库,将 有助于进行数据挖掘和模式识别,提高研究的效率和精度。
3、机制研究:进一步深入研究药用植物的作用机理,有助于发现新的药物 靶点,为药物设计和优化提供更多帮助。
4、植物代谢组学的应用:除了药物研究外,植物代谢组学还可以应用于植 物保护、农业生物技术等领域,为这些领域的研究和实践提供新的工具和方法。
感谢观看
对于植物代谢组学数据分析和数据库的结果,需要结合实际应用场景进行深 入讨论。例如,在植物生长方面,通过分析不同品种植物的代谢物组成差异,可 以为育种提供新的思路和方法。在环境响应方面,了解植物在不同环境条件下的 代谢物变化规律,有助于采取有效的农业管理措施来提高植物的适应性和产量。
植物代谢组学数据分析和数据库 的结论与未来发展
除了测定药物成分外,代谢组学还可以用于研究药物的作用机理。例如,利 用代谢组学技术可以研究中药是如何影响机体代谢过程的。通过对比服药前后机 体的代谢物变化,可以揭示药物的作用靶点和机制,为药物设计和优化提供理论 依据。
四、展望未来
natural product reasearch的参考文献
![natural product reasearch的参考文献](https://img.taocdn.com/s3/m/02c48b57c950ad02de80d4d8d15abe23482f03d3.png)
natural product reasearch的参考文献Natural products research to the constituent components of animals, plants, insects, marine organisms and microorganisms or their metabolites, as well as many endogenous chemical components in humans and animals, collectively referred to as natural products, which mainly include proteins, peptides, amino acids, antibiotics and other naturally occurring chemical components.Recent advances in the study of natural products, historically, natural products have played a key role in drug discovery, including cancer and infectious diseases, cardiovascular disease and multiple sclerosis, compared to traditional synthetic molecules, natural products have special characteristics, which bring advantages and challenges to the drug discovery process.Natural products have scaffold diversity and structural complexity. They typically have higher molecular weights, more carbon and oxygen atoms, but fewer nitrogen and halogen atoms, more H bond receptors and donors, lower computational octanol-water partition coefficients, and greater molecular rigidity. Overall, the pool enriches"biologically active" compounds that cover a wider chemical space compared to typical synthetic small molecule libraries.Despite these advantages and multiple examples of successful drug discovery, several drawbacks of natural products have led pharmaceutical companies to reduce drug discovery programs based on natural products, such as natural product screening, which often involves extract libraries of natural sources, which may not be compatible with traditional target-based assays.Classic drug research based on pharmaceutical research begins with biological screening of "coarse" extracts to identify a biologically active extract, further fractionation to isolate active natural products, and metabolomics is developed as a method for simultaneously analyzing multiple metabolites in biological samples. Advances in analytical instrumentation used in research, coupled with computational methods that can produce reasonable analog structures and their respective simulated spectra, have also enabled the application of "omics" methods such as metabolomics in drug discovery-based.翻译:天然产物是指动物、植物、昆虫、海洋生物和微生物体内的组成成分或其代谢产物以及人和动物体内许许多多内源性的化学成分统称作天然产物,其中主要包括蛋白质、多肽、氨基酸、抗生素类等天然存在的化学成分。
29个大豆品种代谢组学分析及植物分子特征数据库的建立的开题报告
![29个大豆品种代谢组学分析及植物分子特征数据库的建立的开题报告](https://img.taocdn.com/s3/m/14369840bfd5b9f3f90f76c66137ee06eff94e3d.png)
29个大豆品种代谢组学分析及植物分子特征数据库的建立的开题报告一、研究背景大豆作为全球第一大粮食作物和最主要的植物蛋白来源,具有重要的经济和社会价值。
然而,大豆种质资源的多样性和遗传特性的研究还相对滞后,因此需要进行深入的研究,以深入了解大豆的遗传特性和代谢调控机制。
代谢组学研究是一种高通量的技术,可以系统地研究生物体内代谢物的变化规律,从而掌握其代谢调控机制。
通过代谢组学技术研究大豆代谢物谱系,不仅有利于深入了解大豆代谢调节机制,还能有效促进大豆的育种和生产。
二、研究目的本研究旨在对29个不同大豆品种进行代谢组学分析,建立大豆植物分子特征数据库,探究大豆代谢物水平的基因调节和遗传变异规律,为大豆的育种和生产提供有力的理论和实验基础。
三、研究内容1. 29个大豆品种的代谢组学分析将29个大豆品种进行代谢物谱系分析,通过代谢指纹图谱综合分析,挖掘出大豆品种之间的代谢差异,找出关键代谢物,建立大豆代谢通路图,并进行系统分析和比较。
2. 大豆植物分子特征数据库的建立筛选关键代谢物和基因,进行数据库建设,收录大豆代谢通路和代谢物信息,并整合大豆基因组、转录组和蛋白质组等多维度数据,在数据库中进行生物信息学分析,为大豆育种和生产提供理论依据。
3.大豆品种的遗传多样性分析基于代谢物数据进行品种遗传多样性分析,探究大豆代谢路径上的遗传变异规律,筛选出与代谢物水平相关的遗传位点和遗传基因,分析其调控机制,为大豆新品种选育提供科学依据。
四、研究意义本研究将系统地分析大豆代谢物谱系,建立大豆植物分子特征数据库,揭示大豆代谢调节机制和其遗传变异规律,为大豆产业提供重要的理论和实验基础,推动大豆产业的发展,为人民生活提供更好的保障。
生物大数据技术中的代谢物组学分析工具推荐
![生物大数据技术中的代谢物组学分析工具推荐](https://img.taocdn.com/s3/m/9edbc45ea9114431b90d6c85ec3a87c241288a4d.png)
生物大数据技术中的代谢物组学分析工具推荐在生物大数据技术领域,代谢物组学分析工具的选择对于研究人员来说至关重要。
代谢物组学是一种研究生物体内代谢产物的定性和定量分析方法,为研究人员提供了对生物体内代谢反应和代谢途径的深入了解。
在这篇文章中,我将介绍几种常用的代谢物组学分析工具,并分析它们的优缺点,以帮助研究人员选择适合自己研究需求的工具。
1. XCMSXCMS是一种广泛应用的代谢物组学分析软件工具。
它使用无偏差的质谱法进行代谢产物的分析和定量测定。
XCMS可用于对生物样本进行质谱图图像的处理、峰识别、峰对齐和统计分析。
优点之一是XCMS具有强大的数据处理能力,能够处理大规模的数据集。
此外,XCMS还具有用户友好的界面和丰富的功能模块,适用于初学者和经验丰富的研究人员。
2. MetaboAnalystMetaboAnalyst是一款功能强大的在线代谢物组学分析工具。
它提供了一套完整的分析流程,包括数据处理、统计分析、代谢途径分析和生物标志物鉴定等。
MetaboAnalyst支持多种常见的代谢物组学数据格式,并提供了多种统计方法和可视化工具。
此外,MetaboAnalyst还具有可视化和报告生成功能,可帮助研究人员直观地展示和解释结果。
3. MZmineMZmine是一款开源的代谢物组学数据处理软件。
它提供了一系列功能强大的工具用于数据处理、特征提取、峰识别、峰对齐和统计分析等。
优点之一是MZmine具有相对较低的误报率和误识别率。
此外,MZmine还支持多种数据格式的导入和导出,方便与其他分析工具进行集成使用。
4. MetFragMetFrag是一种专门用于代谢物结构鉴定的工具。
它使用质谱数据和代谢物数据库,通过结合不同的鉴定算法,帮助研究人员确定分子的化学结构。
MetFrag具有高度的准确性和灵敏度,并且在代谢物结构预测领域取得了良好的效果。
然而,MetFrag在处理大规模的代谢物组学数据上的效率相对较低。
国外代谢组学数据库的简介
![国外代谢组学数据库的简介](https://img.taocdn.com/s3/m/392e1d0a6bd97f192279e93c.png)
国外代谢组学常见数据库列表和简介李克峰博士背景介绍新一代的代谢组学 (Next-Generation Metabolomics),在全世界范围内都是刚刚兴起。
随着仪器分析工具的迅猛发展,代谢组学的研究也逐年增多,成为后基因组学时代,系统生物学的主要研究手段之一。
代谢组分析产生了大量的生物信息数据(Big Data) 。
代谢数据库的开发对于归纳总结这些大数据、方便后续的代谢组学数据分析、揭示隐藏在大数据背后的生物学机理具有十分重要的作用。
本文归纳总结了代谢组学研究和分析检测常用的一些国外的代谢组学数据库,为从事代谢组学研究和应用方面工作的科研人员提供方便。
[1] Human Metabolome Database (人类代谢组数据库)简介和特点:Human Metabolome Database (HMDB) 数据库是由加拿大代谢组学创新中心[The Metabolomics Innovation Centre (TMIC)] 于2007年创立的代谢组学综合数据库。
网站主要收录人体内源性代谢产物,包括化合物简介、化学式、分子量、化学分类、化学性质、代谢通路、部分代谢产物的浓度,部分MS/MS图谱等。
该数据库目前化合物名字搜索、分子量搜索、分子结构搜索, MS/MS 搜索。
该数据库的主要缺点:目前不支持批量搜索,仅限于单个代谢产物搜索,搜索效率较低。
不支持代谢通路搜索、代谢化合物浓度搜索等。
[2] Metlin (Scripps Center for Metabolomics)简介和特点:Metlin数据库,是由The Scripps Institute Gary Siuzdak组创立,主要侧重用于非靶向代谢组学(Non-targeted Metabolomics) 代谢产物鉴定用。
网站的主要特征是具有大量的代谢产物的MS/MS图谱,而且每个化合物物都有不同的碰撞能图谱,可以清晰的找到代谢产物的碎片离子。
代谢组研究中GC-MS和LC-MS数据的区别
![代谢组研究中GC-MS和LC-MS数据的区别](https://img.taocdn.com/s3/m/d4b437a2a6c30c2258019e4e.png)
在代谢组学研究中,GC-MS和LC-MS是两种比较常用的检测平台,Web of Science 的数据显示,LC-MS是目前主要的代谢组学分析平台。
目前医学代谢组学的研究大多集中在临床医学、药理分析领域,而其试验样本大多为人体尿液、血浆、细胞、组织等,这些样本中的代谢物大都能较好地电离。
LC-MS灵敏度较高,能分离上千种小分子代谢物,检测限为ppb(即十亿分之一),可用于痕量分析。
GC-MS 在代谢组学的研究中除了作为靶向性物质的分析,亦或作为LC-MS非靶向性代谢组学的热稳定化合物的一种补充。
两者因为流动相和检测原理的差别,从而得到的数据也是有一定区别的。
下面我们将从数据库、离子源、数据形式、分析物质类型等几个方面简述其相互的差别。
1.数据库1.1 LC-MS除了自建的数据库之外,进行代谢组学研究的常用数据库有METLIN、MassBank、mzCloud等数据库。
METLIN数据库是由美国斯克里普斯研究院开发的,是一个非常全面的质谱和二级质谱数据库[1],这些二级质谱数据是在多个QTOF质谱检测平台得到的,比如SCIEX、Agilent、Waters,其中包含了在不同的碰撞能、正负离子模式下得到的二级谱图。
MassBank是一个网络开放的数据库,旨在公开分享从代谢物的化学标准品得到的质谱图以方便用户进行代谢物的鉴定。
MassBank包含了代谢物的质谱信息以及采集情况,这些信息来自于不同的质谱仪设置,包括不同的电离技术例如ESI、EI、CI、APCI以及MALDI;同时还有来自于不同仪器厂商生产的高分辨(Q-TOF、Orbitrap)和低分辨的质谱仪(QQQ,Q-trap)采集的信息。
MassBank 显著的一个特征就是它使用的被称为“合并谱图(merged spectra)”的信息,即人为地将来自于相同代谢物但是不同碰撞能量或者不同的碎裂方式的碎片离子合并为一张质谱图[2]。
mzCloud总共有1.7w个化合物(农学、内源性、食品等多领域综合性数据库),具有二级图谱的1w+(不分物种),其中3000+个属于内源性化合物;具有标准品的化合物有1w+,主要以自己平台创建。
代谢组学方法及其研究进展(re)
![代谢组学方法及其研究进展(re)](https://img.taocdn.com/s3/m/ab589e40cd1755270722192e453610661ed95abd.png)
广泛应用的滤噪技术是正交信号校正技术(orthogonal signal correction , OSC) 。与普通的谱图滤噪技术不同,OSC 滤掉与类别判断 正交(不相关) 的变量信息,只保留与类别判断有关的变量,从而使类别判别 分析能集中在这些与类别的判别相关的变量上,提高了判别的准确性。
样品制备
代谢产物的分 离、检测、鉴定
数据分析 与模型建立
代谢组学的研究方法
研究对象
单个细胞或细胞类 对生物体液和组织进行系统测量和分
型中所有的小分子 析,研究完整的生物体中代谢物随时
成分和波动规律
间改变的情况,确定生物标志物
样品制备方法
根据不同的分析方法
采取不同的样品制备方法
代谢产物分离、 检测与鉴定方法
代谢组学的应用(5)
(5)疾病诊断和发病机理探讨:
➢ 诊断先天性疾病 以往主要依赖酶学检测,但耗时、耗力,检出率低。如多 种羧酶缺陷病,常规酶学检查不仅阳性率低,而且不能辨别治疗后微量酶变 化。GC /MS分辨率高,NMR检测不需要样品准备、提纯等预处理,用于疾病 筛查方便、快捷。如利用NMR 技术分析患者尿液中尿黑酸的量,可以用来筛 查尿黑酸病这种常染色体隐性遗传性代谢性疾病;检查羊水中3-羟基异戊酸 和甲基枸橼酸可适用于产前筛查。
什么是代谢组学?
“代谢组学” = “代谢” + “组 学”
基因组学 genomics
DNA
转录组学 transcriptomics
mRNA
蛋白质组学 proteomics
Pr
代谢组学
研究一个细胞、组织或器官中,所有……的一门科学!
干货分享代谢组学常用数据库特点总结
![干货分享代谢组学常用数据库特点总结](https://img.taocdn.com/s3/m/6fcb379b6aec0975f46527d3240c844769eaa0c9.png)
⼲货分享代谢组学常⽤数据库特点总结上期我们简要介绍了代谢组学常⽤数据库。
本期将详细介绍每个数据库特点。
HMDB(www.hmdb.ca)HMDB由加拿⼤⼈类代谢组计划(Human Metabolome Project, HMP)发起,并于2007年发布⾸个代谢组草图。
⽬前最新版本HMDB4.0包含114100代谢物、5498条疾病链接、3840 NMR实验图谱、22198 MS/MS实验质谱图和7418 GC-MS实验质谱图。
另有⼏千到数万个代谢物预测的NMR或MS谱图。
相较于以前版本,4.0版新增了6777个代谢物—SNP互作关系,2497个代谢物—药物互作关系和18192个代谢反应。
此外,HMDB⽀持多种搜索⽅式,包括化合物名字搜索、分⼦量搜索、分⼦结构搜索和⼆级质谱搜索。
但该库⽬前不⽀持批量搜索,仅限于单个代谢物搜索,搜索效率较低。
另外,该库也不⽀持代谢通路搜索、代谢化合物浓度搜索等功能。
HMDB是当前世界上最完整且最全⾯的⼈类代谢物和⼈类代谢数据精选收集。
我国科学家对该库的完善也有⼀定贡献。
KEGG(https://www.kegg.jp)KEGG是基因组破译⽅⾯的数据库,其第⼀版于1995年上线,当时仅包含Pathway、Genes、Compound和Enzyme四个部分。
⽬前KEGG已包含18个部分,17268种代谢物和460条通路,整合了基因组、化学、系统功能和健康信息。
将已经完整测序的基因组中得到的基因⽬录与更⾼级别的细胞、物种和⽣态系统⽔平的系统功能进⾏关联是KEGG数据库的特⾊之⼀。
与其他数据库相⽐,KEGG 的⼀个显著特点就是具有强⼤的图形功能,它利⽤图形⽽不是繁缛的⽂字来介绍众多的代谢途径以及各途径之间的关系,使研究者能够对其所要研究的代谢途径有⼀个直观全⾯的了解。
Metlin(https://)Metabolite Link (Metlin)数据库由The Scripps Institute Gary Siuzdak组于2003年创建,2005年对公众开放,主要侧重⽤于液质⾮靶向代谢组学(Non-targeted Metabolomics)代谢物鉴定领域,⽬前包括超百万种⼩分⼦物质,超431000个⾼分辨率MS/MS质谱图。
化工人员必备 化学数据库大全
![化工人员必备 化学数据库大全](https://img.taocdn.com/s3/m/fa3b86905122aaea998fcc22bcd126fff7055d86.png)
化工人员必备 - 化学数据库大全简介化工领域是一个复杂且广泛的领域,化学工作者在实验、研发、生产等方面都需要具备丰富的化学知识。
为了提高工作效率和准确性,化学数据库成为化工人员必备的重要工具之一。
本文将介绍一些常用的化学数据库,并分析其特点和应用场景。
1. 化学物质数据库1.1 PubChemPubChem是一个由美国国立卫生研究院(NIH)开发和维护的免费、开放的化学物质数据库。
它收集了全球范围内上百个机构和实验室提供的几千万个化合物的数据,包括化合物的结构、性质、活性信息等。
化工人员可以通过PubChem查询特定化合物的基本信息和相关文献,并可以下载大量的化学结构文件。
PubChem提供了用户友好的网页界面和RESTful API,方便用户进行数据检索和集成。
1.2 ChemSpiderChemSpider是由皇家化学学会(RSC)开发的一个免费的在线化学物质数据库。
它收集了全球范围内众多出版物、实验室和专利提供的大量化合物的数据,包括化合物的结构、物理化学性质、活性等。
ChemSpider可以通过化合物的分子式、结构式等进行快速搜索,并提供了详细的化学信息和相关文献。
此外,ChemSpider还提供了自动化合物结构匹配、光谱解析等高级功能,方便化工人员进行更深入的研究。
1.3 Chemical Abstracts Service (CAS)CAS是一个全球领先的化学信息公司,其化学物质数据库是全球公认的最全面、最权威的化学数据库之一。
CAS收集了全球范围内数千家机构提供的大量化合物的数据,提供了化合物的标识号、结构、性质、合成方法等详细信息。
化工人员可以通过CAS号或关键词进行快速搜索,获取所需的化学信息。
此外,CAS还提供了化学文献数据库和化学专利数据库,方便用户进行文献查阅和专利分析。
2. 反应数据库2.1 ReaxysReaxys是由RELX集团旗下的Elsevier公司开发的一个综合性化学反应数据库。
gnps的mn操作
![gnps的mn操作](https://img.taocdn.com/s3/m/1fdf45765b8102d276a20029bd64783e09127daf.png)
gnps的mn操作GNPS是一个用于质谱数据分析和共享的在线平台,它提供了一系列的工具和数据库,帮助研究人员解析和比较质谱数据。
其中,MN操作是GNPS平台中的一个功能,用于进行网络分析。
MN操作是基于质谱数据构建分子网络的过程。
它通过计算质谱数据中的相似性,将相似的质谱谱图连接在一起,形成一个网络。
这个网络可以帮助研究人员发现样品中的化合物之间的关系,以及发现可能存在的未知化合物。
MN操作的具体步骤如下:1. 数据预处理,首先,质谱数据需要进行预处理,包括峰提取、峰对齐和去噪等步骤,以确保数据的质量和一致性。
2. 相似性计算,接下来,对预处理后的质谱数据进行相似性计算。
常用的相似性计算方法包括基于峰的相似性计算和基于谱图的相似性计算。
这些计算方法可以衡量两个质谱谱图之间的相似程度。
3. 构建网络,根据相似性计算结果,将相似的质谱谱图连接在一起,形成一个分子网络。
网络中的节点代表质谱谱图,边表示相似性。
4. 网络分析,对构建的分子网络进行分析。
可以使用各种网络分析算法和工具来探索网络的拓扑结构、发现群集和子结构等信息。
这些分析可以帮助研究人员理解样品中化合物的相互作用和结构。
通过MN操作,研究人员可以更好地理解质谱数据中的化合物之间的关系,并发现潜在的生物活性化合物或未知化合物。
这对于天然产物研究、药物发现和代谢组学等领域具有重要意义。
总结起来,GNPS平台中的MN操作是一种基于质谱数据的网络分析方法,通过计算质谱谱图之间的相似性,构建分子网络,帮助研究人员揭示样品中化合物之间的关系。
这一操作可以为化学生物学和药物研发等领域的研究提供有价值的信息。
代谢通路数据库汇总
![代谢通路数据库汇总](https://img.taocdn.com/s3/m/57c91b77571252d380eb6294dd88d0d233d43c6f.png)
代谢通路数据库汇总严格来讲,某些人会认为通路实际上是不存在的,更有甚者开玩笑说其实只有网络存在。
但无论怎样,通路的存在是有意义的。
生物通路可以直观的向我们展示生物学过程中的无数种相互作用。
举个例子说,只需要几个标志符号、几条线和几个箭头,一个典型常见的通路可以表现受体结合的活动、蛋白质复合物、磷酸化反应、易位与转录调控。
即使通路图看上去有时候像是涂鸦之作,但是通路图在生物学领域中的文献和日常研究工具箱中已经是必不可少的基本工具。
分析所用的计算方法用到了这些通路工具的话,科研人员可以将通路与生物学注释与实验数据库连接到一起,从而形成系统生物学的一种有效工具。
但是通路信息的收集和维护道路还很漫长。
今天为大家汇总的代谢通路数据库均从相关网站搜集,鉴于国内很少有相关方面中文资料的介绍,因此大部分的文字都是查阅维基百科和相应数据库网站翻译过来的,可能会存在某些翻译不到位的地方,还请看出端倪的朋友在文章底部留言指正,小编会深表感激。
另外,如果还有遗漏的通路数据库请留言补充。
SMPDB/SMPDB为“小分子通路数据库(The Small Molecule Pathway Database)”的缩写,它是一个互动性较强且具有数据可视化的数据资源库,含有超过618种发现于人体中的小分子通路。
其中70%的通路(超过433条)为该数据独有,在其他数据库中无法找到。
这些通路包括代谢、药物以及疾病通路。
SMPDB设计创建的初衷是为了满足并支持代谢组学、转录组学、蛋白质组学和系统生物学中的通路鉴定与通路发现。
还有部分数据提供了有关人类代谢通路、代谢疾病通路、代谢物信号通路和药物作用通路的超级精美的超链接图表。
所有的SMPDB通路包括了有关器官、亚细胞、蛋白质复合物的辅助因子、蛋白复合物的位置、代谢物的位置、化学结构和蛋白质复合物的四级结构信息。
每一个小分子有相应的链接,点击后可以弹出关于该小分子的详细内容。
所有的SMPDB通路都伴有详细的描述和参考资料,每张图表上都有通路预览图、条件或过程概述。
生物信息学应用于天然产物研究
![生物信息学应用于天然产物研究](https://img.taocdn.com/s3/m/c8992f86a0c7aa00b52acfc789eb172dec639961.png)
生物信息学应用于天然产物研究随着人们对自然界的认识不断加深,越来越多的天然产物被发现并应用于药物、食品、化妆品等多个领域。
然而,天然产物的研究和开发对实验室的设备、技术和人力等方面的要求较高,成本较大。
如何更加高效地研究天然产物,实现其在人类生活中的价值,成为当前科研工作者需要解决的问题。
生物信息学是一门新兴的学科,它的发展给天然产物研究带来了新的思路和方法。
一、生物信息学在天然产物研究中的应用生物信息学是生命科学与信息科学交叉的学科,包括了生物数据获取、存储、处理和分析等多个方面。
在天然产物研究中,生物信息学主要应用在以下几个方面:1. 基因组学基因组学是生物信息学的一个研究领域,主要研究DNA序列、基因组结构及其功能等方面。
在天然产物研究中,基因组学的应用可以帮助研究人员分析植物、菌类等天然产物的基因组结构及其编码的生物活性成分,进一步发掘其潜在的化合物与药物功能。
2. 转录组学转录组学主要研究在不同生理状态下,基因的表达水平及其变化。
在天然产物研究中,转录组学的应用可以帮助研究人员分析植物、菌类等生物体在不同生长、发育、环境等条件下的转录组组成,以及其编码的生物活性成分的表达水平变化,有助于研究人员进一步探索天然产物的生物合成途径和调控机制。
3. 蛋白质组学蛋白质组学主要研究细胞或组织中的蛋白质种类、数量及其功能等方面。
在天然产物研究中,蛋白质组学的应用可以帮助研究人员发现与天然产物生物合成相关的酶类,进一步推动天然产物的生产与优化。
4. 代谢组学代谢组学主要研究生物体中代谢物的种类、数量及其代谢通路等方面。
在天然产物研究中,代谢组学的应用可以帮助研究人员分析植物、菌类等生物体中生物活性成分的代谢途径,以及生物体在不同环境下的代谢物组成的变化,为天然产物的发掘与开发提供理论基础。
二、案例分析下面以三个案例分析生物信息学在天然产物研究中的应用。
1.天然产物-腐壳酸的基因组与转录组分析研究人员利用长春花属植物腐壳树提取、纯化腐壳酸,并对其进行基因组与转录组分析。
metabolomics workbench data repository
![metabolomics workbench data repository](https://img.taocdn.com/s3/m/52ed45af988fcc22bcd126fff705cc1754275f45.png)
metabolomics workbench data repository Metabolomics Workbench是一个用于代谢组学研究的数据库和工具集。
它提供了一个集中的数据存储和共享平台,用于存储、分析、注释和可视化代谢组学数据。
Metabolomics Workbench的数据存储库(Data Repository)是一个专门用于存储代谢组学数据的平台。
它可以存储各种类型的代谢组学数据,包括质谱(MS)和核磁共振谱(NMR)等。
此外,该数据存储库还提供了多种工具,用于数据的管理、查询、分析和可视化。
该数据存储库的一个重要特点是它支持各种数据格式,包括原始数据、注释数据和可视化数据等。
这使得研究人员可以轻松地导入、导出和共享数据,从而促进了代谢组学领域的数据共享和合作。
总的来说,Metabolomics Workbench的数据存储库为代谢组学研究提供了一个强大的数据管理工具,促进了数据共享和合作,有助于推动代谢组学领域的发展。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
化学分析计量CHEMICAL ANALYSIS AND METERAGE第28卷,第5期2019年9月V ol. 28,No. 5Sept. 2019128doi :10.3969/j.issn.1008–6145.2019.05.030应用于天然产物研究与开发的代谢组学数据库张柳,王丽瑶,张凯雪,魏冠华,杨志刚(兰州大学药学院,兰州 730000)摘要 代谢组学在对生物体系的小分子代谢物进行定性和定量研究中产生了大量的数据,成为天然产物研究和开发的重要工具。
一系列公开、方便且注释良好的代谢组学数据库和全功能软件的开发促进了天然产物大数据的集成、处理和解释,这不仅有利于数据的存储、管理和分析,还可作为信息共享联动的平台。
基于质谱的代谢组学数据库的建立对于天然产物已知成分筛选、未知成分鉴定起着十分重要的作用。
对国内外常用的代谢组学数据库及其特征进行综述,强调它们的内容、功能和应用,为数据库的选择提供理论依据,并展望代谢组学数据库的开发趋势。
关键词 天然产物;代谢组学;质谱;数据库;全功能软件中图分类号:O657 文献标识码:A 文章编号:1008–6145(2019)05–0128–07Metabolomics databases for natural products research and developmentZHANG Liu , WANG Liyao , ZHANG Kaixue , WEI Guanhua , YANG Zhigang(School of Pharmacy , Lanzhou University , Lanzhou 730000, China)Abstract Metabolomics produced a large amount of data in qualitative and quantitative studies of small molecule metabolites in biological systems ,and had become an important tool for the research and development of natural products. A series of open ,convenient and well-annotated metabolomics databases and full-functional software development facilitated the integration ,processing and interpretation of natural product big data ,which not only facilitated the storage ,management and analysis of data ,but also served as an information sharing platform. The establishment of a mass spectrometry-based metabolomics database played an important role in the screening of known components of natural products and the identi fication of unknown components. The commonly used metabolomics databases and their characteristics at home and abroad were summarized ,emphasized their contents ,functions and applications ,provided a theoretical basis for the selection of databases ,and the development tendency of metabolomics databases were prospected.Keywords natural products; metabolomics; mass spectrometry; database; integrated software 天然产物是动物、植物、微生物等的个体或其含有的化学成分[1],主要包括生物碱、黄酮类、皂苷类、蒽醌类、萜类、多糖、多肽和蛋白质等。
我国中草药资源丰富,从中发现结构新颖、具有生物活性的天然产物已成为中药研发的一个重要途径和手段,为中药现代化、国际化研究提供了新的思路,推动中药的成分鉴定、评价和质量控制的发展[2]。
天然产物结构具有复杂性和多样性,传统的研究方法(提取、分离、纯化和鉴定)耗时费力,且获得的大多是含量较高、结构稳定的成分,不易得到微量、痕量或在分离过程中容易丢失的成分,无法实现大量样品中未知成分的快速识别和高效鉴定,不能满足当前高速发展的新药研发过程。
如何建立各成分快速分离和简便获取结构信息的方法是天然产物研究和开发的热点[3–4]。
近年来,继基因组学、转录组学和蛋白质组学之后又一新兴的学科代谢组学成为天然产物研究的重要工具[5–6]。
代谢组学旨在通过对生物体系的小分子代谢物进行大规模的定性和定量研究[7],来反映其受刺激后(如基因突变、病理生理变化以及环境变化)代谢产物的变化,因此适合天然产物高通量、快速、全面分析[8]。
代谢组学最常用的分析技术是核磁共振(NMR)和质谱(MS)[9],NMR 技术分析快速、基金项目 国家重点研发计划政府间国际科技创新合作重点专项(2016YFE0129000);甘肃省中医药管理局科研课题(GZK–2015–21);兰州大学中央高校基本科研业务费专项资金(lzujbky–2017–k26)通讯作者 杨志刚,副教授,博士,研究方向为中药药效物质基础及代谢组学,E-mail: yangzg@ ;收稿日期 2019–07–01引用格式 张柳,王丽瑶,张凯雪,等.应用于天然产物研究与开发的代谢组学数据库[J ].化学分析计量,2019,28(5): 128–134.ZHANG L ,WANG L Y ,ZHANG K X ,et al. Metabolomics databases for natural products research and development [J ].Chemical analysis and meterage ,2019,28(5): 128–134.129张柳,等:应用于天然产物研究与开发的代谢组学数据库选择性好,对样品的需求量少,几乎不需要对样品进行前处理,能提供丰富的相关信息,如代谢产物的结构、浓度、分子动力学及相互作用等。
MS通常与不同的色谱系统串联[10],与NMR相比,提供了更高的灵敏度和分辨率[11],应用范围更为广泛,主要与液相和气相色谱法结合使用,以提高化合物的特异性检测和检测数量[12]。
基于MS的代谢组学研究在天然产物分析中具有重要的作用,可获得化合物的精确质量数、元素组成、特征离子碎片、保留时间等大量复杂的多元性数据[13]。
这些数据集需要通过可视化软件、统计工具或综合数据库进行有效的数据分析和解释。
代谢组学标准将化合物的鉴定分为4个不同级别:鉴定(Identification)、注释(Annotation)、表征(Characterization)和分类(Classification)[14],相比于准确鉴定,利用文献和数据库中的数据进行比较可实现对化合物的注释。
建立高效、全面且注释良好的质谱数据库成为天然产物结构解析、剔除已知成分、鉴定新成分的最佳方法之一[15],因此一些国际上著名的代谢组学研究团队和机构均开发了相关数据库及其软件,大力推动了天然产物研究[16]。
笔者选取在设计、实现和信息检索方面突出的代谢组学数据库,从数据库建立的技术方法、数据种类、数量以及基本功能等方面进行总结,为天然产物研究中成分的鉴定和数据库的开发及应用提供理论依据。
1 基于液相色谱–质谱联用的代谢组学数据库液相色谱–质谱联用(LC–MS)是研究天然产物成分、分析复杂样品体系中目标化合物的有效手段,与其它分离鉴定技术相比具有选择性好、灵敏度高、结构信息多和快速筛选的特点,且不需要对样品进行繁琐和复杂的前处理,尤其适用于分析超微量的高、中、低极性成分[17]。
利用数据库对照组分和标准化合物的保留时间以及不同加合物离子峰和特征碎片离子等综合信息,可快速筛选已知成分,为中药中天然产物有效部位、活性成分的寻找提供新的途径[18]。
钱叶飞等[19]建立了包含生物碱类、黄酮类、醌类、苯丙素类、萜类等不同类型的210多个化学成分的液相色谱–质谱联用数据库,实现了中药及天然产物化学成分的快速鉴定。
张加余等[3]建立了含600多个化合物的液相色谱–质谱数据库,可以应用于天然产物未知组分的高效鉴定和靶向分离。
1.1 全球天然产物社会分子网络全球天然产物社会分子网络(Global natural products social molecular networking,GNPS)作为目前最大的天然产物公共数据库,是一个分析、储存、注释MS/MS质谱数据的平台,收录22644个化合物和235850张谱图,成功应用于药物发现、食品科学、农业科学以及海洋科学等领域。
GNPS质谱数据库通过变量去重复法自动分析每一个上传的数据,实现多来源MS/MS数据的更新和管理,分子资源管理器可以追溯每个数据的原始数据集以及元数据,有利于目标化合物的查找。
数据库运用可视化分子网络揭示不同生物来源和实验室数据集之间的联系,用户可以通过点击分子网络中的节点查看MS /MS谱图以及峰值数据来快速识别已知化合物及其类似物、表征未知化合物。
该数据库最大的优势是支持同时上传多个mass charge ratio Extensible Markup Language(mzXML),mass charge ratio Markup Language(mzML),Micrografx(MGF)格式文件进行大批量搜索[20]。
1.2 Mass Bank数据库Mass Bank是基于JA V A开发的分布式数据库,主要包含初级代谢产物,如类黄酮、皂苷、萜类、醛类等[21],旨在通过公开分享从代谢物的化学标准品得到的质谱图以方便用户进行代谢物的鉴定[22]。
Mass Bank包含了代谢物的名称、分子式、相对分子质量、化学结构式、质谱数据等,涵盖了19000张一级质谱谱图以及28000张二级质谱谱图。