5外文翻译1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本科毕业设计外文翻译
(2010届)
题目:面向对象数据库Xindice的应用系统
学生姓名韩文杰
指导教师王奔
专业班级软件工程2008(2+2)2班
所在学院计算机科学与技术学院
提交日期2010年3月
使用开源XML数据库Xindice构建鼻咽癌2D/MS库--Feng Li,Maoyu Li,Zhiqiang Xiao,Pengfei Zhang,Jianling Li and Zhuchu Chen
地址:中国卫生部癌症蛋白组织学重点实验室中南大学湘雅医院中南大学癌症研究所Email:Feng Li-fengl@;Maoyu Li-maoyuli@;Zhiqiang Xiao-
zqxiao2001@;Pengfei Zhang-jimszhang0421@;Jianling Li-jianlingli2001@;Zhuchu Chen*-tcbl@
1.摘要
1.1背景
许多蛋白质组学的倡议要求所有信息要用统一的标准来集成。这些信息来自于收集的样品和展示给公众的实验结果的数据。这些不同格式和结构的数据的集成和转换对我们来说是一个巨大的挑战。XML技术因为它的简单性和灵活性在处理这类问题时给我们呈现出一个希望。鼻咽癌(NPC)是最常见的癌症之一,在南部中国和东南亚,这标志着鼻咽癌发病的地理和种族差异。尽管有一些癌症蛋白质组数据库,现在仍没有鼻咽癌蛋白质组数据库。
1.2结果
用人类蛋白质标记语言编辑器将原始实验数据原始实验数据捕获到一个XML文档,将XML文档导入原生XML数据库Xindice。关于鼻咽癌蛋白质组的2D/MS库是由Apache,,PHP,Xindice创建的。这个库提供了一种通过互联网访问数据库的方法。在我们的网站上,同时两种方法(关键字查询,点击查询)来访问鼻咽癌蛋白质组学数据库的实体。
1.3结论
我们2D/MS存储库可以用于共享的鼻咽癌蛋白质组学原始数据,这些数据来自于凝胶型的蛋白质实验。用于构建用户自己的蛋白质存储库的数据库和PHP源代码可以在/上访问到。
2.背景
人类和其他模型有机体基因组计划的完成提供了一系列的基础设施来允许我们对细胞发信号、规则、新陈代谢的动态过程有一个更好的了解。尽管所有的细胞中都含有完整的基因组,但是在特定细胞中只有基因的一小部分被表达。在不同的条件和同一器官的不同组织中,一个特定组的蛋白质被表达或翻译后修饰来执行细胞的特定功能。术语蛋白质组是蛋白质和基因组和混合体,它指整个的
蛋白质成份,连同所有在一个挑选的细胞中共有原子价修正蛋白质。随着后基因组学的到来,功能性基因组学已经变成了生物研究的一个新焦点,当评定全功能性蛋白质时,蛋白质组已经成为一个非常有希望的领域。
为了了解不同蛋白质所扮演的角色和解剖蛋白质之间相互作用的网络,一个高渗透的方法学正在被应用在这个新出现的领域。结果,通过高渗透的蛋白质组方法大量的实验数据产生。这些高渗透的蛋白质组方法有大型双杂交系统,高全质量光谱技术,多维色谱仪。同时,随着蛋白质组信息量的迅速增加,对有一个公共库蛋白质组库和在实验室之间交流原始蛋白质组的实验数据有着迫切需求。原始实验数据通常是由不同的生成仪器,实验室和方法产生,因此仍难以直接交换原始蛋白质组数据。最近,一个新的特殊的组织,名为PSI(蛋白质组学标准计划)成立于在美国华盛顿举办的人类蛋白质组组织会议上,定义数据表示社区标准会议蛋白质组学的数据比较方便,交流和核查。由于在我们实验室产生的原始蛋白质组实验数据和在大多数蛋白质组学实验室使用的技术还是基于2D/MS
系统,我们打算把精力集中在由2D/MS系统一般蛋白质组学格式产生的原始蛋白质组学数据的交换上。
目前,形成了一些与整个蛋白质组学标准相关的XML模型如PEDRo,HUP-ML和AGML。在这些模型中,PEDRo,HUP-ML是两个用于处理蛋白质组学原始数据流行的模型。PEDRo是由诺曼佩顿教授率领的一个小组开发,考虑到凝胶蛋白质组数据与其他的XML模式的许多方面,如mzXML,mzData和mzIdent,更具体地说应为质谱数据。HUP-ML是另一个基于XML面向蛋白质组分析的格式,它是由Kamijo et al.在2002年的AOHUPO XML专题讨论会上提出的。
HUP-ML是建立在典型的2D/MS系统之上的,可以被大多数的实验室使用。
在这里,我们把HUP-ML editor作为数据采集的软件,把HUP-ML数据模型作为鼻咽癌蛋白质组库。鼻咽癌在中国南部和东南亚是最常见的癌症之一,这表明鼻咽癌的发病具有明显的地域和种族差异。公共蛋白质组库是研究复杂的癌症机制基础设施。虽然有许多癌症蛋白质组数据库,但就我们所知一直没有鼻咽癌蛋白质组数据库。在本文中,我们用HUP-ML编辑器来收集原始鼻咽癌蛋白质组学数据,包括实验结果和实验条件。然后,将这些XML文件导入Xindice数据库,PHP是用来把来自Web客户端的查询请求传递给数据库管理系统,并查询结果以
HTML格式返回给客户端。PHP源代码可以从我们的网站
/上下载以构建用户自己的蛋白质组库。
3.结果
在鼻咽癌2D/MS库中鼻咽癌凝聚型蛋白质组实验数据的Xpath的查询结构如图3.1所示。
图3.1Xpath查询结果
这个2D/MS库的结构如图3.2所示。
图3.22D/MS库的结构
要检索一个标识点的精确信息,我们提供了两种选择来查询信息。一种方式是通过文本输入来查询数据库,可以输入一个NCBI加入数字,蛋白质名称或别名,或者基因的名称。另一种查询方法是点击2-DE凝胶图上的点击点。这两种查询方法都是建立在Xpath查询之上。这个Xpath查询结果是将返回一个XML文档。为了显示一个可读的查询结果,在将结果输送给客户端浏览器之前XLST处理器的转换工作是必须的。Sablotron XSLT处理器转变结果的一个例子如图3.3所示。
图3.3Sablotron处理器转化结果