生本教育
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
—255—
基于Web 的新城疫病毒基因分型系统
陆王红1,曹永忠2,张剑峰1
(1. 扬州大学信息工程学院,扬州225009;2. 扬州大学农业部畜禽传染病学重点实验室,扬州225009)
摘 要:根据新城疫病毒分子进化规律,采用JSP 和SQL Server 技术,设计并开发出基于Web 的新城疫病毒基因分型系统。该系统通过计算机自动对核酸序列分析处理,提取特征位点信息,并与分型标准进行比较,从而实现快速准确分型。有效地减少分型过程中人的参与,缩短基因分型的周期,具有较强的实用性和可扩展性。 关键词:新城疫病毒;JSP 技术;基因分型
Genotyping System of Newcastle Disease Virus Based on Web
LU Wang-hong 1, CAO Yong-zhong 2, ZHANG Jian-feng 1
(1. Information Engineering College, Yangzhou University, Yangzhou 225009;
2. Key Laboratory of Animal Infectious Diseases of Ministry of Agriculture, Yangzhou University, Yangzhou 225009)
【Abstract 】According to the molecular evolution rule of Newcastle Disease Virus(NDV), a genotyping system of NDV based on Web is developed by using JSP and SQL server database technology. The system analyses and processes nucleic acid sequences automatically through computer program. It acquires the information of characteristic sites and compares them with genotyping standards, thus the system realizes accurate genotyping quickly, decreases the times of people participation, and shortens the period of genotyping. It has better practicability and expansibility. 【Key words 】Newcastle Disease Virus(NDV); JSP technology; genotyping
计 算 机 工 程 Computer Engineering 第35卷 第4期
Vol.35 No.4 2009年2月
February 2009
·开发研究与设计技术· 文章编号:1000—3428(2009)04—0255—03
文献标识码:A
中图分类号:N945
1 概述
新城疫(ND)是禽类的一种高度接触性、烈性传染病,曾
屡次造成世界范围的大流行,给许多国家的养禽业带来严重的经济损失。
新城疫病毒(NDV)是ND 的病原,它是一种具有囊膜的单股不分节段RNA 病毒。多年来,人们一直在研究NDV 毒株的鉴定和分类方法,以便对ND 流行的起源进行迅速而准确的判定[1]。
目前NDV 基因型的分类主要采取进化树分型法,此方法需事先选取包含所有基因型的参考核酸序列,人工分别提取包含待分型序列在内的所有序列的F 基因序列,并转换为进化树生成软件能识别的文件格式,接下来逐一将所提取的所有F 基因文件输入进化树生成软件,选择构造进化树的算法,进而生成进化树,最后依据进化树中待分型序列所属进化分支完成基因型的判别。
此种判别方法存在以下不足:
(1)参考基因型序列的选取工作量很大。研究者需提供超出基因型类别的多条序列,一一将它们与分型标准进行比较,进而确定参考序列的基因型。若研究者手边序列有限,将直接影响下面基因型的判别。
(2)人工参与次数较多。其中F 基因的提取、F 基因文件格式的转换、进化树生成软件的序列输入、构建进化树算法的选择以及最终进化树的分析都需人工参与。
(3)结果不唯一。构建进化树的算法主要有最大简约法、距离法和最大似然法,构建树算法不同生成的进化树也可能不同,进而基因型的判别结果也可能不同。
(4)基因型的判别过程操作繁琐,判别周期长。整个基因
型的判别从参考基因型序列的选取到F 基因的提取和格式转换再到进化树的生成,中间涉及多个软件,每一个环节出错都将直接影响分型结果的正确性。另进化树的构建过程中,算法不同运行时间也不同。
2 系统的设计
2.1 系统的体系结构
由于该系统是B/S 结构模式,因此分型系统采用三层体系结构——数据层、业务逻辑层和表示层。
(1)数据层主要负责分型标准数据、序列RE 位点数据和序列编码后的氨基酸字母数据的存储管理。
(2)业务逻辑层主要是响应序列RE 位点数据的提取和序列编码后氨基酸字母数据的提取,并将提取的数据同分型标准数据库进行对比分析,判别待分型的序列基因型等操作,分别由核酸分型服务和蛋白分型服务来实现。
(3)表示层是系统将用户提交的待分型的序列判别结果返回给用户,返回的方式为文本或二进制码。
这种结构可以很方便地实现系统数据的管理、应用和发布。三层体系结构的建立将数据和数据的应用分割开来,提高了系统运行的稳定性,也极大提高了系统运行的可扩 展性[2]。
系统的体系结构如图1所示。
基金项目:国家自然科学基金资助重点项目(30630048);江苏省高校自然科学研究计划基金资助项目(06KJB230136);江苏省动物预防医学重点实验室开放课题基金资助项目(K06015)
作者简介:陆王红(1979-),女,硕士研究生,主研方向:生物信息学,数据挖掘;曹永忠,博士研究生;张剑峰,教授 收稿日期:2008-09-20 E-mail :zhangjf@