线粒体基因全分析及进化树的构建毕业论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、前言(Introduction)
英国《自然》杂志网络版2006年5月18日报道,科学家已对含有2.23亿个碱基对,占人类基因组中碱基对总量的8%左右的人类第一号染色体完成测序,宣告持续16年的人类基因组计划全部完成。
作为人类自然科学史上重要的里程碑,“人类基因组”的研究已从“结构基因组”阶段进入“功能基因组”阶段。
在人类基因组计划后相继推出的水稻基因组计划、马铃薯基因组计划、草鱼基因组计划等,和快速增长的微生物基因测序,“海量”的基因信息的积累,催生了“功能基因组”时代的来临。
针对充分利用“海量”基因组信息的生物信息学不仅应运而生,而且为以注释、阐明基因功和利用基因生物学功能的“后基因组时代”的研究发挥了重大作用。
生物信息学是把基因组DNA序列信息分析作为源头,在获得了蛋白质编码区的信息后,进行蛋白质空间结构的预测和模拟,然后依据特定蛋白质的功能进行必要的药物设计。
就是说,生物信息学的主要任务是组织和分析生物学数据,而生物学数据的分析离不开计算机算法的运用。
因此,可以说生物信息学是一门集生命科学、计算机科学、数学、物理学为一身的多学科交叉的前沿学科。
动物mtDNA属母系遗传,是共价闭合的双链DNA分子,核酸序列和组成比较保守,基因的排列顺序比较稳定而且紧密,无重组和单拷贝。
由于其结构和进化上的特点,mtDNA已成为研究动物起源进化以及群体遗传分化的理想对象。
昆虫mtDNA大小约为15.4~16.3kb,其基因组大小的变化受A+T-rich区长度变化的影响十分显著。
A+T-rich 区(A+T丰富区)的长度最短为399 bp,最长达4601 bp,两者相差4202bp,前者见于Tricholepidion gertschi,后者见于黑尾果蝇Drosophila melanogaster。
昆虫线粒体基因组由2个rRNA基因(1rRNA和srRNA)、22个tRNA基因、13个蛋白编码基因[Cytb基因(细胞色素b基因,cytochrome oxidase b),ATPase6和ATPase8(ATP酶亚基基因6和8,ATP synthase subunits 6 and 8),COⅠ、COⅡ和COⅢ(细胞色素氧化酶亚基基因Ⅰ-Ⅲ,cytochrome oxidasesubunit Ⅰ-Ⅲ),NDl-6和ND4L(NADH降解酶基因1~6和4L,NADH dehydrogenase subunit 1-6 and 4L)],共37个基因和1个包含复制启动子的非编码区(A+T-rich区)组成。
Aloni 和Attardi将mtDNA两条链中密度较小者命名为轻链(L链),另一条命名为重链(H链)。
考虑到昆虫mtDNA没有明显的L链与H链之分,Simon等根据昆虫mtDNA中多数基因都是从一条链上转录的特点,将这一条链定义为J链,另一条链定义为N链[1-3]。
自Wolstenholme和Clary第一个报道了果蝇Drosophila yakuba mtDNA全序列以来,GenBank已收录了80余种昆虫mtDNA全序列,其中双翅目昆虫有15个种。
在双翅目实蝇科昆虫中,地中海实蝇Ceratis capitata和油橄榄果实蝇Bactrocera oleae的线粒体基因组全序列已有报道[4]。
梨小食心虫,学名Grapholitha molesta (Busck),简称“梨小”,别名有梨小蛀果蛾、东方果蠹蛾、梨姬食心虫、桃折梢虫、小食心虫、桃折心虫。
属于鳞翅目(Lepidoptera),
小卷叶蛾科(Olethreutidae )。
梨小在各地果园均有发生,是梨树的重要害虫,在梨、桃树混栽的果园为害尤为严重。
梨小除为害梨、桃树外,也为害李、杏、苹果、山楂等,严重影响果品质量及梨果产量,尤其是长江、黄河流域最严重[5]。
因此,我的论文是通过NCBI 下载的梨小食心虫的全线粒体基因,并对其结构和功能进行分析。
2、材料和方法(Marerials and Methods )
2.1、研究思路
2.2、搜索基因
2.2.1、在NCBI 中搜索梨小食心虫线粒体全基因序列
方法:
首先进入NCBI 的官网,在Search 中选择All Databases,在查询框中输入Grapholita molesta mitochondrion ,点击Search,然后选择Geneome,总共出现一条记录,即选择NC 014806, Display 选择为Genbank,选择Download 中的Genbank 格式,即可下载得到梨小食心虫的线粒体全基因序列。
2.2.2、用DNAMAN 分析其基因结构
对于获取的海量数据,我们要先进行一些基本的分析,确定基因的分子量、碱基的组成等信息。
方法:
选取梨小食心虫的线粒体基因,选取显示的方式为包含cds,点击确认,即可。
2.2.3、碱基同源性分析的方法
方法:
进入网址:,在序列中提交NC 014806,其他选项默认设置。
通过在线的BLAST的比对,可以找到与梨小食心虫线粒体同源性最高的物种,从而可通过研究其同源性高的物种,间接研究该物种,为该物种的进一步研究提供一定的理论依据。
2.2.4、开放性阅读框(ORF)分析的方法
方法:
利用NCBI的ORF Finder程序对NC 014806做开放性阅读框分析。
网址如下:
参数选择:Genetic Codes:1 Standard
开放阅读框[open reading frame,0RF] 是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。
ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件[6]。
通过ORF的分析,我们可以确定全基因中哪段基因片段可以翻译为蛋白质,从而为特定蛋白质的功能的确定提供依据。
2.3、基因编码蛋白质的理化性质分析
利用ExPaSy中的Protparam和Protscale进行蛋白质的氨基酸组成、分子质量、等电点以及疏水性分析[7]。
2.3.1、氨基酸组成、分子质量、等电点分析方法
利用ExPaSy软件包中的Protparam工具进行氨基酸组成、分子质量、等电点分析网址如下:
通过氨基酸组成、分子质量、等电点分析,我们可以确定编码蛋白的最基本性质,为进一步研究蛋白质的二级结构、三级结构提供依据。
2.3.2、亲疏水性分析方法
利用瑞士生物信息学研究所(Swiss Institute of Bioinformatics,SIB)的ExPASy服务器上的ProtScale程序对ORF 翻译后的氨基酸序列SEQUENCE进行亲疏水性分析网址如下:
参数选择:
Hphob. / Kyte & Doolittle
正值表明疏水,负值表明亲水。
通过疏水性分析,可以让我们了解蛋白质是否属于亲水蛋白。
2.4、基因编码蛋白质的结构分析
2.4.1、蛋白质的二级结构分析
方法:
利用Expasy服务器下的SWISS-MODEL中的Psipred进行蛋白序列的二级结构分析网址:
/workspace/index.php?func=tools_targetidentification1
蛋白质二级结构:指蛋白质肽链本身的折叠和盘绕的方式。
二级结构主要有α-螺旋、β-折叠、β-转角。
常见的二级结构有α-螺旋和β-折叠。
二级结构是通过骨架上的羰基和酰胺基团之间形成的氢键维持的,氢键是稳定二级结构的主要作用力。
蛋白质二级结构预测,是通过氨基酸序列,预测蛋白质二级结构的过程。
氨基酸序列具有不同的长度,不同的氨基酸排列顺序。
实验分析表明这种差异能够形成不同的蛋白质结构。
研究蛋白质的结构意义重大,不但有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质之间的相互作用,而且对生物学、医学和药学都有非常重要的作用[8]。
2.4.2、蛋白质的三级结构分析
方法:
将分析的结果向蛋白质立体结构数据库PDB ( Protein Data Bank)提交该蛋白质序列,利用RasMol软件显示该蛋白的三维分子结构
蛋白质三级结构(protein tertiary structure): 蛋白质分子处于它的天然折叠状态的三维构象。
三级结构是在二级结构的基础上进一步盘绕,折叠形成的。
三级结构主要是靠氨基酸侧链之间的疏水相互作用,氢键,和盐键(离子键)维持的。
此外共价二硫键在稳定某些蛋白质的构象方面也起着重要作用。
通过研究蛋白质的三级结构,可以让我们更直观的通过其结构了解其功能性,从而为蛋白质功能的确定提供有力的依据[9]。
2.5、基因编码蛋白质的功能分析
2.5.1、信号肽预测的方法
方法:
利用丹麦科技大学(DTU)的CBS服务器蛋白质序列的信号肽(signal peptide)预测,进入Prediction Serves 页面。
网址如下:
参数选择:
Eukaryotes;Both;GIF (inline);Standard
信号肽,常指新合成多肽链中用于指导蛋白质的跨膜转移(定位)的N-末端的氨基酸序列(有时不一定在N端)。
信号肽位于的N端。
一般由15~30个氨基酸组成。
包括三个区:一个带正电的N 末端,称为碱性氨基末端:一个中间疏水序列.以中性氨基酸为主,能够形成一段d螺旋结构,它是信号肽的主要;一个较长的带的C末端,含小分子氨基酸,是信号序列切割位点.也称加工区。
信号肽的作用,可使正在翻译的核糖体附着到RER膜上,还可以在信号肽指引下蛋白质在细胞内[10]。
通过信号肽的预测,可以让我们知道蛋白质是如何跨膜转移的。
2.5.2、磷酸化位点分析的方法
方法:
磷酸化和去磷酸化是细胞内信号传导的重要方式,利用丹麦科技大学(DTU)的CBS服务器上的NetPhos2.0 Server程序做磷酸化位点分析。
NetPhos2.0 Server程序是基于神经网络算法,对蛋白序列中的Ser、Thr和Tys三种氨基酸残基可能成为的磷酸化位点作出预测。
网址如下:
蛋白质磷酸化是最常见、最重要的一种蛋白质翻译后修饰方式,它参与和调控生物体内的许多生命活动.通过蛋白质的磷酸化与去磷酸化,调控信号转导、基因表达、细胞周期等诸多细胞过程.随着蛋白质组学技术的发展和应用,蛋白质磷酸化的研究越来越受到广泛的重视[11]。
2.5.3、亚细胞定位的方法
方法:
通过WoLF PSORT工具基于其氨基酸序列预测蛋白质亚细胞定位点
网址如下:
参数选择:
Fungi;From Text Area
亚细胞定位是指某种蛋白或表达产物在细胞内的具体存在部位。
例如在核内、胞质内或者细胞膜上存在。
GFP是绿色荧光蛋白,在扫描共聚集显微镜的激光照射下回发出绿色荧光,从而可以精确地定位蛋白质的位置[12-14]。
2.5.4、二硫键分析的方法
运用scratch protein Predictor 对蛋白质的二硫键做出分析。
网址如下:
参数选择:
Dlpro(Disulfide Bonds)
二硫键是指两个硫原子之间形成的共价键,一般指多肽链中的两个半胱氨酸残基侧链的硫原子之间形成的共价键。
对于维持许多蛋白质分子的天然构象和稳定性十分重要。
二硫键与蛋白质高级结构的生物活性有关同时与蛋白质的复性也有关联。
如核糖核酸酶A经巯基乙醇(还原剂)和尿素(蛋白质变性剂)处理后,发生变性作用,四对二硫键断裂,多肽链伸展开来,高级结构发生变化,失去生物活性。
如果用透析法将大量还原剂和变性剂除去,在微量还原剂存在下,四对二硫键在原来的位置重新形成,伸展开的多太肽链会自发折叠成天然构象,生物活性得到恢复。
次试验也证明蛋白质高级结构的信息存在于一级结构中[15]。
2.6、构建系统进化树
选取不同进化层次的典型物种基因,利用ClustalX 软件的N-J法构建系统进化树。
方法:
1、序列的输入
将Fasta格式的多序列文件在Clustal X中的file菜单下的“load sequence ”中导入,读取多重序列数据文件。
2、序列的多重比对和比对结果的输出
在Clustal X中选择Alignment菜单下的“outputformat options”设定输出格式,然后选择“Do Complete Alignment”,对序列做多重比较,同时生成所需的多重序列比较文件*.aln文件。
3、打开mega 4.1,选择file菜单下的“convert to mega format”,弹出分析文件的对话框,点击文件夹图标,从目的文件夹中选中Clustal X 比对分析后产生的*.aln文件,此时即转换到准备分析的目标文件夹,将其转换为meg格式的文件。
之后用“open data”将其导入到mega 中进行系统树构建。
4、构建进化树
在mega中,先选择Phylogeny菜单下的“Construct Tree”,然后再选择“Neighbor-Jioning(NJ)”来构建NJ树,并保存树文件。
此次构建系统进化树,主要采用的软件是clustalx,选取的进化树构建物种为有代表性的动植物,通过和其同源性比较相近的线粒体基因,构建系统进化树,从而确定梨小食心虫在进化系统中的地位和其他物种的亲缘关系。
算法选用邻位相邻算法(neighbor joining,NJ),原因在于它是一种距离矩阵算法,不仅可以计算两两的比对距离,还对整个树的长度进行最小化,从而对树的拓扑结构进行了限制,是目前应用最广泛的基于距离的算法[16]。
主要采用的物种有:
1、梨小食心虫线粒体(Grapholita molesta mitochondrion)
NCBI登录号为>gi|315270918|ref|NC_014806.1|
2、中国桑野蚕线粒体(Bombyx mandarina from China mitochondrion)
NCBI登陆号为>gi|291575900|gb|GU966621.1|
3、日本桑野蚕线粒体(Bombyx mandarina from Japan mitochondrion)
NCBI登陆号为>gi|291575508|gb|GU966593.1|
4、桑尺蠖线粒体(Phthonandria atrilineata mitochondrion)
NCBI登陆号为>gi|170522569|gb|EU569764.1|
5、中国二化螟线粒体(Chilo suppressalis mitochondrion)
NCBI登陆号为>gi|291575900|gb|GU966621.1|
6、茶小卷叶蛾线粒体(Adoxophyes honmai mitochondrion)
NCBI登录号为>gi|291575900|gb|GU966621.1|
7、美国白蛾线粒体(Hyphantria cunea mitochondrion)
NCBI登陆号为>gi|290758069|gb|GU592049.1|
8、朝灰蝶线粒体(Coreana raphaelis mitochondrion)
NCBI登陆号为>gi|68272052|gb|DQ102703.1|
9、蔗螟线粒体(Ostrinia furnacalis mitochondrion)
NCBI登陆号为>gi|18314304|ref|NC_003368.1|
共九种进行系统进化树的构建,参数选择为默认参数
2.7、生物信息学主要软件介绍
2.7.1 DNAMAN
DNAMAN 是美国 Lynnon Biosoft 公司开发的高度集成化的分子生物学综合应用软件,可以用于多序列比对、PCR 引物设计、限制性酶切分析、质粒绘图、蛋白质分析等,几乎囊括了所有日常核酸、蛋白质序列的分析工作。
2.7.2 ExPaSy
ExPASy是Expert Protein Analysis System的缩写,从字面理解即为专业蛋白质分析系统.从取名就可以看出网站背后的牛人们的气势和专业精神。
ExPASy由瑞士生物信息学研究所维护(),提供从序列(Swiss-Prot)到结构(Swiss-Model),以及2-D Page等蛋白质操作相关的全套服务。
2.7.3 Clustalx
CLUSTALX是CLUSTAL多重序列比对程序的Windows版本。
Clustal X为进行多重序列和轮廓比对和分析结果提供一个整体的环境。
序列将显示屏幕的窗口中。
采用多色彩的模式可以在比对中加亮保守区的特征。
窗口上面的下拉菜单可让你选择传统多重比对和轮廓比对需要的所有选项[17,18]。
3、结果与分析(Results and Analysis)
3.1、梨小食心虫线粒体基因的获取与分析
3.1.1、梨小食心虫线粒体全基因序列的获取
通过NCBI,得到梨小食心虫线粒体的登陆号为:NC 014806,具体序列见附录1。
3.1.2、DNAMAN对基因序列的分析
通过DNAMAN软件对梨小食心虫的线粒体基因进行分析,可以得到如下结论,具体分为以下三点结论,具体分析图见附录1:
3.1.2.1、梨小食心虫mtDNA基因组结构
梨小食心虫线粒体基因组全长15717bp,为一环形的双链DNA(见附录1-1)。
其长度比油橄榄果实蝇(15815bp)短98 bp,比地中海实蝇(15 980 bp)短263bp。
梨小食心虫线粒体基因组全序列已录入GenBank数据库,序列号为NC_014806。
梨小食心虫mtDNA 由22个tRNA,2个rRNA,13个蛋白编码基因以及一个包含起始复制和转录的控制区(A+T-rich区)组成。
从J链编码的基因有C0Ⅰ-Ⅲ、ND2、ND3、ND6、ATP6、ATP8、Cvt6和13个tRNA基因(包括tRNA-11e、tRNA-Met、tRNA-Trp、tRNA-Leu-UUR、tRNA-Lys、tRNA-Asp、tRNA-Gly、tRNA-Ala、tRNA-Arg、tRNA-Asn、tRNA-Ser-AGN、tRNA-G1u和tRNA-Thr),从N链编码的基因有NDl、ND4、ND4L、ND5、lrRNA、srRNA 和9个tRNA基因(包括tRNA-Gln、tRNA-Cys、tRNA-Pro、tRNA-Tyr、tRNA-Phe、tRNA-Leu-CUN、tRNA-His 和tRNA-Val、tRNA-Ser-UCN)。
3.1.2.2、梨小食心虫mtDNA基因组核苷酸组成
梨小食心虫mtDNA基因组核苷酸组成在梨小食心虫线粒体基因组全序列中,各碱基的总含量分别是40.3% A,11.2% C,7.9% G,40.6% T,AT总含量高达51.8%,表现出昆虫线粒体基因组中著名的“A+T偏好性”。
3.1.2.3、梨小食心虫线粒体基因组tRNA结构分析
在梨小食心虫mtDNA的22个tRNA中,除亮氨酸(Leu)和丝氨酸(ser)所对应的tRNA 有2个以外,其他的氨基酸都只有一个tRNA与之对应。
21个tRNA均有规则的三叶草结构,仅tRNA—ser(AGN)无D臂,由8个核苷酸取代了该位置,这是节肢动物线粒体基因组的一个普遍特征。
具体如下图:
3.1.3、碱基同源性分析
通过分析结果可得知:分析图见附图2和附图3。
梨小食心虫的线粒体全基因与日本的野桑蚕线粒体(Bombyx mandarina from Japan mitochondrion)最为相似,高达到了99%。
3.1.4、开放性阅读框(ORF)分析
通过分析可得:分析过程见附录4、附录5。
序列NC 014806,6748~7299位存在一个长552bp的开放阅读框,编码为183个氨基酸,起始密码子为ATG,终止密码子为TAG,在此将该阅读框命名为SEQUENCE,方便以后使用。
3.2、基因编码蛋白质的理化性质分析
3.2.1、氨基酸组成、分子质量、等电点分析
试验结果表明, SEQUENCE蛋白质分子式为C1024H1603N241O243S5,原子总数为3116,分子质量为21338.7,等电点为9.40。
在氨基酸组成上亮氨酸33,占18%,异亮氨酸32个,占17.5%,苯丙氨酸,15个,占8.2%,甘氨酸1236个,占8.0%。
氨基酸对应的英文名称和单个字母缩写见附录5-1。
3.2.2、疏水性分析
分析可得到结果:分析过程见附录6,得知该蛋白有4个疏水性区域14个亲水区域。
3.3、基因编码蛋白质的结构分析
3.3.1、蛋白质二级结构分析
经分析可得:分析图见附录7、8、9。
SEQUENCE的二级结构,主要以α-螺旋,不规则盘绕和延伸链为蛋白最大量的结构元件,ß-折叠散布于整个蛋白质中。
3.3.2、蛋白质三级结构分析
结果见附录10。
3.4、基因编码蛋白质的功能分析
3.4.1、信号肽预测
分析可得结果:具体图谱见附录11、12。
由附录11、12分析,可知信号肽序列为:
MAGITANYEFDLKKIIALSTLRQLGLIIRILRIGLP,具体对应的氨基酸见图5-1,在生物体内,蛋白质的合成场所与功能场所常常被一层或多层细胞膜所隔开,这样就产生了蛋白质转运的问题。
核糖体是真核生物细胞内合成蛋白质的场所,几乎在任何时候,都有数以百计或千计的蛋白质离开核糖体并被输送到细胞各个部分,以补充细胞的物质成分和更新细胞功能。
由于细胞各部分都有特定的蛋白质组分,因此,合成的蛋白质必须准确无误地定向运送才能保证生命活动的进行。
一般认为,蛋白质定位的信息存在于该蛋白质自身结构中,并且通过与膜上特殊受体的互相作用得以表达。
在起始密码子后,有一段编码疏水性氨基酸序列RNA片段,这个氨基酸序列就称为信号序列。
含有信号肽的蛋白质一般能够被分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值。
SEQUENCE的第36 -37位之间有信号肽的剪切位点。
3.4.2、磷酸化位点分析
通过分析可得结论:具体图谱见附录13和附录14。
由磷酸化位点分析,有1个Ser,1个Thr,2个Tyr可能成为蛋白激酶磷酸化位点。
3.4.3、亚细胞定位
结果如下:k used for kNN is: 27
queryProtein mito: 15.0, plas: 5.0, E.R.: 3.0
解释:mito为线粒体、plas为质粒、E.R为内质网
由上可得结论:亚细胞定位分析可知SEQUENCE最有可能存在线粒体中。
3.4.4、二硫键分析
由分析可知:具体见附录15,SEQUENCE含有3个Cys,共形成1个二硫键,分别连接着第56位和第86位Cys。
绝大多数情况下二硫键是在多肽链的β-转角附近形成的。
二硫键的形成并不规定多肽链的折叠,然而一旦蛋白质采取了它的三维结构则二硫键的形成将对此构象起稳定作用。
假如蛋白质中所有的二硫键相继被还原将引起蛋白质的天然构象改变和生物活性丢失。
在许多情况下二硫键可选择性的被还原。
同时,该蛋白含有二硫键也使得该蛋白对热、对蛋白酶降解较为稳定。
3.5、构建系统进化树
最终获得的系统进化树如图:
从上图我们不难看出,梨小食心虫与茶小卷叶蛾、朝灰蝶进化关系关系最近。
4、总结和展望(Summary and Outlook)
本章通过对梨小食心虫的线粒体基因序进行生物信息学的分析,总结结果如下:梨小食心虫线粒体基因的NCBI的登录号NC 014806,基因全长为15717bp,为一环形的双链DNA,并且于6748~7299处存在一个长552bp的开放阅读框,可编码为183个氨基酸,起始密码子为ATG,终止密码子为TAG。
将其ORF出的氨基酸序列(命名为SEQUENCE)继续进行生物信息学的分析,SEQUENCE与目前数据库中存有的数据中具有明显的同源性,尤其与日本的野桑蚕线粒体高达99%。
对其进行的一级结构分析和二级结构分析中,表明SEQUENCE是一个酸性蛋白,亲水性较强,疏水性较弱,信号肽序列为第36位~第37位,亚细胞定位最大可能性为定位于线粒体。
主要以α-螺旋,不规则盘绕和延伸链为新蛋白最大量的结构元件,ß-折叠散布于整个蛋白质中。
与此同时,经过与八种物种进行多序列比对,构建进化树,我们可以得知梨小食心虫与其中的茶小卷叶蛾、朝灰蝶进化关系关系最近。
通过这些分析数据,可以从功能、结构上获得有价值的信息,为下一步的研究及开发利用做出探索、提出可参考的研究方案。
在人类基因组计划的推动下,以生物信息的采集、处理、存储、传布、分析和解释等多个方面为研究内容的生物信息学得到了很好的发展。
本次通过运用生物信息学研究内容的一部分对一个基因序列的结构和功能进行了预测,为下一步研究方案的制定提供了依据,以期研究的顺利进行[18]。
但是,不容忽视的是,目前生物信息还不是一个很完善的学科,所以通过生物信息获取的结论目前并不能直接转化为生产力,用于应用,更多的是作为别的学科的一个佐证,但是在不远的未来,生物信息获取的数据结果一定可以直接产生价值,用于实际的应用。
所以,此次论文的写作,更多的是为未来更好的研究提供一种思路,一种方法,开拓新的视野。
参考文献
[1] 周润清,刘磊,刘凤章等.梨小食心虫的发生与防治.落叶果树,2007,(2):44-47
[2] 李伟,茅矛.生物信息学新进展——第六届国际生物信息学和基因组研究年会综述.国外医学遗传
学分册,1999,22(2):104-107
[3] 郭志云,张怀渝,梁龙.生物信息学技术进展.生物技术通讯2004,5(3):313-317
[4] 丁达夫,梁卫平,陈洁.生物信息学.1998,50,2(3):20
[5] 欧阳曙光,贺福初.生物信息学:生物实验数据和计算技术结合的新领域.科学通
报,1999,44(14):1457-1468
[6] 文建平,李雄彪.数字透出的信息——生命科学正在蓬勃发展.中国生物工程杂志,2004,24(4)
[7] 王斌会.生命科学中的信息学——生物信息学. 医学信息,2000,13(10):519-520
[8] 陈铭.后基因组时代的生物信息学.生物信息学,2004,2(2):29-34
[9] 郑珩,王非.药物生物信息学.北京:化学工业出版社:现代生物技术与医药科技出版中心,2004
[10] Attwood T.K., Pasrry-Smith D.J.著,罗静初等译.生物信息学概论.北京:北京大学出版社,2002
[11] 郝柏林,张淑誉编著.生物信息学手册.上海:上海科学技术出版社,2000
[12] Andreas D.Baxevanis.The Molecular Biology Database Collection:2002 update.Nucleic Acids
Research,2002,30(1):1-12
[13] 张成岗,贺福初编著.生物信息学方法与实践:科学出版社,2002
[14] Kyte J.Jensen,Skovgaard M,and Brunak S.Prediction of novel archaeal enzymes from
sequence-derived features. Protein Science,2002,(11):2894-2898
[15] Hofmann K., Bucher P., Falquet L.,Bairoch A.The Prosite database, its status in 1999.Nucleic Acids Research,1999,(27):215-219
[16] Blom,N., Gammeltoft, S.,and Brunak, S.Sequence-and structure-based prediction of eukaryotic protein
phosphorylation sites. Journal of Molecular Biology,1999,294(5):1351-1362
[17] 王镜岩编著,生物化学(第三版),北京:北京大学出版社,124-127
[18] 陈梅香,骆有庆,赵春江等.梨小食心虫研究进展.北方园艺2009,(8):144-147
致谢
由于个人在外工作的原因,本篇论文的完成,是在利用网络沟通的前提下,经过导师赵志国老师和马瑞燕教授的悉心指导,从而完成的论文写作。
此次论文的写作,从开始的构思到最后的成稿,无不包含了他们的心血和帮助。
此次论文的完成,让我感受到他们渊博的知识、开拓创新的思维方式、严谨治学的态度、高尚的学者风范、忘我的工作作风、孜孜以求的敬业精神以及严以律己宽以待人的待人方式,这些都是我学习的榜样,并将永远激励我前行。
值此论文完成之际,谨向马老师和赵老师献上我最诚挚的感谢和最崇高的敬意!
最后感谢参与论文的评阅工作和论文答谢委员会的所有老师,恳请各位老师指出文章的不足,并加以斧正、批评,提出宝贵的意见。
谢谢!
附录
附图1、梨小食心虫线粒体基因的核酸分析图
SEQ NC_014806: 15717 bp;
Composition 6328 A; 1767 C; 1239 G; 6382 T; 1 OTHER
Percentage: 40.3% A; 11.2% C; 7.9% G; 40.6% T; 0.0%OTHER
Molecular Weight (kDa): ssDNA: 4839.39 dsDNA: 9684.68
COLOURS
sequence = 1
features = 0
FEATURES
cds 262..1260
/name="ND2"
cds 1460..2990
/name="COX1"
cds 3057..3738
/name="COX2"
cds 3879..4040
/name="ATP8"
cds 4034..4711
/name="ATP6"
cds 4719..5507
/name="COX3"
cds 5576..5929
/name="ND3"
cds 6325..8058
/name="ND5"
cds 8079..9479
/name="ND4"
cds 9480..9794
/name="ND4L"
cds 9937..10461
/name="ND6"
cds 10492..11637
/name="CYTB"
cds 11721..12659
/name="ND1"
ORIGIN
1 TTAAAAATAA GCTAAATTAA GCTTTTGGGT TCATACCCCA AATATAAAGG AAATCCCTTT
61 TTTTTAAAAA TAAAGTGCCT GAAAAAAAGG ATTATTCTGA TAGGATAAAT TATGTAGAAT
121 TCTACCTTTA TTATATTTTA TAGAATTAAA CTATATCTAA TAGTATCAAA AACTATTGTG
181 CATCATACAC TAAAATATAT AAAAGAATTT ATAATTCTAT TTAAAGTAAT
TATTAATTAT
241 TTATTTTATA TTTTTTTTTT AATAAATTCA AATAAAATAT TTTTTATATT TACCTTATTT 301 TTTAGAACAT TAATTTCTAT TTCTTCAAAT TCATGATTTG GATGTTGAAT TGGATTAGAA
361 ATTAATTTAT TAAGATTTAT CCCCCTAATC TCAAACTCAA AGAATTTATT TTCTTCTGAA
421 GCATCTTTAA AATATTTTCT TATTCAATCT ATTGCATCAA TTAATTTTTT ATTTATTATT 481 TTAATAAAAA TATTATTTAT AAATTTAGAA ATAAATGTAA TTATTTCTAT CATAATAAAT
541 TCTACTTTAT TAATAAAAAT AGGTTCTGCA CCATTTCATT TTTGATTTCC CAATATTATA
601 GAAGGGTTAT CATGATTAAA TTGTTTTATT TTAATAACTT GACAAAAAAT TTCCCCCATA
661 ATTTTATTAT CATATTATTT TTATAGAAAA CTTTTAATTA TTATTTTAAT TTTAAATGTA 721 ATTATTGGAG CAATTGGAGG TTTAAACCAA ACTTCACTTC GTAAATTAAT AGCTTTTTCC
781 TCTATTAATA ACTTAGGATG AATATTATCC TCTATTATAA TTAGAGAAAA CTTATGAATA
841 TTTTATTTTA TATTTTATAG TTTTTTAAAT AGATTATTAT GTATAATATT TTTTTTATTT 901 AATATTTATT TTATTAATCA ATTATTTATT ATTAATTTAA ATAATATAAT TAAATTATCT
961 ATTATAATTA ATTTTTTATC TTTAGGTGGT TTACCACCAT TCATTGGATT TTTTCCCAAA
1021 TGAATAGTAA TTAATTTTTT ATTAAAAAAT AATTTTTTTA TTTTAACATT TATTTTTGTA 1081 ATAATAAGAT TAATTATACT ATTATATTAT ATTCGAATTA TTTATTCTTC TCTCATATTT 1141 AATTATTTAA ATTTAAAATG ATTTAAAATT AATATTAAAA ATAATTCTTT TTTTTTAATT
1201 AATTTTTTAA GTATAATTTC TCTATTAGGA ATAATTATTA GAACTTTTTT TTATCTTTAA 1261 GGTTTTAAGT TAATTTAAAC TAATAATCTT CAAAATTATT TATAAAGAAA AATTTCTTTA
1321 AGCCTTAGAA TTTTTTTTCA TCTTAAAATT TGCAATTTTA TATTATAATA TTTAACTATA
1381 AGACTTAATA AAAGAGAAGT TTTTCTCGTT AATAAATTTA CAATTTATCG CCTAAACTTC
1441 AGCCATTTTA TTCTATTAGC GAAAATGACT TTACTCTACA AATCATAAAG ATATTGGAAC
1501 ATTATATTTT ATTTTTGGAA TTTGAGCCGG AATAGTAGGA ACATCTTTAA GTTTACTTAT
1561 TCGTGCAGAA TTAGGTAATC CAGGATCTCT TATTGGAGAT GATCAAATTT ATAATACTAT
1621 TGTCACTGCA CATGCCTTTA TTATAATTTT TTTTATAGTA ATACCTATTA TAATTGGTGG
1681 ATTTGGAAAT TGACTAGTTC CATTAATATT AGGATCACCT GATATAGCAT。