运用mega5构建系统发生进化树.
一个新杉木纤维素合酶ClCesA基因的克隆与植物表达载体构建
一个新杉木纤维素合酶ClCesA基因的克隆与植物表达载体构建魏晓骁;王士亚;陈潇潇;汪凤林;曹光球;曹世江【摘要】In order to explore the molecular mechanism of Chinese fir wood formation, total RNA was extracted from Chinese fir new leaves and cDNA was synthesized. A new ClCesA was cloned using RT-PCR. The length of open reading frame of ClCesA is 2955 bp, with 984 amino acids. Based on TMHMM Server v. 2.0 and MEGA5.1 software, ClCesA proteins consist of 8 across-membrane structures, with average 18 amino acid residues and zinc finger in N end. Also, a conservative DDDQXXLRW structure domain was found in ClCesA protein. Phylogenetic tree analysis showed that ClCesA may be associated with secondary cell wall formation. The flu-orescent quantitative PCR analysis showed that ClCesA can be expressed in organsof root, stem and leaf in Chinese fir, with the highest expression in the root and the least in leaf. Lastly, a plant overexpression vector pGWB506-35s-ClCesA-GFP was successful-ly constructed from pGWB506 vector which contains GFP tag and hygromycin resistance gene by Gateway technology.%为探索杉木木材形成的分子机制,以杉木嫩叶总RNA反转录的cDNA为模板,运用RT-PCR技术克隆出一个新杉木纤维素合酶基因ClCesA.该基因的开放阅读框(ORF)为2955 bp,共编码984个氨基酸.通过TMHMM Server v.2.0和MEGA 5.1软件预测ClCesA蛋白的跨膜结构和功能,发现该蛋白N端含有锌指结构,共有8个跨膜结构,平均跨膜区域18个氨基酸残基,并具有保守的DDDQXXLRW结构域.系统进化树分析结果表明,ClCesA可能与细胞次生壁形成有关.荧光定量PCR分析表明,ClCseA基因在杉木的不同器官(根、茎、叶)中均有表达,但在杉木根中的表达含量最高,茎中次之,叶中最低.随后,为后续该基因功能验证提供基础,将ClCesA 克隆到含有GFP标签和潮霉素抗性的pGWB506载体,构建植物过表达载体pGWB506-35S-ClCesA-GFP.【期刊名称】《福建农林大学学报(自然科学版)》【年(卷),期】2017(046)001【总页数】7页(P66-72)【关键词】杉木;纤维素合酶;基因克隆;表达分析;载体构建【作者】魏晓骁;王士亚;陈潇潇;汪凤林;曹光球;曹世江【作者单位】福建农林大学林学院;国家林业局杉木工程技术研究中心,福建福州350002;福建农林大学林学院;国家林业局杉木工程技术研究中心,福建福州350002;福建农林大学林学院;国家林业局杉木工程技术研究中心,福建福州350002;福建农林大学林学院;国家林业局杉木工程技术研究中心,福建福州350002;福建农林大学林学院;国家林业局杉木工程技术研究中心,福建福州350002;福建农林大学林学院;国家林业局杉木工程技术研究中心,福建福州350002【正文语种】中文【中图分类】Q785;S791.27纤维素作为地球上最丰富的可再生资源,是木材次生木质部细胞壁的主要组成成分之一,约占木材干重的40%,是决定木材品质的重要因子之一.为此揭示植物纤维素生物合成机制对木材材质改良、木材定向培育都具有十分重要的意义.纤维素合酶(CesA)是纤维素生物合成的关键酶之一[1,2].研究表明,CesA基因通过在转录水平上对纤维素合成进行调控,对植物细胞壁发育起到重要作用[3-5].美国密西根大学在2000年初次从欧洲颤杨(Populus tremuloides)中克隆得到林木的纤维素合酶基因PtrCesA1[6],并且研究发现该基因主要在植物茎中表达,表达高峰期主要出现在次生壁形成期间.此后,在毛果杨(Populus trichocarpa)[7]、大青杨(Populus ussuriensis)[8]、松树(Pinus radiata)[9]、苎麻(Boehmeria nivea)[10]、桉树(Eucalyptus)[11]、马尾松(Pinus massoniana)[12]、杉木(Cunninghamia lanceolata)[13]、毛竹(Phyllostachys edulis)[14]等木本植物中都陆续克隆分离出CesA基因,其中毛果杨中鉴定出18个CesA基因[7],杂交杨(Populus tremula (L)×P.tremuloides)中鉴定出10个CesA基因,绿竹(Bambusa bambusaoldhami)中鉴定出8个CesA基因[14].这些基因共同构成了林木的纤维素合酶基因家族.对ClCesA基因功能的研究结果表明,PtrCesA1、PtrCesA2、PtrCesA3这3个基因可能组成同一个纤维素合成酶复合体,共同完成杨树次生壁的合成[15];而PtrCesA4、PtrCesA5、PtrCesA7这3个基因可能与初生壁的形成有关[16].在毛果杨中,PtCesA4、PtCesA5、PtCesA7、PtCesA8、PtCesA17和PtCesA18在木质部特异高表达[17].Song et al[18]通过研究杨树的纤维素合酶发现,杨树的木质部细胞膜上至少具有2种纤维素合酶复合体,复合体Ⅰ由CesA4、CesA7、CesA8、CesA17和CesA18组成,参与细胞次生壁的合成;复合体Ⅱ由CesA3、CesA10、CesA11、CesA13、CesA15和CesA16组成,参与细胞初生壁和次生壁的合成.杉木作为中国南方重要的速生用材树种之一,用途非常广泛.近几年,与杉木材性相关的分子机制研究取得一定进展[19,20],而有关杉木的纤维素生物合成分子机制的研究报道甚少.彭沙沙等[21]克隆了杉木纤维素合成酶类似蛋白ClCslD1;而庞景等[13]克隆了杉木纤维素合成酶基因CesA,通过将本研究克隆出的基因ClCseA与庞景等克隆的CesA基因的DNA和蛋白序列进行比较,发现2个基因在核苷酸的编码区有11处位点存在差异,分别为773、821、1 249、1 537、1 545、1 554、2 166、2 436、2 580、2 823、2 856位点;在氨基酸的编码区序列也发现3处位点存在差异,分别为258、274、513位点.由于杉木基因组测序未完成,关于杉木纤维素合成酶基因家族的数量、各个基因的确切功能,以及各基因间的相互作用关系均不清楚.虽然克隆出的2个基因存在相似性,但也存在差异,有可能为2个不同的基因.关于基因的功能尚需进一步验证.探索杉木中纤维素合酶基因家族的功能,特别是相关次生细胞壁形成的纤维素合酶基因,对于利用现代分子生物学手段改良杉木木材品质具有重要意义.本研究以杉木三代种子园种子发育植株为材料,利用RT-PCR技术分离克隆出1个新的杉木ClCesA基因,长度为2 955 bp,编码984个氨基酸;同时进行了生物信息学分析以及不同器官表达情况的研究;采用Invitrogen公司的gateway特异性位点重组技术将ClCesA基因构建到植物表达载体中,以期为进一步的功能解析提供依据,同时也为杉木材性的改良提供重要的基因资源.1.1 材料收集与RNA提取试验材料由国家林业局杉木工程技术研究中心提供,为杉木种子发育而成的杉木幼苗.取长势好的杉木幼嫩叶片组织0.2 g,按照TIANGEN公司的总RNA提取试剂盒操作说明书提取杉木总RNA,通过1%(质量分数)的琼脂糖凝胶电泳和超微量分光光度计Nanodrop分别检测样品的RNA质量及浓度.1.2 ClCesA基因克隆与序列分析利用NCBI网上的GenBank数据库查询到已知杉木的DNA序列,采用gateway 技术设计特异引物(表1).取检测合格的杉木总RNA,利用TIANScript cDNA第一链合成试剂盒进行第1条链cDNA的合成.合成的cDNA稀释10倍后进行PCR反应,具体反应体系见表2.反应程序为:95 ℃预变性3 min;94 ℃变性1 min,53 ℃退火3 min,72 ℃延伸3 min,共30循环;最后72 ℃延伸10 min.扩增后的产物经1%(质量分数)的琼脂糖凝胶电泳检测后,通过BP连接到pDONR207载体上,热激转化到大肠杆菌DH-5α感受态细胞,进行Gen抗性筛选.选取单菌落做菌落PCR,将检测为阳性的菌落进行液体LB过夜培养,使用天根质粒试剂盒提取质粒,并送铂尚生物公司进行全长测序.利用实时荧光定量PCR仪研究ClCesA基因在不同组织的表达情况.qPCR扩增试剂为SYBR Premix Ex Taq,采用的荧光染料为SYBR GreenⅠ,以杉木EF1α基因作为内参基因.在进行qCR分析前,先使用普通PCR检测体系的反应条件,如退火温度、模板量等,并将PCR 产物进行测序,以保证qPCR结果的准确性.1.3 植物表达载体的构建使用Gateway BP反应试剂盒,将回收带有attB位点的ClCesA基因PCR产物与入门载体pDONR207在室温下进行BP反应1 h.反应体系为:PCR产物0.6 μL,入门载体0.4 μL,BP酶0.25 μL.随后将反应产物全部转化到E.coli Trans 5α感受态细胞,涂布于含Gen(50 mg·L-1)的LB平板;次日随机挑选阳性克隆摇菌并提取质粒,经PCR检测验证正确后进行测序,即可获得入门克隆载体pDONR207-ClCesA.参考Gateway LR反应试剂盒的操作说明书,将入门载体与目的载体pGWB506进行LR反应,室温25 ℃,反应后转化大肠杆菌DH5α感受态细胞,并涂布于LB平板(含50 mg·L-1潮霉素),37 ℃培养过夜.次日挑单菌落,摇菌后用试剂盒提取质粒,经PCR检测载体构建的正确性,并进行测序验证.1. 4 纤维素合酶基因的序列分析在DNAMAN V6软件上设计引物;通过Vecter NTI软件进行序列比对;在TMHMM Server v.2.0软件上进行蛋白质结构分析;运用MEGA 5.1软件通过邻接法构建不同植物的基因进化树;采用Microsoft Excel 2007软件对基因表达进行作图.2.1 杉木总RNA提取杉木叶片总RNA经1%(质量分数)琼脂糖凝胶电泳,结果见图1.从图1可以看出,RNA条带完整,28 S rRNA和18 S rRNA 2条主带明显,28 S rRNA的亮度约为18 S rRNA的2倍,且无DNA污染.采用超微量分光光度计进行浓度测定和质量分析、检测,结果显示,样品总RNA浓度为231 μg·μL-1,D260 nm/D280nm=1.86,其浓度与质量均满足反转录的要求,可用于后续试验.最后,将总RNA 样品置于-80 ℃冰箱保存.2.2 扩增产物的碱基序列测定与分析取上述总RNA,采用天根公司的逆转录酶试剂盒获得cDNA,通过RT-PCR反应得到1个约3 000 bp的产物(图2),将该产物连接到pDONR207载体且转化DH-5α,挑取阳性克隆测序.测序结果显示该序列与CesA基因的同源性很高,并含有保守结构域.其氨基酸序列及结构如图3所示.2.3 蛋白质跨膜结构的预测从图4可以看出,新的ClCesA蛋白具有8个跨膜区,分别为175~197、204~223、760~782、794~816、831~853、878~900、910~932、945~964,最大跨膜区域为22个氨基酸残基,最小跨膜区域为12氨基酸残基,平均跨膜区域为18个氨基酸残基.2.4 基因序列系统发生树本研究运用MEGA 5.1软件构建系统进化树,将克隆到的杉木ClCesA基因编码区与拟南芥(Arabidopsis thaliana, At)、颤杨(P.tremuloides, Ptr)、欧洲山杨×颤杨(Populus tremula×P.tremuloides, Ptt)、火炬松(Pinus taeda L., Pt)、银灰杨(Populus canescens (Ait.) Smith, Pca)、毛白杨(Populus tomentosa Carrière, Pto)的初生壁和次生壁形成的CesA基因进行系统进化树分析.初生壁有关基因有AtCesA1(O48946)、AtCesA2(O48947)、AtCesA5(Q8L778)、AtCesA9(Q9SJ22)、PtrCesA7(AAO25581)、PttCesA2(AAT09895)、PtrCesA4(AAO25536)、PtrCesA6(AAP40636).次生壁有关基因有PtCesA1(AAX18647)、PtCesA2(AAX18648、PtCesA3(AAX18649)、PtrCesA2(AAM26299)、PtrCesA7(AAO25581)、PtrCesA3(AAQ08987)、PcaCesA1(AAC78476)、PttCesA1(AAT09894)、PttCesA3-1(AAT09896)、PttCesA3-2(AAT09897)、AtCesA4(Q84JA6)、AtCesA8(Q8LPK5)、PtoCesA1(AAY21910).从图5可以看出ClCesA分布在次生壁较密集的分支,且与杉木ClCesA1在一个小分支,说明两者的亲缘关系较近,可能执行类似的功能,由此推测ClCesA基因可能与次生壁合成有关.2.5 ClCesA基因在不同组织的表达杉木纤维素合酶基因在不同器官表达情况的分析结果(图6)显示,杉木的根、茎、叶3个器官均有纤维素合酶基因表达,而且相对表达量在杉木根中最高,茎中次之,叶中最低.因此,可以推测ClCesA基因与杉木木材生长发育的调控有着密切关系.2.6 植物过表达载体的构建将检测正确的入门载体pDONR207-ClCesA和目的载体pGWB506进行LR反应,获得植物表达载体pGWB506-35S-ClCesA-GFP,载体构建策略如图7所示.使用特异性的载体引物和基因特异性引物做菌落PCR,扩增出1 000 bp的片段(图8),表明LR反应成功.重组质粒的测序结果显示,ClCesA并未产生突变,并且和原序列相同,说明本试验的植物表达载体连接正确.通过序列比对与分析,Pear et al[22]首先从棉花中克隆得到与细菌CelA基因同源的纤维素合酶基因GhCesA1、2.通过基因组学分析研究,Richmond et al[23]得到了拟南芥基因组中的10个CesA基因的蛋白质序列结构特点.Suzuki et al[17]分析了杨树基因组的18个CesA基因的结构特点.目前为止,研究发现CesA基因编码的蛋白质有着相类似的结构,共有8个跨膜结构域, N端有2个, C端有6个.1个锌指结构域在N端,可能和蛋白质之间的相互作用有关.CesA蛋白都含有较典型的结构如DDDQxxRW(天冬氨酸、天冬氨酸、天冬氨酸、谷氨酞胺-x-x精氨酸—色氨酸)[24].通过对CesA基因功能的研究,已陆续鉴定出与初生壁和次生壁形成相关的基因.在欧洲颤杨中,PtrCesA1、PtrCesA2、PtrCesA3可能形成一个纤维素合成酶复合体,共同完成杨树次生壁的合成[15,24],而PtrcesA4、PtrCesA5、PtrCesA7可能与初生壁的形成有关[16].本研究克隆到一个新杉木ClCesA基因,通过系统进化树,该基因与聚类在一个进化分支并在根中表达量最高,推测该基因可能参与植物次生细胞壁的形成.而庞景等克隆到的2个CesA基因,ClcesAl与PtrCesAl的同源性最高;ClCesA2与ZmCesA2聚类在一起,两者在茎中高度表达.本研究中所用材料为培养30 d左右的杉木种子萌发而成的幼苗,而庞景所用的杉木材料为1年生杉木幼苗,且纤维素合酶CesA在植物不同发育阶段、不同器官中的表达量不同,所以这可能是造成ClCesA在杉木器官中表达量不同的原因.植物中除了CesA基因外,还有类纤维素合酶(cellulose synthase-like, CSL)基因家族参与纤维素的生物合成.拟南芥CSL蛋白有9个家族,分别为CSL(A/B/C/D/E/F/G/H/J)[25];在基因序列上,CSL基因与CesA基因具有部分同源,主要参与各种β-聚糖链的合成[23,25].彭莎莎等[21]也从杉木中克隆到了CSL基因,并分析其序列结构特点.【相关文献】[1] KUMAR M, TURNER S. Plant cellulose synthesis: CESA proteins crossing kingdoms[J]. Phytochemistry, 2015,112:91-99.[2] KAUR S, DHUGGA K, GILl K. Novel structural and functional motifs in cellulose synthase (CesA) genes of bread wheat (Triticum aestivum L.)[J]. PLoS ONE, 2016,11(1):e0147046. [3] DESPREZ T, JURANIEC M, CROWELLE E F. Organization of cellulose synthase complexesinvolved in primary cell wall synthesis in Arabidopsis thaliana[J]. Proceedings of the National Academy of Sciences, 2007,104(39):15 572-15 577.[4] TAYLOR N G. Cellulose biosynthesis and deposition in higher plants[J]. New Phytologist, 2008,178(2):239-252.[5] TANAKA K, MURATA K, YAMAZAKI M. Three distinct rice cellulose synthase catalytic subunit genes required for cellulose synthesis in the secondary wall[J]. Plant Physiology, 2003,133(1):73-83.[6] WU L, JOSHI C P, CHIANG V L. A xylem-specific cellulose synthase gene from aspen (Populus tremuloides) is responsive to mechanical stress[J]. The Plant Journal,2000,22(6):495-502.[7] DJERBIJ S, LINDSKOG M, ARVESTAD L. The genome sequence of black cottonwood (Populus trichocarpa) reveals 18 conserved cellulose synthase (CesA) genes[J]. Planta, 2005,221(5):739-746.[8] 许雷,刘一星,方连玉.大青杨纤维素合成酶PuCesA6基因cDNA的克隆及序列分析[J].西南林业大学学报,2012,32(5):26-32.[9] KRAUSKOPF E, HARRIS P J, PUTTERILL J. The cellulose synthase gene PrCESA10 is involved in cellulose biosynthesis in developing tracheids of the gymnosperm Pinus radiata[J]. Gene, 2005,350(2):107-116.[10] 刘昱翔,陈建荣,彭彦,等.苎麻纤维素合成酶基因BnCesA4 cDNA序列的克隆与表达分析[J].作物研究,2014,28(5):472-478.[11] RANIK M, MYBURG A A. Six new cellulose synthase genes from Eucalyptus are associated with primary and secondary cell wall biosynthesis[J]. Tree Physiology, 2006,26(5):545-556.[12] 阮维程,潘婷,季孔庶.马尾松纤维素合成酶基因PmCesA1的克隆及其分析[J].分子植物育种,2015,13(4):861-870.[13] 庞景,童再康,黄华宏,等.杉木纤维素合成酶基因CesA的克隆及表达分析[J].浙江农林大学学报,2015,32(1):40-46.[14] 邓小波,胡尚连,曹颖,等.绿竹与毛竹纤维素合成酶(CesA)的生物信息学分析[J].福建林学院学报,2011,31(1):84-90.[15] SAMUGA A, JOSHI C P. Cloning and characterization of cellulose synthase-like gene, PtrCSLD2 from developing xylem of aspen trees[J]. Physiologia Plantarum,2004,120(4):631-641.[16] KALLURI U C, JOSHI C P. Differential expression patterns of two cellulose synthase genes are associated with primary and secondary cell wall development in aspen trees[J]. Planta, 2004,220(1):47-55.[17] SUZUKI S, LI L, SUN Y H. The cellulose synthase gene superfamily and biochemical functions of xylem-specific cellulose synthase-like genes in populus trichocarpa[J]. PlantPhysiology, 2006,142(3):1 233-1 245.[18] SONG D, SHEN J, LI L. Characterization of cellulose synthase complexes in Populus xylem differentiation[J]. New Phytologist, 2010,187(3):777-790.[19] 蒋向辉,佘朝文,许栋,等.杉木CCoAOMT基因部分cDNA克隆与序列分析[J].中南林业科技大学学报,2009,29(6):24-28.[20] 吕运舟,郑佳,陈金慧,等.参与杉木次生壁合成调控的转录因子ClMYB4的克隆及在大肠杆菌中表达[J].分子植物育种,2012,10(5):512-519.[21] 彭沙沙,童再康,黄华宏,等.杉木纤维素合成酶类似蛋白基因ClCslD1的克隆及其生物信息学分析[J].浙江农林大学学报,2012,29(1):1-6.[22] PEAR JR, KAWAGOE Y, SCHRECKENGOET W E. Higher plants contain homologs of the bacterial celA genes encoding the catalytic subunit of cellulose synthase[J]. Proceedings of the National Academy of Sciences, 1996,93(22):12 637-12 642.[23] RICHMOND T A, SOMERVILLE C R. The cellulose synthase superfamily[J]. Plant Physiology, 2000,124(2):495-498.[24] SAMUGA A, JOSHI CP. A new cellulose synthase gene (PtrCesA2) from aspen xylem is orthologous to Arabidopsis AtCesA7 (irx3) gene associated with secondary cell wall synthesis[J]. Gene, 2002,296(1):37-44.[25] LIEPMAN A H, CAVALIER D M. The cellulose synthase-like A and cellulose synthase-like C families: recent advances and future perspectives[J]. Front Plant Sci, 2012,3(109):1-7.。
用MEGA构建进化树
如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP 建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web数据库检索。
下载后可直接使用,主要包括几个方面的功能软件:i)DNA 和蛋白质序列数据的分析软件。
ii)序列数据转变成距离数据后,对距离数据分析的软件。
iii)对基因频率和连续的元素分析的软件。
iv)把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v)绘制和修改进化树的软件,进行网上blast搜索。
用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA序列并测序,然后与数据库/blast/Blast.cgi比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT文档中,如>TS1GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCG GA TAGGACCTCGGGA TGCA TGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGA TCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAA GTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAACAC GTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAA TACCGGA T>TS2TGCAAGTCGAGCGAATGGA TTAAGAGCTTGCTCTTA TGAAGTTAGCGGCGGACGGGTG AGTAACACGTGGGTAACCTGCCCA TAAGACTGGGATAACTCCGGGAAACCGGGGCTAA TACCGGATAACA TTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383GA TGAACGCTGGCGGCGTGCCTAA TACATGCAAGTCGAGCGAA TGGATTAAGAGCTTG CTCTTA TGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGAC TGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC ………………………….………………………….参考序列选择有几个原则:a,不选非培养(unclutured)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
进化树构建方法-MEGA
利用MEGA 来构建进化树(molecular evolutionary genetics analysis 分子进化遗传分析)打开mega5,选择Align----edit/built alignment----create a new alignment—OK选择DNA/protein出现新的对话框Open------选择已经保存好的用clustalx 经过比对保存的以.aln格式的文件打开之后,出现下面的页面双击文件名可以进行修改的。
我的就是从这里开始修改把A,B,C 都去掉,只留号码就好右键菜单点击delete 删除带※的那一行。
得到下面的图示,点击保存,重新起名字。
之后点击此图内的Alignment 选择Align by clustalW即可。
默认设置即可,点击OK就进行比对了,此后会出现一个过渡对话框,显示的是两两比对和多序列比对的过程之后回到初始页面,就是这个页面之后点File---点开,把刚才保留的文件点开然后出现下面的页面多了几个内容,点击TA的那个框框。
之后出现这样的框框图片然后在主程序中选择phylogeny---construct/test neighbor-joining tree,然后出现下面的页面黄色框框处的的参数是可以改变的,该图为我已经改变好的,把Bootstrap 的值改为1000 Methods根据文献上的参考改为了Kimura2-parameter model.之后点击compute,就出现了,而且还带有必需的支持率即自展值,是用来检验你所计算的进化树分支可信度的。
简单地讲就是把序列的位点都重排,重排后的序列再用相同的办法构树,如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上一分,如果没出现就给0分,这样经过你给定的repetitions 次(至少1000次)重排构树打分后,每个分枝就都得出分值,计算机会给你换算成bootstrap值。
重排的序列有很多组合,值越小说明分枝的可信度越低,最好根据数据的情况选用不同的构树方法和模型。
MEGA5使用说明
MEGA软件——系统发育树构建方法(图文讲解)
2012年12月02日⁄Evolution⁄字号小中大⁄评论 3 条⁄阅读 3,872 次[点击加入在线收藏夹]
一、序列文本的准备
构树之前先将目标基因序列都分别保存为txt文本文件中(或者把所有序列保存在同一个txt文本中,可以用“>基因名称”作为第一行,然后重起一行编辑基因序列),序列只包含序列字母(ATCG或氨基酸简写字母)。
文件名名称可以已经您的想法随意编辑。
二、序列导入到Mega 5软件
(1)打开Mega 5软件,界面如下
(2)导入需要构建系统发育树的目的序列
OK
选择分析序列类型(如果是DNA序列,点击DNA,如果是蛋白序列,点击Protein)
出现新的对话框,创建新的数据文件
选择序列类型
导入序列
导入序列成功。
(3)序列比对分析
点击工具栏中“W”工具,进行比对分析,比对结束后删除两端不能够完全对齐碱基
(4)系统发育分析
关闭窗口,选择保存文件路径,自定义文件名称
三、系统发育树构建
根据不同分析目的,选择相应的分析算法,本例子以N—J算法为例
Bootstrap 选择1000,点击Compute,开始计算
计算完毕后,生成系统发育树。
根据不同目的,导出分析结果,进行简单的修饰,保存
本方法来自网络,经小编microibs编辑,修改补充,如果转载请注明PLoB出处。
最新MEGA5使用说明
1MEGA软件——系统发育树构建方法(图文讲解)22012年12月02日⁄Evolution⁄字号小中大⁄评论 3 条⁄阅读 3,872 3次[点击加入在线收藏夹]4一、序列文本的准备5构树之前先将目标基因序列都分别保存为txt文本文件中(或者把所有序列6保存在同一个txt文本中,可以用“>基因名称”作为第一行,然后重起一行编7辑基因序列),序列只包含序列字母(ATCG或氨基酸简写字母)。
文件名名称8可以已经您的想法随意编辑。
910111213二、序列导入到Mega 5软件14(1)打开Mega 5软件,界面如下151617(2)导入需要构建系统发育树的目的序列1819202122OK23选择分析序列类型(如果是DNA序列,点击DNA,如果是蛋白序列,点击24Protein)252627出现新的对话框,创建新的数据文件282930选择序列类型313233导入序列34353637383940导入序列成功。
41(3)序列比对分析424344点击工具栏中“W”工具,进行比对分析,比对结束后删除两端不能够完全对45齐碱基464748(4)系统发育分析495051关闭窗口,选择保存文件路径,自定义文件名称525354三、系统发育树构建555657根据不同分析目的,选择相应的分析算法,本例子以N—J算法为例585960Bootstrap 选择1000,点击Compute,开始计算616263计算完毕后,生成系统发育树。
646566根据不同目的,导出分析结果,进行简单的修饰,保存67本方法来自网络,经小编microibs编辑,修改补充,如果转载请注明PLoB 68出处。
69。
MEGA5.10构建系统进化树
Escherichia coli O157:H7 str. EC4045相关基因的系统进化树构建以glutamate-ammonia ligase adenylyltransferase 为例
1、进入NCBI主页
2、选择Protien 数据库,输入搜索名称
3、在右侧的Top Organisms[Tree]下,选择其中一个种
4、点击进入第一条目,
5、点击send to 保存文件
6、回到NCBI,到Blast,页面
7、点击进入Protien Blast ,
8、将以上搜索的蛋白质序列输入到搜索框中,进行序列比对
9、在上图中选取10个与原蛋白序列相关性最强的蛋白,一一如上述方法保存,以便接下来进行系统进化树的构建。
10、将10个序列导入MEGA ,得到
11、点击Alignment,
12、出现下图,点击OK
13、得到序列匹配后的,将其保存为“.meg”格式
14、
15、重新回到MEGA主页面,打开保存的格式文件
16、点击TA可看到
17、点击C可看到保守序列,V则是可变序列
18、回到主页面,点击Phylogeny
19、点击下图中Compute
20、得到系统进化树。
Mega的使用以及进化树的绘制
1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
使用mega构建进化树的流程
使用mega构建进化树的流程下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!使用 MEGA 构建进化树的流程如下:1. 数据准备:收集需要构建进化树的序列数据,可以是 DNA 序列或蛋白质序列。
运用mega5构建系统发生进化树
运用mega5构建系统发生进化树1.准备序列文件准备fasta格式序列文件(fasta格式:大于号>后紧跟序列名,换行后是序列。
举例如下)。
每条序列可以单独为一个文件,也可以把所有序列放在同一文件内。
核酸序列:>sequence1_nameCCTGGCTCAGGATGAACGCT氨基酸序列:>sequence2_nameMQSPINSFKKALAEGRTQIGF2.多序列比对打开MEGA 5,点击Align,选择Edit/Build Alignment,选择Create a new alignment,点击OK。
这时需要选择序列类型,核酸(DNA)或氨基酸(Protein)。
选择之后,在弹出的窗口中直接Ctrl + V粘贴序列(如果所有序列在同一个文件中,即可全选序列,复制)。
也可以:点击Edit,选择Insert Sequence From File,选择序列文件(可多选)。
序列文件加载之后,呈蓝色背景(为选中状态)。
点击按钮,选择Align DNA (如果是氨基酸序列,则会出现Align Protein)。
弹出的窗口中设置比对参数,一般都是采用默认参数即可。
点击OK,开始多序列比对。
比对完成后,呈现以下状态。
这时需要截齐两端含有---的序列:选中含有---的序列,按键Delete删除(注意:两端都需要截齐)。
截齐之后,保存文件为:filename.mas3.构建系统进化树多序列比对窗口,点击Data,选择Phylogenetic Analysis,弹出窗口询问:所用序列是否编码蛋白质,根据实际情况选择Yes或No。
此时,多序列比对文件就激活了,可以返回MEGA 5主界面建树了。
MEGA 5主界面。
点击Phylogeny,选择Construct/Test Neighbor-Joining Tree…弹出的对话框询问:是否使用当前激活的数据,选择Yes。
这时弹出建树参数设置对话框,更改No. of Bootstrap Replications为1000,其他参数默认即可,点击Compute。
如何用MEGA5.0和Clustalx1.83构建进化树
如何用MEGA和Clustalx构建进化树MEGA是一个关于序列分析以及比较统计的工具包,从3.1版本到后来的4.0版本一直都广为大家熟悉,现在推出了Mega5.0版本。
功能比以前多有改进。
现主要介绍使用Mega 5.0构建系统进化树的方法。
供大家参考。
用MEGA构建进化树有以下步骤:1、测序:将克隆扩增测序得到的16S rDNA序列进行测序。
2、NCBI上做Blast找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后寻找相似性最高的细菌,通常把该属的序列(Fasta格式文件)下载下来,或点击GenBank登录号,复制FSATA 格式,整合在一个*.txt文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹),如>XXXXAGGCTTAACACA TGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCG GACGGGTGAGTAA TGCTTAGGAA TCTGCCTA TTAGTGGGGGACAACATTCCGAAAGGA ATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAA TAGATGAGCCTAAGTCGGA TTAGCTAGTTGGTGGG>gi|289469964|gb|GU388381.1| Acinetobacter tandoii strain DSM 14970 16S ribosomal RNA gene, partial sequence ACTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACA TTCCGAAAGGGATGCTAATACCGCA TACGCCCTACGGGGGAAAGCAGGGGATCTTCGG ACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTAC CAAGGCGACGA TCTGTAGCGGGTCTGAGAGGATGA………………………….参考序列选择注意事项:1、不选非培养(unclutured)微生物为参比;2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
MEGA5构建系统发育树
实验原理
• 系统发生树(英文:Phylogenetic tree)又 称为演化树(evolutionary tree),是表明 被认为具有共同祖先的各物种间演化关系 的树。是一种亲缘分支分类方法。 (cladogram)。在树中,每个节点代表其 各分支的最近共同祖先,而节点间的线段 长度对应演化距离(如估计的演化时间)。
MEGA5可以识别 fasta格式文件 将
17-RNASE1.fasta.txt
重命名为
17-RNASE1.fasta
•选择打开方式为MEGA5,打开17-RNASE1.fasta,自动跳 出序列窗口 •用ClustalW做多序联配
ClustalW参数设置
多序列联配后结果
以.meg格式保 存结果
mega5可以识别fasta格式文件17rnase1fastatxt重命名为17rnase1fasta?选择打开方式为mega5打开17rnase1fasta自动跳出序列窗口?用clustalw做多序列联配clustalw参数设置多序列联配后结果以
实验五 进化树分析
实验目的 1.理解系统发育分析的基本原理 2.学会使用MEGA5.1软件包构建系统发育树。
回到MEGA主窗口 打开所保存的文件(.meg)
点击按钮打开文件窗口
显示保守位点 显示变异位点
回到MEGA主窗口构建进化树
选择邻接法建树
当前打开的文件
选择Bootstrap 检验
作业
1.使用MEGA5.05软件包构建蛋白质进化树的 具体使用顺序,并写出具体步骤。 2.以下面的序列为材料构建系统进化树,并将 进化树抓图。 附序列:花生SAMDC蛋白质进化树分析,见 SAMDC ms.txt文档。
用MEGA构建进化树
如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP 建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web数据库检索。
下载后可直接使用,主要包括几个方面的功能软件:i)DNA 和蛋白质序列数据的分析软件。
ii)序列数据转变成距离数据后,对距离数据分析的软件。
iii)对基因频率和连续的元素分析的软件。
iv)把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v)绘制和修改进化树的软件,进行网上blast搜索。
用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA序列并测序,然后与数据库比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT 文档中,如>TS1GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCG GA TAGGACCTCGGGA TGCA TGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGA TCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAA GTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAACAC GTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAA TACCGGA T>TS2TGCAAGTCGAGCGAATGGA TTAAGAGCTTGCTCTTA TGAAGTTAGCGGCGGACGGGTG AGTAACACGTGGGTAACCTGCCCA TAAGACTGGGATAACTCCGGGAAACCGGGGCTAA TACCGGATAACA TTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383GA TGAACGCTGGCGGCGTGCCTAA TACATGCAAGTCGAGCGAA TGGATTAAGAGCTTG CTCTTATGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCA TAAGAC TGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC ………………………….………………………….参考序列选择有几个原则:a,不选非培养(unclutured)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
利用mega构建树原理
利用mega构建树原理
Mega构建树的原理主要基于系统发育树(又称分子进化树)的概念。
这是一种描述一群有机体发生或进化顺序的拓扑结构,用于在生物信息学中描述不同生物之间的相关关系。
拓扑结构将讨论范围内的事物之间的相互关系表示出来,将这些事物之间的关系通过图表示出来。
Mega软件可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。
在构建系统发育树时,它采用了一系列的算法和模型,如邻接法(NJ)、最大似然法(ML)、最大简约法(MP)和贝叶斯法(Bayes)等。
这些方法和模型的选择取决于具体的数据和研究目标。
构建系统发育树的一般过程包括以下几个步骤:
1. 数据准备:收集需要研究的物种的基因或蛋白序列,并进行比对,以确保它们的同源性。
比对的结果可以保存为特定的格式,如FASTA。
2. 模型选择:根据数据的特性,选择一个合适的进化模型。
例如,对于DNA序列,可以选择GTR、TN93、HKY等模型;对于蛋白序列,可以选择JTT、WAG、LG等模型。
3. 树的构建:使用选择的模型和方法,构建系统发育树。
这个过程可能包括搜索最优的树结构、计算分支长度等。
4. 树的评估和优化:通过一些统计方法,如自展值(Bootstrap)等,对构建的树进行评估和优化,以提高其可靠性。
需要注意的是,构建系统发育树是一个复杂的过程,需要一定的专业知识和经验。
同时,由于生物进化的复杂性,构建的树可能并不完全准确,需要结合其他证据进行解释和验证。
Mega的使用以及进化树的绘制
1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
MEGA软件——系统发育树构建方法
MEGA软件——系统发育树构建方法1)序列文本构树之前先将每个样品的序列都分别保存为txt文本文件中,序列只包含序列字母(ATCG或氨基酸简写字母)。
文件名名称可以已经您的想法随意编辑。
2)序列导入MEGA 5首先打开MEGA 5软件,界面如下:然后,导入需要构建系统进化树的序列:点击OK出现新的对话框,创建新的数据文件导入成功3)序列比对分析点击W,开始比对。
比对完成后删除序列两端不能完全对其的碱基。
系统分析然后,关闭该窗口,在弹出的对话框中选择保存文件,文件名随便去,比如保存为1。
4)系统发育树构建以NJ为例Bootstrap选择1000,点Computer,开始计算计算完毕后,生成系统发育树。
以下“系统发育树树的修饰”方法沿用斑竹brightfuture01的方法5)树的修饰建好树之后,往往需要对树做一些美化。
这个工作完全可以在word中完成,达到发表文章的要求。
点击image,copy to clipboard。
新建一个word文档,选择粘贴。
见下图:在图上点击右键-编辑图片,就可以对文字的字体大小,倾斜等做出修饰。
见下图:这个时候可以通过Adobe professional 对其进行图像导出:先将此word文档打印成PDF,见下图:将打印出来的PDF保存在桌面上,打开,如下图:此时,点击工具,高级编辑工具,裁剪工具,如下图所示:选择需要的区域以删除周围的空白区,双击发育树,会出现下图:点击确定,出现下图(把空边切掉了):点击文件,另存为,在保存类型一栏中选择TIFF格式,点击确定后会生成下面这个图片,所生成图片绝对可以满足文章的发表:OK,结束了,自己玩一把吧。
科研快速组图方法介绍利用MEGA构建系统演化树
贴图基本用法及剪贴板贴图
贴图分组保存
比如我当前在为问题 A 查找资料,所以建立了一堆和 A 相 关的贴图,但之后我因为各种原因不得不停下问题 A,转去解 决问题 B,我不希望问题 A 的贴图继续占用我的屏幕空间,妨 碍我对问题 B 的思考,这时候我就新建一个分组,切换过去, 就可以开始为问题 B 弄一堆贴图了,而我也可以随时再切换回 问题 A 的分组去继续处理它。
使用PPT组图
使用PS组图
1. 整理图片:按顺序分组,重命名 1. 整理图片:按顺序分组,重命名原
原始图片
始图片
2. 将原始图片分组导入到PPT中 2. 根据原始图片的大小和数目,计算
3. 拖动,对齐,平均分布图片,组 新建图层大小,在PS中新建图层
合对象
3. 将原始图片导入到PS中,在复制到
4. 添加文字标注
MEGA 的全称是Molecular Evolutionary Genetics Analysis(分子演化遗传 分析)。MEGA 主要用于多序列比对、构建系统演化树及评估演化关系可靠 性等,是一款免费软件。
构建演化树的一般方法为: 1. 进行多序列比对 (MSA) 2. 选择建树方法:距离法、最大简约法,最大似然法和贝叶斯法 3. 建立演化树及评估可靠性
2018年春季经验交流
1. 科研快速组图方法介绍 2. 利用MEGA构建系统演化树 3. 实用截图工具Snipaste推荐
汇报人:XX 时间:2018-3-27
交流内容
1. 图片类型及格式简介 2. PPT与PS常规组图方法演示 3. Photoshop快速组图动作包SciPicMatrix介绍 4. SciPicMatrix安装及效果演示 5. PPT对图片的压缩 6. MEGA构建演化树 7. 实用截图工具Snipaste推荐
用MEGA构建进化树
怎么样用MEGA建坐进化树之阳早格格创做是一个关于序列分解以及比较统计的工具包,其中包罗有距离建立法战MP建立法;可自动大概脚动举止序列比对付,估计进化树,估算分子进化率,举前进化假设考验,还能联机的Web数据库检索.下载后可间接使用,主要包罗几个圆里的功能硬件:i)DNA战蛋黑量序列数据的分解硬件.ii)序列数据转形成距离数据后,对付距离数据分解的硬件. iii)对付基果频次战连绝的元素分解的硬件.iv)把序列的每个碱基/氨基酸独力瞅待(碱基/氨基酸惟有0战1的状态)时,对付序列举止分解的硬件.v)画造战建矫正化树的硬件,举止网上blast搜索.用MEGA建坐进化树有以下步调:1. 16S rDNA测序战参照序列采用从环境中分散到单克隆,去沉复后扩删16S rDNA序列并测序,而后与数据库比对付,找到相似度最下的几个序列,决定一下您分散的细菌约莫属于哪个科哪个属,如果相似度达到百分之百那基础不妨决定您分散得到的便是Blast到的那个,而后找一到二个共科的,再找一到二个共脚段,再找一到二个共目的细菌,把序列齐脚下下去,以FSATA形式调整正在TXT文档中,如>TS1GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGATT AGTGGCGAACGGGTGAGTAACACGTGGGTGATCTGCC CTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAAT ACCGGATAGGACCTCGGGATGCATGTTCCGGGGTGGA AAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGATCCTGGCTCAGGACGAACGCTGGC GGCGTGCTTAACACATGCAAGTCGAACGATGAAGCCC AGCTTGCTGGGTGGATTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTG GGAAACTGGGTCTAATACCGGAT>TS2 TGCAAGTCGAGCGAATGGATTAAGAGCTTGCTCTTATG AAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAAC CTGCCCATAAGACTGGGATAACTCCGGGAAACCGGGG CTAATACCGGATAACATTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCG AGCGAATGGATTAAGAGCTTGCTCTTATGAAGTTAGCG GCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATA AGACTGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAA CYGCATGGTTC………………………….………………………….参照序列采用有几个准则:a,不选非培植(unclutured)微死物为参比;b,所选参照序列要精确,内里无过失碱基;c,正在包管共属的前提下,劣先采用16S rDNA齐少测序大概齐基果组测序的种;d,每个种属采用一个参照序列,如果自己的序列中共一属的较多,可适合采用二个参照序列. 2. 序列比对付将整治佳的序列导进,如图接着步调自动运止,得出截止,自动输出 .aln战.dnd 为后缀的二个文献.序列比对付也不妨间接用MEGA去搞.MEGA,如下图所示:4.只可挨启meg要领的文献,然而是它不妨把其余要领的多序列比对付文献变换过去,用.aln要领(Clustal的输出文献)变换.meg文献.面File:Convert to MEGA Format,挨启变换文献对付话框,从脚段文献夹中选中Clustal 对付比分解后所爆收的.aln文献,面打挨启.5. 变换佳的meg文献,会弹出一个提示疑息,面打ok.查看meg序列文献末尾是可平常,若存留clustal. *止,即可简略.面存盘保存meg文献,meg文献会战aln文献保存正在共一个目录.6. 关关变换窗心,回到主窗心,当前面里板上的“Click me to activate a data file”挨启刚刚才的meg文献.如果为蛋黑量序列,采用“protein sequence”,电打“OK”,得到以下图示,数据输进之后的格式,窗心底下有序列文献名战典型.而正在其余一个窗心内,出现以下数据文献面打采用战编写数据分类图标,可对付所采用的序列举止编写,完成后面打close即可.序列编写完成后,可举止保存,面打保存后出现以下界里,面打ok即可.7. 建坐进化树的算法主要分为二类:独力元素法(discrete character methods)战距离依赖法(distance methods).所谓独力元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决断的(比圆:一个序列上大概包罗很多的酶切位面,而每个酶切位面的存留与可是由几个碱基的状态决断的,也便是道一个序列碱基的状态决断着它的酶切位面状态,当多个序列举前进化树分解时,进化树的拓扑形状也便由那些碱基的状态决断了).而距离依赖法是指进化树的拓扑形状由二二序列的进化距离决断的.进化树枝条的少度代表着进化距离.独力元素法包罗最大简约性法(Maximum Parsimony methods)战最大大概性法(Maximum Likelihood methods);距离依赖法包罗除权配对付法(UPGMAM)战邻位贯串法(Neighbor-joining).(1)phylogeny→UPGMA(2)用Bootstrap建坐进化树,MEGA的主要功能便是搞Bootstrap考证的进化树分解,Bootstrap考证是对付进化树举止统计考证的一种要领,不妨动做进化树稳当性的一个度量.百般算法虽然分歧,然而是支配要领基础普遍.进化树的建坐是一个统计教问题.咱们所建坐出去的进化树不过对付真正在的进化关系的评估大概者模拟.如果咱们采与了一个适合的要领,那么所建坐的进化树便会靠近真正在的“进化树”.模拟的进化树需要一种数教要领去对付其举止评估.分歧的算法有分歧的适用目标.普遍去道,最大简约性法适用于切合以下条件的多序列:i 所要比较的序列的碱基不共小,ii 对付于序列上的每一个碱基有近似相等的变同率,iii 不过多的颠换/变换的倾背,iv 所考验的序列的碱基数目较多(大于几千个碱基);用最大大概性法分解序列则不需以上的诸多条件,然而是此种要领估计极其耗时.如果分解的序列较多,有大概要花上几天的时间才搞估计完成.历程如下①参数的树坐:phylogeny→bootstrap test of phylogeny→NJ②系统进化树的尝试要领,不妨采用用Bootstrap,也不妨采用不举止尝试.沉复次数(Replications)常常设定起码要大于100比较佳,随机数种子不妨自己随意设定,不会做用估计截止.普遍采用500大概1000.有许多Model供采用,默认为Kimura 2-paramete r,分歧的Model 有分歧的算法,简曲请参照博业的死物疑息教书籍籍.设定完成,面compute,启初估计.②截止输出:那个历程所耗时间战序列的数量战少短成正比,步调便会爆收那样一个树,该窗心中有二个属性页,一个是本初树,一个是bootstrap考证过的普遍树.树枝上的数字表示bootstrap考证中该树枝可疑度的百分比.截止如下:8. 进化树的劣化:1)利用该硬件可得到分歧树型,如下图所示:除此除中,还不妨有多种树型,根据需要去采用.2)隐现建立的相关疑息:面打图标i.3)面打劣化图标,可举止各项劣化:Tree栏中,不妨举止树型采用:rectangular tree/circle tree/radiation tree.每种树皆不妨举止少度,宽度大概角度等的设定Branch:可对付树枝上的疑息举止建改.Lable:可对付树枝的名字举止建改.Scale:标尺树坐Cutoff:cutoff for consensus tree.普遍为50%. 9、进化树的分类劣化Place root on branch:不妨去回变换.Flip subtree:180度翻转分枝,名字翻转180度.Swab subtree:接换分枝,名字不翻转.Compress/expand subtree与Set divergent time:不妨把共一分枝的基果压缩大概扩展.面打Compress/expand subtree后,正在要压缩的分枝处面打,出现以下界里,正在name/caption 中输进文献名(比圆wwww),其余另有很多的选项,树坐佳了,面打OK.所得到的截止,不妨正在压缩战扩展之间变换. 10. 安排进化树根据所的进化树的效验,要举止安排,包罗多余序列简略、缺累序列增加、种属称呼标注等等,还要根据投稿纯志央供正在PHOTOSHOP中建改等.完成后的进化树应包罗充脚的疑息.自己所搞进化树完成图如下:。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.准备序列文件
准备fasta格式序列文件(fasta格式:大于号>后紧跟序列名,换行后是序列。
举例如下)。
每条序列可以单独为一个文件,也可以把所有序列放在同一文件内。
核酸序列:
>sequence1_name
CCTGGCTCAGGATGAACGCT
氨基酸序列:
>sequence2_name
MQSPINSFKKALAEGRTQIGF
2.多序列比对
打开MEGA 5,点击Align,选择Edit/Build Alignment,选择Create a new alignment,点击OK。
这时需要选择序列类型,核酸(DNA)或氨基酸(Protein)。
选择之后,在弹出的窗口中直接Ctrl + V粘贴序列(如果所有序列在同一个文件中,即可全选序列,复制)。
也可以:点击Edit,选择Insert Sequence From File,选择序列文件(可多选)。
序列文件加载之后,呈蓝色背景(为选中状态)。
点击按钮,选择Align DNA (如果是氨基酸序列,则会出现Align Protein)。
弹出的窗口中设置比对参数,一般都是采用默认参数即可。
点击OK,开始多序列比对。
比对完成后,呈现以下状态。
这时需要截齐两端含有---的序列:选中含有---的序列,按键Delete删除(注意:两端都需要截齐)。
截齐之后,保存文件为:filename.mas
3.构建系统进化树
多序列比对窗口,点击Data,选择Phylogenetic Analysis,弹出窗口询问:所用序列是否编码蛋白质,根据实际情况选择Yes或No。
此时,多序列比对文件就激活了,可以返回MEGA 5主界面建树了。
MEGA 5主界面。
点击Phylogeny,选择Construct/Test Neighbor-Joining Tree…弹出的对话框询问:是否使用当前激活的数据,选择Yes。
这时弹出建树参数设置对话框,更改No. of Bootstrap Replications为1000,其他参数默认即可,点击Compute。
这里解释一下,Construct/Test Maximum Likelihood Tree…(ML)或Construct/Test Neighbor-Joining Tree…(NJ)或Construct/Test Minimum-Evolution Tree…(ME)为三种不同的建树方法,NJ方法最常用。
建树完成,效果如下所示。
注意,要点击Bootstrap consensus tree查看树形。
保存文件为filename.mts(可以用MEGA 5打开)。
4.后期修改
为了美观,也是为了满足发表文章的要求,需要对进化树进行树形、字体、字号的修改。
点击View,选择Options。
弹出窗口中,在Tree标签中可以修改枝与枝之间的距离(Taxon Separation)、枝长(Branch Length)和树宽(Tree Width),调整至美观即可。
Branch标签中,可以选择勾选“Hide values lower than %”,一般隐藏50%以下的数值。
其他的参数可以自行研究,一般默认即可。
文字字体、字号的修改。
方法1:点击Image,选择Save as PDF file,保存至filename.pdf。
打开软件Adobe Illustrator CS6,文件---打开---选择刚刚保存的PDF文件。
修改好之后,文件---导出---可以导出很多种类型的文件。
一般选择保存成TIFF(.tif)文件,颜色模式选择RGB,勾选LZW压缩,其他默认。
方法2:点击Image,选择Copy to Clipboard。
粘贴到Word中,右击进化树图片,编辑图片。
即可更改字体字号。
修改好可以了。
或者进一步导出图片格式:先将该word文件打印生成PDF文件,再用Adobe Illustrator CS6或Adobe
Photoshop CS6导出图片格式。