谈一谈对发育分析的认识

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

谈一谈对发育分析的认识
传统的物种鉴定分析中会利用物种的性状构建矩阵然后绘制系统发育树。

随着分子生物学的发展,尤其是测序技术的进展,利用Marker序列进行同源序列比对,之后可以计算遗传距离矩阵,绘制系统发育树,通过分子钟计算进化速率,计算进化选择压力等等。

系统发育分析最原始的数据是序列信息,可以是核酸序列也可以是蛋白序列。

这些序列可以是自己测序获得,例如原来的EST序列,基因序列;也可以是公共数据库(GenBank,EBI,Swissprot 等)来源的已发表数据。

现在也有利用SNP,基因排列顺序与间距等信息进行系统发育分析的。

获得序列后要进行多序列比对,有多种工具都可以完成:MEGA,Bioedit,Clustal,MAFFT,MUSCLE等。

构建系统发育树可以是单基因建树也可以是多基因建树,现在转录组测序和基因组测序已经非常普遍,所以多基因建树是越来越多,因为单基因的序列信息比较少很容易造成偏差。

在多基因建树的时候,序列文件建议保存为.fasta文件,按每个基因一个文件保存,在每个文件中按相同的物种顺序保存fasta格式的序列,物种名的ID要特别注意,因为部分软件只识别前十个字符,当物种名是拉丁名的话,结果能让你哭死。

多序列比对推荐使用MAFFT,它的精度和速度都是比较好的,而且命令行操作,批量处理很容易。

序列比对完后可以进行序列保守性选择(Gblock),替换饱和性检验(PAUP麻烦要自己作图,DAMBE)等分析,检测序列是否适合
用来构建系统发育树。

相关文档
最新文档