- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
************************************************************************* genes in this No. chromosome of distribution of mouse homology genes mouse in human chromosome 1 1、2、5、6、8、13、18 2 2、7、9、10、11、15、20 3 1、3、4、8 4 1、6、8、9 5 1、4、7、12、13、18、22 6 2、3、7、10、12 7 6、10、11、15、16、19 8 1、4、8、13、16、19 9 3、6、11、15、19 10 6、10、12、19、21、22 11 2、5、7、16、17、22 12 2、7、14 13 1、5、6、7、9、15、17 14 3、8、10、13、14、X 15 5、8、12、22 16 3、8、16、21、22 17 6、16、19、21 18 5、10、18 19 9、10、11、X X X ***********************************************************************
******************************************************** 序列分析和多序列比较 # BLAST Web site http://www.ncbi.nlm.nih.gov/BLAST/ # FASTA at EBI http://www2.ebi.ac.uk/fasta3/ # CLUSTALW software ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalW # HMMER software http://hmmer.wustl.edu/ # SAM profile software http://www.cse.ucsc.edu/research/compbio/sam.html # BCM Search Launcher http://kiwi.imgen.bcm.tmc.edu:8088/searchlauncher/launcher.html 系统进化树构建和稳定性分析 # PHYLIP http://evolution.genetics.washington.edu/phylip.html # Hennig86 http://www.vims.edu/~mes/hennig/software.html # MEGA/METREE http://www.bio.psu.edu/faculty/nei/imeg # GAMBIT http://www.lifesci.ucla.edu/mcdbio/Faculty/Lake/Research/Programs/ # MacClade http://phylogeny.arizona.edu/macclade/macclade.html # PAUP http://onyx.si.edu/PAUP/ # GCG software package http://www.gcg.com/ *******************************************************
Phylogeny Based on Whole Genome as inferred from Complete Information Set Analysis (CISA)
we present a new method based on information theory to calculate the phylogenic distance between biological sequences, including 16s Ribosomal RNA, which is used for method proof-test, 24 completely sequenced genomes, as well as all predicted ORF products of them, creating Phylogeny of genome and proteome using neighboring-joining algorithm. Scientists have already been conscious of that no other biological sequence can bring more phylogenetic information than the genome. However, previous algorithms don’t have the ability to handle such megabase level nucleic acid or amino acid sequences, whose length sizes are in most cases unequal.
More and more LGT(Lateral Gene Transfer ) were discovered and reported. Some people guess 1.5%~14.5% of genes in a genome are related with LGT, even rRNA molecules are involved in LGT;
* chromosome 13 are relatively stable, for instance, whereas chromosome 12 in men and chromosome 16 in women are enormously fickle. * why vertebrates have four times as many HOX genes, a group of key developmental genes, as do fruit flies.
研究生命是从哪里起源的?生命是如何进化的?遗传 密码是如何起源的?估计最小独立生活的生物至少需 要多少基因,这些基因是如何使它们活起来的?比如, 鼠和人的基因组大小相似,都含有约三十亿碱基对, 基因的数目也类似。可是鼠和人差异确如此之大,这 是为什么?同样,有的科学家估计不同人种间基因组 的差别仅为 0.1%;人猿间差别约为1%。但他们表型间 的差异十分显著。 这又为什么? 完整基因组序列的比较研究是解决这些问题的重要途 径。
The distribution of mouse homology genes in the human chromosome
(Data from GenBank,Coordinate by R.S.Chen)
序列相似性比较。就是将待研究序列与DNA或蛋白 质序列库进行比较,用于确定该序列的生物属性,也就 是找出与此序列相似的已知序列是什么。完成这一工作 只需要使用两两序列比较算法。常用的程序包有BLAST、 FASTA等; l 序列同源性分析。是将待研究序列加入到一组与之同 源,但来自不同物种的序列中进行多序列同时比较,以 确定该序列与其它序列间的同源性大小。这是理论分析 方法中最关键的一步。完成这一工作必须使用多序列比 较算法。常用的程序包有CLUSTAL等; l 构建系统进化树。根据序列同源性分析的结果,重建 反映物种间进化关系的进化树。为完成这一工作已发展 了多种软件包,像PYLIP、MEGA等; l 稳定性检验。为了检验构建好的进化树的可靠性,需 要进行统计可靠性检验,通常构建过程要随机地进行成 百上千次,只有以大概率(70%以上)出现的分支点才 是可靠的。通用的方法使用 Bootstrap算法,相应的软件 已包括在构建系统进化树所用的软件包当中。为便于使 用者查找表三给出了进化分析相关软件的因特网地址。
(3) in each kingdom, some difference of gene order in difference species could be used to infer the evolutionary relationship of these species.
This method provides a new way to study the evolutionary relationship of those old species.
Study on conservation of gene order in complete genomes
. We analyzed the gene order of 70 ribosomal proteins in 16 complete genomes. These genes would form 9-14 operons in each genome. The results show that: (1) there are more that 20 ribosomal proteins contained in rpL3 and rpL4 operons, the gene order of these genes are very conserved in both Eu-bacteria and Archae-bacteria; (2) some operons’ structure are special to Eu-bacteria and Archae-bacteria respectively;
human genome shares 223 genes with bacteria-genes that do not exist in the worm, fly, or yeast. A reticulated tree, or net, which might more appropriately represent life's history.
Garcia-VallvéS, Romeu A, Palau J. ,Genome Res, 2000, 11, 1719~1725 Yap W H, Zhang Z, Wang Y. , J. Bacteriol. 1999, 181: 5201~5209
Some people argue it is impossible to reconstruct a universal life tree;
四、基于序列数据的生物进化研究当前面 临的问题 自1859年 Darwin 的物种起源 (Origin of Species) 发表以来,进化论成为对人类自 然科学和自然哲学发展的最重大贡献之一。 进化论研究的核心是描述生物进化的历史 (系统进化树)和探索进化过程的机制。自 本世纪中叶以来,随着分子生物学的不断 发展,进化论的研究也进入了分子水平。 当前分子进化的研究已是进化论研究的重 要手段,并建立了一套依赖于核酸、蛋白 质序列信息的理论方法。
Pennisi E. ,Science, 1999, 284: 1305~1307 Doolittle R F.,Nature, 1998, 392: 339~342
As more and more whole genome sequence and the related data become available, it is possible to re-consider the phylogeny and clustering properties of species in more broad measurements, even in level of whole genome.