什么是植物基因组
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2000年-2014年测序植物基因组大小比较
http://www.dxy.cn/bbs/topic/30217258?from=recommend&mode=o
10000
15000
20000
25000
5000
0
拟南芥 水稻 水稻 杨树 葡萄 衣藻 小立碗藓 番木瓜 百脉根 三角褐指藻 高粱 玉米 黄瓜 大豆 二穗短柄草 褐藻 团藻 蓖麻 小球藻 苹果 森林草莓 可可树 野生大豆 褐潮藻类 麻风树 卷柏 枣椰树 琴叶拟南芥 马铃薯 条叶蓝芥 白菜 印度大麻 木豆 蒺藜苜蓿 蓝载藻 谷子 谷子 番茄 甜瓜 亚麻 盐芥 香蕉 雷蒙德氏棉 大麦 梨 西瓜 甜橙 小麦 棉花(雷蒙德氏棉) 梅花 鹰嘴豆 橡胶树 毛竹 短花药野生稻 小麦A 小麦D 桃树 丝叶狸藻 中国莲 挪威云杉 海洋球石藻 虫黄藻 油棕榈 枣椰树 醉蝶花 莲 桑树 猕猴桃 胡杨 八倍体草莓 康乃馨 甜菜 无油樟(互叶梅) 芝麻 辣椒 火炬松 棉花(亚洲棉) 萝卜 甘蓝 菜豆 野生大豆 普通小麦 野生西红柿 非洲野生稻 油菜 中果咖啡 茄子 多个野生大豆 绿豆 啤酒花 蝴蝶兰
1969
1969年,科学家成功分离出第一个基因。
基因组测序
基因组的de novo 测序,从最初的sanger测序发展到二代三代测序,主要是通量的改变。 1、1977年在PNAS上发表的双末端中止法测定DNA序列(DNA sequencing with chain-terminating inhibitors),就是第一代测序。代表应用-------耗资30亿美元的“人类基因组计划”。 2、2005年第二代测序平台出现,以IIIlumia HiSeq平台为代表的二代测序技术,以通量高、周期短、价 格低的特点,使人类基因组、动植物、微生物等不同领域都相应开发出了基于二代平台的测序应用。代表 应用-------G.hirsutum L. (四倍体陆地棉)T. urartu(二倍体野生单粒小麦)等。 3、二代测序具有短Reads数据特征,并且对于高重复等基因组难以获得较好的组装效果。以PacBio平台 为基础的单分子实时测序技术为代表的三代测序应运而生(还有纳米孔测序法),通常配合或辅助二代测 序技术。代表应用------Oropetium thomaeum(复活草)基因组研究。
Plant Physiol. 2004 Oct; 136(2): 3177–3190. doi: 10.1104/pp.104.044081
该图(A)为含有大麦HA位点(B)是其水稻共线区域,可以鲜明地看出他
们在这一基因区域的基因集结构差异。
THE END
请老师和同学们 批评指正!
18-20 kb
20-30 kb
把整个基因组分割为LSC区和SSC区。并不是所有的叶绿体都含有IR。
叶绿体基因组中含有大量的功能基因,可分成三类,即光合作用有关基因, 和基因表达本身有关的基因和其他生物合成有关的基因。
120-180kb
81-87kb
表达基因包括核糖体RNA基因、转运RNA基因、核糖体蛋白基因、 RNA 聚合酶以及翻译起始因子等。光合系统基因包括光合系统I 和光合 系统II、细胞色素蛋白酶、ATP 合成酶、ATP 依赖的蛋白相关基因、羧 化大亚基和NADH脱氢酶。光合代谢基因包括matK 、accD、 ccsA
鉴定、基因丢失、非编
码区片段所占比例太大。
上表表示完成测序的部分高等植物线粒体基因组特征
3.含有较多的重复序列
含有大量重复序列,包括长重复序列和短重复序列,其大小从几 bp 到几十 kb不等。不 同大小的重复序列导致的重组率不完全相同
4.含有来自于叶绿体和细胞核的序列 5.存在 C-U RNA 编辑
多倍体事件分析——基因组自身比对
• 4DTV,即四重简并颠换位点比例。4dtv=(四重 简并颠换位点数)/四重简并位点数,由于这种位 点的突变不会引起氨基酸改变,因此不受选择 压力的影响。 • 图像横坐标为4DTV值,纵坐标为4DTV值相同 的基因数量比例。每次多倍体事件都意味着同 源基因的大量涌现,因此会在相应的4DTV值出 出现峰值(4DTV与进化时间成正相关)
02
基因组的特征
• 核 • 叶绿体 • 线粒体
植物基因组特征:
1、植物基因组往往比较大染色体数目变化范围大。
世界上现在公认的基因组最大的生物是Paris japonica,中文名
衣笠草,约150Gb,大约是人类(3.2Gb)的50倍,是具有40 条染色体的八倍体。已知的染色体数目最多的一个科叫 衣笠草
2000年-2014年测序植物基因组大小比较
http://www.dxy.cn/bbs/topic/30217258?from=recommend&mode=o
https://probes.pw.usda.gov/piece/browse.php
https://probes.pw.usda.gov/piece/browse.php
多倍体事件分析——信息流的实例
• 基因组的多倍体事件会引起基因组信息 的加倍,相应的也会引起基因组的结构 变化、基因表达变化等等多方面的遗传 变异。 • 基因组的成套复制为基因组级的变异提
供了更多的可能性,是物种分化和演变
的来源之一,也是新等位基因产生的来 源之一。
基因组研究方法——同源性分析
The complex jujube genome provides insights into fruit tree biology . NATURE COMMUNICATIONS | 5:5315 | DOI: 10.1038/ncomms6315
什么是? 植物基因组
Plant genome
主讲 小组成员
1
基因组的定义 植物基因组特征 三种基因组研究技术
目录
2
3
01
基因组的基本知识
• 基因的由来 • 基因组的定义 • 测序技术的发展历程 • 植物基因组的特征
基因的前世今生
1909
1909年,丹麦植物学家和遗传学家约翰 逊首次提出“基因”这一名词,用以表 达孟德尔的遗传因子概念。
2、植物基因组多倍体比较常见,而动物中极其罕见。
常见植物染色体数目以及其倍型
水稻 倍型 染色体数 目 2n 24 玉米 2n 20 香蕉 3n 33 水仙 3n 30 马铃薯 4n 48 曼陀罗 4n 48 小麦 6n 42
3、植物基因组重复序列含量往往更高。 4、植物体独有的功能比如光合作用就有其相对应植物独有的基因。
1953
1953年,美国人沃森和英国人克里克通 过实验提出了DNA分子的双螺旋模型。
1860~1870
1860至1870年,奥地利学者孟德尔根 据豌豆杂交实验提出遗传因子概念,并 总结出孟德尔遗传定律。
1944年
1944年,3位美国科学家分离出细菌的 DNA(脱氧核糖核酸),并发现DNA是携பைடு நூலகம்带生命遗传物质的分子。
• 基因组多倍体化后,一方面高倍体可能与原物种发生生殖隔离,另一方面 两个复制区域随着物种的发展,内部的基因会发生不同的突变,最终导致 新物种的形成。
• 物种演变的过程中,曾经的多倍体区域,其基因相似性和基因顺序的一致 性会一定程度上得以保留,因此,能够通过这两个方面的信息来推测历史 多倍体化事件
19
图中的短线即代
表相似性的片段, 若,颜色相同的 片段出现在三个 不同的染色体对 的区域,则证明 该物种的基因组 曾经发生过三倍
体化。
A high-quality carrot genome assembly provides new insights into carotenoid accumulation and asterid genome evolution. NATURE GENETICS VOLUME 48 | NUMBER 6 | JUNE 2016
Ophioglossum ,中文名瓶爾小草科,属于蕨类,该科物种最
多可有1260条染色体。
瓶爾小草
10000
15000
20000
25000
5000
0
拟南芥 水稻 水稻 杨树 葡萄 衣藻 小立碗藓 番木瓜 百脉根 三角褐指藻 高粱 玉米 黄瓜 大豆 二穗短柄草 褐藻 团藻 蓖麻 小球藻 苹果 森林草莓 可可树 野生大豆 褐潮藻类 麻风树 卷柏 枣椰树 琴叶拟南芥 马铃薯 条叶蓝芥 白菜 印度大麻 木豆 蒺藜苜蓿 蓝载藻 谷子 谷子 番茄 甜瓜 亚麻 盐芥 香蕉 雷蒙德氏棉 大麦 梨 西瓜 甜橙 小麦 棉花(雷蒙德氏棉) 梅花 鹰嘴豆 橡胶树 毛竹 短花药野生稻 小麦A 小麦D 桃树 丝叶狸藻 中国莲 挪威云杉 海洋球石藻 虫黄藻 油棕榈 枣椰树 醉蝶花 莲 桑树 猕猴桃 胡杨 八倍体草莓 康乃馨 甜菜 无油樟(互叶梅) 芝麻 辣椒 火炬松 棉花(亚洲棉) 萝卜 甘蓝 菜豆 野生大豆 普通小麦 野生西红柿 非洲野生稻 油菜 中果咖啡 茄子 多个野生大豆 绿豆 啤酒花 蝴蝶兰
除玉米T型cms细胞 的T-urf13基因外,植物线 粒体中所有编码蛋白质的基因都存在编 辑现象编辑
6.基因编码序列相对保守,但基因间隔序列易发生改变
03
基因组研究方法
基因组多倍体事件分析 基因组同源分析 目标基因与基因组共线性分析方法
多倍体事件分析——多倍体说明:
• 多倍体事件是植物基因组在进化过程中出现的染色体片段复制、全基因组 复制等现象,不同于基因复制,基因组的多倍体化是一组基因共同的复制 现象,其特征是大范围内的基因的相似性和基因排列顺序的一致性。
图中展示了枣(中)分别于梨(上)、梅(下)的全基因组(全染色体)的 比对结果,连线的区域即代表基因组之间的共线性区域分布状态,可见这三 个物种之间具有较近的同源关系。
多物种全基 因组分析, 即可明显地
对各个物种
同步进行全 局分析,能
够更直观地
呈现物种间 的差异。
耶尔森氏菌多个变种的全基因组分析
基因组研究方法——目标基因的共线性分析
基因组
一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因 组。————百度百科 In modern molecular biology and genetics, a genome is the genetic material of an organism. It consists of DNA (or RNA in RNA viruses). The genome includes both the genes (the coding regions) and the noncoding DNA, as well as the genetic material of the mitochondria and chloroplasts. ————维基百科 一个单倍体细胞中全部包含遗传信息的载体的集合。 ————我们的理解 信息流定义:一个物种正常基因组序列与特定的群体多 态性共同组成的信息集。 操作流定义:一个物种全部染色体与染色体随细胞周期 变化时形成的动态分子复合体,是一个巨大的细胞机器。
植物特有的编码、非编码基因、调控序列及其产物形成了植物特有的光合作用系统。
植物叶绿体基因组:
定义: 叶绿体DNA(cp DNA)存在于叶绿体内的DNA。高等植物 叶绿体的DNA为双链共价闭合环状分子。
结构上叶绿体基因组DNA一般为双链环状分子,极少数为线状, CpDNA 基因数为120个左右。典型的叶绿体基因组结构包括四个部分, 两个IR区
植物线粒体基因组:
1.结构复杂
无论是基因组大小还是基因结构,差异性都很大。
1)植物线粒体基因组大小差异可能是由于线粒体基因组含有大量的非编码序列。
2)基因结构差异大的原因包括:重复序列的重组、基因修饰、序列插入或丢失。
上表表示不同植物的线粒体基因组大小
植物线粒体基因组:
2.基因密度低
相对于整个线粒体基因 组的大小来说,它含有 的基因太少。原因:一 些基因还没有被发现和