棉花基因组测序研究进展

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

雷蒙德氏棉基因 组中13条染色体 的模式图 绿色:外显子 红色:内含子 黄色:DNA转座子 紫色:反转录转 座子(长末端重 复序列) 蓝色:其他序列
2014-5-18中国科学家主导完成另一二倍体棉花——木本 棉(A基因组)全基因组图谱——最新研究成果于《自然• 遗传学》发表Genome sequence of the cultivated cotton Gossypium arboretum(nature genetics) 对一株连续培育18代的纯系栽培木本棉shixiya1(SXY1)进 行了全基因组测序,绘制出的高质量木本棉基因组大小约 为1,694 Mb,共有41,330个编码基因。利用高分辨率的遗 传图谱,将90.4%的木本棉(G.arboreum)组装序列成功 定位到13个连锁群上。 研究人员对该基因组进行了注释,结果显示木本棉基因组 中68.5%是由不同类型的重复序列组成,其中95.12%为长 末端重复序列(LTR)。
• 目标:从长远来看,棉花基因组测序最重要的目标是
建立占世界棉花产量92%以上的、最广泛栽培的陆地 棉种其全基因组序列。但由于其基因组丰富、尺幅大 (约2.5 GB)、多倍体性质以及其他复杂性,必须制定 分阶段实施的策略才能够生效。
棉花基因组测序的成果
2012-8-26二倍体棉花雷蒙德氏棉(D基因组)草图基因 组公布 The draft genome of a diploid cotton Gossypium
• 根据染色体组学分类
A B C D E F G K
非洲
46个二倍体
(2n= 2x= 26)
美洲
51个种
(2n= 4x= 52)
澳大利亚
5个四倍体
(AD)1 陆地棉 (AD)2 海岛棉 (AD)3 (AD)4 (AD)5
棉花属共包括46个二倍体(2n=2x=26)棉 种和5个已经确认的四倍体(2n=4x=52)棉种, 所有的二倍体棉花物种均可能由一个共同的 祖先进化而来,这个祖先随后多样化分化成 八个基因组,包括A、B、C、D、E、F、G和K。 而所有的四倍体棉花物种都是由A基因组物种 木本棉(又称亚洲棉)(G.arboreum(A2))和 D基因组物种雷蒙德氏棉(G.raimondii(D5)) 物种间杂交形成。
• 根据棉花的品种分类
• ⑴细绒棉:又称陆地棉。纤维线密度和长度中等,一 般长度为25~35mm,线密度为2.12~1.56 dtex (4700~6400公支)左右,强力在4.5cN左右。中国种 植的棉花大多属于此类。
• ⑵长绒棉:又称海岛棉。纤维细而长,一般长度在 33mm以上,线密度在1.54~1.18dtex(6500~8500公支) 左右,强力在4.5cN以上。它的品质优良,主要用于 编制细于10tex的优等棉纱。中国种植较少,除新疆 长绒棉以外,进口的主要有埃及棉、苏丹棉等。 • 此外,还有纤维粗短的粗绒棉,已趋淘汰
• 二倍体棉种到四倍体棉种的进化史
棉花基因组测序计划
内容:国际棉花基因组计划(ICGI)是全球 31个国家的科学家参与组建的国际学术组织, 目的是提高对棉花基因组结构和功能的认识, 促进全球棉花研究、教育等方面的交流、合 作,加强知识和资源整合,促进和造福全球 的棉花事业。
• 重要意义 • 棉花是世界上最重要的天然纺织纤维和意 义重大的油料作物 • 棉纤维是研究植物细胞伸长、细胞壁与纤 维素合成的最好材料 • 解码棉花基因组将是提高对棉属多倍体性、 基因组大小变异的功能和农艺学重要性认 识的基础
• 方法:全基因组霰弹法(即鸟枪法)和基于高分辨率
物理图谱的逐步克隆法。
ຫໍສະໝຸດ Baidu
• 重点突破方向:雷蒙德氏棉在所有棉花物种中,虽
然它不是栽培种,但其基因组最小,是首先实施测序的 极好选择。如果可以得到主要棉花栽培品种陆地棉的 综合物理图谱(陆地棉基因组是雷蒙德氏棉的3倍),雷 蒙德氏棉的序列信息随时可以通过把其综合物理图谱 的BAC末端序列作为锚而转移给陆地棉。
棉花基因组测序研究进展
内容提要
棉属简介及分类 国际棉花基因组测序计划 棉花基因组测序的成果 棉花基因组测序的意义及展望
棉花简介
• 棉花是全球最重要的经济作物之一。它的纤维, 俗称皮棉,是纺织工业主要的天然资源。 • 大约3300万公顷(约占世界5%的耕地)用于棉花 种植。 • 2011年全球纺织工厂年度市场价值大约为6306亿 美元。 • 除了它的经济价值,棉花也是一种研究多倍体化、 细胞伸长和细胞壁生物合成的极好的模式系统。
• 展望 高质量的棉花基因组参考序列的完成,将推动快速 DNA 序列测定的基 因分型技术和全基因组关联研究的发展,进而显著促进棉花遗传学研 究的发展。 通过遗传学和分子标记方法,获得决定棉花品质和产量的功能分子标 记,育种家可以利用功能标记在系谱和群体中追踪特定等位基因,用于 对亲本的选择和对难以鉴定表型选择性状位点的加速选择。 分子标记因其数量巨大,且不受基因表达时间、显隐性关系和环境条 件的影响,会大大提高育种选择的准确性,缩短育种周期,提高选择效 率。 建立在基因组学研究基础上的分子标记辅助设计育种和常规育种相结 合,也将是未来作物育种研究的必然发展方向。随着棉花基因组学、 转录物组学、蛋白质组学等方面知识的快速积累,这些知识与棉花育 种学的交叉和结合将会逐步加快、最终必然使棉花基因组学辅助育种 从理论走向实践。
a:b 木本棉与雷蒙德氏棉十三 条染色体的比较 c:木本棉和雷蒙德氏棉LTR的 插入时间和数目 柱形图:某一时间点的插入数 目 线性图:某一时间段总共插入 的数目 d:部分木本棉和雷蒙德氏棉7 号染色体的微观比较 黄色:基因模型 绿色:同源基因对应位置 蓝色:转座子的位置
2015-4-20陆地棉基因组(AD组)图谱绘制完成在《自然-生物 技术》上发表Genome sequence of cultivated Upland cotton (Gossypium hirsutum TM-1) provides insights into genome evolution (Nature Biotechnology) • 整合了全基因组散弹枪法、BAC-to-BAC、高密度遗传图谱构建 等策略,对陆地棉遗传标准系—TM-1进行了全基因组测序和组 装,最终获得了26条染色体。 • 得到了76943个蛋白编码基因,首次从全基因组水平揭示了四倍 体棉花是由A基因组的祖先和D基因组的祖先通过染色体融合而 形成,并初步揭示了四倍体棉花基因组的进化规律。 • 通过两个二倍棉花和四倍体棉花不同纤维发育时期乙烯代谢通 路的基因组比较和相关的实验证据,证实了乙烯调控纤维伸长 的双向调节假说—纤维伸长发育过程中,乙烯过多和不足都会 抑制棉纤维的伸长,这是不同棉种间纤维长度存在差异重要原 因之一。
图1陆地棉基因组的进化 和形成 a:陆地棉和其他6个来源 于双子叶植物的物种 b:陆地棉AD基因组分别与 木本棉A基因组和雷蒙德 氏棉D基因组的比较
2015-5-24南京农业大学作物遗传与种质创新国家重点实 验室、教育部杂交棉创制工程研究中心研究人员利用新一 代测序和SNP(单核苷酸多态性)基因分型方法,构建了 四倍体棉花的高密度遗传图谱,并表征了四倍体棉花基因 组的结构变异。
活跃 抗病 比A表达上调 长
棉花基因组测序的意义及展望
意义:
第二代高通量测序技术并结合BAC 末端大片段测序方法, 完成了世界上最重要的棉种陆地棉(AtDt基因组)的全序列 测定和组装,结束了棉花没有参考基因组图谱的历史. 继 2012 年发表二倍体雷蒙德氏棉基因组和2014年发表二倍 体亚洲棉基因组之后,在棉花基因组学领域的又一重要突 破,开启了棉花基因组学研究的新篇章。 棉花基因组的解析, 对棉花产量和品质形成生物学机制的 深入研究、优异基因的选择和利用、高通量基因分型及建 立更加有效的育种策略奠定了坚实基础.
棉花分类
• 根据纤维的长度和外观分类
• 【粗绒棉】--也叫亚洲棉,原产印度。由于产量 低、纤维粗短,不适合机器纺织。 • 【长绒棉】--也叫海岛棉,原产南美洲。纤维长、 强度高是其特点,适合于纺高支纱。中国只有新 疆生产。 • 【细绒棉】--也叫陆地棉,原产中美洲,所以又 称美棉。适应性广、产量高、纤维较长、品质较 好是其特点,可纺中支纱[1] 。
• 刊登在国际知名期刊《Genome Biology》,题为 “Sequence-based ultra-dense genetic and physical maps reveal structural variations of allopolyploid cotton genomes”
• 该研究小组构建了一幅高密度种间遗传图谱,包括4,999,048个SNP位 点,不均匀地分布在26个异源四倍体棉花连锁群中,覆盖4,042 cM。 研究小组通过对照组装草图序列和遗传图谱,在棉花基因组中确定了 重组率和突变热点。利用这一图谱,研究人员通过将公共可用的雷蒙 德氏棉(G. raimondii)基因组信息与荧光原位杂交分析相结合,确 定了四倍体棉花的基因组重排和着丝粒区域。 • 这项研究用测序后基因分型法,确定了陆地棉(G. hirsutum)和海 岛棉(G. barbadense)之间上百万个SNPs。研究人员构建并利用一 幅高密度SNP图谱,来纠正序列错误组装,将scaffolds合并成与染色 体一致的pseudomolecules,检测基因组重排,并确定了异源四倍体 棉花中的着丝粒区域。 • 该研究发现,四倍体棉花的着丝粒逆转录因子序列,来源于D亚基因 组祖先,可能在异源四倍体形成之后侵入了A亚基因组着丝粒。本研 究对于棉花的遗传研究和育种,提供了一份宝贵的基因组资源。


已测的A、D、AD基因组三者的比较
A 基因组大小 编码蛋白数目 1694Mb 40976 D 775.2Mb 41330 AD 2173Mb 76943
LTR大小
反转录转座子 活跃程度 是否抗黄萎病 ACO转录水平 表达纤维长度
1145Mb
非常活跃 感病 失活 短
348Mb
稳定 抗病 非常高 无
1471
raimondii(Nature Genetics) 基因组大小约775.2Mb,包括了40,976个蛋白质编码基因,92.2% 得到了转录数据的进一步证实。超过73%的组装序列被锚定在13 条雷蒙德氏棉染色体上。 获得了在双子叶植物中有可能存在的paleohexaploidization事 件以及在1300-2000万年前棉花全基因组复制(WGD)事件的证 据。 确定了总共2,355个保守块,大约有40%的平行基因存在于超过1 个保守块中,表明在进化过程中基因组经历了重要的染色体重 排。 近57%的基因组由转座元件(transposable elements ,Tes)构 成,其中大部分可能来自长末端重复序列(long terminal repeat,LTRs)扩增。研究人员在对陆地棉(G.hirsutum)和海 岛棉(G. barbadense)种对纤维形成起关键作用的基因间观察 到了定性差异。
相关文档
最新文档