基于重测序的陆地棉InDel标记开发与评价

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
种质材料的表型数据在 Nie 等[11]的文章中已报 道, 从中获取了 2 年 4 点共 8 个环境下的表型数据 及最佳线性无偏预测(BLUP)后的表型值, 8 个环境 分别为 2012 年湖北黄冈(E1)、2012 年河南原阳(E2)、 2012 年新疆库尔勒(E3)、2012 年新疆石河子(E4)、 2013 年湖北黄冈(E5)、2013 年河南原阳(E6)、2013 年新疆库尔勒(E7)和 2013 年新疆石河子(E8)。选取 与纤维品质相关的 6 个表型数据, 分别为纤维上半 部平均长度(FUHML)、纤维比强度(FS)、纤维伸长 率(FE)、纤维整齐度(FU)、马克隆值(MV)和短纤维 率(SF)。 1.2 InDel 标记设计
摘 要: 碱基插入/缺失(InDel)是基因组中丰富的遗传变异形式。InDel 以其密度高、易于基因型分型等优点成为分 子标记开发的理想来源。本研究利用 262 份陆地棉品系重测序数据鉴定的 InDel 位点, 在全基因组范围内设计了 3206 个 InDel 标记并挑选均匀分布的 320 个标记进行验证。320 个标记筛选出 87 个多态性标记, 多态性率为 26.88%。利 用多态性标记对不同地理来源的 262 份陆地棉种质资源进行基因分型, 共检测到 160 个等位位点; 多态性信息含量 (PIC)为 0.0836~0.3750, 平均值为 0.3073; 基因多样性指数变异范围为 0.0874~0.5000, 平均值为 0.3876, 表明我国陆 地棉遗传基础相对狭窄。群体结构分析将 262 份陆地棉品系大致划分为 2 个亚群, 聚类分析和主成分分析的结果与 之基本一致。采用混合线性模型(Mixed linear model)对 6 个纤维品质性状的关联分析检测到 65 个关联位点(P < 0.01), 各位点对表型变异贡献率为 2.57%~8.12%。本研究旨在利用重测序数据开发全基因组范围的可用于凝胶检测的 InDel 标记, 为棉花种质资源研究和分子标记辅助选择育种提供便捷工具。 关键词: 陆地棉; InDel 标记; 遗传多样性; 群体结构; 关联分析
1 材料与方法
1.1 供试材料及性状表型数据 采用 262 份陆地棉种质资源材料, 根据地理来
源分类, 包括中国长江流域棉区的 75 份、中国黄河 流域棉区的 118 份、中国西北内陆棉区的 33 份、中
国北方特早熟棉区的 17 份、中国南方棉区的 2 份, 以及美国的 11 份和前苏联的 6 份[9]。依据 Nie 等[11] 的 SSR 标记在 503 份种质材料中的扩增结果, 挑选 了 24 份多态性高的材料用于后续多态性标记筛选, 这些材料比较全面地覆盖了种质材料的多态性信息, 利用 24 份材料作为参考, 可以快速筛选出具有代表 性的多态性标记。24 份种质材料编号分别为 ZY40、 ZY43、ZY54、ZY91、ZY121、ZY122、ZY211、ZY238、 ZY240、ZY262、ZY320、ZY358、ZY361、ZY362、 ZY376、ZY410、ZY413、ZY423、ZY434、ZY452、 ZY468、ZY481、ZY495 和 ZY507。
棉花许多重要的农艺性状如产量、纤维品质、 生育期等均为数量性状, 解析复杂数量性状的遗传 基础主要有连锁分析和关联分析两种方法。关联分 析是一种以连锁不平衡为基础, 鉴定自然群体目标 性状与遗传标记关系的分析方法。它具有无需构建 作图群体、省时省力、解析精度高等优点, 也是传 统连锁分析 QTL 定位的有益补充。在棉花中, 国内 外广泛开展了关联分析相关的研究工作[9-11], 然而 这些研究大部分是基于 SNP 的, 利用 InDel 进行关 联分析的研究相对较少。
/ E-mail: zwxb301@
DOI: 10.3724/SP.J.1006.2019.84100
基于Байду номын сангаас测序的陆地棉 InDel 标记开发与评价
吴 迷 汪 念 沈 超 黄 聪 温天旺 林忠旭*
华中农业大学植物科学技术学院 / 作物遗传改良国家重点实验室, 湖北武汉 430070
InDel 标记是根据不同个体基因组同源序列发 生的核苷酸片段插入或缺失而开发的, 具有基因组 内分布广、密度高、变异稳定、可重复性好、价格 低廉等优点, 在水稻[5]、玉米[6]、油菜[7]等作物中被 广泛应用。2015 年 Zhang 等[8]完成了异源四倍体陆 地棉品种‘TM-1’全基因组测序及组装工作。2017 年 Wang 等[9]完成了 352 份棉花材料重测序, 同时发掘 大量 InDel 变异位点, 为全基因组范围的 InDel 标记 开发提供了条件。
Abstract: Insertion and deletion (InDel) are abundant forms of genetic variation in the genome. InDel has been recognized as an ideal source for marker development due to its high-density distribution and genotyping efficiency. In this study, the whole genome re-sequencing data of 262 upland cotton accessions were applied to identify 3206 InDel markers, and 320 markers with uniform distribution across the genome were selected to be evaluated. Eighty-seven polymorphic markers were identified, accounting for 26.88% of screened markers. A total of 160 allelic loci were detected using the 87 polymorphic markers in the 262 upland cotton accessions with an average polymorphic information content (PIC) of 0.3073 (ranging from 0.0836 to 0.3750) and an average genetic diversity of 0.3876 (ranging from 0.0874 to 0.5000), indicating a relatively low genetic diversity. Population structure analysis revealed extensive admixture and identified two subgroups, clustering analysis and principal component analysis supported the subgroups identified by STRUCTURE. Association analysis were performed by MLM (Mixed linear model), and 65 marker loci were associated with fiber quality traits (P < 0.01), explaining 2.57%–8.12% of the phenotypic variation. Genome-wide and gel based InDel markers developed based on re-sequencing data in this study provide a facile tool for cotton germplasm resources research and molecular marker assisted selection breeding. Keywords: Upland cotton; InDel marker; genetic diversity; population structure; association analysis
本研究基于wang等9的重测序结果筛选indel变异位点开发覆盖全基因组范围的可用于凝胶检测的indel标记并对重测序的262份陆地棉材料进行遗传多样性亲缘关系和群体结构的分析以及通过关联分析挖掘与纤维品质性状相关联的indel标记从而评价这些标记在棉花遗传和育种中的应用潜力
作物学报 ACTA AGRONOMICA SINICA 2019, 45(2): 196203 ISSN 0496-3490; CN 11-1809/S; CODEN TSHPA9
第2期
吴迷等: 基于重测序的陆地棉 InDel 标记开发与评价
197
种植的大部分陆地棉品种多由美国引进的岱字棉、 斯字棉、金字棉等少数种质资源衍生而来, 这也导 致我国陆地棉种质资源相对匮乏、遗传基础较为狭 窄、多样性水平低[2]。为有效拓宽陆地棉的遗传基 础、加快不同育种目标下的棉花新品种选育及遗传 改良进程, 将传统育种方法和分子标记辅助选择育 种方法结合是有效可行的。目前, 多种分子标记如 简单序列重复(SSR)、单核苷酸多态性(SNP)等广泛 地应用于棉花种质资源遗传多样性评价、亲缘关系 鉴定、遗传图谱的构建、重要农艺性状 QTL 定位及 图位克隆和种质鉴定等方面[3-4]。
基于 Wang 等[9]检测的 InDel 位点集合, 筛选出 测序深度大于 7、插入/缺失碱基数大于 30 bp 且最 小等位基因频率大于 0.05 的 InDel 位点。提取 InDel 位点上下游 150 bp 序列, 将其中含有“N”的位点过 滤。以 Zhang 等[8]发表的陆地棉标准品系‘TM-1’基 因组序列为参考进行比对, 阈值设置为 1×10–10, 选 取完全匹配的 InDel 位点作为候选标记开发位点。 使用 Primer 3.0[12]设计引物, 引物长度范围为 18~24 bp, GC 含量范围在 40%~60%之间, 退火温度范围为 54~60℃。最后, 去除位于 scaffold 上的引物及 SSR 引物。引物由金斯瑞生物科技有限公司合成。
本 研 究 基 于 Wang 等 [9]的 重 测 序 结 果 , 筛 选 InDel 变异位点, 开发覆盖全基因组范围的、可用于 凝胶检测的 InDel 标记, 并对重测序的 262 份陆地棉 材料进行遗传多样性、亲缘关系和群体结构的分析, 以及通过关联分析挖掘与纤维品质性状相关联的 InDel 标记, 从而评价这些标记在棉花遗传和育种中 的应用潜力。
棉花作为世界上重要的经济作物, 是纺织制造 业 中 天 然 纤 维 的 主 要 来 源 。 陆 地 棉 (Gossypium
hirsutum)是棉花的主要栽培种。我国棉花育种史较 短, 前期改良主要依赖于国外引种[1], 当前选育和
本研究由湖北省技术创新专项(2018ABA082)资助。 This study was supported by the Technology Innovation Program of Hubei Province (2018ABA082). * 通信作者(Corresponding author): 林忠旭, E-mail: linzhongxu@ 第一作者联系方式:E-mail: 656542680@ Received(收稿日期): 2018-07-19; Accepted(接受日期): 2018-10-08; Published online(网络出版日期): 2018-11-16. URL: /kcms/detail/11.1809.S.20181115.1104.002.html
Development and evaluation of InDel markers in cotton based on whole-genome re-sequencing data
WU Mi, WANG Nian, SHEN Chao, HUANG Cong, WEN Tian-Wang, and LIN Zhong-Xu*
National Key Laboratory of Crop Genetic Improvement / College of Plant Science and Technology, Huazhong Agricultural University, Wuhan 430070, Hubei, China
相关文档
最新文档