基于基因组测序揭示香稻Badh2基因的变异信息

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

DOI:10.16498/ki.hnnykx.2019.008.001
水稻(Oryza sativa L)是世界上重要的粮食作物之一,全世界约有超过1/2 的人以水稻为主食[1]。

香味是稻米品质的一个重要特征,香米不仅在蒸煮后清香可口,而且具有更高的营养价值,因此在国际市场上占有特殊的地位,其销售价格比普通大米高1倍以上。

印度和巴基斯坦生产的巴斯马蒂(Basmat)香米、东南亚地区广泛种植的茉莉(Jasmine)香米,因其具有浓郁的香味,在欧洲、北美、澳大利亚、西非、中国等市场上备受欢迎[2]。

香稻含有多种挥发性化合物,其中直接与水稻香味相关的挥发性物质为2-乙酰1-吡咯啉(2-acetyl-1-pyrroline,2AP)[3-4]。

由于甜菜碱醛脱氢酶基因Badh2功能的缺失会导致2AP前体物质的增加,从而积累2AP使水稻产生香味[5]。

Ahn et al通过一系列的分子标记定位表明香味基因是位于8号染色体上的隐性基因[6]。

Bradbury et al [7]在香稻和非香稻材料的fgr区域进行序列测定,最终确定控制甜菜醛脱氢酶(BADH2)的基因Badh2为控制香味性状的基因。

香稻中无功能的BADH2蛋白是Badh2基因编码区中第7外显子有8 bp的缺失(命名为badh2.1或badh2-E7),导致翻译提前终止而产生,中断了2AP合成底物Y-氨基丁醛的代谢,使其转而生成了香味物质2AP。

随着香味基因的克隆和大量香稻的收集,研究者对香味基因位点的变异情况进行了深入研究,除badh2-E7外,目前共发现有20余种badh2的等位基因[8-12]。

除了编码区 SNPs 或 InDels 引起非同义突变或移码框突变而导致无功能的BADH2蛋白产生的变异类型外,还有一些Badh2基因的变异发生在内含子区、启动子区及5’UTR 区,携带这些变异类型的水稻品种大多散发独特的香气。

因此,对不同香稻品种Badh2基因的序列进行分析,探明其变异发生的区域及及进行成香机理研究,对充分发掘、利用香稻种质资源以改善农业种植结构,推进优质香米产业化,提高我国香米的国际市场竞争力都具有十分重要的意义。

课题组利用二代测序技术对来源于同一优质香型材料的3个香稻品种XW13、YZX及XW17进行全基因组测序,对其Badh2基因的编码区、内含子区及启动子区进行序列分析,明确其香味基因的变异类型。

同时,结合已公开发表的3 010份水稻资源中76份香稻资源的序列信息,对不同香稻资源的Badh2基因进行变异分析。

 基于基因组测序揭示香稻Badh2基因的变异信息 
 刘之熙,朱克永,闵 军,刘三雄,陈彦成 
(湖南省水稻研究所,农业部长江中下游籼稻遗传育种重点实验室,湖南 长沙 410125)
摘 要:香稻是一种具有芳香气味的特种稻资源,具有较高的营养价值和经济价值。

利用二代测序技术对3个香稻品种XW13、YZX及XW17进行全基因组测序,发现3个香稻品种的Badh2基因序列一致,在编码区无明显变异的情况下,启动子区有1个 8 bp的插入突变,这种变异类型在已测序并公开发表的76份香稻资源的Badh2基因序列中也有发现,命名为badh2-p。

关键词:香稻品种;Badh2基因变异;启动子;SNP;InDel
中图分类号:Q812, S511 文献标识码:A 文章编号:1006-060X(2019)08-0001-04 R evealing the Variation Information of Badh2 Gene in Aromatic Rice Based on
Genome Sequencing
LIU Zhi-xi,ZHU Ke-yong,MIN Jun,LIU San-xiong,CHEN Yan-cheng (Hunan Rice Research Institute, Key Laboratory of Indica Rice Genetics and Breeding in the Middle and Lower Reaches of Yangtze River,
Minister of Agriculture, Changsha 410125, PRC)
Abstract:Aromatic rice is a special rice resource with aromatic odor, which has high nutritional and economic value. The whole genome of three aromatic rice varieties XW13, YZX and XW17 was sequenced by second-generation sequencing technology. The sequence of Badh2 gene of three aromatic rice varieties was identical. Without obvious variation in coding region, there was an insertion mutation of 8 bp in promoter region. The variant type was also found in the Badh2 gene sequence of 76 fragrant rice resources, named badh2-p.
Key words:a romatic rice varieties; Badh2 gene variation; promoter; SNP; InDel
收稿日期:2019-06-20
基金项目:湖南省自然科学基金青年基金项目(2019JJ50334);湖
南省农业科技创新资金项目(2018QN06)
作者简介:刘之熙(1981-),女,山西长治市人,助理研究员,主
要从事水稻分子育种和种子质量检测技术研究。

 湖南农业科学(HUNAN AGRICULTURAL SCIENCES )2019年8月1 材料与方法
1.1 3个香稻品种XW13、YZX 及XW17的全基因组测序
3个香稻品种XW13、YZX 及XW17的种子使用75%酒精消毒后播种于发芽盒中,30 ℃(16 h 昼/8 h 夜)生长。

利用CTAB 法提取基因组DNA,琼脂糖凝胶电泳分析DNA 降解程度以及是否有RNA 污染, Nanodrop 检测DNA 的纯度(OD 260/OD 280比值), Qubit 对DNA 浓度进行精确定量。

OD 值在1.8~2.0 之间,含量在1.5 μg 以上的DNA 样品通过Covaris 破碎机随机打断成长度为350 bp 的片段,采用TruSeq Library Construction Kit 进行建库,DNA 片段经末端修复、加ployA 尾、加测序接头、纯化、PCR 扩增等步骤完成整个文库制备。

构建好的文库通过Illumina HiSeq 进行测序。

1.2 基因组组装、注释及SNP、InDel 检测分析
利用 base calling (Illumina pipeline CASAVA v1.8.2)得到Raw data,通过质控程序,将含有Illumina 文库构建接头的reads、一端含有超过10% 未知碱基 (N bases) 的reads、一端含有超过50% 低质量碱基(sequencing quality value ≤5)的reads过滤掉,得到Clean data。

利用BWA [13]软件(参数:mem-t 4-k 32 -M)将Clean data 比对到参考基因组Os-Nipponbare- Reference-IRGSP-1.0上。

利用SAMTOOLS [14](mpileup-m 2-F 0.002-d 1000)进行SNP 和InDel 检测,得到3个香稻品种的SNP 和InDel 变异信息。

利用ANNOVAR 对SNP 和InDel 的检测结果进行功能注释,根据SNP/InDel 在基因组上的位置,将其分为编码区SNP/InDel、内含子区SNP/InDel、剪切位点SNP/InDel、基因上游SNP/InDel、基因下游SNP/InDel 和基因间区SNP/InDel ;根据SNP/InDel 在编码区引起的功能突变,将其分为非同义突变SNP、同义突变SNP、移码框突变InDel、非移码框突变InDel、使基因获得终止密码子突变SNP/InDel 和使基因失去终止密码子突变SNP/InDel。

1.3 3个香稻品种及76份香稻资源中Badh2基因的变异类型分析
从3个香稻品种的测序数据中提取Badh2基因及其启动子区(上游1 500 bp)的SNP 和InDel 信息,从/网站下载3 010份测序水稻资源中76份香稻资源的Badh2基因及其启动子区的SNP 和InDel 信息,比较这些品种或资源中Badh2基因的变异类型,揭示Badh2基因的变异信息。

2 结果与分析
2.1 3个香稻品种XW13、YZX 及XW17的基因组图谱
基于Illumina 技术测序平台,利用双末端测序的方法,对XW13、YZX 及XW17进行了全基因组测序, 产生的 Raw data 在12 285.038~14 827.401 M之间,过滤后的 Clean data 在12 267.991~14 808.401 M 之间。

通过BWA 软件比对到日本晴参考基因组IRGSP-1.0上,比对率在91.61%~96.71%之间,对参考基因组(排除N 区)的平均覆盖深度在30.46~36.77X 之间,1X 覆盖度(至少有一个碱基的覆盖)在91.05%以上。

2.2 3个香稻品种SNP、InDel 变异信息
利用SAMTOOLS 对XW13、YZX 及XW17进行SNP 和InDel 检测,各品种检测到的SNP 数目介于1 706 194~1 868 460之间,InDel数目介于296 674~ 318 410之间。

利用ANNOVAR 对检测结果进行注释,得到各品种SNP 和InDel 注释结果信息,见表1和表2。

各品种SNP 和InDel 在基因组上的分布频率见图1和图2(以XW13为例)。

2.3 3个香稻品种及76份香稻资源中Badh2基因的变异类型
与日本晴参考基因组IRGSP-1.0相比,3个香稻品种的Badh2基因序列一致,20 378 294 bp~20 386 061 bp (Badh2基因及其启动子)区域内共检测到8个SNPs 和6个InDels,突变主要发生在启动子区,编码区未检测到SNP 和InDel 变异。

其中,启动子区有1个8 bp
表1 3个香稻品种SNP 检测及注释结果统计
品 种上 游外显子
内含子剪切位点基因间区共 计使基因获得终止密码子使基因失去终止密码子
同义突变非同义突变XW13248 2656 441992106 351163 044278 7081 743780 2371 820 715YZX 230 0375 915939100 039152 145262 7061 586734 0751 706 194XW17
253 384
6 483
1 007
109 293
166 160
285 651
1 716
804 100
1 868 460
表2 3个香稻品种InDel 检测及注释结果统计
品 种上 游外显子
内含子剪切位点基因间区共 计使基因获得终止密码子
使基因失去终止密码子
移码突变非移码突变XW1351 878218297 5647 61753 483203146 058314 769YZX 48 179204297 0327 01350 708205138 580296 674XW17
52 205
230
34
7 604
7 822
53 753
220
148 306
318 410
刘之熙 等:基于基因组测序揭示香稻Badh2基因的变异信息
的插入突变,与已报道的日本香稻Nankai 138在启动子 区具有相同的插入序列,因此,将这一变异类型命名 为badh2-p。

日本香稻Nankai 138除启动子区存在 8 bp 的插入外,在5’UTR 区还有一个3 bp 的缺失,因此 将其Badh2基因的变异类型命名为badh2-p -5’UTR [15]。

对76份香稻资源的Badh2基因及其启动子区进行SNP 和InDel 分析,发现有26份资源在第7外显子存在 8 bp 缺失,Badh2基因的变异类型为badh2-E7;有30份资源在启动子区存在8 bp 插入,
Badh2基因的变异类型与XW13、YZX 及XW17相同,
为badh2-p ;其中有17份资源的变异类型为badh2-E7 +badh2-p 。

有3份资源在启动子区存在3 bp 缺失,将其Badh2基因的变异类型命名为badh2-p .1;1份资源在启动子区存在 6 bp 缺失,将其Badh2基因的变异类型命名为badh2-p .2;2份资源在启动子区存在6 bp 插入,将其Badh2基因的变异类型命名为badh2-p.3;其余31份资源在编码区和启动子区均无明显变异。

不同Badh2基因的变异类型在76份香稻资源中的具体
图1 XW13中SNP
在基因组上的分布频率
图2 XW13中InDel 在基因组上的分布频率
 湖南农业科学(HUNAN AGRICULTURAL SCIENCES )2019年8月分布见图
3。

图3 不同Badh2基因的变异类型在76份香稻资源中的分布
3 小结与讨论
前人对控制香味性状的甜菜碱醛脱氢酶基因(Badh2)的研究主要集中在编码区和内含子区碱基的插入、缺失或突变导致翻译提前终止而产生无功能的BADH2蛋白,中断了2AP 合成底物Y-氨基丁醛的代谢,使其转而生成了香味物质2AP。

对启动子区的变异研究较少。

利用二代测序技术对3个香稻品种XW13、YZX 及XW17进行全基因组测序,发现在Badh2基因编码区无明显变异的情况下,启动子区有1个 8 bp 的插入突变,这种变异类型在已测序的76份香稻资源中也有发现,命名为 badh2-p 。

有研究表明,若基因在编码区上游500 bp~1500 bp 的区域内存在较多的InDels,其发生差异表达的频率较高[16]。

因此,测序得到的 badh2-p 是否会影响其Badh2基因的表达水平,进而影响香味物质2AP 的积累使品种产生香气的分子机制,有待深入分析研究。

参考文献:
[1] Hu C Y,Shi J X,Quan S,et al. Metabolic variation between japonica
and indica rice cultivars as revealed by non-targeted metabolomics[J]. Scientific Reports, 2015,4:5067.
[2] Mumm R,Hageman J A,Calingacion M N,et al. Multi-platform
metabolomics analyses of a broad collection of fragrant and non-fragrant rice varieties reveals the high complexity of grain quality characteristics[J]. Metabolomics,2016,12(2):38. [3] Buttery R G,Ling L C,Juliano B O,et al. Cooked rice aroma and
2-acetyl-1-pyrroline[J]. Journal of Agricultural and Food Chemistry,1983,31(4):823-826.
[4] Tsuzuki E,Shimokawa E. Inheritance of aroma in rice[J]. Euphytica,
1990,46(2):157-159.
[5] Chen S H,Yang Y,Shi W W,et al. Badh2,encoding betaine
aldehyde dehydrogenase, inhibits the biosynthesis of 2-acetyl-1-pyrroline,a major component in rice fragrance[J]. The Plant Cell,2008,20(7):1850-1861.
[6] Ahn S N,Bollich C N,Tanksley S D. RFLP tagging of a gene for aroma
in rice[J]. Theoretical and Applied Genetics,1992,(7/8):825-828. [7] Bradbury L M T,Fitzgerald T L,Henry R J,et al. The gene for
fragrance in rice[J]. Plant Biotechnology Journal,2005,3(3):363-370. [8] Hashemi F S G,Rafii M Y,Ismail M R,et al. Biochemical,genetic
and molecular advances of fragrance characteristics in rice[J]. Critical Reviews in Plant Sciences,2013,32(6):445-457.
[9] Amarawathi Y,Singh R,Singh A K,et al. Mapping of quantitative
trait loci for basmati quality traits in rice (Oryza sativa L.)[J]. Molecular Breeding,2007,21(1):49-65. [10]
Shi W W,Yang Y,Chen S H,et al. Discovery of a new fragrance allele and the development of functional markers for the breeding of fragrant rice varieties[J]. Molecular Breeding,2008,22(2):185-192. [11]
Kovach M J,Calingacion M N,Fitzgerald M A,et al. The origin and evolution of fragrance in rice (Oryza sativa L.)[J]. Proceedings of the National Academy of Sciences,2009,106(34): 14444-14449. [12]
Shao G N,Tang S Q,Chen M L,et al. Haplotype variation at Badh2, the gene determining fragrance in rice[J]. Genomics,2013,101(2):157-162. [13] L i H ,D u r b i n R . F a s t a n d a c c u r a t e s h o r t r e a d a l i g n m e n t w i t h B u r r o w s -Wheeler transform[J]. Bioinformatics,2009,25(14):1754-1760. [14] Li H,Handsaker B,Wysoker A,et al. The sequence Alignment/Map format and SAMtools[J]. Bioinformatics,2009,25(16):2078-2079. [15]
Shi Y Q,Zhao G C,Xu X L,et al. Discovery of a new fragrance allele and development of functional markers for identifying diverse fragrant genotypes in rice[J]. Molecular Breeding, 2014,33(3):701-708. [16]
Zhang H Y,He H,Chen L B,et al. A genome-wide transcription analysis reveals a close correlation of promoter INDEL polymorphism and heterotic gene expression in rice hybrids[J]. Molecular Plant,2008,1(5):720-731.
(责任编辑:高国赋)。

相关文档
最新文档