诺禾致源高分文章集锦-植物基因组

合集下载

denovo-技术支持类-基因组denovo组装新技术

denovo-技术支持类-基因组denovo组装新技术

图1 10X Genomic linked-reads辅助基因组组装流程图表1 不同组装策略组装人的基因组大小和ScaffoldN50长度[1]随着技术的发展,越来越多的物种完成了基因组的测序工作。

但基于二代测序短读长的限制,制约了参考基因组的组装质量,从而影响了后续研究工作的开展。

如今,我们可以利用更多的新技术,如10X Genomics,BioNano,ChiCago等,将基因组组装结果进行完善,进一步构建出高质量的参考基因组。

10X Genomics linked-reads10X Genomics公司通过在序列中引入barcode序列,能够得到跨度在50-100Kb的linked reads信息,与二代测序数据相结合,在Scaffold 的组装上能够得到媲美三代测序的组装结果(表1)。

展开阅读10X Genomic linked-reads辅助基因组组装流程如下图所示:图2 光学图谱工作流程图表3 利用Chicago技术提升相应的指标图3 Chicago文库构建流程图[6]Chicago文库构建流程如下:基因组 de novo 组装新技术助力文章冲刺新高度[1] Mostovoy Y, Levy-Sakin M, Lam J, et al. A hybrid approach for de novo human genome sequence assembly and phasing[J]. Nature methods, 2016. 阅读原文>>/nmeth/journal/v13/n7/abs/nmeth.3865.html[2] Pendleton M, Sebra R, Pang A W C, et al. Assembly and diploid architecture of an individual human genome via single-molecule tech-nologies[J]. Nature methods, 2015. 阅读原文>>/s?wd=paperuri:(ac8d0768*******de9b67e959e5d924b)&filter=sc_long_sign&sc_ks_para=q%3DAssembly+and+diploid+architecture+of+an+individual +human+genome+via+single-molecule+technologies.&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=14004045691020250024[3] VanBuren R, Bryant D, Edger P P , et al. Single-molecule sequencing of the desiccation-tolerant grass Oropetium thomaeum[J]. Nature, 2015. 阅读原文>>/s?wd=paperuri:(4f4baa5f458c3598ebfa32b1017a4569)&filter=sc_long_sign&sc_ks_para=q%3DSingle-molecule+sequencing+of+the+desiccation-tolera nt+grass+Oropetium+thomaeum.&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=3671601047694710580[4] Dong Y, Xie M, Jiang Y, et al.Sequencing and automated whole-genome optical mapping of the genome of adomestic goat (Capra hircus). Nature biotechnology, 2013, 31(2): 135-141. 阅读原文>>/nbt/journal/v31/n2/full/nbt.2478.html [5] Zhang Q, Chen W, Sun L, et al. The genome of Prunus mume. Nature communications, 2012, 3: 1318. 阅读原文>>http://pubmedcentralcanada.ca/pmcc/articles/PMC3535359/[6] Bredeson J V, Lyons J B, Prochnik S E, et al. Sequencing wild and cultivated cassava and related species reveals extensive interspecific hybridization and genetic diversity[J]. Nature biotechnology, 2016, 34(5): 562-570. 阅读原文>>/s?wd=paperuri:(030555bb483ea9f72bf308bf22787f02)&filter=sc_long_sign&sc_ks_para=q%3DSequencing+wild+and+cultivated+cassava+and+related +species+reveals+extensive+interspecific+hybridization+and+genetic+diversity.&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=13838504648880517513[7] Putnam N H, O'Connell B L, Stites J C,et al. Chromosome-scale shotgun assembly using an in vitro method forlong-range linkage[J]. Genome research, 2016, 26(3): 342-350. 阅读原文>>/s?wd=paperuri:(4c8ec46542c7e21bfa15ae10f7a9f8bf)&filter=sc_long_sign&sc_ks_para=q%3DChromosome-scale+shotgun+assembly+using+an+in+vit ro+method+for+long-range+linkage.&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=36575566455777547参考文献Chicago技术(体外Hi-C 技术)作为提供长距离连接数据的组装提升方法,Chicago技术不仅能够获得长序列连接信息,还能帮助组装提升到染色体水平,该技术使用效率高、操作简便、经济性强,并且产生的高质量文库能够更好地应用于后期组装或研究。

诺禾致源高分文章集锦-植物转录组

诺禾致源高分文章集锦-植物转录组

温带和热带莲根状茎形成过程中的转录组分析Transcriptomic Analysis of the Regulation of Rhizome Formation in Temperate andTropical Lotus (Nelumbo nucifera )研究对象:莲根状茎期刊:Scientific Reports影响因子:5.578合作单位:中国科学院武汉植物园发表时间:2015年7月摘 要Rhizome is the storage organ of lotus derived from modified stems. The development of rhizome is a complex process and depends on the balanced expression of the genes that is controlled by environmental and endogenous factors. However, little is known about the mechanism that regulates rhizome girth enlargement. In this study, using RNA-seq, transcriptomic analyses were performed at three rhizome developmental stages—the stolon, middle swelling and later swelling stage —in the cultivars ‘ZO’ (temperate lotus with enlarged rhizome) and ‘RL’ (tropical lotus with stolon). About 348 million high-quality reads were generated, and 88.5% of the data were mapped to the reference genome. Of 26783 genes identified, 24069 genes were previously predicted in the reference, and 2714 genes were novel transcripts. Moreover, 8821 genes were differentially expressed between the cultivars at the three stages. Functional analysis identified that these genes were significantly enriched in pathways carbohydrate metabolism and plant hormone signal transduction. Twenty-two genes involved in photoperiod pathway, starch metabolism and hormone signal transduction were candidate genes inducing rhizome girth enlargement. Comparative transcriptomic analysis detected several differentially expressed genes and potential candidate genes required for rhizome girth enlargement, which lay a foundation for future studies on molecular mechanisms underlying rhizome Formation.关键词根状茎;变态发育; DGE 研究背景莲根状茎,即莲藕,作为一种变态茎,是莲的贮藏器官。

诺禾致源2014产品手册

诺禾致源2014产品手册
1
CONTENTS
建库测序
06 建库测序服务
基因组测序
08 动植物基因组测序 10 基因组特征评估 11 基因组de novo测序 14 泛基因组测序(pan-genome) 16 动植物重测序 17 变异检测(基于全基因组重测序) 19 变异检测(基于简化基因组测序) 21 单个性状定位 24 遗传图谱(基于全基因组重测序) 26 遗传图谱(基于简化基因组测序) 28 群体进化(基于全基因组重测序) 30 群体进化(基于简化基因组测序)
[2] Zhi X Y, Yao J C, Li H W, et al. Genome-wide identification, domain architectures and phylogenetic analysis provide new insights into the early evolution of shikimate pathway in prokaryotes[J]. Molecular phylogenetics and evolution, 2014, 75: 154-164.
[8] Xu X, Dong G X, Hu X S, et al. The genetic basis of white tigers[J]. Current Biology, 2013, 23(11): 1031-1035. [9] Jiang W, Liu Y, Xia E, et al. Prevalent role of gene features in determining evolutionary fates of whole-genome duplication duplicated genes in flowering plants[J]. Plant physiology, 2013, 161(4): 1844-1861. [10] Zhang G, Cowled C, Shi Z, et al. Comparative analysis of bat genomes provides insight into the evolution of flight and immunity[J]. Science, 2013, 339(6118): 456-460. [11] Fan Y, Huang Z Y, Cao C C, et al. Genome of the Chinese tree shrew[J]. Nature communications, 2013, 4: 1426. [12] Wang M Y, Zhao P M, Cheng H Q, et al. The Cotton transcription factor TCP14 functions in auxin-mediated epidermal cell differentiation and elongation[J]. Plant physiology, 2013, 162(3): 1669-1680. [13] Lu S, Zong C, Fan W, et al. Probing meiotic recombination and aneuploidy of single sperm cells by wholegenome sequencing[J]. Science, 2012, 338(6114): 1627-1630. [14] Guo S, Zhang J, Sun H, et al. The draft genome of watermelon (Citrullus lanatus) and resequencing of 20 diverse accessions[J]. Nature genetics, 2013, 45(1): 51-58. [15] Li S, Li R, Li H, et al. SOAPindel: Efficient identification of indels from short paired reads[J]. Genome research, 2013, 23(1): 195-200. [16] Li M, Wu H, Luo Z, et al. An atlas of DNA methylomes in porcine adipose and muscle tissues[J]. Nature communications, 2012, 3: 850. [17] Fan W, Li R. Test driving genome assemblers[J]. Nature biotechnology, 2012, 30(4): 330. [18] Liu C M, Wong T, Wu E, et al. SOAP3: ultra-fast GPU-based parallel alignment tool for short reads[J]. Bioinformatics, 2012, 28(6): 878-879. [19] Hvilsom C, Qian Y, Bataillon T, et al. Extensive X-linked adaptive evolution in central chimpanzees[J]. Proceedings of the National Academy of Sciences, 2012, 109(6): 2054-2059. [20] Zhang G, Fang X, Guo X, et al. The oyster genome reveals stress adaptation and complexity of shell formation[J]. Nature, 2012, 490(7418): 49-54.

复杂基因组组装软件——NOVOheter系列(高杂合基因组、高重复基因组、超大基因组)

复杂基因组组装软件——NOVOheter系列(高杂合基因组、高重复基因组、超大基因组)

图1 NOVOheter1.0 组装流程图图2 NOVOheter2.0 组装流程图表1 诺禾致源部分高复杂基因组项目组装结果表4 BUSCO 评估结果统计首页 科技服务 医学检测 科学与技术 市场与支持 加入我们 关于我们提供领先的基因组学解决方案Providing Advanced Genomic Solutions随着高通量测序技术的发展,越来越多的物种被测序,组装质量也因组装技术水平的提高而不断攀升,但复杂基因组组装仍像一道高耸入云的峻岭横亘在科研工作者面前。

为了支持物种复杂基因组的组装,挑战学术研究和产业发展的最前沿,诺禾致源开发出 NOVOheter 系列软件,并基于 NOVOheter 建立起一整套针对复杂基因组组装的解决方案,解决了以往复杂基因组项目周期长、费用高的问题,组装指标及质量均获国际学术界高度认可。

Species某植物Genome size4.25 GbBUSCO notation assessment resultsC:95%[D:16%],F:1.8%,M:2.1%,n:956高杂合基因组组装——NOVOheter1.0杂合率大于0.5%的二倍体或多倍体属于复杂基因组,涵盖大部分林木类植物、水产类动物以及昆虫等,部分物种杂合率高达1%,甚至2%~3%,高杂合的基因组组装给基因组测序研究带来了较大挑战。

诺禾致源团队开发的 NOVOheter1.0 软件,专门针对高杂合基因组组装,让高杂合不再成为组装难题(具体流程如图1所示)。

表1是使用 NOVOheter1.0 软件完成的高杂合基因组组装结果。

项目经验结果 2 BUSCO 评估BUSCO(Benchmarking Universal Single-Copy Orthologs)评估,利用单拷贝直系同源基因,评估基因组完整性。

[2]由结果可知,956个直系同源单拷贝基因,组装出来了95%的完整单拷贝基因,说明组装结果完整。

nature plants 基因组文章

nature plants 基因组文章

nature plants 基因组文章近年来,越来越多的研究证明植物基因组的基本结构受到环境因素的影响。

由于植物在多种非常不同的生态系统中生长,他们的基因组结构也会做出相应的变化。

相比于动物基因组,植物基因组具有更多的复杂性,并且这些复杂性对于科学家和分子生物学家来说是一个挑战。

目前的技术手段也仅仅能够解释和利用植物基因组的基本框架,但是我们如何充分利用这些基因组活动结构仍然不得而知。

Nature Plants志一直在提供有价值的文章来帮助科学家更好地理解植物基因组的复杂性。

近年来,Nature Plants志发表了一系列重要的文章,深入探讨了植物基因组的进化、结构和功能。

比如,《Nature Plants》杂志曾发表了一篇重要的文章,利用测序技术来研究来自不同植物物种的基因组,该文章表明了植物的基因组结构多样性和其在不同环境中的适应性。

此外,这篇文章还提出了一种可将基因组活动与植物性状相关联的新技术,以实现植物基因组进化及其相关特性的定量分析。

另一篇《Nature Plants》杂志发表的文章,聚焦于利用基因组数据来探究植物物种之间的分子进化关系以及它们在不同环境中表现出的多样性。

该文章提出了一系列有用的结论,例如有关植物基因组的不同演化模式,以及植物基因组如何受到环境的影响。

此外,该文章也发现,重要的植物基因组区域,如细胞膜和其他蛋白质,也可能随着植物物种的演变而改变。

此外,《Nature Plants》杂志还发表了一篇有关植物基因组可塑性的文章。

该文章研究了影响植物基因组可塑性的关键因素,比如环境、营养和遗传多样性。

文章还分析了这些因素如何影响植物的基因组结构、表达和功能,以及如何影响植物的性状和开花时期等特性。

自从Nature Plants志发表的各种文章后,科学家们更好地理解了植物基因组的复杂性及其可塑性,以及如何利用这些信息来改良植物特性。

同时,这些文章也为更加深入地研究植物基因组提供了一个坚实的基础。

诺禾致源高分文章集锦-动物基因组

诺禾致源高分文章集锦-动物基因组

川金丝猴全基因组测序解析其植食性机制与进化史Whole-genome sequencing of the snub-nosed monkey provides insights into folivory and evolutionary history研究对象:川金丝猴期刊:Nature Genetics 影响因子:29.352合作单位:中国科学院动物研究所发表时间:2014年11月摘 要Colobines are a unique group of Old World monkeys that principally eat leaves and seeds rather than fruits and insects. We report the sequencing at 146× coverage, de novo assembly and analyses of the genome of a male golden snub-nosed monkey (Rhinopithecus roxellana ) and resequencing at 30× coverage of three related species (Rhinopithecus bieti , Rhinopithecus brelichi andRhinopithecus strykeri ). Comparative analyses showed that Asian colobines have an enhanced ability to derive energy from fatty acids and to degrade xenobiotics. We found evidence for functional evolution in the colobine RNASE1 gene, encoding a key secretory RNase that digests the high concentrations of bacterial RNA derived from symbiotic microflora. Demographic reconstructions indicated that the profile of ancient effective population sizes for R. roxellana more closely resembles that of giant panda rather than its congeners. These findings offer new insights into the dietary adaptations and evolutionary history of colobine primates.关键词金丝猴;重测序;植食性;进化研究背景金丝猴(Rhinopithecu spp.)隶属于灵长目(Primates)、疣猴亚科(Colobinae)、仰鼻猴属(Rhinopithecus ),目前共有5个种,即川、滇、黔、缅甸和越南金丝猴。

诺禾致源高分文章集锦-植物基因组

诺禾致源高分文章集锦-植物基因组

陆地棉基因组测序揭示四倍体棉进化与纤维发育机制Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement研究对象:陆地棉遗传标准系TM-1期刊:Nature Biotechnology影响因子:41.514合作单位:南京农业大学发表时间:2015年4月摘 要Upland cotton is a model for polyploid crop domestication and transgenic improvement. Here we sequenced the allotetraploid Gossypium hirsutum L. acc. TM-1 genome by integrating whole-genome shotgun reads, bacterial artificial chromosome (BAC)-end sequences and genotype-by-sequencing genetic maps. We assembled and annotated 32,032 A-subgenome genes and 34,402 D-subgenome genes. Structural rearrangements, gene loss, disrupted genes and sequence divergence were more common in the A subgenome than in the D subgenome, suggesting asymmetric evolution. However, no genome-wide expression dominance was found between the subgenomes. Genomic signatures of selection and domestication are associated with positively selected genes (PSGs) for fiber improvement in the A subgenome and for stress tolerance in the D subgenome. This draft genome sequence provides a resource for engineering superior cotton lines.关键词陆地棉;de novo;四倍体研究背景陆地棉(Gossypium hirsutum L.)隶属锦葵目(Malvales),锦葵科(Malvaceae),棉属(Gossypium),因最早在美洲大陆种植而得名,是世界上最重要的棉花栽培品种,占全球棉花种植面积的90%以上。

诺禾致源资料

诺禾致源资料
[7] Qu Y, Zhao H, Han N, et al. Ground tit genome reveals avian adaptation to living at high altitudes in the Tibetan plateau[J]. Nature communications, 2013, 4.
CONTENTS
目录
建库测序
06 建库测序服务
基因组测序
08 动植物基因组测序 10 基因组特征评估 11 基因组de novo测序 14 泛基因组测序(pan-genome) 17 动植物重测序 18 变异检测(基于全基因组重测序) 20 变异检测(基于简化基因组测序) 22 单个性状定位 25 遗传图谱(基于全基因组重测序) 27 遗传图谱(基于RAD-seq简化基因组技术) 29 遗传图谱(基于GBS简化基因组技术) 31 群体进化(基于全基因组重测序) 33 群体进化(基于简化基因组测序)
测序策略
每台仪器数据产出
最低测序量
Q30
项目周期

PE300
13Gb data / 1 Run 13Gb data (1 Run)
微生物
55 16S/18S/ITS等扩增子测序 58 宏基因组测序 61 细菌基因组测序 64 真菌基因组测序 67 小基因组测序
1
诺禾致源 北京诺禾致源生物信息科技有限公司于2011年3月15日在北京中关村生命科学 园注册成立,以基因组学研究与应用开发为发展方向,致力于成为全球领先的基因组学研究解决方案提供者。专 注于开拓生物学、计算机科学和信息技术在动植物研究以及人类健康领域的应用。
[4] Li M, Tian S, Jin L, et al. Genomic analyses identify distinct patterns of selection in domesticated pigs and Tibetan wild boars[J]. Nature genetics, 2013, 45(12): 1431-1438.

诺禾致源有参转录组结题报告

诺禾致源有参转录组结题报告
如下:
@HWI-ST1276:71:C1162ACXX:1:1101:1208:2458 1:N:0:CGATGT NAAGAACACGTTCGGTCACCTCAGCACACTTGTGAATGTCATGGGATCCAT + #55???BBBBB?BA@DEEFFCFFHHFFCFFHHHHHHHFAE0ECFFD/AEHH
5 / 49
北京诺禾致源生物信息科技有限公司
2 测序数据质量评估
2.1 测序错误率分布检查
每个碱基测序错误率是通过测序Phred数值(Phred score, Qphred)通过公式(公式1 :Qphred = -10log10(e))转化得到,而Phred 数值是在碱基识别(Base Calling)过程中 通过一种概率模型计算得到,这种模型可以准确地预测碱基判别的错误率。Phred分值,不正确的碱基识别率,碱基正确识别率以及Q-score的对应关系ert sling后进行HiSeq/MiSeq测序。
3 / 49
北京诺禾致源生物信息科技有限公司
二、生物信息分析流程
获得原始测序序列(Sequenced Reads)后,在有相关物种参考序列或参考基因组的情况下,通过如下流程进行生物信息分析: 其中,DEU分析仅针对有生物学重复样品,若样品无生物学重复,则不进行此项分析。对于蛋白互作网络分析,若其存在于合同信息分析内容中,而且选择了相 应的分析物种或者近缘物种,则进行此项分析;若不存在,则不进行。
参考文献 附录
文件目录列表 软件列表 Methods英文版 备注
1 / 49
北京诺禾致源生物信息科技有限公司
一、建库测序流程
从RNA样品到最终数据获得,样品检测、建库、测序每一个环节都会对数据质量和数量产生影响,而数据质量又会直接影响后续信息分析的结果。为了从源头上 保证测序数据的准确性、可靠性,诺禾致源对样品检测、建库、测序每一个生产步骤都严格把控,从根本上确保了高质量数据的产出。流程图如下:

推荐植物基因组学领域的经典文章

推荐植物基因组学领域的经典文章

推荐植物基因组学领域的经典文章1.基因组的结构和变异2.分子标记连锁图谱构建基因3.QTL定位的原理和方法4.QTL精细定位5.基因和QTL的可隆5.1插入突变方法5.2图位克隆的方法(含比较图位克隆)5.3候选基因法6.资源评估和利用7.分子标记辅助选择(含分子设计育种)8.转基因8.1转基因体系和实证研究8.2转基因的生态学安全研究9.比较基因组9.1标记水平比较基因组9.2序列水平的比较研究9.3性状水平的比较研究9.4功能比较研究10.***优势研究10.1遗传学解释10.2分子生物学解释11.分子进化(主要是玉米进化)12.基于连锁不平衡的关联分析12.1实证研究12.2方法学研究13.基因组研究中的一些新技术运用13.1DNA芯片技术13.2 DNA shuffling13.3Gene Trap13.4 Gene therapy in plants13.5 TILLING 技术1.植物基因组的结构和变异在越来越多的植物基因组被测完后,该研究的重要性逐渐显现,该方面的文章可以说是汗牛充栋.在玉米方面该领域的大牛是Buckler, ES; Messing, J, Dooner HK, Doebley J ; Gaut, BS.1. Buckler, E. S., Gaut, B. S. and McMullen, M. D. (2006) Molecular and functional diversity of maize. Curr. Opin. Plant Biol. 9, 172-176这是关于玉米基因组结构的REVIEW文章,先了解大概,在细读研究文章.其任何2个玉米自交系之间的遗传变异大于人和大猩猩之间的差异的经典论断充分说明玉米变异的广泛性.最近因为人类基因组研究的进展而似乎可以改写.2.Messing J, Dooner HK. Organization and variability of the maize genome. Curr Opin Plant Biol. 2006 Apr;9(2):157-63两位大牛的联合REVIEW, 值得一读.3.Goff S A, Ricke D, Lan T H, Presting G, Wang R, Dunn M, Glazebrook J, Sessions A, Oeller P,Varma H, Hadley D, Hutchison D, Martin C, Katagiri F, Lange B M, Moughamer T, Xia Y, Budworth P, Zhong J, Miguel T, et al. A Draft Sequence of the Rice Genome Oryza sativa L. ssp. japonica. Science, 2002, 296: 92-100大家或许都知道这篇文章,但我相信看完的不多,尽管全基因组测序的文章许多,强烈建议大家读这篇,讨论写的太好了.同期中国测序的文章就相形见拙许多,当然之后水稻精细图谱的公布,这篇文章也可以读读.4. International Rice Genome Sequencing Project. The map-based sequence genome. nature, 2005, 436: 793-8005.Fu H H, Dooner H K. Intraspecific violation of genetic colinearity and its implications in maize. Proc Natl Acad Sci USA, 2002, 99: 9573-9578该文章给我的启示许多,基因的存在和缺失也是等位基因的一种形式就是其一,尽管后来该文章的结论不断被修正.6.Song R, Messing J: Gene expression of a gene family in maize based on noncolinear haplotypes. Proc Natl Acad Sci USA 2003, 100:9055-9060.宋任涛代表作之一, 与Fu的文章有异曲同工之妙,给***优势提供了新的解释.7.Brunner S, Fengler K, Morgante M, Tingey S, Rafalski A: Evolution of DNA sequence non-homologies among maize inbreds. Plant Cell 2005, 17:343-360.5,6工作的基础上提供了更多的数据8. Lai J, Li Y, Messing J, Dooner HK: Gene movement by Helitron transposons contributes to the haplotype variability of maize. Proc Natl Acad Sci USA 2005, 102:9068-9073.赖锦盛的代表工作之一,为玉米基因组的扩张提供了全面的解释.9. Lai J, Ma J, Swigonova Z, Ramakrishna W, Linton E, Llaca V, Tanyolac B, Park YJ, Jeong OY, Bennetzen JL et al.: Gene loss and movement in the maize genome. Genome Res 2004, 14:1924-1931部分阐述了玉米基因组的结构的成因,更多的是插入而不是缺失.10. Morgante M, Brunner S, Pea G, Fengler K, Zuccolo A, Rafalski A:Gene duplication and exon shuffling by helitron-like transposons generate intraspecies diversity in maize.Nat Genet 2005, 37:997-1002与8讲的同一个故事.11.Tenaillon MI, Sawkins MC, Long AD, Gaut RL, Doebley JF, Gaut BS: Patterns of DNA sequence polymorphism along chromosome 1 of maize (Zea mays ssp. mays L.). Proc Natl Acad Sci USA 2001, 8:9161-9166该数据表明,在玉米基因组大约只保留了其祖先大刍草60%的遗传变异.12.Messing J, Bharti AK, Karlowski WM, Gundlach H, Kim HR, Yu Y, Wei F, Fuks G, Soderlund CA, Mayer KF et al.: Sequence composition and genome organization of maize. Proc Natl Acad Sci USA 2004, 101:14349-14354玉米有59000个基因的预测就出自此文.13. Bruggmann R, Bharti AK, Gundlach H, Lai J, Young S, Pontaroli AC, Wei F, Haberer G, Fuks G, Du C, Raymond C, Estep MC, Liu R, Bennetzen JL, Chan AP, Rabinowicz PD, Quackenbush J, Barbazuk WB, Wing RA, Birren B, Nusbaum C, Rounsley S, Mayer KF, Messing J. Uneven chromosome contraction and expansion in the maize genome. Genome Res. 2006 Oct;16(10):1241-5114.Emrich SJ, Li L, Wen TJ, Yandeau-Nelson MD, Fu Y, Guo L, Chou HH, Aluru S, Ashlock DA, Schnable PS. Nearly Identical Paralogs: Implications for Maize (Zea mays L.) GenomeEvolution.Genetics. 2007 Jan;175(1):429-39Schnable 提出的NIP概念给我们以后的关联分析和其他一系列研究提出了新的挑战,尽管在玉米基因组的频率只有1%.15. Fu Y, Emrich SJ, Guo L, Wen TJ, Ashlock DA, Aluru S, Schnable PS.Quality assessment of maize assembled genomic islands (MAGIs) and large-scale experimental verification of predicted genes. Proc Natl Acad Sci U S A. 2005 23;102(34):12282-7.看看什么是MAGI,也是Schnable的贡献,其超大的课题组(在美国而言)和永不疲倦的精力让他文章如麻,而且牛文不断。

诺禾致源高分文章集锦-微生物功能研究

诺禾致源高分文章集锦-微生物功能研究
研究结果
1、研究共鉴定出已注释 ORFs 中 48.4% 的 TSS 位点。作者发现同许多原核生物不同,嗜冷甲烷叶菌有 约 51% 的 mRNA 具有较长 5' UTR(>50nt),约 24% 的 mRNA 5' UTR 大于 150nt(图 1)。
2、14% 的基因拥有多重 TSSs(图 2),此外还有 84 个基因拥有低温响应的 gTSS 和启动子,在不 同的温度下会转录形成含有不同剪切形式 5' UTR 的转录本,这种转录后水平的调控协同转录中调控来影响 mRNA 的表达水平与稳定性,从而控制古菌的低温r(VI) 降低了细菌和潜在的反硝化微生物的多样性;在含 Cr(VI) 污水处理器中,Thauera 属占主导地位。当废水中不含 Cr(VI) 时,处理器中检测不到 Thauera 的存在,当处理含 120 mg/L Cr(VI) 废 水时,Thauera 相对丰度可达 18.18%(图 1)。
研究对象:含 Cr(VI) 废水处理反应器污泥 期刊:Water Research 影响因子:5.528 合作单位:南京大学 发表时间:2015 年 3 月
摘要
In this study, a lab-scale expanded granular sludge bed reactor was continuously operated to treat high-nitrate wastewater containing different concentrations of hexavalent chromium (Cr(VI)). Nearly complete nitrate removal was achieved even at 120 mg/L influent Cr(VI). Pyrosequencing of 16S rRNA gene showed that Cr(VI) decreased the biodiversity of the bacterial community and potential denitrifiers. Proteobacteria dominated in the bioreactor, and Betaproteobacteria had increased abundance after Cr(VI) feeding. Thauera and Halomonas were the two predominant genera in the bioreactor fed with Cr(VI), demonstrating opposite responses to the Cr(VI) stress. Metagenomic analysis indicated that Cr(VI) feeding posed no obvious effect on the overall function of the bacterial community, but altered the abundance of specific denitrifying genes, which was evidenced by quantitative real time PCR. This study revealed that Halomonas mainly contributed to the denitrification under no or low Cr(VI) stress, while Thauera played a more important roleunder high Cr(VI) stress.

重测序-全基因组选择(GS)

重测序-全基因组选择(GS)

首页 科技服务 测序指南 基因课堂 市场活动与进展 文章成果 关于我们全基因组选择1. Meuwissen T H, Hayes B J, Goddard M E.Prediction of total genetic value using genome-wide dense marker maps[J]. Genetics, 2001, 157(4): 1819 1829. 阅读原文>>2. Haberland A M, Pimentel E C G, Ytournel F, et al. Interplay between heritability, genetic correlation and economic weighting in a selection index with and without genomic information[J]. Journal of Animal Breeding and Genetics, 2013, 130(6): 456-467. 阅读原文>>3. Wu X, Lund M S, Sun D, et al. Impact of relationships between test and training animals and among training animals on reliability of genomic prediction[J]. Journal of Animal Breeding and Genetics, 2015, 132(5): 366-375. 阅读原文>>4. Goddard M E ,Hayes BJ. Genomic selection [J]. Journal of Animal Breeding and Genetics,2007,124:323:330. 阅读原文>>5. Heffner E L, Sorrells M E, Jannink J L. Genomic selection for crop improvement [J]. Crop Science, 2009, 49(1): 1-12. 阅读原文>>参考文献全基因组选择简介Meuwissen等[1]在2001年首次提出了基因组选择理论(Genomic selection , GS),即利用具有表型和基因型的个体来预测只具有基因型不具有表型值动植物的基因组育种值(GEBV)。

动植物基因组概述

动植物基因组概述

产品
RAD-seq评估 相对杂合度
基因组Survey 分析
简单基因组
复杂基因组
哺乳动物和 鸟类基因组 简单泛基因组
复杂泛基因组测序策略:RAD 测序策略:HiSeq PE125/HiSE125/HiSeq PE150 测序深度:50X
研究对象 四倍体陆地棉
发表时间 2015年4月
期刊 Nature Biotechnology
影响因子 41.514
金丝猴 大豆泛基因组
2014年11月 2014年9月
Nature Genetics Nature Biotechnology
29.352 41.514
藏猪 地山雀
2013年10月 2013年7月
contig N50=36 Kb; scaffold N50=579 Kb
contig N50 =22 scaffold N50= 468 Kb
ccontig N50 =18.1 Kb; scaffold N50= 319.7 Kb
进展 后续分析 审稿中 后续分析 后续分析 后续分析 文章撰写
contig N50 ≥10 Kb scaffold N50 ≥100 Kb
contig N50 ≥10 Kb scaffold N50 ≥50 Kb
3个月
依据样品 数而定
随着高通量测序的发展及相应软件的开发,几乎所有物种都能够以较低的成本来完成基因组图谱,但对于复杂基因组来说,能够较好地完成其基因组图谱仍然 是个难题。诺禾团队在动植物复杂基因组测序方面有着丰富的项目经验,部分成功案例展示如下:
近年来,高通量测序技术的迅猛发展,极大地推动了全基因组测序工作的展开,全球已有几百种的植物和动物完成了全基因组测序工作。

诺禾致源宏基因组测序方法

诺禾致源宏基因组测序方法

诺禾致源宏基因组测序方法
宏基因组测序是对整个宏生物群落进行基因组测序的一种方法,相比于传统的目标基因测序,宏基因组测序可以同时获得多个生物样品的全基因组信息,从而更全面地了解宏生物群落的组成和功能。

1.DNA提取:从宏生物群落样品中提取总DNA,通常使用化学方法或商业DNA提取试剂盒进行提取。

目的是获取宏生物群落中所有生物个体的DNA。

2.文库构建:将提取的DNA通过PCR扩增或其它方法得到文库,文库中包含了宏生物群落中各种生物个体的DNA序列。

文库构建的方法可以根据具体实验要求选择。

3.测序准备:将文库进行质检和定量,确保文库质量符合要求。

然后将文库进行测序前的处理,如片段长度选择、连接测序引物等。

4.高通量测序:利用高通量测序平台,如IlluminaHiSeq、MiSeq等,对文库进行测序。

宏基因组测序通常采用短读长的测序方式,得到的序列长度一般在50300bp之间。

5.数据分析:将得到的测序数据进行质控,去除低质量的序列和污染序列,然后通过比对到参考基因组或组装得到宏基因组的序列信息。

通过分析序列数据,可以进一步了解宏生物群落的组成、功能和遗传多样性。

基因作物利弊作文结束语

基因作物利弊作文结束语

基因作物利弊作文结束语在如今这个科技飞速发展的时代,基因作物的出现就像一阵旋风,刮得人们的生活泛起了层层涟漪。

有人对它拍手称赞,觉得是解决粮食危机的大救星;也有人对它忧心忡忡,担心会带来意想不到的麻烦。

那基因作物到底是福还是祸呢?咱先来说说基因作物的好处。

就拿抗虫棉来说吧,以前种棉花的时候,那棉铃虫可是个让人头疼的大问题。

农民们天天背着个喷雾器在地里打药,累得腰酸背痛不说,还不一定能把虫子都消灭掉。

可自从有了抗虫棉,情况就大不一样啦。

这种经过基因改造的棉花自带抗虫属性,虫子一咬就死翘翘,农民们省了不少心,也少用了好多农药。

农药用得少了,不仅节约了成本,还减少了对环境的污染,这可真是一举多得呀!还有那些转基因的大豆和玉米,产量那叫一个高。

以前一亩地能收个几百斤就算不错了,现在轻轻松松就能上千斤。

这对于咱们这个人口众多的国家来说,那可是解决温饱问题的重要手段。

想象一下,以前粮食不够吃,大家都得勒紧裤腰带过日子,现在有了基因作物,粮仓满满的,心里也踏实多了。

不过,基因作物也不是只有好的一面。

有人就担心,这基因改造会不会改变食物的营养成分啊?比如说,原来的玉米香甜可口,营养丰富,经过基因改造后,虽然产量上去了,可味道和营养会不会打折扣呢?这可关系到咱们的身体健康,不能不操心。

而且,基因作物的种植也可能会对生态环境造成影响。

就比如说,那些抗虫的基因会不会不小心跑到其他植物身上去,打乱了自然界的平衡呢?还有,一些野生的昆虫可能会因为基因作物的抗虫特性而找不到食物,导致它们的数量减少,这一连串的反应谁也说不准会带来什么样的后果。

我还记得有一次去乡下姥姥家,正赶上他们在讨论要不要种转基因的玉米。

姥姥一辈子在地里劳作,对土地有着深厚的感情。

她坐在炕上,一边纳着鞋底,一边忧心忡忡地说:“这转基因的东西咱也不懂,万一不好可咋办?”舅舅则在一旁说:“现在大家都种,产量高,能多卖钱,咱也试试呗。

”一家人七嘴八舌,各有各的想法。

nature plants 基因组文章

nature plants 基因组文章

nature plants 基因组文章内容摘要:本文讨论了植物基因组学,它是研究物种多样性和植物生命周期过程中扮演至关重要角色的重要一环。

文章具体概述了植物基因组学的相关研究,介绍了一些植物基因组学研究如何增强我们对植物的认识,并且为研究生物多样性、植物疾病及其防治以及分子育种提供了基础。

还介绍了最近在植物基因组学方面的一些发展,包括植物基因组的测序、比较和分析以及最新的技术如CRISPR-Cas系统,以及如何将基因组学重点放在植物多样性以及环境和适应研究上。

最后,简要介绍了未来几年植物基因组学发展的前景。

《Nature Plants因组文章》植物基因组学是研究物种多样性和植物生命周期过程中扮演至关重要角色的重要一环。

它为研究生物多样性、植物疾病及其防治以及分子育种提供基础。

近年来,植物基因组学的研究取得了显著进展,增强了我们对植物多样性的认识,并降低了分子育种的成本。

植物基因组学包括植物基因组的测序、比较和分析。

2015年,科学家在基因组学方面取得了重大进展,对大量植物基因组进行了测序,一些最初只是拥有少量转录本数据的植物基因组也被全面解析。

这提供了一个基础,为进一步研究显著提高效率,使分子育种和环境适应能够更有效地进行。

此外,最近几年取得的新技术进展为植物多样性和适应性研究带来了新的机遇。

这些新技术包括CRISPR-Cas系统,可以用于基因编辑,以改变植物物种的特性和性能,同时也可以用于调节植物的生长和表型。

未来几年,植物基因组学将继续取得重大进展。

由于技术的进步,研究人员可以对植物基因组进行更准确的测序和分析,以及更深入地探索植物的多样性。

此外,今后还将深入探索如何利用基因编辑技术来改善育种性能,保护植物免受病虫害,以及如何改善植物耐旱、耐盐和耐热性。

新型技术可能将使植物基因组学研究再次取得关键性进展,有助于我们对环境的理解和保护,改善我们生活的质量。

综上所述,植物基因组学是一门研究物种多样性和植物生命周期过程的重要科学。

动植物基因组de novo常见问题

动植物基因组de novo常见问题

动植物基因组de novo常见问题基础知识1、什么是基因组de novo测序答:对某一物种进行高通量测序,利用高性能计算平台和生物信息学方法,在不依赖于参考基因组的情况下进行组装,从而绘制该物种的全基因组序列图谱。

2、普通基因组的定义答:单倍体,纯合二倍体或者杂合度<%,且重复序列含量<50%,GC 含量为35%到65%之间的二倍体。

3、复杂基因组的定义答:杂合率>%,重复序列含量>50%,GC含量处于异常的范围(GC 含量<35%或者GC含量>65%=的二倍体,多倍体。

诺禾致源对二倍体复杂基因组进一步细分为微杂合基因组(%<杂合率<%=、高杂合基因组(杂合率>%)以及高重复基因组(重复序列比例>50%)。

4、怎么查询基因组的大小答:查询植物基因组大小的网站:;查询动物基因组大小的网站:。

、5、基因组的项目周期6、基因组承诺的组装指标答:简单基因组:contig N50>20K,scaffold N50>500K;复杂基因组:contig N50>20K,scaffold N50>300K。

样品要求1、动植物基因组测序对取样有什么要求答:植物:需要黑暗无菌条件下培养的黄化苗、组培苗,基因组样本量500μg~1mg,越多越好。

选择纯合或杂合度尽可能小的样品(杂合度<%)。

动物:应选取肌肉、血液等含脂肪较少的部位取样,尽量选择同一个体取样,以减少个体差异性对后续拼接的影响。

基因组样本量500μg~1mg,越多越好。

样本的性别决定模式是XY型,则尽量选择雌性个体(XX型),如果是ZW型,则尽量选择雄性个体(ZZ型)。

2、全基因组测序对DNA样本有什么要求答:(1)样品需求量(单次):小片段文库,≥3μg;2Kb~5Kb大片段文库,≥20μg;10Kb~20Kb大片段文库,≥60μg;完成全基因组测序样品DNA量需求约为500μg~1mg;(2)样品浓度:对于小片段文库,≥50ng/μl,对于2Kb~5Kb 大片段文库,≥150ng/μl;对于10Kb~20Kb大片段文库,≥150ng/μl;(3)样品纯度:OD260/280=~;无蛋白质、RNA污染或肉眼可见杂质污染;(4)样品质量:基因组完整。

诺禾致源再添一作成果组装新策略完成犬蝠基因组精细图谱并揭示食果蝙蝠免疫基因演化新机制

诺禾致源再添一作成果组装新策略完成犬蝠基因组精细图谱并揭示食果蝙蝠免疫基因演化新机制

诺禾致源再添一作成果组装新策略完成犬蝠基因组精细图谱并揭示食果蝙蝠免疫基因演化新机制
近些年来,随着基因组学技术的发展和普及,动物的基因组结构如犬、蝠等动物的基因组分析也开始受到越来越多关注。

基于诺禾致源和其他研
究机构相关研究成果,我们最近又实施了一次新的策略来完成犬蝠基因组
精细图谱,并发现了食果蝙蝠免疫基因演化的新机制。

首先,为了完成精细图谱,我们首先采用了诺禾致源的高通量测序技术,对52份犬蝠基因组和17份食果蝙蝠基因组进行测序与建库,利用该
技术最终获得了更为精细的基因组图谱。

同时,利用该技术也可以获得更
准确的免疫基因定位信息,从而揭示了食果蝙蝠抗病毒免疫基因演化机制。

其次,我们还采用了高通量比对技术来获得犬蝠和食果蝙蝠的基因表
达水平。

我们在犬蝠和食果蝙蝠的基因组中从各种环境中提取和准备组织
样本,然后用高通量比对技术检测各个基因的表达水平,从而更准确地揭
示基因演化的机制。

最后,我们还采用了分子生物学技术,用单链接聚合酶链反应法(SLiP-PCR)来分析食果蝙蝠的基因组片段,获得更多的基因组信息。

剑指NG!诺禾致源助力鉴定影响调控元件的人类SNPs

剑指NG!诺禾致源助力鉴定影响调控元件的人类SNPs

剑指NG!诺禾致源助力鉴定影响调控元件的人类SNPs国庆假期,小编在翻朋友圈的时候,看到远在荷兰留学的师兄也晒了自己的出游美照,花海风车大牧场真是一个都不少。

听师兄说,荷兰不光景色好,生活节奏慢,科研水平还挺高,动不动就能发个CNS 什么的。

这不,今年7月份,荷兰癌症研究所 Bas van Steensel 教授研究团队,借助诺禾强大的测序平台和专业的信息分析,成功开发出一种基于高通量测序的方法来鉴定影响转录调控元件活性的 SNPs,其研究成果发表在国际顶级期刊 Nature Genetics[1]!下面就让小编带大家一起学习一下吧~研究背景传统的 GWAS 分析所得到的 SNPs 大多处于非编码区,通常只能说明与疾病相关的突变“在哪儿”,但是难以完全解释这些突变“有什么用”。

越来越多的研究表明,非编码区的突变通过影响基因的表达调控从而导致疾病和表型的多样性[2~4]。

而基于报告实验的功能性筛选其通量很小,难以测试大量的SNPs 对调控元件活性的可能影响。

为此,作者开发了一种调控元件调查(survey of regulatory elements, SuRE)报告技术,以高通量测序的方法,对590万个SNPs 进行了鉴定,并从中筛选出对启动子和增强子活性具有调控作用的 SNPs,解决了这一难题。

研究方法▪样本选择:使用HG02601、GM18983、HG01241、HG03464 四个样本进行基因组 DNA 的获取。

▪文库构建及分析思路:将基因组DNA 打断为大约300bp 的片段来构建SuRE 文库。

这些片段与不含启动子,并携带了不同的barcode 的质粒进行连接。

通过基因组测序的方法,将 barcode 信息与片段上的SNP 信息进行标定。

将构建好的质粒转染到K562 及HepG2 细胞系中,并对细胞进行转录组测序。

根据barcode 表达量差异,寻找直接调控启动子/增强子活性的SNP 位点,并将其定义为raQTLs。

【文章知识点】深度解析长末端重复反转录转座子(LTR-RTs)

【文章知识点】深度解析长末端重复反转录转座子(LTR-RTs)

【⽂章知识点】深度解析长末端重复反转录转座⼦(LTR-RTs)提起 LTR,相信很多⼈和我之前⼀样都是熟悉⼜陌⽣的感觉,听过或者接触过却未深⼊了解过。

若您对 LTR 分析有兴趣,却苦于⽆从下⼿时,愿本⽂作为⼀个叩门砖,为您敲开 LTR 分析的⼤门。

本篇从 LTR 的定义、分类、⽣物学意义、结构特征、鉴定⽅法等⽅⾯层层递进,带您⾛进神奇的 LTR 世界。

1. LTR 与重复序列、转座⼦的关系LTR-RTs 是 Long terminal repeat-retrotransposons 的缩写,中⽂名是长末端重复反转座⼦。

LTR-RTs 名字中既有重复、⼜有转座⼦,那么它和重复序列、转座⼦是什么关系呢?图1 为您解答。

图1 重复序列主要分类重复序列:根据重复区域是否连续可分为串联重复序列和散在重复序列(⼜名转座⼦、转座元件)两⼤类,前者相连,后者不相连。

转座元件(transposable elements, TEs) ⼜称转座⼦:指在基因组中能够移动或复制,并可以整合到基因组新位点的⼀段 DNA 序列。

根据转座过程是否形成 RNA 中间体,转座⼦可分为 DNA 转座⼦和反转录转座⼦。

反转录转座⼦是以 RNA 为媒介,伴有反转录过程,以复制-粘贴的⽅式在基因组的新位置产⽣⼀个新的拷贝。

DNA 转座⼦的转座机制则是剪切-粘贴的形式。

LTR-RTs :是反转座⼦中的⼀种,因其两侧存在长的末端重复⽽得名。

不含长末端重复的反转座⼦统称 non-LTR-RTs,主要包含短散在重复(SINE)和长散在重复(LINE)。

2. LTR的分类动植物基因组中存在⼤量转座⼦,尤其是植物基因组中。

LTR 因其数量多且 LTR 长度巨⼤,在植物转座⼦中具有较⾼的基因组含量。

在⽟⽶基因组中 LTR 占基因组含量⾼达 75% ,⼭苍⼦基因组中 LTR 占⽐⾼达 47%,所以基因组 LTR 的鉴定尤为重要。

反转录转座⼦根据转座元件结构的完整性和转座特点可分为⾃主元件(编码转座酶)和⾮⾃主元件(⾃⾝不编码转座酶)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

陆地棉基因组测序揭示四倍体棉进化与纤维发育机制Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement研究对象:陆地棉遗传标准系TM-1期刊:Nature Biotechnology影响因子:41.514合作单位:南京农业大学发表时间:2015年4月摘 要Upland cotton is a model for polyploid crop domestication and transgenic improvement. Here we sequenced the allotetraploid Gossypium hirsutum L. acc. TM-1 genome by integrating whole-genome shotgun reads, bacterial artificial chromosome (BAC)-end sequences and genotype-by-sequencing genetic maps. We assembled and annotated 32,032 A-subgenome genes and 34,402 D-subgenome genes. Structural rearrangements, gene loss, disrupted genes and sequence divergence were more common in the A subgenome than in the D subgenome, suggesting asymmetric evolution. However, no genome-wide expression dominance was found between the subgenomes. Genomic signatures of selection and domestication are associated with positively selected genes (PSGs) for fiber improvement in the A subgenome and for stress tolerance in the D subgenome. This draft genome sequence provides a resource for engineering superior cotton lines.关键词陆地棉;de novo;四倍体研究背景陆地棉(Gossypium hirsutum L.)隶属锦葵目(Malvales),锦葵科(Malvaceae),棉属(Gossypium),因最早在美洲大陆种植而得名,是世界上最重要的棉花栽培品种,占全球棉花种植面积的90%以上。

尽管陆地棉在棉花产业中占据核心地位,但由于其为异源四倍体,相关的全基因组测序工作一直难以开展。

来自南京农业大学、北京诺禾致源、美国德克斯大学的国际团队,利用最新测序技术,成功构建了高质量的陆地棉全基因组图谱,为进一步改良棉花的农艺性状提供了基础,同时也为多倍体植物的形成和演化机制提供了新的启示。

植物研究结果1、陆地棉基因图谱绘制陆地棉基因组大小为2.5 Gb,组装结果contig N50达到34 Kb,scaffold N50达到1.6 Mb,其中92%的scaffold 可定位到染色体上。

组装结果优于目前已测序的多倍体植物油菜(N50=764 Kb)、烟草(N50=345-386 Kb)等。

2、A 亚组和D 亚组非对称进化通过比较陆地棉(AADD)、雷蒙德氏棉(DD)和亚洲棉(AA)的基因组序列,估算出陆地棉形成于一百万至一百五十万年前。

在陆地棉形成后的一百多万年内,A 亚组不仅有更高的蛋白质进化速率,其染色体重排发生频率与及基因丢失和失活的频率均显著高于D 亚组(图1)。

3、A 亚组和D 亚组对陆地棉性状的互补性贡献分析发现811个正选择基因(470个在A 亚组,341个在D 亚组),在A 亚组中,正选择基因与纤维长度的发育有重要关系;而在D 亚组中,正选择基因多与抗性有关。

该结果表明陆地棉继承了两个祖先种中各自的优良性状,因此具有良好的纤维品质及广泛的适应性。

4、棉纤维关键基因的表达及进化分析对MYB 、CESA 等纤维发育相关的重要基因开展了表达及进化分析。

MYB 基因家族中的一个分支在纤维发育中起重要的作用;陆地棉中多个CESA 基因在驯化过程中受到了显著的正选择作用,可能与棉纤维品质的改良有直接关系(图2)。

图1 异源多倍体棉花基因组共线性分析与非对称进化分析参考文献Zhang T, Hu Y, Jiang W, et al . Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement [J]. Nature biotechnology, 2015, 33(5): 531-537.图2 MYB 基因家族表达模式分析野生大豆泛基因组阐明遗传多样性与重要农艺性状De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits 研究对象:大豆期刊:Nature Biotechnology影响因子:41.514合作单位:中国农业科学院作物科学研究所发表时间:2014年9月摘 要Wild relatives of crops are an important source of genetic diversity for agriculture, but their gene repertoire remains largely unexplored. We report the establishment and analysis of a pan-genome of Glycine soja, the wild relative of cultivated soybean Glycine max , by sequencing and de novo assembly of seven phylogenetically and geographically representative accessions. Intergenomic comparisons identified lineage-specific genes and genes with copy number variation or large-effect mutations, some of which show evidence of positive selection and may contribute to variation of agronomic traits such as biotic resistance, seed composition, flowering and maturity time, organ size and final biomass. Approximately 80% of the pan-genome was present in all seven accessions (core), whereas the rest was dispensable and exhibited greater variation than the core genome, perhaps reflecting a role in adaptation to diverse environments. This work will facilitate the harnessing of untapped genetic diversity from wild soybean for enhancement of elite cultivars.关键词大豆;泛基因组;SOAPdenovo;农艺性状研究背景大豆是重要的油料和高蛋白粮饲兼用作物,近年来,我国乃至世界大豆育种难以取得突破性进展,单产停滞不前,其主要原因是目前大豆品种的遗传基础狭窄,匮乏的基因源成为制约栽培大豆育种研究的关键。

野生大豆具有较强的抗逆性和繁殖能力,是栽培大豆重要的基因资源。

方法流程植物图1 7株野生大豆共有和特有基因集参考文献Li Y, Zhou G, Ma J, et al . De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits [J]. Nature biotechnology, 2014, 32(10): 1045-1052.3、变异检测及注释以栽培大豆基因组为参考,7株野生大豆分别鉴定出SNP 3.6-4.7百万个,其中0.12-0.15百万个位于编码区;InDel 0.50-0.77百万个,2,989-4,181个导致了移码;大量的变异位点(44-53%)为重测序手段未能识别出的新位点(图2)。

4、进化分析野生大豆与栽培大豆的祖先约在80万年前即发生了分化(图3);正选择分析发现栽培大豆受选择的基因多与抗旱有关,而野生大豆中受选择基因非常多样化。

5、农艺性状基因定位鉴定出大量与抗逆、抗病、花期、产油量和高度等重要农艺性状相关基因和变异,例如14号染色体上一段8 Kb 的片段与野生大豆抗逆和植物发育相关,野生大豆和栽培大豆开花时间的差异与开花时间调控基因SNP 和InDel 变异有关(图4)。

研究结果1、组装和注释7株野生大豆基因组最小为889.33 Mb。

最大为1118.34 Mb,7株野生大豆基因组组装结果contig N50约7.7-26.6 Kb,scaffold N50约16.3-62.7 Kb,平均每个基因组注释出55,570个基因,其中85-90%的基因为全长基因。

2、泛基因组构建对7个野生大豆基因组进行比较,发现它们共有59,080个基因家族(pan-genome),48.6%为7个野生大豆共享(core-genome),51.4%则仅存在于个别样本中(dispensable-genome)(图1)。

相关文档
最新文档