ncRNASNP_ a database of SNPs in lncRNAs and their potential functions in human and mouse 14

合集下载

lncrna定位方法

lncrna定位方法

lncrna定位方法lncRNA(长非编码RNA)是一类转录产物,其作用范围涉及基因组表达调控、细胞增殖和分化等方面。

为了了解lncRNA在细胞中的具体定位,研究人员开发了多种实验方法和计算工具。

1. 亚细胞定位实验技术:a. 原位杂交(in situ hybridization):这是一种常用的实验方法,通过与lncRNA序列互补的DNA探针,可以在细胞中检测lncRNA的位置。

利用这种方法,可以确定lncRNA是定位在细胞核内还是细胞质中。

b. 细胞分离:通过细胞分离技术,将细胞核和细胞质分开,并进一步提取lncRNA,从而确定lncRNA的具体分布。

2. RNA-Seq基于计算的方法:a. 对比表达分析:通过对lncRNA和mRNA的测序数据进行比较,可以了解lncRNA相对于mRNA在细胞中的相对表达水平。

这可以帮助我们了解lncRNA的组织特异性和细胞特异性表达。

b. 共定位分析:通过将lncRNA与已知定位的蛋白质或DNA结合位点进行比对,可以预测lncRNA在基因组内的定位。

这可以帮助我们了解lncRNA是否与特定基因或基因组区域有相互作用。

3. 功能研究:a. RNA亲和层析:通过将lncRNA与特定蛋白质结合,可以确定lncRNA与该蛋白质的相互作用,并进一步了解lncRNA的功能和定位。

b. CRISPR系统:利用CRISPR系统对lncRNA基因进行编辑或靶向,通过观察细胞中的表现变化,可以了解lncRNA的生物学功能和定位。

综上所述,通过亚细胞定位实验技术、RNA-Seq基于计算的方法以及功能研究,我们可以准确地了解lncRNA在细胞中的定位,从而进一步研究其功能和作用机制。

这些研究方法和技术的不断发展,为我们揭示lncRNA的生物学意义提供了重要的工具和途径。

LncRNA的结构、功能及其作用机制研究综述-生物化学论文-生物学论文

LncRNA的结构、功能及其作用机制研究综述-生物化学论文-生物学论文

LncRNA的结构、功能及其作用机制研究综述-生物化学论文-生物学论文——文章均为WORD文档,下载后可直接编辑使用亦可打印——研究发现,在哺乳动物基因组中,只有不到2%的转录产物具有蛋白编码功能,其余98% 均为非编码RNA (noncoding RNA,ncRNA)[1,2]. 根据核苷酸序列的长度,ncRNA 可分为短链ncRNA (short/small ncRNA)和长链LncRNA(long ncRNA),二者之间并没有特别严格的界限,仅以ncRNA 核苷酸序列的长度来区分,一般将长度大于200 核苷酸ncRNA定义为LncRNA[3.7]. 根据核苷酸序列长度定义LncRNA 虽已得到了普遍的公认,但缺乏严谨性[8],已有报道证实,有些LncRNA 的长度就小于200 个核苷酸[9]. LncRNA 分布广泛,在动物[10,11]、植物[12]、酵母[13]甚至病毒[4]中均发现有LncRNA 存在,其功能几乎涉及到生物体生理及病理的全部生物学过程,既能调节细胞的增殖、分化及代谢等生理过程,也参与调节机体的各种病理过程,如癌症、糖尿病、免疫病、阿尔茨海默病等[14,15,32 ,41]. 本文对近年来有关LncRNA 的结构、功能及其作用机制的研究进展进行综述。

1 LncRNA 的分子结构尽管在过去20 多年里,也有关于LncRNA 的一些报道,但高通量测序技术的发展才使得从基因水平研究LncRNA 成为可能[15]. 为了更深入地展开LncRNA 相关研究,了解其功能及作用机制,科学家们根据LncRNA 在基因组中所处的位置及背景,将LncRNA 分为基因间LncRNA (intergenic LncRNA)和内含子LncRNA (intronic LncRNA)以及正义LncRNA (sense LncRNA)和反义LncRNA (antisenseLncRNA)等4 种类型[4],也有人将LncRNA 分为5类,即正义、反义、双向、基因内LncRNA 及基因间LncRNA 等5 种类型[2,8].结构是功能的基础,任何物质的功能发挥都离不开其特有的分子结构,研究一个物质的结构是了解其功能及其作用机制必要前提。

ncRNA(非编码RNA)的知识

ncRNA(非编码RNA)的知识

ncRNA(非编码RNA)的知识z2010-07-31 10:36:54| 分类:Biology | 标签:rna |举报|字号订阅目录一、核糖核酸(RNA)二、转运RNA(tRNA)三、信使RNA(mRNA)四、核糖体RNA(rRNA)五、小核RNA(snRNA)六、RNA干扰(RNAi)七、反义RNA(atRNA)八、核仁小分子RNA(snoRNA)九、细胞质小分子RNA(scRNA)十、不均一核RNA(hnRNA)十一、干扰mRNA的互补RNA(miRNA)十二、非编码RNA(ncRNA)十三、短发夹RNA(shRNA)十四、短干扰RNA(siRNA)十五、核酸酶(RNase)十六、核糖核酸酶抑制剂(RNasin)十七、向导RNA(gRNA)一、核糖核酸(RNA)1 概述核糖核酸(RiboNucleic Acid ) ,简称RNA。

由至少几十个核糖核苷酸通过磷酸二酯键连接而成的一类核酸,因含核糖而得名。

RNA普遍存在于动物、植物、微生物及某些病毒和噬菌体内。

RNA和蛋白质生物合成有密切的关系。

在RNA 病毒和噬菌体内,RNA是遗传信息的载体。

RNA一般是单链线形分子,也有双链的如呼肠孤病毒RNA;环状单链的如类病毒RNA,1983年还发现了有支链的RNA分子。

在RNA病毒中,RNA是遗传物质,植物病毒总是含RNA。

近些年在植物中陆续发现一些比病毒还小得多的浸染性致病因子,叫做类病毒。

类病毒是不含蛋白质的闭环单链RNA分子,此外,真核细胞中还有两类RNA,即不均一核RNA (hnRNA)和小核RNA(snRNA)。

hnRNA是mRNA的前体,snRNA参与hnRNA的剪接(一种加工过程)。

自1965年酵母丙氨酸tRNA的碱基序列确定以后,RNA序列测定方法不断得到改进。

目前除多种tRNA、5SrRNA、5.8SrRNA 等较小的RNA外,尚有一些病毒RNA、mRNA及较大RNA的一级结构测定已完成,如噬菌体MS2RNA含3569个核苷酸。

2020年生信SCI大赏-最全生信文章、最友好生信期刊、最详情发文趋势都在这里!

2020年生信SCI大赏-最全生信文章、最友好生信期刊、最详情发文趋势都在这里!

2020年⽣信SCI⼤赏-最全⽣信⽂章、最友好⽣信期刊、最详情发⽂趋势都在这⾥!i⽣信专注⽣物分析最前沿定期解读⽣信⽂章提供⽣信分析思路和套路⽅便⼤家短平快发SCI时光如⽔,即便是如此艰⾟坎坷的2020也已悄然离去。

⽣活在继续,舞会从来不曾停⽌!在这不平凡的2020年,⽣信SCI发⽂量如何?发⽂趋势⼜如何?有哪些⽣信友好期刊?今天我们就来整体回顾⼀下2020年⽣信SCI⽂章进展!2020年⽣信SCI发⽂量统计⼩编在Pubmed中,通过“gene expression omnibus”、“TCGA”、“bioinformatics”、“biomarker”、“differentially expressed”、“protein protein interaction”、“ROCanalysis”“signature”等关键词进⾏组合检索,再经过筛选、去重复,最终检索到2020年发表的所有⽣信SCI共4165篇,其中纯⽣信(或仅含少量表达检测)⽂章3194篇,剩下的971篇⽣信实验类⽂章,其包含实验占⽐>30%。

看到这个数据你是不是有疑惑“听说⽣信⽂章很难发了,怎么还有这么多的⽂章呢,⽽且还不缺乏⾼分⽂章”。

那别⼈的⽣信⽂章都是怎么设计的呢?纯⽣信⽂章投哪些期刊⽐较容易接收呢?下⾯我们来⼀探究竟!⽣信友好期刊推荐对2020年所有⽣信⽂章的发表期刊进⾏统计,以下列举出接收⽣信⽂章量⼤于30篇的期刊,根据接收量排序如下:2020⽣信友好期刊接收量2020-IF因⼦Front Oncol181 4.85Biomed Res Int154 2.28Front Genet152 3.26Aging (Albany NY)129 4.83Oncol Lett101 2.31PeerJ93 2.38Cancer Cell Int87 4.18Cancers (Basel)84 6.13Sci Rep77 4.00J Cancer71 3.57Biosci Rep69 2.94BMC Cancer67 3.15Med Sci Monit65 1.92Medicine (Baltimore)62 1.55Cancer Manag Res61 2.89Cancer Med58 3.49J Cell Mol Med57 4.49Ann Transl Med51 3.30PLoS One44 2.74J Cell Physiol39 5.55J Comput Biol37 1.05Mol Med Rep36 2.10J Cell Biochem35 4.24Int J Mol Sci34 4.56J Transl Med34 4.12Am J Transl Res33 3.38DNA Cell Biol33 3.19DNA Cell Biol33 3.19Technol Cancer Res Treat33 2.07Front Mol Biosci30 4.19猫头鹰博⼠(微信:ipaper360)根据接收量>20篇,影响因⼦>3筛选条件,按照期刊影响因⼦排序如下:2020⽣信友好期刊2020-IF因⼦接收量Theranostics8.5821Cancers (Basel) 6.1384Bioinformatics 5.6120J Cell Physiol 5.5539Front Cell Dev Biol 5.2023Front Immunol 5.0922Front Oncol 4.85181Aging (Albany NY) 4.83129Int J Mol Sci 4.5634J Cell Mol Med 4.4957J Cell Biochem 4.2435Front Mol Biosci 4.1930Cancer Cell Int 4.1887J Transl Med 4.1234Sci Rep 4.0077J Cancer 3.5771Cancer Med 3.4958Cancer Biomark 3.4426Oncol Rep 3.4227Am J Transl Res 3.3833Ann Transl Med 3.3051Front Genet 3.26152DNA Cell Biol 3.1933BMC Cancer 3.1567猫头鹰博⼠(微信:ipaper360)以上期刊列表绝对都能称作“⽣信友好期刊”了,⼤家有需要投稿的⽣信⽂章,可以根据影响因⼦在列表中选择合适的期刊哦。

lncRNA的筛选-高通量测序服务

lncRNA的筛选-高通量测序服务

长链非编码RNA(Long noncodingRNA,lncRNA)是一类转录长度大于200nt的RNA分子,属于ncRNA(noncoding RNA,ncRNA)中片段较大的一些基因,它们本身缺乏明显的开放阅读框,不编码蛋白,而是以RNA的形式在多种层面上调控基因的表达。

近几年来,ncRNA 的研究越来越多,随着一些ncRNA基因的克隆以及计算机生物信息学预测方法的发展,人们逐渐认识到ncRNA和蛋白质分子一样参与了整个的生命活动。

研究发现,已鉴定的ncRNA 几乎参与了生命活动的每个环节,包括基因转录调控、基因印迹与沉默、mRNA的稳定和翻译、蛋白质的转运和定位等。

目前预测的lncRNA多达数千个,但是科学家预计,哺乳动物基因组序列中大约4%~9%的序列产生的转录本是lncRNA,而只有1%的编码蛋白序列。

RNA高通量测序一次性产生上百万RNA序列,能够快速鉴定特定条件下表达的lncRNA。

通过lncRNA高通量测序,能够发现新的lncRNA。

服务内容
lncRNA分离纯化
文库制备
模板制备
高通量测序
数据分析
客户提供
a.RNA样品
b.组织样品
c.血液样品
d.细胞样品等其他研究样品。

我们提供
完整详尽的实验报告;
实验中所涉及的图片、数据;
实验结果分析。

ncrna注释流程

ncrna注释流程

ncrna注释流程是一个相对复杂的过程,主要包括以下几个关键步骤:
首先,需要从基因组测序数据中提取非编码RNA(ncRNA)的序列信息。

这一步需要使用特定的软件或工具,如BLAST、Infernal 等,对测序数据进行比对和筛选,以识别出可能的ncRNA序列。

接下来,对这些ncRNA序列进行注释。

注释的目的是为了了解这些ncRNA的功能和分类。

注释过程中,需要利用已知的数据库信息,如Rfam、RFAM等,对这些ncRNA序列进行比对和分类。

这一步通常需要使用一些专门用于ncRNA注释的工具,如CpLncRNA、lncRNAdb等。

在注释过程中,还需要对这些ncRNA序列进行进一步的分析和筛选。

例如,可以使用一些特定的软件或工具,如RNAfold、ViennaRNA等,对这些序列进行结构预测和稳定性分析,以确定它们是否具有稳定的二级结构。

最后,综合上述信息,对这些ncRNA序列进行最终的分类和注释。

注释结果可以包括ncRNA的名称、类别、位置、可能的生物学功能等信息。

这一步通常需要研究人员具备一定的生物信息学背景和专业知识,以便准确地解释和分析结果。

总体而言,ncrna注释流程是一个高度专业化且需要综合运用多种工具和数据库的过程。

通过这一流程,研究人员可以更深入地了解ncRNA的功能和作用机制,为未来的生物医学研究和应用提供重要的基础数据和资源。

lncrna研究方法

lncrna研究方法

LncRNA研究方法引言长链非编码RNA(long noncoding RNA,简称lncRNA)是一类长度超过200个核苷酸的RNA分子,不具有翻译成蛋白质的能力。

近年来,越来越多的研究表明,lncRNA在生物学过程中起到重要的调控作用。

因此,研究lncRNA的功能和机制对于深入理解基因表达调控和疾病发生发展具有重要意义。

本文将介绍几种常用的lncRNA研究方法,包括lncRNA鉴定、表达分析和功能研究。

1. lncRNA鉴定方法1.1 基于转录组测序技术的lncRNA鉴定1.1.1 基于RNA-seq的lncRNA鉴定RNA-seq是一种高通量测序技术,可以同时检测转录本的数量和结构。

通过RNA-seq数据分析,可以利用不同lncRNA和mRNA的长度、读取方向、外显子数目和剪接事件等特征来鉴定lncRNA。

1.1.2 基于CAGE技术的lncRNA鉴定CAGE(Cap Analysis of Gene Expression)技术可以用来检测转录起始位点(transcription start site,TSS),从而揭示基因的转录起始区域。

结合CAGE技术和高通量测序,可以鉴定lncRNA的转录起始位点,辅助lncRNA的鉴定和表达分析。

1.2 基于生物信息学方法的lncRNA鉴定1.2.1 基于序列保守性的lncRNA鉴定lncRNA在进化中可能会保留一定程度的序列保守性,即不同物种之间的lncRNA序列相对保守。

利用序列保守性的分析方法,可以鉴定出可能的lncRNA 序列,并进行进一步的实验验证。

1.2.2 基于结构特征的lncRNA鉴定lncRNA的结构特征在一定程度上与其功能相关。

通过比对已知lncRNA的结构特征和未知序列的结构特征,可以进行预测和鉴定。

2. lncRNA表达分析方法2.1 qRT-PCRqRT-PCR(quantitative reverse transcription polymerase chain reaction)是一种可靠的lncRNA表达分析方法。

长链非编码RNALncRNA研究,读这篇文章就足够了!

长链非编码RNALncRNA研究,读这篇文章就足够了!

长链非编码RNALncRNA研究,读这篇文章就足够了!1.认识一下长非编码RNA定义非编码RNA (non-coding RNA,ncRNA)指不翻译成多肽的RNA。

按照长度不同,短于200nt的归为小非编码RNA (small ncRNAs,sncRNAs),长于200nt的归为长非编码RNA (long ncRNAs,lncRNAs)。

分类根据染色体上与编码基因的相对位置将lncRNA分为反义型(antisense lncRNAs)、内含子型(intronic lncRNAs)、反向型(divergent lncRNAs)、基因间型(intergenic lncRNAs)、启动子上游型(promoter upstream lncRNAs)、启动子型(promoter-associated lncRNAs)、转录起始位点型(transc ription start site-associated lncRNAs) [1, 2] (图1)。

图1. 根据染色体上与编码基因的相对位置对ncRNA进行分类。

lncRNAs作用范围广泛,机制非常复杂,这里从基因调控的角度重点讲一讲。

为了方便大家的理解,咱们来看看lncRNA的特点。

简单讲,lncRNA的本质是RNA,是由核苷酸组成的长链,有以下几个优势:(1) 可以轻松的与同源DNA序列(转录lncRNA的基因以及序列相似的基因)结合;(2) 可以轻松的与同源RNA序列结合;(3) 其丝带般的特点可以折叠成复杂的二级结构,轻松与多种蛋白质结合。

也就是说,lncRNA情商极高,与上层领导(DNA)关系暧昧,与同事(RNA)关系很铁,与下属(蛋白质)关系紧密。

这样八面玲珑的lncRNA那肯定是相当吃得开啊。

2.lncRNA参与转录前调控顾名思义,转录前调控就是对转录事件发生之前的准备阶段进行调控,主要指染色质开放或关闭状态的调控——想要使原来不转录的基因开启转录,就需要染色质从关闭状态转换为开放状态;想要使原来转录的基因不再转录,就需要染色质从开放状态转换为关闭状态。

lncRNA分析方案

lncRNA分析方案

Long noncoding RNA分析方案一、项目背景目前,越来越多的人开始把焦点放在MicroRNA上,因为它们具有降解目标mRNA和抑制翻译的功能,从而调节基因表达。

然而,新近的研究发现,还有一类序列比较长的非编码RNA(long noncoding RNA)也具有调节基因表达的功能。

例如小鼠中的macroRNA Xist和Air,其大小分别为18和108kb。

Xist通过与染色体作用引起失活的X染色体上的大部分基因沉默,而Air与父本的Igf2r/Slc22a2/Slc22a3基因簇的沉默有关。

另外,long ncRNA还可能与基因印记和反义转录有关。

高密度的芯片tiling array和大规模的全长cDNA文库分析显示,在哺乳动物体内存在多达数千的ncRNA,通过FANTOM对102,801 cDNAs的全长测序和分析显示,大约有三分之一(34,030)的序列缺少潜在的蛋白编码区域。

而其中的大部分序列的功能仍然不清楚,当然其中可能有假的ncRNA序列,如3’UTR或5’UTR片断及内含子片断。

2006~2007年,有好几篇文章通过生物信息学的方法预测了小鼠Long ncRNA的序列和潜在数量。

由于文章采用的对ncRNA的限制条件不尽相同,得到的long ncRNA的数量也存在差异:PNAS 上的文章[3]为1328个,其中849个在脑中有明显的信号;Genome Res.上[4]的文章则在小鼠中预测出3122 个长的全长ncRNAs(“macroRNAs”) 。

PLoS Genetics在2006年[1]有一篇文章除了预测小鼠macro ncRNA之外,还用RT-PCR、Northern等方法进行了验证。

二、项目意义在人的基因组中,只有2%碱基用于编码蛋白,而有72%的碱基是可以转录的,因此ncRNA的存在有很大的空间。

然而,这些不编码蛋白的RNA(ncRNA)有什么作用呢?近些年,研究者们主要将目光聚集在短的ncRNA(microRNA)上,已经发现了数百个microRNA,其主要功能是调节基因的表达。

lncRNASNP2:lncRNA与SNP研究关联数据库

lncRNASNP2:lncRNA与SNP研究关联数据库

lncRNASNP2:lncRNA与SNP研究关联数据库lncRNASNP2(/lncRNASNP2)是由华中科技大学研究人员开发的专门收录lncRNA和SNP关联信息的数据库,包含人和小鼠两个物种。

其中,lncRNASNP2收录了人的141,353个lncRNA信息,10,205,295个对应SNP位点信息,859,534个对应非编码拷贝数变异信息和315,234个基于TCGA挖掘的肿瘤突变信息;小鼠包括117,405个lncRNA信息和对应的5,104,701个SNP位点信息。

由于在该数据库中,已经把SNP位点,拷贝数变异信息,miRNA 结合信息,疾病信息与lncRNA进行了整合,因此,只要输入任何一条信息进行检索即可。

如小编想看“hotair”,输入即可:选择对应的转录本进入查看详情:有关这个lncRNA的注释信息,结构信息,序列,相关变异统计和来源文献等都一览无遗。

对于每一部分信息,可以点击右边的内容进行查询:“Variants in lncRNA”这一部分,把该lncRNA的所有SNP位点详细信息,拷贝数变异信息都整理出来了,每一个可点入进行详情查看。

“lncRNA disease”这里展示的是用TAM预测的有关这个lncRNA可哪些疾病存在关联,为了解lncRNA和某些特定疾病的关联提供依据。

“miRNA target sites on lncRNA”做lncRNA研究,有哪些miRNA可能与之结合,是最常能考虑到的。

这里展示了什么位置,有miRNA结合可能性,是否有实验验证,是否保守等都进行了分类,每一个的结合信息可以点击miRNA进行查看:“miRNA target gain”&“miRNA target loss”lncRNA的SNP位点变异与拷贝数变化是否影响miRNA的结合,是增强还是减弱,这部分给出了详细的答案,这也是DNA变异是否lncRNA功能的重要依据。

“expression”这一部分把不同肿瘤及突变下,lncRNA的表达情况进行了汇总,因此,可以比较不同情况下lncRNA的表达特异性,对于疾病的深入研究提供了参考。

NONCODE数据库使用指南一款好用的lncRNA数据库

NONCODE数据库使用指南一款好用的lncRNA数据库

NONCODE数据库使用指南一款好用的lncRNA数据库ncRNA的研究以星火燎原之势席卷科研界,尤其是lncRNA的发现,更是受到广大学者们的热捧。

尽管lncRNA的研究很火,但其仍然处于初步的探索和基础研究阶段。

目前,无论是在国内还是国外都没有统一的命名规则,这也给各位研究者带来了很大的烦恼。

当各位老师拿到lncRNA数据的时,心中酸楚不言而喻。

一款实用的lncRNA数据库(NONCODE Database)帮您解决大部分问题,走起01数据库基本介绍NONCODE DB是一款综合性的数据库,该数据库是一个比较全面的ncRNA相关注释的数据库,尤其是lncRNA信息,不仅支持常用lncRNA的name、NONCODE ID(例如:NONHSAG000001)搜索,部分lncRNA支持其他数据库名字进行搜索。

该数据库目前收入了16个物种,主要是动物方面的,包括人、小鼠、大鼠、奶牛、鸡、果蝇、斑马鱼、线虫、酵母、拟南芥、黑猩猩、大猩猩、恒河猴、复鼠、鸭嘴兽、猩猩。

数据库包含信息丰富,包括表达、功能、与疾病关系、染色体位置、序列保守性等,并可进行序列Blast搜索,同时支持数据下载。

目前最新更新为2017年4月6日更新的版本。

数据库链接为:02数据库的使用以下是数据库的页面展示从页面模块可以看出,基于这个数据库我们可以浏览所涉及物种的全部lncRNA信息,搜索感兴趣的lncRNA,功能查看,比对,下载等。

1)已知某lncRNA 的序列信息,想知道该lncRNA基因组上位置信息,功能如何?只需要将序列信息粘贴到blast模块,(参数默认)搜索结果如下:(图一是参考文献及该lncRNA的NONCODE等信息,图二是具体的比对结果)选择得分最高的第一个比对结果,将相似性比较高的转录本ID NONHSAT002796.2在search中搜索可以获得如下信息:基本信息如下:序列信息表达谱信息:数据来源等:2)对于刚刚搜索的比较感兴趣的lncRNA进行功能的注释如下:只需将lncRNA 的基因ID 输入到Function模块即可。

整整24个!lncRNA科研必备最全数据库收录

整整24个!lncRNA科研必备最全数据库收录

整整24个!lncRNA科研必备最全数据库收录长链非编码RNA(long non-coding RNA,lncRNA)是指长度大于200 个核苷酸的不参与蛋白质编码过程的DNA 转录产物。

近年来,这类lncRNA 在表观遗传、转录及转录后水平上调控基因表达方面的研究比较广泛,已获得较为深刻的认知。

最近人们认识到lncRNA 在许多的生理、病理途径中发挥着一定的作用,比如干细胞全能性、神经生长分化与肿瘤发生等。

生命科学研究中非编码调控RNA可谓是研究最火的领域之一,大量lncRNA数据不断积累和各种资源数据库被开发出来,使我们更加方便地查询和研究。

数据团队整理相关文献总结出了24个数据库和工具。

接下来我们会对每个数据库和工具进行一个简短的总结,并提供相关的链接和文献。

1. NoncodeNONCODE v4是一个全面的综合注释数据库,数据由二代高通量测序技术产生,涵盖所有类型ncRNAs,(除了rRNAs and tRNAs)。

NONCODE的优势之处在于其ncRNA注释,提供编码能力评估,位置信息,表达信息和潜在功能以及共表达等信息。

另外它还对先前的基因芯片数据重注释,以获得更多的lncRNA表达信息。

2. LncRBaseLncRBase是一个基于特征序列(如CGIs和重复序列)来分析IncRNA功能的注释数据库。

2015年11月,LncRBase收录了83201个鼠的和133361个人类的ncRNA转录本,分析内容包含“lncRNA-ncRNA互作”或“Alu repeat elements”结果。

/zhumur/lncrbase/3. lncRNomelncRNome是专门收集人类lncRNAs信息的知识数据库,包括疾病、表达、生物功能和表观遗传等相关信息。

/lncRNome/4. NREDNERD是一个发育和分化相关的基因芯片数据库,包含各种组织特异表达的lncRNA。

用户可以在特定的器官,部位和细胞中查询lncRNA的表达情况。

全转录组LncRNA与CircRNA测序分析策略

全转录组LncRNA与CircRNA测序分析策略

DIANALncBase
11 GeneCards v3
12 Linc2GO
13 lncPro
14
lncRNABase (starBase v2.0)
repository of mammalian long non-protein coding transcripts that have been experimentally shown to be both noncoding and funcOonal
© 2010-2016 Novel Bio Co.,Ltd
CONTENTS
目 录
1 生命体中的暗物质 2 RNA-seq之“暗物质”解决方案 3 lncRNA与circRNA的分析方案 4 关于我们:烈冰团队
如何设计一次lncRNA的研究
课题设计与样本准备 测序与数据分析 后期功能验证
研究目标:circRNA,lncRNA?Novel,Known? 实验手段:Poly A(+),Ribofree? 样本选择:生物学重复?采样位置?
历代发表文章的建库统计
更多的环状RNA被检测
更准确的背景 与表达量的关系
© 2010-2016 Novel Bio Co.,Ltd
Iju Chen, WIREs RNA 2016, 6:563–579. doi: 10.1002/wrna.1294
CONTENTS
目 录
1 生命体中的暗物质 2 RNA-seq之“暗物质”解决方案
Experimentally verified and computaOonally predicted microRNA targets on long noncoding RNAs.
www.microrna.gr/LncBase

LncRNA分析流程搭建——前言

LncRNA分析流程搭建——前言

LncRNA分析流程搭建——前言
湿实验转岗干实验的菜鸡,现需搭建ceRNA分析流程,记录学习过程,供交流学习~
背景:lncRNA是长度>200个核苷酸的非编码RNA,占ncRNA 的80%左右,其本身缺少明显的开放阅读框,不编码蛋白质,广泛存在于各种生物体内,具有组织特异性表达和丰度低等特点。

lncRNA大多数由RNA聚合酶II转录后经过剪接和多聚腺苷酸化加工而成,通常具有5'加帽结构和3'多聚A尾结构,但其中有40%的lncRNA不携带poly(A)。

lncRNA保守性较差,仅在RNA的二级结构和启动子区域有进化保守性。

相比于其他非编码RNA,lncRNA序列较长,可形成更为复杂的空间结构而与蛋白质因子相互作用,故携带的信息量更为丰富;lncRNA也提供了较大的空间位置,可同时与多个分子结合。

技术原理:由于只有部分lncRNA的3'端带有poly(A),其他lncRNA则缺少poly(A),因此针对poly(A)的oligo (dT) 磁珠富集方法不能全面捕获lncRNA。

通常lncRNA的高通量测序采用去除核糖体RNA(rRNA)的方法来富集lncRNA。

在处理样本时采用去除rRNA 的反向富集法不仅可以最大限度的保留lncRNA的种类,同时还可以最大限度的富集到所有的转录组mRNA,随后可反转录为cDNA进行测序文库的构建,上机测序。

生物信息学分析:(1)测序数据质量控制;(2)序列比对;(3)转录本拼接;(4)lncRNA的鉴定与注释;(5)差异表达分析;(6)lncRNA功能分析和预测
生信分析过程将逐步呈现~。

lncRNA介绍专题:lncRNA与其他非编码RNA

lncRNA介绍专题:lncRNA与其他非编码RNA

lncRNA介绍专题:lncRNA与其他非编码RNAncRNA(non-coding RNA)是近年来发现的一类能转录但不编码蛋白质的具有特定功能的RNA小分子。

功能基因组学的飞速发展将越来越多的目光引向了对非编码转录产物功能的研究。

ncRNA根据大小可以分为两组:大于200bp的long RNAs以及小于200bp的small RNAs,其中long RNAs包括long non-coding RNA(lncRNA)和circleRNA,small RNAs包括miRNA、piRNA、snRNA 、snoRNA 等等。

lncRNAlncRNA一般是指长度大于200 个核苷酸,没有显著的蛋白质编码能力的的DNA 转录产物。

虽然这个定义稍显武断,但是它却可以很好的区分lncRNA与miRNA、piRNA等小RNA。

lncRNA的分类是比较复杂的,根据它们在基因组上的位置附近的编码基因,可以将其分为以下5类:•反义型,antisense•内含子型,intronic•基因间型,intergenic•分歧型,divergent•增强子型,enhancer:很多lncRNA都是enhancer型lncRNA,它们可以调控它们产生区域的增强子和其他调控因子的作用。

不同的lncRNA会存在于细胞的不同地方:存在于核内或胞浆内。

根据其所处位置的不同,其发挥的作用也不相同。

有些lncRNA还可能同时存在于核内和胞浆内。

核内lncRNA占lncRNA的大多数,通过招募染色质调节因子(chromatin modifiers)到DNA上来发挥调节作用,或者作为一些核糖核蛋白的脚手架来发挥作用。

而胞浆中的lncRNA作用于基因的转录后水平的调节,如作为miRNA海绵(可以是环状结构,也可以是线性结构),抑制miRNA 对mRNA的作用。

同时lncRNA还可以影响到RNA的半衰期(见下图)。

LncRNA 起初被认为是没有功能的转录垃圾。

转录组RNAseq术语解释

转录组RNAseq术语解释

转录组RNAseq术语解释名词解释RNA-Seq1.index测序的标签,⽤于测定混合样本,通过每个样本添加的不同标签进⾏数据区分,鉴别测序样品。

2.碱基质量值)出错的概率的整数映射。

碱基质量值越⾼Base CallingQ-score(Quality Score)是碱基识别(或表明碱基识别越可靠,碱基测错的可能性越⼩。

3.Q30代表碱基的精确度在99.9%。

碱基质量值为Q30(Fragments Per Kilobase of transcript per Million fragmentsmapped)4.FPKM个数。

计算公式为1K个碱基上的fragmentmap上的reads中map到外显⼦的每每1百万个即双表⽰⽐对到某⼀转录本上的⽚段数⽬,公式中,cDNA Fragments 总数,Mapped ReadsMapped Reads(Millions)表⽰端Reads数⽬;个碱基为单:转录本长度,以Transcript Length(kb)kb以10为单位;位。

Fold Change)5.FC(即差异表达倍数。

False Discovery Rate)6.FDR(的个数占所有被拒绝)零)假设即错误发现率,定义为在多重假设检验过程中,错误拒绝(拒绝真的原( 值的阈值。

来决定P的原假设个数的⽐例的期望值。

通过控制FDR P-value)7.P值(P<0.05⼀般以P 反映某⼀事件发⽣的可能性⼤⼩。

统计学根据显著性检验⽅法所得到的值,即概率,0.01。

或为显著,P<0.01为⾮常显著,其含义是样本间的差异由抽样误差所致的概率⼩于0.05)8.可变剪接(Alternative splicing6/ 61/ 1.剪接异mRNA(选择不同的剪接位点)产⽣不同的有些基因的⼀个mRNA前体通过不同的剪接⽅式。

可变剪接是调节基因表达和产⽣蛋⽩alternative splicing)(或选择性剪接,构体,这⼀过程称为可变剪接质组多样性的重要机制,是导致真核⽣物基因和蛋⽩质数量较⼤差异的重要原因。

lncRNA数据库

lncRNA数据库

lncRNA数据库史上最全的lncRNA数据库⼤全及⼼得分享miRNA研究热度正在消减,lncRNA却热⽕朝天。

虽然⽼谈⼀直默默觉得部分lncRNA就是伸长了的miRNA,其作⽤机制⽐较类似,但有关所有lncRNA全⽅⾯的功能研究还需要进⼀步的探索。

⼩伙伴们更需要装配研究的利器,帮助我们在寻求相关lncRNA信息时能够⼿到拈来,不费吹灰之⼒!今天⽼谈就跟⼤家分享⼀些研究lncRNA的数据库,帮助⼤家做好科研准备⼯作。

当然lncRNA数据库较之于miRNA可能相对较少,毕竟后者的研究已经⾮常成熟。

--by⽼谈1. NONCODE提供对长链⾮编码RNA的全⾯注释,包括表达和ncFANs计算机软件预测的lncRNA功能。

这是⾮编码RNA研究的知名数据库,已经更新到2014年的8⽉了。

⽹址:Note:⼩伙伴们⼩⼼使⽤时状况百出,这个⽹站对lncRNA的命名⽅法是他们⽹站内部命名的系统!!要哭了有没有,根本找不到你要的lncRNA……但有个办法解决,因为他们⽹站有Blast的系统,你如果有lncRNA的序列的话,还是能找到对应的编号的。

对于lncRNA在不同组织中的表达还是挺有⽤的。

2. 提供有⽣物学功能的长链⾮编码RNA的全⾯注释。

这是长链⾮编码RNA研究领域的⼤⽜Johnmattick实验室构建的⽹站。

⽹站:/Note:这个⽤下来凭良⼼说还⾏,输⼊lncRNA名称之后,会对这个lncRNA的功能及表达进⾏注释。

这个⽹站⽤的是NCBI上Gene的命名法,使⽤上还是没有障碍的。

3. 提供长链⾮编码RNA的表达图谱和转录调控的全⾯鉴定和注释。

整合了⾼通量的RNA-seq鉴定的lncRNA及其表达图谱和ChIP-Seq实验技术鉴定的转录因⼦结合位点。

⽹站:/chipbase/Note:中⼤的这个数据库主要是对于⼀些lncRNA的表达及lncRNA与转录因⼦之间的关系的⼀个注释数据库。

主要可以了解与转录因⼦相关的lncRNA的结合情况。

结合lncRNAmicroRNA和SNP的研究,有哪些数据库可以用?

结合lncRNAmicroRNA和SNP的研究,有哪些数据库可以用?

结合lncRNAmicroRNA和SNP的研究,有哪些数据库可以用?聊聊跟科研有关的感想心得,如基金,文章和实验。

今天我们承接上篇文章(如何根据疾病查SNP位点?)介绍进行lncRNA或者miRNA的SNP研究的时候,能用到的工具:1. lncSNP2.0 http://210.46.80.146/lincsnp/search.php这里我们通过疾病进行检索,单击Disease 以后我们在检索框中输入胃癌 Gastric cancer:我们看到136条胃癌相关的SNP位点,其中涉及到的lncRNA有7146条:数据我们可以下载查看。

2. MirSNP:/mirsnp/search/这里的信息就包括了基因、miRNA和SNP的信息,我们可以通过miRNA进行检索:这里我们就看到了gene-miRNA-SNP的关系:也就是说SNP导致miRNA与靶基因的结合调控异常从而调控靶基因表达。

这样的课题和文章非常多,比如:1. 癌基因FNDC3B的3’UTR长度多态性介导miRNA调控鼻咽癌转移机制的研究(2016年中标基金)2. BER通路基因miRNA结合位点基因多态性与结直肠癌易感性的关联及功能研究(2015年中标基金)3. MRP1/ABCC1基因3' UTR单核苷酸多态性介导miRNA对原发性肝癌多药耐药性的影响(2014年中标基金)4. TRIOBP基因miRNA结合位点SNP对职业噪声性听力损失易感性的作用研究(2013年中标基金)我们可以参考以前写过的文章:(文章篇)S5E21: SNP,miRNA和lncRNA的课题设计?(文末两个福利)当然,这个数据库还可以让我们进行批量检索:比如我们通过多个基因进行检索:3. lncRNASNP:/lncRNASNP/比如:就可以通过snp查询miRNA以及lncRNA:以及SNP位点的存在对miRNA与lncRNA结合的影响:这个数据库可以帮我们提出科学假说:由于SNP位点的存在,导致lncRNA与miRNA之间的结合异常,从而导致lncRNA对miRNA 的sponge吸附作用异常,进而与疾病的发生发展产生联系。

非编码RNA调控生物过程的机制

非编码RNA调控生物过程的机制

非编码RNA调控生物过程的机制随着高通量测序技术的出现,越来越多的非编码RNA(ncRNA)被发现并引起了科学家们的关注。

这些ncRNA虽然不参与蛋白质编码,但在生物过程中发挥着重要的调控作用。

本文将介绍ncRNA的分类、调控机制以及其在生物过程中的重要性。

一、ncRNA的分类ncRNA按照长度可以分为两类:小分子ncRNA和长链ncRNA。

小分子ncRNA一般长度小于200nt,包括miRNA、siRNA等;长链ncRNA长度一般大于200nt,包括lncRNA、circRNA等。

miRNA(microRNA)是一类长度约为20-24nt的小分子ncRNA,它们的主要功能是通过结合靶mRNA降解或抑制mRNA的翻译。

miRNA通常由转录本后内切酶Drosha和Dicer依次剪切产生。

siRNA(small interferingRNA)长度也为20-24nt,与miRNA类似,它通过结合靶mRNA,激活RNA脱氧核酸酶,引导RNA降解。

siRNA是RNA干扰(RNA interference)的关键分子。

lncRNA(long non-codingRNA)指大于200nt的ncRNA,目前已发现数量众多。

lncRNA参与复杂的细胞调控机制,包括染色质重构、基因转录后调控和RNA代谢等领域。

相比于miRNA和siRNA,lncRNA功能及其调控复杂性更多。

circRNA(circular RNA)是最近被发现的一种ncRNA类型,它形成一个环形结构,抑制miRNA的作用,进而参与了多种生物学过程。

以上是常见的几种ncRNA分类,这些ncRNA在细胞生命活动中具有各种不同的调控作用,如下所述。

二、ncRNA的调控机制(a) 基因转录后调控基因转录后调控是指ncRNA通过介导DNA甲基化、染色质修饰、核糖体RNA加工、核糖体生物合成等途径间接参与生物学过程。

基因转录后调控的ncRNA主要包括lncRNA、miRNA、piRNA(Piwi-interactingRNA)等。

ncRNA系列专题(三)丨RNA界谁的情商最高?——lncRNA作用机制

ncRNA系列专题(三)丨RNA界谁的情商最高?——lncRNA作用机制

ncRNA系列专题(三)丨RNA界谁的情商最高?——lncRNA作用机制都说做人难,做好人更难,好人全靠高情商。

都说lncRNA情商极高,与上层领导(DNA)关系暧昧,与同事(RNA)关系很铁,与下属(蛋白质)关系紧密,八面玲珑的lncRNA那是相当吃得开啊。

想在生物行业这个圈子里混得好,还得多向lncRNA学习。

来,咱们今天就向大家分析分析lncRNA如何在圈子里如鱼得水,嘿嘿!图1 (网络来源图片,和珅)lncRNAs作用范围广泛,机制非常复杂,这里从基因调控的角度重点讲一讲。

为了方便大家的理解,咱们先来看看lncRNA的特点。

简单讲,lncRNA的本质是RNA,是由核苷酸组成的长链,有以下几个优势:1. 通过碱基互补配对,轻松与靶DNA序列结合;2. 通过碱基互补配对,轻松与靶RNA序列结合;3.其丝带般的特点可以折叠形成二级或三级结构,轻松与多种蛋白质结合。

LncRNA的牛皮可不是乱吹的,接下来给大家逐一带来相关文献报道作为论据支撑!LncRNA与染色质和DNAlncRNA重塑染色质Deng et al.发现HoxB lincRNA的表达量上调能调控心源性中胚层发育,促进造血循环。

HoxB lincRNA能够作为染色质循环结构的调控因子引导Setd1a/MLL1到hoxb基因,控制血液系统相关基因的转录[1]。

图2. HoxB基因在中胚层和造血过程中发挥着关键的作用DNA绑定Postepska-Igielska et al.认为调控因子lncRNA Khps1能够通过联系SPHK1的启动子激活原癌基因的表达。

在这个过程中,Khps1与SPHK1通过RNA-DNA绑定的方式诱导染色质修饰酶建立转录本疏松的结构,并激活E2F1基因的转录[2]。

图3. lncRNA Khps1与SPHK1基因发生绑定的作用机制促进染色质成环通过FACS纯化技术和RNA-seq,Jiang et al.全面论述了在人内胚层和胰腺系细胞的转录本动力学,以及鉴定了100余个特异性lncRNA。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Published online20October2014Nucleic Acids Research,2015,Vol.43,Database issue D181–D186doi:10.1093/nar/gku1000 lncRNASNP:a database of SNPs in lncRNAs and their potential functions in human and mouseJing Gong1,2,†,Wei Liu2,†,Jiayou Zhang3,Xiaoping Miao1,*and An-Yuan Guo2,*1Department of Epidemiology and Biostatistics,School of Public Health,T ongji Medical College,Huazhong University of Science and T echnology,Wuhan,Hubei430030,PR China,2Department of Biomedical Engineering,Key Laboratory of Molecular Biophysics of the Ministry of Education,College of Life Science and T echnology,Huazhong University of Science and T echnology,Wuhan,Hubei430074,PR China and3Department of influenza vaccine research,Wuhan Institute of Biological Products,Wuhan,Hubei430207,PR ChinaReceived August08,2014;Revised September29,2014;Accepted October07,2014ABSTRACTLong non-coding RNAs(lncRNAs)play key roles in various cellular contexts and diseases by diverse mechanisms.With the rapid growth of identified lncRNAs and disease-associated single nucleotide polymorphisms(SNPs),there is a great demand to study SNPs in lncRNAs.Aiming to provide a use-ful resource about lncRNA SNPs,we systematically identified SNPs in lncRNAs and analyzed their po-tential impacts on lncRNA structure and function.In total,we identified495729and777095SNPs in more than30000lncRNA transcripts in human and mouse, respectively.A large number of SNPs were predicted with the potential to impact on the miRNA–lncRNA in-teraction.The experimental evidence and conserva-tion of miRNA–lncRNA interaction,as well as miRNA expressions from TCGA were also integrated to pri-oritize the miRNA–lncRNA interactions and SNPs on the binding sites.Furthermore,by mapping SNPs to GWAS results,we found that142human lncRNA SNPs are GWAS tagSNPs and197827lncRNA SNPs are in the GWAS linkage disequilibrium regions.All these data for human and mouse lncRNAs were imported into lncRNASNP database(http://bioinfo. /lncRNASNP/),which includes two sub-databases lncRNASNP-human and lncRNASNP-mouse.The lncRNASNP database has a user-friendly interface for searching and browsing through the SNP,lncRNA and miRNA sections. INTRODUCTIONThe ENCODE project shows that most of the human genome nucleotides can be transcribed into primary tran-scripts in different cells(1),producing a range of non-coding RNAs(ncRNAs).Long non-coding RNAs(lncR-NAs)are ncRNAs defined as transcripts>200nt in length, which are typically transcribed by RNA polymerase II and are often multiexonic and polyadenylated(2).lncRNAs play critical roles in various biological processes and cellular contexts by diverse mechanisms to participate in the regu-lation of transcription/post-transcription/post-translation, organization of protein complexes,cell–cell signaling as well as recombination(3,4).The functions of lncRNAs are de-scribed in terms of their expressions,biological processes, diseases mechanisms,as well as their polymorphisms(5). By dysregulating target gene expression,lncRNAs involve in a number of complex human diseases,including coro-nary artery diseases,autoimmune diseases,neurological dis-orders and various cancers(6).Single nucleotide polymorphisms(SNPs)represent the most frequent genetic variants among individuals and link to gene expression,function,phenotypes and diseases(7). Recently,SNPs in lncRNAs were found to be linked to their abnormal expressions and dysregulations,thus play important roles in disease association(5,8).For example, the rs2839698TC genotype of lncRNA H19was associated with a low risk of developing non-muscle-invasive blad-der cancer(9).SNP rs6983267affects the expression of lncRNA CCAT2thus impacts tumor growth and metasta-sis in colorectal cancer(10).In addition,many genome-wide association studies(GW ASs)have identified several trait-associated SNPs in or nearby lncRNAs,such as antisense noncoding RNA in the INK4locus(ANRIL)(11).There-fore,it is important to identify SNPs in lncRNAs,espe-cially link SNPs in lncRNAs with GW AS results for study-ing complex traits and diseases.MicroRNAs(miRNAs)are another class of small ncR-NAs.lncRNA can interact with miRNA by complemen-tary sequence to act as a miRNA decoy or sponge,which are widely confirmed by experiments(12–15).For example,*To whom correspondence should be addressed.Tel:+862787793177;Fax:+862787793177;Email:guoay@Correspondence may also be addressed to Xiaoping Miao.Tel:+862783650744;Fax:+862787793177;Email:miaoxp@†The authors wish it to be known that,in their opinion,the first two authors should be regarded as Joint First Authors.C The Author(s)2014.Published by Oxford University Press on behalf of Nucleic Acids Research.This is an Open Access article distributed under the terms of the Creative Commons Attribution License(/licenses/by/4.0/),which permits unrestricted reuse,distribution,and reproduction in any medium,provided the original work is properly cited. at The Fourth Military Medicine University on January 16, 2015/ Downloaded fromD182Nucleic Acids Research,2015,Vol.43,Database issuelncRNA PTENP1function as a decoy for PTEN-targeting miRNAs in tumor suppression(14).Currently,starBase has collected more than10000miRNA–ncRNA inter-action pairs from high-throughput studies(16).SNPs in miRNA target sites on lncRNAs may influence(destroy or create)the miRNA–lncRNA interactions,thereby alter their functions.For protein-coding genes,SNP impacts on their miRNA target sites has been validated in many stud-ies(17,18)and a number of databases for predicting func-tional SNPs in miRNA target sites were constructed,in-cluding MicroSNiPer,PolymiRTS,miRdSNP,MirSNP and our previous work miRNASNP(19–23).Thus,a database for SNPs in lncRNAs and their potential functions on lncRNA–miRNA binding will be very useful to accelerate the researches.Currently,there are many databases about lncRNA se-quence,expression and function,including NONCODE, LNCipedia,lncRNAdb,lncRNAtor,lncRNAMap,star-Base,lncRNome,Linc2GO and LncRNADisease(16,24–31).There are very few studies and databases about the lncRNA SNPs on genome-wide,which include systematical analyses of SNPs in long intergenic noncoding RNAs(lin-cRNAs)and a database named LincSNP linking disease-associated SNPs to human lincRNAs(32,33).However, both studies focused on lincRNAs,a subclass of lncR-NAs and both of them didn’t analyze the SNP effects on miRNA–lncRNA interactions.Until now,there is no genome-wide analysis or a database for the comprehensive lncRNA related SNPs and their potential functions.In this study,we constructed the lncRNASNP database aiming to provide comprehensive information about lncRNA related SNPs in human and mouse and explore their potential functions.We characterized all SNPs in lncRNA exon sequences,and predicted their effects on lncRNA secondary structure and lncRNA–miRNA in-teraction.Furthermore,we identified human lncRNA SNPs in the GW AS linkage disequilibrium(LD)regions to link lncRNAs to phenotypes.The lncRNASNP has a user-friendly interface for searching and displaying.We hope it will be a useful resource for the lncRNA,SNP and miRNA research communities.DATA COLLECTION AND DATABASE CONTENT SNPs in lncRNA transcriptsThe human and mouse SNP data were downloaded from dbSNP of NCBI(human GRCh37and mouse mm10). We obtained the human lncRNA data from LNCipedia database,which contains32108human lncRNA tran-scripts of17436lncRNA genes(GRCh37)(25).We ex-tracted36471confident mouse lncRNA transcripts from NONCODEv4by excluding the unpublished and uncon-fident data.The genomic coordinates of mouse lncRNAs were converted from genome assembly mm9to mm10us-ing the LiftOver utility in UCSC(). By comparing the genomic coordinates of SNPs with those of lncRNAs,we identified495729SNPs and777095SNPs in human and mouse lncRNA transcripts(Table1),respec-tively.We refer to these SNPs as lncRNA SNPs in human and mouse.Impacts of SNPs on lncRNA structuresA part of lncRNAs can exert their functions by scaffold-ing protein complexes(34),suggesting the structural fea-tures of lncRNAs play important roles in their functions.SNPs in lncRNA transcripts may influence the lncRNA secondary structure to impact its stability,expression and functions(35).To assess the impacts of SNPs on lncRNA secondary structures,we first extracted lncRNA transcript sequences from human/mouse reference genome accord-ing to the lncRNA transcript BED file as Ref-transcripts.For each SNP,we changed the corresponding allele in thegiven Ref-transcript to alternative allele as Alt-transcript.Then,RNAfold program(36)was used to illustrate the secondary structure and calculate the minimal free energy (MFE, G).Energy change of RNA structures( G)was calculated by the MFE differences using G=| Galt−Gref|,where Gref and Galt are the MFEs of the Ref-transcript and Alt-transcript,respectively.In human andmouse lncRNAs,the average energy changes by SNPs are(1.30±1.62)kcal/mol and(1.26±1.27)kcal/mol,whilethe energy changes of the top10%are3.10kcal/mol and3.00kcal/mol,respectively.miRNA–lncRNA interactionIncreasing evidence shows that lncRNAs can be directly regulated by miRNAs(16),thereby indirectly regulate gene expression by competing with shared miRNAs(12).In lncRNASNP database,we not only predicted miRNA tar-get sites on lncRNAs,but also integrated the interaction conservation,miRNA expression and experimental vali-dated miRNA–lncRNA interaction for prioritization.After downloading mature miRNA sequences from latestversion of miRBase(37)(release20),miRNA target siteson lncRNAs were predicted by combining the results oftwo popular tools,namely TargetScan(38)and miRanda(39).To further reduce false positives and prioritize the in-teractions,we also considered the conservations of targetsites and the expression of miRNAs.The miRNA bindingsites existing in the conserved exons across human,mouse,rat and dog were classified as conserved.The conserva-tion analysis of lncRNA exons were analyzed by UCSCLiftOver tool and set the parameter of‘minimum ratio ofbases that must remap’as0.5.By analyzing the miRNA ex-pression profiles of9566human small RNA samples across28diseases from The Cancer Genome Atlas(TCGA),wefound that only553miRNAs(21%)have an expressionlevel>1RPM(reads per million)and the remaining79%miRNAs are almost no expression.In a specific tissue,the predicted bindings of these unexpressed miRNAs may bevery week and useless.Thus,we provided the miRNA ex-pression levels to help users to assess the confidence of themiRNA–lncRNA interaction in specific tissues.Further-more,we also included8091experimentally supported hu-man miRNA–lncRNA interactions from starBase(16).Impacts of SNPs on miRNA–lncRNA interactionsSNPs in the miRNA target sites may destroy or createmiRNA binding sites on lncRNAs,which result in lossand/or gain function of miRNA–lncRNA interactions.Toat The Fourth Military Medicine University on January 16, 2015/Downloaded fromNucleic Acids Research,2015,Vol.43,Database issue D183Table1.Data summary in lncRNASNP databaseData content Number of recordsHuman MouselncRNA gene/transcript17436/3210825512/36471miRNA25761900SNPs in lncRNA transcripts495729777095SNPs affect MLP a(loss/gain)262154/280012366731/357246All predicted MLP64132737448200Conserved MLP b6983713780Experimental MLP c(all/loss by SNPs)8091/2116NAMLP affected by SNPs(loss/gain)799694/830829898220/864767MLP loss by SNPs with miRNA RPM>1d158105NAMLP gain by SNPs with miRNA RPM>1165731NAlncRNA SNPs are GW AS tagSNPs142NAlncRNA SNPs in GW AS LD regions197827NAa MLP means miRNA-lncRNA target pair.b The miRNA binding sites are existed in all the conserved exons across human,mouse,rat,and dog.c The miRNA–lncRNA target pairs supported by CLIP experiment results from starBase.d The miRNA RPM is the average value estimated from TCGA samples(9566samples across28cancer types).assess the impact of each SNP on miRNA–lncRNA inter-action,we used TargetScan and miRanda to predict target sites on the SNP around sequences(±25bp around SNP) of Ref-transcripts and Alt-transcripts.Thus,we obtained four groups of target datasets,which were recorded as RT (targets on Ref-transcripts by TargetScan),RM(targets on Ref-transcripts by miRanda),AT(targets on Alt-transcripts by TargetScan)and AM(targets on Alt-transcripts by mi-Randa).The miRNA–lncRNA pairs exist in both RT and RM,but in neither AT nor AM,were defined as interac-tion losses.On the contrary,if a miRNA–lncRNA pair was predicted in both AT and AM,but in neither RT nor RM, we defined the Alt-transcript gained a novel target site.We found a large number of SNPs with the potential to disturb original miRNA target sites or/and created new potential miRNA target sites.The detail results are shown in Table1. SNPs in GWAS identified trait associated regions Currently,GW ASs have linked more than10000SNPs to human traits and diseases.However,most of them lo-cate outside of protein-coding regions.The lncRNASNP database attempts to link SNPs in lncRNAs to pheno-types and human diseases.We utilized the GW AS results from the NHGRI GW AS Catalog(40).By intersecting the GW AS identified strongest risk SNPs(record as GW AS tagSNPs in our study)with SNPs in lncRNAs,we found 142GW AS tagSNPs in human lncRNAs.Aim to better uti-lize the GW AS data,we also captured the LD blocks of each tagSNP for different populations using Haploview(setting R2≥0.8)(41)by analyzing the genotype information of ±500kb around the tagSNP and defined these LD blocks as GW AS identified trait associated regions.The used pop-ulations include ASW,CHB,CEU,CHD,JPT,TSI,YRI, LWK,MEX,MKK and GIH.Our analysis shows that197 827lncRNA SNPs are in the GW AS LD regions of all pop-ulations.DATABASE ORGANIZATION AND WEB INTERFACE All data were organized into a set of relational MySQL ta-bles.The lncRNAs transcript ID,miRNA ID and SNP ID were used as the primary keys to organize and link all ta-bles.The lncRNASNP website(.cn/lncRNASNP/)was built with the Ruby on Rails(RoR)open-source web framework.We developed several user-friendly search boxes to make the data retrieval easily and efficiently.A quick search box was designed at the top-right of each page for searching by lncRNA transcript ID, miRNA ID,SNP ID and even a defined chromosome re-gion(Figure1A).The advanced search was provided onthe home page with multiple ways for searching by differ-ent keywords or batch search by a list of IDs.Since lncRNASNP database contains data from humanand mouse,we divided it into two sub-databases,namely lncRNASNP-human and lncRNASNP-mouse.Each ofthem displays data mainly through three sections,which areSNP section,lncRNA section and miRNA section.The SNP section stored all the SNPs in lncRNAs as wellas their detailed information.Data in this section include(i)basic information of the SNP;(ii)SNP impacts on lncRNA secondary structure;(iii)SNP impacts on miRNA–lncRNA interaction.It also contains information of SNPs in GW ASLD regions and related GW AS information(Figure1B)inthe lncRNASNP-human database.We set four options to optimize the SNP selection because of the huge SNP list.The first is the‘position’option allowing users to querySNPs in a user-defined chromosome region.The second isthe‘GMAF’option helping users to filter results by theglobal minor allele frequency of a SNP,which is an impor-tant consideration of the sample size in association stud-ers can also limit the queried SNPs in GW AS regionsor/and impacting miRNA–lncRNA interaction.By com-bining these options,users can quickly access to the inter-ested polymorphisms.The lncRNA section provides the information of lncR-NAs.By clicking on a specific lncRNA,users can access itsbasic information,the SNPs on it,miRNAs binding to itand potential miRNA target sites gain/loss by SNPs(Fig-ure1C and E).In the‘Basic information’part,we pro-vide the conservation information of lncRNA gene by in-tegrating the results of Necsulea et al.(42)and lncRNAtor database(27).In the‘miRNAs binding to lncRNA’part,at The Fourth Military Medicine University on January 16, 2015/Downloaded fromD184Nucleic Acids Research,2015,Vol.43,DatabaseissueFigure 1.Overview of the lncRNASNP database.(A )The navigation bar of the database,including three main sections.(B )The SNP page with GW AS information and SNP effects on miRNA–lncRNA interactions.(C )An example of miRNA target loss by a SNP in lncRNA.(D )The miRNA section to search all targeted lncRNAs of miRNAs in four categories based on their expression.(E )The miRNA binding sites on a lncRNA.at The Fourth Military Medicine University on January 16, 2015/Downloaded fromNucleic Acids Research,2015,Vol.43,Database issue D185the potential binding miRNAs were shown by small bars on the binding location with different colors representing different target types(grouped by conservation,experimen-tal evidence and miRNA expression level)(Figure1E). The miRNA section enables users to select interested miRNAs by expression to obtain their targeting lncRNAs and possible gain/loss target of lncRNAs by SNPs.In this section,the miRNAs have been classified into four cate-gories according to their expressions.They were high ex-pressed miRNA group(RPM≥1000),middle expressed miRNA group(10≤=RPM<1000),low expressed miRNA group(1≤RPM<10)and unexpressed miRNA group(RPM<1).For each human miRNA,we also pro-vide the expression levels in28cancer types in the‘basic information of miRNA’part(Figure1D).SUMMARY AND FUTURE DIRECTIONSWith the rapid advances in high-throughput technologies, the lncRNA identification increases greatly in the past few years.It is necessary to analyze the lncRNA related SNPs and construct a database to help elucidating the biologi-cal functions of lncRNAs.In this study,we systematically integrated lncRNA,miRNA and SNP information as well as GW AS results and miRNA expression profiles to seek potential functional SNPs.The lncRNASNP database can be used for either small or large-scale SNP selection from lncRNAs and is particularly useful for association and func-tional studies.In lncRNASNP database,we found142of GW AS tagSNPs in lncRNAs and lots of lncRNA SNPs in GW AS LD regions.These results will help to find the real causative SNPs and genes for GW AS studies.Furthermore, we have predicted the miRNA target sites on lncRNAs and integrated experimentally validated miRNA–lncRNA pairs in the database.In combination with other miRNA/gene databases,users can further explore the relationship be-tween miRNA,lncRNA and protein-coding genes.We can envision that in the next few years the number of lncRNAs will accumulate rapidly not only in human and mouse,but also in other species.In the future,lncRNASNP will update the database frequently and extend to other species.For other species without GW AS data,the eQTL data will be utilized for SNP selection.As the data accumu-lation of lncRNA expression and miRNA–lncRNA bind-ing,we will update them into the database to reduce false positive predictions.We aim to develop and maintain the lncRNASNP database as a useful resource for the research community.ACKNOWLEDGEMENTSThe authors thank XueQin Chen,Yin Lin,Qiong Zhang and Shuyun Bo for the debugging and design of the website. We are also grateful to members of the Guo Lab and Miao lab for helpful suggestions.FUNDINGNational Natural Science Foundation of China[31171271, 31270885,31471247,81402744,31201000and81222038]; Program for New Century Excellent Talents in University;Ministry of Education of China[to A.Y.G.and X.M.];Gen-eral Financial Grant from the China Postdoctoral Science Foundation[2014M552049and2012M511605];National Program for Support of Top-notch Y oung Professionals[toX.M.].Funding for open access charge:National Natural Science Foundation of China[NSFC-31270885].Conflict of interest statement.None declared.REFERENCES1.Birney,E.,Stamatoyannopoulos,J.A.,Dutta,A.,Guigo,R.,Gingeras,T.R.,Margulies,E.H.,Weng,Z.,Snyder,M.,Dermitzakis,E.T.,Thurman,R.E.et al.(2007)Identification andanalysis of functional elements in1%of the human genome by theENCODE pilot project.Nature,447,799–816.2.Rinn,J.L.and Chang,H.Y.(2012)Genome regulation by longnoncoding RNAs.Annu.Rev.Biochem.,81,145–166.3.Geisler,S.and Coller,J.(2013)RNA in unexpected places:longnon-coding RNA functions in diverse cellular contexts.Nat.Rev.Mol.Cell Biol.,14,699–712.4.Hu,W.,Alvarez-Dominguez,J.R.and Lodish,H.F.(2012)Regulationof mammalian cell differentiation by long non-coding RNAs.EMBORep.,13,971–983.5.Tang,J.Y.,Lee,J.C.,Chang,Y.T.,Hou,M.F.,Huang,H.W.,Liaw,C.C.and Chang,H.W.(2013)Long noncoding RNAs-related diseases,cancers,and drugs.The Scientific World Journal,2013,943539.6.Li,J.,Xuan,Z.and Liu,C.(2013)Long non-coding RNAs andcomplex human diseases.Int.J.Mol.Sci.,14,18790–18808.7.Shastry,B.S.(2009)SNPs:impact on gene function and phenotype.Methods Mol.Biol.,578,3–22.8.Zhang,X.,Zhou,L.,Fu,G.,Sun,F.,Shi,J.,Wei,J.,Lu,C.,Zhou,C.,Yuan,Q.and Yang,M.(2014)The identification of an ESCCsusceptibility SNP rs920778that regulates the expression of lncRNAHOTAIR via a novel intronic enhancer.Carcinogenesis,35,2062–2067.9.Verhaegh,G.W.,Verkleij,L.,Vermeulen,S.H.,Heijer,M.,Witjes,J.A.and Kiemeney,L.A.(2008)Polymorphisms in the H19gene and therisk of bladder cancer.Eur.Urol.,54,1118–1126.10.Ling,H.,Spizzo,R.,Atlasi,Y.,Nicoloso,M.,Shimizu,M.,Redis,R.S.,Nishida,N.,Gafa,R.,Song,J.,Guo,Z.et al.(2013)CCAT2,a novelnoncoding RNA mapping to8q24,underlies metastatic progressionand chromosomal instability in colon cancer.Genome Res.,23,1446–1461.11.Pasmant,E.,Sabbagh,A.,Vidaud,M.and Bieche,I.(2011)ANRIL,along,noncoding RNA,is an unexpected major hotspot in GW AS.FASEB J.,25,444–448.12.Wang,Y.,Xu,Z.,Jiang,J.,Xu,C.,Kang,J.,Xiao,L.,Wu,M.,Xiong,J.,Guo,X.and Liu,H.(2013)Endogenous miRNA spongelincRNA-RoR regulates Oct4,Nanog,and Sox2in humanembryonic stem cell self-renewal.Dev.Cell,25,69–80.13.Bak,R.O.and Mikkelsen,J.G.(2014)miRNA sponges:soaking upmiRNAs for regulation of gene expression.Wiley Interdiscip.Rev.RNA,5,317–333.14.Poliseno,L.,Salmena,L.,Zhang,J.,Carver,B.,Haveman,W.J.andPandolfi,P.P.(2010)A coding-independent function of gene andpseudogene mRNAs regulates tumour biology.Nature,465,1033–1038.15.Cesana,M.,Cacchiarelli,D.,Legnini,I.,Santini,T.,Sthandier,O.,Chinappi,M.,Tramontano,A.and Bozzoni,I.(2011)A longnoncoding RNA controls muscle differentiation by functioning as acompeting endogenous RNA.Cell,147,358–369.16.Li,J.H.,Liu,S.,Zhou,H.,Qu,L.H.and Yang,J.H.(2014)starBasev2.0:decoding miRNA-ceRNA,miRNA-ncRNA and protein-RNAinteraction networks from large-scale CLIP-Seq data.Nucleic AcidsRes.,42,D92–D97.17.Chin,L.J.,Ratner,E.,Leng,S.,Zhai,R.,Nallur,S.,Babar,I.,Muller,R.U.,Straka,E.,Su,L.,Burki,E.A.et al.(2008)A SNP in alet-7microRNA complementary site in the KRAS3 untranslatedregion increases non-small cell lung cancer risk.Cancer Res.,68,8535–8540.18.Kapeller,J.,Houghton,L.A.,Monnikes,H.,Walstab,J.,Moller,D.,Bonisch,H.,Burwinkel,B.,Autschbach,F.,Funke,B.,Lasitschka,F.at The Fourth Military Medicine University on January 16, 2015/Downloaded fromD186Nucleic Acids Research,2015,Vol.43,Database issueet al.(2008)First evidence for an association of a functional variant in the microRNA-510target site of the serotonin receptor-type3E gene with diarrhea predominant irritable bowel syndrome.Hum.Mol.Genet.,17,2967–2977.19.Barenboim,M.,Zoltick,B.J.,Guo,Y.and Weinberger,D.R.(2010)MicroSNiPer:a web tool for prediction of SNP effects on putative microRNA targets.Hum.Mutat.,31,1223–1232.20.Bhattacharya,A.,Ziebarth,J.D.and Cui,Y.(2014)PolymiRTSDatabase3.0:linking polymorphisms in microRNAs and their target sites with human diseases and biological pathways.Nucleic AcidsRes.,42,D86–D91.21.Bruno,A.E.,Li,L.,Kalabus,J.L.,Pan,Y.,Yu,A.and Hu,Z.(2012)miRdSNP:a database of disease-associated SNPs and microRNAtarget sites on3 UTRs of human genes.BMC Genomics,13,44. 22.Liu,C.,Zhang,F.,Li,T.,Lu,M.,Wang,L.,Yue,W.and Zhang,D.(2012)MirSNP,a database of polymorphisms altering miRNA target sites,identifies miRNA-related SNPs in GW AS SNPs and eQTLs.BMC Genomics,13,661.23.Gong,J.,Tong,Y.,Zhang,H.M.,Wang,K.,Hu,T.,Shan,G.,Sun,J.and Guo,A.Y.(2012)Genome-wide identification of SNPs inmicroRNA genes and the SNP effects on microRNA target binding and biogenesis.Human mutation,33,254–263.24.Bu,D.,Yu,K.,Sun,S.,Xie,C.,Skogerbo,G.,Miao,R.,Xiao,H.,Liao,Q.,Luo,H.,Zhao,G.et al.(2012)NONCODE v3.0:integrative annotation of long noncoding RNAs.Nucleic Aacids Res.,40,D210–D215.25.Volders,P.J.,Helsens,K.,Wang,X.,Menten,B.,Martens,L.,Gevaert,K.,Vandesompele,J.and Mestdagh,P.(2013)LNCipedia:a database for annotated human lncRNA transcript sequences andstructures.Nucleic Acids Res.,41,D246–D251.26.Amaral,P.P.,Clark,M.B.,Gascoigne,D.K.,Dinger,M.E.andMattick,J.S.(2011)lncRNAdb:a reference database for longnoncoding RNAs.Nucleic Acids Res.,39,D146–D151.27.Park,C.,Yu,N.,Choi,I.,Kim,W.and Lee,S.(2014)lncRNAtor:acomprehensive resource for functional investigation of longnon-coding RNAs.Bioinformatics,30,2480–2485.28.Chan,W.L.,Huang,H.D.and Chang,J.G.(2014)lncRNAMap:a mapof putative regulatory functions in the long non-codingput.Biol.Chem.,50,41–49.29.Bhartiya,D.,Pal,K.,Ghosh,S.,Kapoor,S.,Jalali,S.,Panwar,B.,Jain,S.,Sati,S.,Sengupta,S.,Sachidanandan,C.et al.(2013)lncRNome:a comprehensive knowledgebase of human longnoncoding RNAs.Database,2013,bat034.30.Liu,K.,Yan,Z.,Li,Y.and Sun,Z.(2013)Linc2GO:a humanLincRNA function annotation resource based on ceRNAhypothesis.Bioinformatics,29,2221–2222.31.Chen,G.,Wang,Z.,Wang,D.,Qiu,C.,Liu,M.,Chen,X.,Zhang,Q.,Yan,G.and Cui,Q.(2013)LncRNADisease:a database forlong-non-coding RNA-associated diseases.Nucleic Acids Res.,41,D983–D986.32.Chen,G.,Qiu,C.,Zhang,Q.,Liu,B.and Cui,Q.(2013)Genome-wideanalysis of human SNPs at long intergenic noncoding RNAs.Hum.Mutat.,34,338–344.33.Ning,S.,Zhao,Z.,Y e,J.,Wang,P.,Zhi,H.,Li,R.,Wang,T.and Li,X.(2014)LincSNP:a database of linking disease-associated SNPs tohuman large intergenic non-coding RNAs.BMC Bioinformatics,15,152.34.Mercer,T.R.,Dinger,M.E.and Mattick,J.S.(2009)Long non-codingRNAs:insights into functions.Nat.Rev.Genet.,10,155–159.35.Ding,J.,Lu,Q.,Ouyang,Y.,Mao,H.,Zhang,P.,Yao,J.,Xu,C.,Li,X.,Xiao,J.and Zhang,Q.(2012)A long noncoding RNA regulatesphotoperiod-sensitive male sterility,an essential component ofhybrid rice.Proc.Natl.Acad.Sci.U.S.A.,109,2654–2659.36.Hofacker,I.L.(2003)Vienna RNA secondary structure server.Nucleic Acids Res.,31,3429–3431.37.Kozomara,A.and Griffiths-Jones,S.(2011)miRBase:integratingmicroRNA annotation and deep-sequencing data.Nucleic AcidsRes.,39,D152–D157.38.Friedman,R.C.,Farh,K.K.,Burge,C.B.and Bartel,D.P.(2009)Mostmammalian mRNAs are conserved targets of microRNAs.GenomeRes.,19,92–105.39.Betel,D.,Wilson,M.,Gabow,A.,Marks,D.S.and Sander,C.(2008)The resource:targets and expression.Nucleic AcidsRes.,36,D149–D153.40.Welter,D.,MacArthur,J.,Morales,J.,Burdett,T.,Hall,P.,Junkins,H.,Klemm,A.,Flicek,P.,Manolio,T.,Hindorff,L.et al.(2014)TheNHGRI GW AS Catalog,a curated resource of SNP-traitassociations.Nucleic Acids Res.42,D1001–D1006.41.Barrett,J.C.,Fry,B.,Maller,J.and Daly,M.J.(2005)Haploview:analysis and visualization of LD and haplotype maps.Bioinformatics,21,263–265.42.Necsulea,A.,Soumillon,M.,Warnefors,M.,Liechti,A.,Daish,T.,Zeller,U.,Baker,J.C.,Grutzner,F.and Kaessmann,H.(2014)Theevolution of lncRNA repertoires and expression patterns in tetrapods.Nature,505,635–640. at The Fourth Military Medicine University on January 16, 2015/Downloaded from。

相关文档
最新文档