miRNA基因和编码基因启动子区核小体定位分析

合集下载

miRNA的作用机制及功能研究进展

miRNA的作用机制及功能研究进展

miRNA的作用机制及功能研究进展王娟(德州学院生物系,山东德州253023)摘要microRNA (miRNA)是内源性的大小在20-25nt的一类非编码RNAs,具有调节基因表达活性的功能,广泛存在于真核生物体内,并在进化中保守。

miRNA的广泛存在与进化上的保守性,暗示它在生命活动中具有必不可少的调节作用,他们参与动植物生长发育、细胞分化、细胞增殖与调亡、激素分泌、肿瘤形成等各种过程。

本文总结了近几年来在miRNA的特征、生物发生、作用机制及功能意义上的研究进展。

miRNA无论在数量上还是功能上,可能都远远超过目前的发现,对其进行深入的研究,将有助于我们对生物体的各种生理病理机制的理解,并最终为疾病的诊断和治疗提供新的思路和理论基础。

关键词siRNA; microRNA; piRNA; 微处理器;核糖核酸内切酶Ⅲ; 基因调控; 生长发育;肿瘤治疗前言2006年,Andrew Fire 和Craig Mello 由于在RNAi(RNA interference,RNAi)及基因沉默现象研究领域的杰出贡献而获得诺贝尔医学奖,这再次将人们的注意力拉到siRNA这样一种小分子RNA上。

小分子RNA包括一个大家族,并在真核生物中具有广泛的调节功能。

目前已经有至少两种小分子RNA被描述:来源于发夹状前体的miRNAs (microRNAs)和由长的dsRNAs 加工而来的siRNAs (small interfering RNAs)。

研究发现,miRNA与siRNA有很多相似之处,但也有很大的不同,二者的区别将在以下文中进行论述。

最近又有文章报道了一种新的小分子RNA的发现[25]——piRNAs (piwi-interacting RNAs),他们特异地在小鼠的生精细胞中大量表达。

这些RNAs比以前发现的大多数小RNAs较大,约26–31nt(nucleotides),并与Argonaute蛋白家族的Piwi亚枝(Piwi-subclade)成员相联系。

mirna作用原理

mirna作用原理

mirna作用原理一、引言mirna(microRNA)是一类长度约为20~24个核苷酸的非编码RNA分子,是细胞内调控基因表达的重要因素。

在哺乳动物中,mirna可通过与mRNA靶标相互作用,调控基因转录、剪接和蛋白翻译等过程。

二、mirna的合成与成熟mirna的合成经历多个步骤,包括转录、成熟和靶标识别等过程。

具体步骤如下:2.1 转录mirna基因位于基因组的非编码区域,与mRNA的转录有所不同。

mirna的转录通常由RNA聚合酶II进行,但其转录起始位点可被辅助序列、转录因子和启动子等调控。

转录后的初始转录物被称为pri-mirna。

2.2 剪接和修饰pri-mirna在细胞核内由核酸酶Drosha切割生成前体mirna(pre-mirna)。

pre-mirna包含一个带有长的发夹结构,该结构可保护mirna序列免受核酸酶RNase的降解。

随后,pre-mirna被转运至胞质。

2.3 Dicer酶的介入在胞质中,pre-mirna被RNase III类酶Dicer切割,生成成熟的双链mirna (mature mirna)。

Dicer酶通过识别pre-mirna的发夹结构,切割出成熟mirna 序列。

2.4 修饰与装配成熟mirna的两个链的两端均会发生修饰,包括磷酸化和甲基化。

此外,成熟mirna还与Argonaute(AGO)蛋白相结合,形成RNA诱导沉默复合物(RISC),以实现靶向调控。

三、mirna的作用机制mirna通过与mRNA靶标相互作用,调控基因表达。

其作用机制主要包括激活RNase 活性和抑制翻译两种方式。

3.1 miRNA结合靶标mRNAmirna通过与mRNA的3’非翻译区(3’ UTR)相互作用,形成RNA复合物。

该相互作用主要通过mirna的5’末端6-7个碱基与mRNA的靶标区域互补配对。

3.2 激活RNase活性当mirna与mRNA结合时,mirna可以作为引导RNA,将RNA诱导沉默复合物(RISC)靠近目标RNA。

miRNA研究分析方法整理

miRNA研究分析方法整理

miRNA研究分析方法整理1. miRNA靶基因预测分析miRNA是非编码RNA,不能编码蛋白,它只能通过调控靶基因的表达,参与生物功能。

基于预测工具,获得miRNA调控的靶基因,以及对应的结合位点信息。

这是最常见的miRNA生信分析。

可能结果展示:miRNA调控靶基因预测结果表miRNA-target网络图2. miRNA功能分析基于miRNA的靶基因信息,分析miRNA的功能,主要包括GO富集分析和KEGGpathway富集分析,获得重要miRNA的功能。

可能结果展示:miRNA的功能分析,横坐标代表miRNA,纵坐标代表富集的功能。

节点代表显著富集程度。

miRNA的功能分析,横坐标代表miRNA,纵坐标代表富集的功能。

红色代表显著富集。

3. ceRNA分析即竞争性内源RNA分析,是近两年非常热门的研究方向。

不同的RNA可以通过miRNA结合位点原件,竞争性的调控其他RNA。

在这个调控关系里,miRNA起到关键作用。

可能的结果展示:ceRNA调控关系图(彩色节点是miRNA,黑色节点是LncRNA,灰色是mRNA)4. miRNA测序分析二代测序是目前做分子层面最常用的实验手段。

它可以高通量的对所有相关miRNA进行分析,然后获得和研究方向最相关的miRNA 结论。

可能的结果有:miRNA测序分析流程miRNA的聚类热图分析差异表达miRNA-target网络图。

A代表差异上调miRNA靶基因调控关系;B代表差异下调miRNA靶基因调控关系5. 其他分析转录因子(TF)-miRNA分析,miRNA活性分析,miRNA功能协同网络分析,miRNA共表达分析等等。

可能的结果图:图例:TF-miRNA-target网络图6. miRNA的研究现状小RNA(Small RNA)是一类重要的体内调节分子,主要包括miRNA、piRNA和siRNA。

小RNA可参与基因转录后调控,调节细胞生长、分化,以及个体发育、生殖等重要生物学过程。

小麦miRNA启动子的基因组分析

小麦miRNA启动子的基因组分析

麦类作物学报 2021,41(12):1452-1458J o u r n a l o fT r i t i c e a eC r o ps d o i :10.7606/j.i s s n .1009-1041.2021.12.02网络出版时间:2021-12-07网络出版地址:h t t ps ://k n s .c n k i .n e t /k c m s /d e t a i l /61.1359.S .20211207.0849.002.h t m l 小麦m i R N A 启动子的基因组分析收稿日期:2021-02-23 修回日期:2021-05-03基金项目:国家自然科学基金项目(31971831)第一作者E -m a i l :642207059@q q.c o m 通讯作者:苍晶(E -m a i l :c a n g j i n g2003@163.c o m )任治鹏,王多佳,田宇,娄贵成,李畅,王政委,张达,苍晶(东北农业大学生命科学学院,黑龙江哈尔滨150030)摘 要:M i c r o R N A (m i R N A )是一类非编码R N A ,与植物的生长发育及胁迫响应密切相关㊂为给小麦m i R N A 的转录调控以及新m i R N A 的预测提供参考依据,本研究通过小麦m i R N A 基因定位㊁启动子预测以及顺式作用元件鉴定等方法对小麦m i R N A 启动子进行了基因组分析,结果表明,小麦基因组中有105个pr e -m i R N A 位于150个基因座上,大部分为单拷贝㊂148个m i R N A 基因座具有潜在启动子区域,其中115个m i R N A 基因至少能够预测到一个启动子㊂保守性及基因位置不同的m i R N A 的启动子转录起始位点(T S S)分布也稍有不同,但大多数位于上游序列近端区域㊂对m i R N A 基因T S S 上游序列的顺式作用元件分析发现,m i R N A 启动子区域存在与胁迫响应相关的基序,且小麦中存在3个m i R N A 启动子特异性基序㊂61.4%的小麦m i R N A 启动子区域有C pG 岛分布㊂关键词:小麦;m i R N A ;启动子;顺式作用元件;基因组中图分类号:S 512.1;S 330 文献标识码:A 文章编号:1009-1041(2021)12-1452-07G e n o m i cA n a l ys i s o fW h e a tM i c r o R N AP r o m o t e r s R E NZ h i p e n g ,W A N GD u o j i a ,T I A NY u ,L O UG u i c h e n g,L IC h a n g ,W A N GZ h e n g w e i ,Z H A N GD a ,C A N GJ i n g(C o l l e g e o fL i f eS c i e n c e ,N o r t h e a s tA g r i c u l t u r a lU n i v e r s i t y ,H a r b i n ,H e i l o n g j i a n g 150030,C h i n a )A b s t r a c t :M i c r o R N A s (m i R N A s )a r e s h o r t n o n -c o d i n g R N A s a n d p l a y i m po r t a n t r o l e s i n p l a n t d e v e l -o p m e n t a n d s t r e s s r e s p o n s e .I no r d e r t o p r o v i d e r e f e r e n c e s f o r t h e t r a n s c r i p t i o n a l r e gu l a t i o no fw h e a t m i R N Aa n d t h e p r e d i c t i o no fn e w m i R N A.I nt h i ss t u d y ,t h e g e n o m i cc h a r a c t e r so fw h e a tm i R N A p r o m o t e r sw e r e a n a l y z e db y t h em e t h o d s o fw h e a tm i R N A g e n e l o c a t i o n ,pr o m o t e r p r e d i c t i o n ,a n d i -d e n t i f i c a t i o no f s p e c i f i c c i s -a c t i n g el e m e n t s .I n t h ew h e a t g e n o m e ,a t o t a l o f 105p r e -m i R N A w e r e l o -c a t e do n150g e n e l o c i ,m o s t o fw h i c hh a ds i n g l ec o p y .A m o n g th e150l o c i ,148m i R N A g e n e sh a d p o t e n t i a l p r o m o t e r s ,o fw h i c h115m i R N A g e n e sw e r e p r e d i c t e d t oh a v ea t l e a s t o n e p r o m o t e r .T h e p r o m o t e r c h a r a c t e r i s t i ca n a l y s i so fd i f f e r e n tt y p e so f m i R N A s (i n t e r ge n i cv e r s u si n t r o n i ca n dc o n -s e r v e dv e r s u sn o n -c o n s e r v e d p r e -m i R N A s )r e v e a l e dt h a t t h ed i s t r i b u t i o nof t r a n s c r i pt i o ns t a r ts i t e s (T S S s )w a s s l i g h t l y d i f f e r e n t ,a n dm o s t o fT S S sw e r e l o c a t e d i n t h e p r o x i m a l r e g i o no f t h e u ps t r e a m s e q u e n c e ,w h i c h i n d i c a t e d t h a t t h e p r o x i m a l p r o m o t e r r e g i o nm a y p l a y am o r e e f f e c t i v e r o l e i nm i R N A t r a n s c r i p t i o n i n i t i a t i o n .I na d d i t i o n ,t h e s t a t i s t i c so f c i s -a c t i n g e l e m e n t so n t h eu p s t r e a ms e qu e n c eo f m i R N A T S S s s h o w e d t h a tm i R N A p r o m o t e r r e g i o n s h a d f u n c t i o n a lm o t i f s r e l a t e d t o s t r e s s r e s p o n s e ,a n d t h e r ew e r e t h r e em i R N A p r o m o t e r -s p e c i f i cm o t i f s i nw h e a t .M o r e o v e r ,t h r o u gh t h e i d e n t i f i c a t i o n r e s u l t s o fC p Gi s l a n d s ,w e f o u n d t h a t 61.4%o f t h em i R N A p r o m o t e r r e g i o n so fw h e a t c o n t a i nC pG i s l a n d s .K e y w o r d s:W h e a t;m i R N A;P r o m o t e r;C i s-a c t i n g e l e m e n t;G e n o m eM i c r o R N A(m i R N A)是一类长度为21~24 n t的非编码R N A,广泛存在于植物中,通过负调控其靶基因,参与调控植物的生长发育和逆境胁迫响应[1-2]㊂m i R N A的生物合成过程主要包括m i R N A基因的转录㊁初始转录本加工为成熟m i R N A以及成熟m i R N A装载形成R N A诱导的沉默复合体(R N A-i n d u c e ds i l e n c i n g c o m p l e x, R I S C)[3-7]㊂R I S C通过酶切降解靶基因m R N A 或者抑制靶基因m R N A的翻译,从而对靶基因进行转录后水平上的调控[8]㊂在植物中,能够转录形成m i R N A的m i R N A 基因大部分位于基因间隔区,作为独立的转录单位,只有部分m i R N A基因位于蛋白质编码基因内,能与宿主基因共同转录[9]㊂研究表明,m i R-N A基因由R N A聚合酶Ⅱ(R N A p o l y m e r a s e Ⅱ,P o lⅡ)转录[10]㊂P o lⅡ型启动子包括核心启动子区和上游作用元件,核心启动子区主要由T A T A-b o x㊁转录起始位点(t r a n s c r i p t i o ns t a r t s i t e,T S S)等构成[11]㊂了解m i R N A基因的位置㊁启动子的T S S㊁特定顺式作用元件等上游序列特征,对于研究m i R N A的表达模式及m i R N A介导的调控网络具有重要意义[12]㊂近年来,通过生物信息学分析结合高通量测序,对植物m i R N A 基因的启动子开展了一定的研究㊂如在拟南芥中,M e g r a w等[13]和X i e等[14]通过5'-R A C E的方法,发现大部分拟南芥m i R N A启动子包含T A T A-b o x㊂Z h o u等[15]通过C o V o t e的方法,在拟南芥㊁水稻等植物中鉴定了基因间m i R N A基因的启动子,结果表明,m i R N A基因与蛋白质编码基因均由P o lⅡ型启动子启动,并具有特定的上游元件㊂Z h a o等[16]利用c D N A数据对水稻和拟南芥两种植物m i R N A启动子元件进行比较,同时通过C h I P方法对拟南芥m i R N A基因的T S S进行了预测[17]㊂随着植物基因组研究的发展,促进了m i R N A启动子的鉴定和研究㊂如C u i 等[18]通过基因组数据,定位了水稻m i R N A前体(m i R N A p r e c u r s o r,p r e-m i R N A)在染色体上的位置,并通过T S S P软件预测了m i R N A基因的T S S㊁T A T A-b o x等核心启动子区㊂L i u等[19]和H a n等[20]利用大豆基因组数据对m i R N A基因的启动子特征进行了相关分析㊂K a n j a n a w a t t a n-a w o n g[21]等发现,橡胶树中对乙烯响应的m i R-N A启动子具有多种植物激素相关作用元件㊂Z h o u等[22]利用T S S P-T C M软件对拟南芥㊁毛果杨㊁水稻㊁高粱4种植物的m i R N A启动子进行生物信息学分析,发现基因间和基因内以及保守和非保守m i R N A的启动子具有不同的基因组分布特征及特异性作用元件㊂此外,研究者在拟南芥[23]㊁水稻[24]m i R N A启动子中也发现具有与胁迫相关的特异性转录因子结合元件㊂六倍体(2n=6x=42,A A B B D D)普通小麦(T r i t i c u ma e s t i v u m L.)是全球种植最广泛的农作物之一,为人类提供了20%的消耗能量[25]㊂目前,对小麦m i R N A的研究主要集中于克隆鉴定㊁表达特征分析以及通过预测靶基因进行功能研究等方面[25-26],然而关于小麦m i R N A启动子的研究报道较少㊂近年来,国际小麦基因组测序联盟(I n t e r n a t i o n a l W h e a tG e n o m eS e q u e n c i n g C o n-s o r t i u m,I WG S C)对中国春小麦基因组的组装工作已经完成,其公布的小麦全基因组序列信息对于小麦m i R N A启动子的分析研究具有极大的促进作用㊂本研究通过生物信息学方法对m i R N A 基因组位置分布㊁m i R N A启动子预测以及顺式作用元件的富集和特异性进行研究,以期在基因组水平对小麦m i R N A启动子有一个较为全面的了解,为小麦m i R N A的转录调控探究以及新m i R N A的预测提供依据㊂1材料与方法1.1小麦m i R N A基因位置的预测所有的小麦m i R N A序列来源于m i R B a s e数据库(R e l e a s e22.1,h t t p://w w w.m i r b a s e. o r g/)[27]㊂从E n s e m b lP l a n t s(f t p://f t p.e n s e m-b l g e n o m e s.o r g/p u b/p l a n t s/r e l e a s e-48/f a s t a/ t r i t i c u m_a e s t i v u m/d n a/)下载中国春小麦基因组序列信息㊂使用U R G IB L A S T(h t t p s://u r g i. v e r s a i l l e s.i n r a e.f r/b l a s t/?d b g r o u p=w h e a t_ i w g s c_r e f s e q_v2_c h r o m o s o m e s&p r o g r a m= b l a s t n)[28]进行小麦p r e-m i R N A的基因组定位,选择i d e n t i t i e s=100%的b l a s t结果作为m i R N A 基因的位置,对于i d e n t i t i e sʂ100%的m i R N A则将i d e n t i t i e sȡ97%且m i s m a t c h e sɤ2的结果作为m i R N A基因的位置[19]㊂预测的m i R N A基因通过M a p c h a r t2.30[29]软件进行小麦染色体图谱㊃3541㊃第12期任治鹏等:小麦m i R N A启动子的基因组分析的绘制㊂所有能够定位于小麦基因组上的m i R-N A基因根据两种方法进行分类,第一种分类方法是根据m i R N A保守性分为保守和非保守m i R N A基因,鉴定方法如下:首先利用m i R B a s e 提供的所有物种p r e-m i R N A序列建立本地b l a s t 库,然后将所有小麦p r e-m i R N A进行本地b l a s t 比对㊂如果其他植物中存在i d e n t i t i e s>85%且a l i g n m e n t l e n g t h>90%的相似序列[22],则该基因为小麦保守m i R N A基因,否则为非保守性m i R-N A基因㊂第二种分类方法则根据m i R N A基因在染色体上的位置进行分类,通过J B r o w s e(h t-t p s://u r g i.v e r s a i l l e s.i n r a.f r/j b r o w s e i w g s c/ g m o d_j b r o w s e/)[30]判断m i R N A基因的分布情况,将m i R N A基因分为基因间和基因内两种类型㊂基因间m i R N A位于蛋白质编码基因之间,而基因内m i R N A序列位置则与蛋白质编码基因重叠[15]㊂判断m i R N A基因染色体位置参考的编码蛋白质基因数据为I WG S C中国春A n n o t a-t i o nv1.1数据库[31],包括可高信度(H C)和低信度(L C)蛋白质编码基因座㊂1.2小麦m i R N A基因启动子的预测首先通过Z h o u等[15]的方法获得p r e-m i R-N A的基因间5'端上游序列,当p r e-m i R N A与上游蛋白质编码基因转录方向相同时,如果它们之间的距离大于2400b p,则检索p r e-m i R N A上游2000b p序列;如果距离小于2400b p,则检索上游蛋白质编码基因下游400b p与p r e-m i R N A之间的序列㊂当p r e-m i R N A及其上游蛋白质编码基因转录方向相反时,如果它们之间的距离大于4000b p,则获取p r e-m i R N A上游的2000b p序列,如果距离小于4000b p,则检索从p r e-m i R-N A到中间点(上游蛋白质编码基因与p r e-m i R-N A之间)的序列㊂将以上方法获得的序列作为潜在的启动子预测区域,利用T S S P(h t t p:// w w w.s o f t b e r r y.c o m)进行小麦m i R N A启动子及T S S的预测㊂1.3小麦m i R N A基因启动子上游顺式作用元件的分析利用P l a n t C A R E数据库(h t t p://b i o i n f o r-m a t i c s.p s b.u g e n t.b e/w e b t o o l s/p l a n t c a r e/h t-m l/)[32]对m i R N A启动子T S S到上游2000b p 序列中的顺式作用元件进行分析㊂对于有多个启动子的m i R N A基因,为获得尽可能多的顺式作用元件信息,选择距离p r e-m i R N A起始位点最近的T S S进行分析㊂为了进一步研究m i R N A启动子区域基序的特异性,通过M E M E(h t t p s:// m e m e-s u i t e.o r g/m e m e//t o o l s/m e m e)[33]对m i R N A启动子上游序列中长度为10b p的基序进行鉴定,选择结果中前20个基序进行分析,其他设定为默认值㊂利用全基因组蒙特卡罗模拟方法获得基序的Z-s c o r e,从而判断各基序在小麦m i R N A启动子的特异性[15],具体方法如下:首先将所有获得的m i R N A启动子序列作为目标集,然后在小麦基因组上随机选择长度为2000b p 的序列作为参考集,参考集与目标集的序列数目相同;通过F I MO(h t t p s://m e m e-s u i t e.o r g/ m e m e//t o o l s/f i m o)统计特定基序在目标集和参考集m i R N A序列上平均数量,分别记为N t和N r㊂Z-s c o r e的计算公式为Z=(N t/N r)=σ,它能测量目标集中的基序平均出现次数与参考集样本的均值之间的归一化差异[22]㊂利用C p G P l o t (h t t p://e m b o s s.b i o i n f o r m a t i c s.n l/c g i-b i n/e m-b o s s/c p g p l o t)对小麦m i R N A T S S上游序列中的C p G岛进行分析㊂2结果与分析2.1小麦m i R N A基因的染色体定位目前为止,m i R B a s e数据库(R e l e a s e22.1)共收录122个小麦p r e-m i R N A序列㊂小麦p r e-m i R N A序列和中国春基因组序列b l a s t结果表明,105个(86.1%)p r e-m i R N A定位于小麦染色体上的150个基因座上,而其余17个(13.9%) p r e-m i R N A位于未知染色体或基因组的基因座上,下文中不对此类p r e-m i R N A进行统计㊂p r e-m i R N A分布在小麦所有42条染色体上,其中A 组染色体上有54个,B染色体上有56个,而D组染色体上有40个,93个(76.2%)p r e-m i R N A在染色体上只有1个拷贝,含有2个和2个以上拷贝的p r e-m i R N A分别有4和8个,共占比9.84%,其他17个p r e-m i R N A的拷贝为0㊂2.2小麦m i R N A基因的启动子预测结果150个小麦m i R N A基因座中有148个能够获得启动子潜在区域,对148个m i R N A基因座5 上游序列进行启动子预测,由于部分m i R N A 基因座能够预测到多个启动子,因此共获得166个m i R N A潜在启动子㊂115个(77.7%)小麦p r e-m i R N A基因能够预测到一个启动子,其中, 69个基因的上游序列只能预测到一个启动子,而㊃4541㊃麦类作物学报第41卷其他基因具有多个启动子㊂T S S 是重要的启动子核心元件,对小麦m i R -N A 基因T S S 位点与p r e -m i R N A 距离分布进行统计分析,发现大部分小麦m i R N A 基因的T S S 分布在上游0.8k b 区域内以及1.0~1.6k b 区域内,占全部启动子T S S 数的81.9%(0~0.8k b :54.2%,1.0~1.6k b :27.7%)㊂在所有上游区域中,小麦m i R N A 基因的T S S 在上游0.2k b区域内分布最多(24.1%),而在上游0.8~1.0k b 区域分布较少(5.4%)㊂根据m i R N A 在基因组的位置不同,可分为基因间m i R N A 和基因内m i R N A ,从图1A 可以看出,两种m i R N A 的T S S 均在基因上游0.2k b 区域内分布较多,不同的是基因内m i R N A 在上游0.2~0.4k b ㊁0.6~0.8k b ㊁1.4~1.6k b 间也具有较多的T S S 分布,而基因间m i R N A 在这几个区域内无明显的分布特殊性㊂根据m i R N A 的保守性,可分为保守性m i R N A 和非保守性m i R -N A ,从图1B 可以看出,两种m i R N A 的T S S 均在基因上游0.2k b 区域内分布最多,而与非保守m i R N A 相比,保守m i R N A 在上游1.4~1.6k b 区域内也具有较多分布㊂A :基因间和基因内m i R N A T S S 的分布百分比;B :非保守和保守m i R N A T S S 的分布百分比㊂A :P e r c e n t a g e o fT S Sd i s t r i b u t i o no f i n t e r g e n i c a n d i n t r a g e n i cm i R N A g e n e s ;B :P e r c e n t a geo fT S Sd i s t r i b u t i o no f n o n -c o n s e r v a t i v e a n d c o n s e r v a t i v em i R N A g e n e s .图1 不同种类m i R N A 的T S S 分布F i g .1 T S Sd i s t r i b u t i o no f d i f f e r e n t t y pe s o fm i R N A 2.3 小麦m i R N A 基因启动子上游的特异性顺式作用元件利用P l a n t C A R E 对所有m i R N A 基因T S S 上游2000b p 序列进行顺式作用元件分析,结果(图2)表明,m i R N A 启动子区域中含有的三种顺式作用元件较多,分别为C A A T -b o x ㊁T A T A -b o x和U n n a m e d _4㊂此外与A B A 响应相关的元件(A B R E )㊁与M e J A 响应相关的元件(T G A C G -m o t i f ㊁C G T C A -m o t i f 和MY C )㊁与光响应相关的元件(G -b o x )以及与多种胁迫和代谢调控相关的元件(MY B )在小麦m i R N A 基因上游的占比也较高㊂㊃5541㊃第12期任治鹏等:小麦m i R N A 启动子的基因组分析图中数据为启动子上游顺式作用元件所占百分比㊂V a l u e s i n t h e f i g u r e i s t h e p e r c e n t a g e o fm i R N A p r o m o t e r c i s-a c t i n g e l e m e n t s.图2T S S上游顺式作用元件的分布F i g.2P e r c e n t a g e o f c i s-a c t i n g e l e m e n t s i nu p s t r e a ms e q u e n c e s o fT S S s为进一步鉴定小麦m i R N A基因启动子上的基序特异性,通过M E M E获得在T S S上游序列出现频率较高的且长度为10b p的基序,然后利用全基因组的蒙特卡罗模拟计算获得基序的Z-s c o r e㊂Z-s c o r e的大小在一定程度上能反应基序在m i R N A启动子上的特异性,Z-s c o r e大于2的基序具有m i R N A基因启动子特异性,与m i R N A的转录调控有关的可能性较高[22];而Z-s c o r e小于2的基序在其他基因组区域普遍存在,因此不作为m i R N A启动子重要基序进行研究㊂根据以上标准,获得了3个Z-s c o r eȡ2的小麦m i R N A启动子特异性基序(表1)㊂表1小麦m i R N A基因启动子特异性基序T a b l e1S p e c i f i cm o t i f s o fw h e a tm i R N A g e n e p r o m o t e r s基序M o t i f序列C o n s e n s u s s e q u e n c e E值E-v a l u eZ值Z-s c o r e基序1M o t i f1T T A G T C C C G G1.40e-644.4基序2M o t i f2T T G A A A A A A A6.60e-263.4基序10M o t i f10C A T A T A T A T A2.10e+052.0除顺式作用元件外,C p G岛也是真核生物p o lⅡ型启动子的重要特征之一㊂由于本研究中M I R9670和M I E979可能通过同一个启动子进行转录,因此对114个m i R N A基因启动子的C p G 岛进行分析,C p G P l o t预测结果表明,61.4%的小麦m i R N A基因T S S上游序列有C p G岛分布,启动子区域含有1㊁2㊁3和4个C p G岛的m i R N A 基因分别有41㊁17㊁10㊁2个㊂3讨论本研究首先将m i R B a s e数据库目前登录的所有小麦p r e-m i R N A序列定位于小麦基因组上,在122个p r e-m i R N A中有部分序列无法通过b l a s t获得基因座,其可能原因为:(1)基因位于数据库中的未知染色体上;(2)p r e-m i R N A的序列信息不完全,或所研究品种的p r e-m i R N A序列与参考的中国春基因组序列存在差异;(3)由于小麦基因组较大,组装困难,目前提供的基因组版本存在部分染色体序列的缺失㊂本研究染色体定位结果表明,所有小麦染色体上均存在m i R N A基因㊂前人研究表明,在三个染色体组中,B组染色体上的m i R N A基因分布最多,根据I WG S C数据库,编码蛋白的基因也在B组染色体上的分布最多[21]㊂本研究选择b l a s t结果为100%的染色体位置为m i R N A基因座,因此多拷贝的m i R N A 基因序列相同㊂具有多拷贝的m i R N A基因中,只有M I R6197和M I R9774在三个染色体组上均具有拷贝,其他基因只在一个或两个染色体组上㊃6541㊃麦类作物学报第41卷具有拷贝,这说明大部分基因在不同染色体组上存在序列不同的情况㊂在动物中,m i R N A基因通常聚簇并形成多顺反子R N A共转录,而只有部分植物m i R N A基因存在成簇m i R N A㊂与非成簇m i R N A不同,成簇的多个m i R N A可通过同一个启动子进行转录[18]㊂S i n g h等[34]研究表明,小麦中209个m i R N A存在于89个多顺反子基因座上㊂本研究中,由于使用的m i R B a s e数据库的注释m i R N A信息有限,只发现了1个小麦m i R N A簇,该m i R N A簇中的M I R9670和M I R9779位于6D染色体上,为非保守m i R N A,未在S i n g h等[35]的研究中报道㊂对M I R9670和M I R9779的启动子预测结果发现,只有一个m i R-N A启动子位于上游序列,说明这两个m i R N A 可能通过同一个启动子进行转录㊂小麦成簇m i R N A的启动子特点可通过其他m i R N A库进行更深层次的研究㊂150个m i R N A基因中有148个具有启动子潜在区域,M I R1133和M I R1135基因与上游蛋白质编码基因距离过近,无法获得启动子区域㊂本研究通过T S S P对小麦m i R N A基因的p o lⅡ型启动子进行了预测,结果表明,大部分p r e-m i R-N A(77.7%)上游具有潜在的启动子序列,而少部分m i R N A基因无法预测到启动子,原因可能为:(1)原始m i R N A序列较长,利用p r i-R N A加工后形成p r e-m i R N A序列信息进行启动子预测,其启动子可能位于p r e-m i R N A的上游2k b以外;(2)大多数启动子预测软件都使用同源搜索的方法,因此可能无法预测m i R N A启动子的非保守性启动子;(3)由于基因组的重复性,部分基因组上具有多个拷贝的p r e-m i R N A序列为假基因,不发生转录,因此无法进行启动子预测[19]㊂m i R-N A根据基因位置分为基因间m i R N A和基因内m i R N A,基因内m i R N A通常与宿主基因共同转录,但C u i等[18]的研究表明,基因内m i R N A也可能具有单独的启动子,形成独立的转录本㊂本研究对基因内m i R N A和基因间m i R N A启动子数目分别进行了统计,发现74.3%的基因内m i R-N A至少具有1个p o lⅡ型启动子㊂以上结果表明,小麦中相当一部分的基因内m i R N A也同样具有独立的启动子,而未预测到启动子的基因内m i R N A则可能由宿主基因启动子启动转录㊂T S S是基因的转录起始位点,因此T S S的预测对于m i R N A基因转录特点的研究具有一定的意义㊂本研究对T S S与p r e-m i R N A的距离进行统计分析,结果表明,T S S大多数位于p r e-m i R-N A序列上游800b p内,尤其上游200b p内㊂该结果与大豆和水稻中的m i R N A基因T S S统计结果类似[18-19],这说明小麦等植物的大多数m i R-N A核心启动子区域与p r e-m i R N A序列比较接近,m i R N A的P o lⅡ启动子近端区域的核心启动子区可能对m i R N A的转录起到更大的作用㊂植物基因启动子上的顺式作用元件能够识别结合特定的转录因子,从而对基因的转录进行相应的时空特异性调控[24]㊂本研究对T S S上游序列进行了顺式作用元件分析,结果表明,m i R N A 基因启动子区域存在多种顺式作用元件㊂其中T A T A-b o x最多,T A T A-b o x是一种广泛存在的D N A基序,拟南芥和水稻中m i R N A特异性基序的功能尚不清楚,但新发现的基序对于在小麦中鉴定新的特异性m i R N A以及进行m i R N A的试验分析具有一定的借鉴意义㊂除顺式作用元件外,C p G岛也是重要的启动子序列特征[35]㊂本研究在小麦中部分m i R N A基因上游序列鉴定出了C p G岛,而前人在拟南芥m i R N A启动子中未鉴定到C p G岛,水稻m i R N A启动子中鉴定出的C p G岛也较少[15],烟草中的M I R169基因家族中也未鉴定到C p G岛的存在[36]㊂以上结果说明,小麦㊁水稻等单子叶植物中,C p G岛的分布情况可能与双子叶植物不同㊂m i R N A在植物的基因调控中起到了重要作用,启动子是控制m i R N A基因表达的重要结构,因此对于m i R N A基因启动子的分析研究具有较大的意义㊂本研究利用公布的小麦基因组信息对小麦m i R N A启动子进行了分析,研究了小麦m i R N A的染色体定位以及T S S分布㊁顺式作用元件特异性等启动子特征,相关结果对于小麦m i R N A表达调控的研究及新m i R N A的预测具有一定的借鉴意义㊂在未来的研究中,随着小R N A测序以及分子实验技术的进步,可获得更多的m i R N A功能信息,并结合试验方法对相关结果进行进一步的验证㊂参考文献:[1]L IC,Z H A N GB.M i c r o R N A s i n c o n t r o l o f p l a n t d e v e l o p m e n t [J].J o u r n a l o f C e l l u l a rP h y s i o l o g y,2016,231(2):303.[2]B A S S O M F,F E R R E I R A PC G,K O B A Y A S H IA K,e ta l. M i c r o R N A s a n dn e wb i o t e c h n o l o g i c a l t o o l s f o r i t sm o d u l a t i o n a n d i m p r o v i n g s t r e s s t o l e r a n c e i n p l a n t s[J].P l a n tB i o t e c h-n o l o g y J o u r n a l,2019,17(8):1482.[3]S A B Z E H Z A R IM,N A G H A V IM R.P h y t o-m i R N A:A m o l e-㊃7541㊃第12期任治鹏等:小麦m i R N A启动子的基因组分析c u l e w i t h b e n e f i c i a la b i l i t i e sf o r p l a n t b i o t e c h n o l o g y[J].G e n e,2019,683:28.[4]A N U S H R E E N,S H I V A P R A S A D P V.R e g u l a t i o no f p l a n t m i R N Ab i o g e n e s i s[J].P r o c e e d i n g so f t h eI n d i a n N a t i o n a l S c i e n c eA c a d e m y,2017,95:439.[5]A C H K A R N P,C AM B I A G N O D A,MA N A V E L L A P A. M i R N Ab i o g e n e s i s:A d y n a m i c p a t h w a y[J].T r e n d s i nP l a n t S c i e n c e,2016,21(12):1034.[6]S I N G H A,G A U T AM V,S I N G HS,e t a l.P l a n t s m a l l R N A s:A d v a n c e m e n t i nt h eu n d e r s t a n d i n g o fb i o g e n e s i sa n dr o l e i n p l a n t d e v e l o p m e n t[J].P l a n t a,2018,248(3):545. [7]T Y A G IS,S H A R MA S,G A N I E S A,e ta l.P l a n t m i c r o R-N A s:B i o g e n e s i s,g e n es i l e n c i n g,w e b-b a s e da n a l y s i s t o o l sa n d t h e i r u s e a sm o l e c u l a rm a r k e r s[J].3B i o t e c h,2019,9(11): 413.[8]WA N GJ,M E I J,R E N G.P l a n tm i c r o R N A s:B i o g e n e s i s,h o-m e o s t a s i s,a n dd e g r a d a t i o n[J].F r o n t i e r si n P l a n tS c i e n c e, 2019,10:360.[9]Y A N G G D,Y A N K,WU BJ,e t a l.G e n o m e w i d e a n a l y s i so fi n t r o n i cm i c r o R N A s i n r i c e a n d A r a b i d o p s i s[J].J o u r n a l o fG e n e t i c s,2012,91(3):313.[10]C H E N K,R A J E W S K Y N.T h ee v o l u t i o no f g e n er e g u l a t i o nb y t r a n sc r i p t i o nf a c t o r sa nd m i c r o R N A s[J].N a t u re R e-v i e w sG e n e t i c s,2007,8(2):93.[11]陈敏,陈慧,包海,等.植物m i R N A启动子研究进展[J].中国生物工程杂志,2016,36(5):125.C H E N M,C H E N H,B A O H,e ta l.R e s e a r c h p r o g r e s so f p l a n tm i R N A p r o m o t e r s[J].C h i n e s eJ o u r n a l o f B i o e n g i-n e e r i n g,2016,36(5):125.[12]L E E Y,K I M M,HA NJ,e ta l.M i c r o R N A g e n e sa r et r a n-s c r i b e db y R N A p o l y m e r a s e I I[J].E M B OJ o u r n a l,2004,23 (20):4051.[13]M E G R AW M,B A E V V,R U S L N O V V,e ta l.M i c r o R N A p r o m o t e r e l e m e n t d i s c o v e r y i n A r a b i d o p s i s[J].R N A,2006, 12(9):1612.[14]X I EZ,A L L E NE,F A H L G R E N N,e t a l.E x p r e s s i o n o f A r a-b i d o p s i s m i R N A g e n e s[J].P l a n t P h y s i o l o g y,2005,138(4):2145.[15]Z HO U X,R U A NJ,WA N G G,e t a l.C h a r a c t e r i z a t i o na n d i-d e n t i f i c a t i o no fm i c r o R N A p r o m o t e r s i nf o u rm o d e l s p e c i e s [J].P l o sC o m p u t a t i o n a lB i o l o g y,2005,3(3):e37.[16]Z HA O X,L IL.C o m p a r a t i v e a n a l y s i s o fm i c r o R N A p r o m o t-e r s i n A r a b i d o p s i s a n d r i c e[J].G e n o m i c sP r o t e o m i c sB i o i n-f o r m a t i c s,2013,11(1):56.[17]Z HA O X,Z H A N G H,L I L.I d e n t i f i c a t i o n a n d a n a l y s i s o f t h e p r o x i m a l p r o m o t e r s o fm i c r o R N A g e n e s i n A r a b i d o p s i s[J].G e n o m i c s,2013,101(3):187.[18]C U IX,X US M,MU DS,e t a l.G e n o m i c a n a l y s i s o f r i c em i-c r o R N A p r o m o t e r s a nd c l u s te r s[J].G e n e,2009,431(1/2):61.[19]L I U YX,H A N YP,C H A N G W,e t a l.G e n o m i cA n a l y s i s o f m i c r o R N A p r o m o t e r sa n dt h e i rc i s-a c t i n g e l e m e n t s i ns o y-b e a n[J].A g r i c u l t u r a lS c i e n c e si n C h i n a,2010,9(11): 1561.[20]H A N Y Q,HUZ,Z H E N GDF,e t a l.A n a l y s i s o f p r o m o t e r s o fm i c r o R N A s f r o ma G l y c i n em a x d e g r a d o m e l i b r a r y[J]. J o u r n a l o f Z h e j i a n g U n i v e r s i t y(B i o m e d i c i n e a n dB i o t e c h-n o l o g y),2014,15(2):125.[21]K A N J A N AWA T T A N AWO N G S,T A N G P H A T S O R N R U-A N G S,T R I W I T A Y A K O R N K.e ta l.C h a r a c t e r i z a t i o no fr u b b e r t r e em i c r o R N A i n p h y t o h o r m o n e r e s p o n s e u s i n g l a r g e g e n o m i cD N Al i b r a r i e s,p r o m o t e r s e q u e n c e a n d g e n e e x p r e s-s i o na n a l y s i s[J].M o l e c u l a rG e n e t i c sa n d G e n o m i c s,2014, 289(5):921.[22]Z HO U M,S U NJ,WA N G Q H,e t a l.G e n o m e-w i d e a n a l y s i s o f c l u s t e r i n gp a t t e r n sa n df l a n k i n g c h a r a c t e r i s t i c sf o r p l a n t m i c r o R N A g e n e s[J].F E B SJ o u r n a l,2011,278(6):929.[23]K O N G W,Y A N GZ M.I d e n t i f i c a t i o no f i r o n-d e f i c i e n c y r e-s p o n s i v em i c r o R N A g e n e sa n dc i s-e l e m e n t s i n A r a b i d o p s i s [J].P l a n tP h y s i o l o g y a n d B i o c h e m i s t r y,2010,48(2/3): 153.[24]D E V I SJ,MA D H A V M S,K UMA R G R,e ta l.I d e n t i f i c a-t i o no f a b i o t i c s t r e s sm i R N At r a n s c r i p t i o n f a c t o r b i n d i n g m o-t i f s(T F B M s)i n r i c e[J].G e n e,2013,531(1):15. [25]S U N F,G U O G,D U J,e ta l.W h o l e-g e n o m ed i s c o v e r y o f m i R N A s a n d t h e i r t a r g e t s i nw h e a t(T r i t i c u ma e s t i v u m L.) [J].B M CP l a n tB i o l o g y,2014,14(1):142. [26]L I U Z,WA N G X,C H E N X,e ta l.T a M I R1139:A w h e a t m i R N Ar e s p o n s i v e t o P i-s t a r v a t i o n,a c t s a c r i t i c a lm e d i a t o r i n m o d u l a t i n gp l a n t t o l e r a n c e t oP i d e p r i v a t i o n[J].P l a n tC e l l R e p o r t s,2018,37(9):1293.[27]G R I F F I T H S-J O N E SS,G R O C O C KRJ,V A N-D O N G E NS,e t a l.M i R B a s e:M i c r o R N As e q u e n c e s,t a r g e t sa n d g e n en o-m e n c l a t u r e[J].N u c l e i cA c i d sR e s e a r c h,2006,34:140.[28]A L A N U X M,R O G E R S J,L E T E L L I E RT,e t a l.L i n k i n g t h ei n t e r n a t i o n a l w h e a t g e n o m e s e q u e n c i n g c o n s o r t i u m b r e a d w h e a t r e f e r e n c e g e n o m e s e q u e n c e t ow h e a t g e n e t i c a n d p h e-n o m i c d a t a[J].G e n o m eB i o l o g y,2018,19(1):111.[29]V O O R R I P SRE.M a p C h a r t:S o f t w a r e f o r t h e g r a p h i c a l p r e s-e n t a t i o nof l i n k ag em a p s a n dQ T L s[J].Th e J o u r n a l o f H e-r e di t y,2002,93(1):77.[30]B U E L SR,Y A O E,D I E S H C M,e t a l.J B r o w s e:Ad y n a m i c w e b p l a t f o r mf o r g e n o m ev i s u a l i z a t i o na n da n a l y s i s[J].G e-n o m eB i o l o g y,2016,17(1):66.[31]A P P E L S R,E V E R S O L E K,F E U I L L E T C,e ta l.S h i f t i n g t h e l i m i t s i nw h e a t r e s e a r c h a n db r e e d i n g u s i n g a f u l l y a n n o-t a t e dr e f e r e n c e g e n o m e[J].S c i e n c e,2018,361(6403):E A A R7191.[32]L E S C O T M,D E H A I SP,T H I J SG,e t a l.P l a n t C A R E,ad a-t a b a s e o f p l a n t c i s-a c t i n g r e g u l a t o r y e l e m e n t s a n d a p o r t a l t o t o o l s f o r i n s i l i c o a n a l y s i s o f p r o m o t e r s e q u e n c e s[J].N u c l e-i cA c i d sR e s e a r c h,2002,30(1):325.[33]B A I L E Y TL,E L K A NC.F i t t i n g am i x t u r em o d e l b y e x p e c-t a t i o nm a x i m i z a t i o n t od i s c o v e rm o t i f s i nb i o p o l y m e r s[J].I n t e r n a t i o n a lC o n f e r e n c e o nI n t e l l i g e n t S y s t e m s f o rM o l e c u-l a rB i o l o g y,1994,2:28.[34]S I N G H A K,S I N G H N,K UMA RS,e t a l.I d e n t i f i c a t i o na n de v o l u t i o n a r y a n a l y s i s of p o l y c i s t r o n i cm i R N Ac l u s t e r s i nd o-m e s t i c a t e da n d w i l d w h e a t[J].G e n o m i c s,2020,112(3): 2334.[35]Z HA O Y,WA N GF,C H E NS,e t a l.M e t h o d s o fm i c r o R N A p r o m o t e r p r e d i c t i o n a n d t r a n s c r i p t i o n f a c t o rm e d i a t e d r e g u l a-t o r y n e t w o r k[J].B i o M e d R e s e a r c h I n t e r n a t i o n a l,2017, 2017:7049406.[36]蔡健宇,贾蒙骜,张孝廉,等.烟草m i R N A169基因家族及启动子的生物信息学分析[J].烟草科技,2019,52(10):1.C A I JY,J I A M A,Z H A N GXL,e t a l.B i o i n f o r m a t i c s a n a l y-s i s o f t o b a c c o m i R N A169g e n e f a m i l y a n d p r o m o t e r[J].T o-b a c c oS c i e n c e a n dT e c h n o l o g y,2019,52(10):1.㊃8541㊃麦类作物学报第41卷。

教你玩转miRNA靶基因及其结合位点的预测

教你玩转miRNA靶基因及其结合位点的预测

教你玩转miRNA靶基因及其结合位点的预测研究miRNA的老师们都清楚miRNA靶基因预测的重要性,之前的文章《研究miRNA,这些数据库你必须得知道!| 常用数据库汇总》给各位老师介绍了一些常用的miRNA研究数据库,今天就为大家挑选几个常用的数据库介绍一下其使用方法。

这些数据库一般是通过预测miRNA种子区与mRNA的结合情况来预测靶基因。

种子区(seedregion)指的是miRNA上进化最为保守的片段,从第2个到第8个核苷酸,通常与mRNA 3’-UTR上的靶位点完全互补。

每个数据库都有自己独特的一套规则,但主要遵循以下几个基本原则:miRNA与其靶位点的互补性;miRNA 靶位点在不同物种之间的保守性;miRNA-mRNA双链之间的热稳定性;miRNA 靶位点处不应有复杂的二级结构等。

当然,具体允许有多少个错配,哪里有错配,这就因数据库而异了。

当然,这种预测也并不是完全正确的,因为动物miRNA:mRNA双链往往含有错配、缺口或凸出,因此,预测并不一定是准确的。

不过,对于分值最高的匹配,后续实验的成功率还是挺高的。

以下便是人们常用的miRNA靶点预测工具及其使用方法。

>>>>植物miRNA靶基因的预测psRNATarget网址:/psRNATarget/该网址有三种模式可以选择:载入miRNA的信息预测其靶基因;载入一个基因预测miRNA;同时载入miRNA和基因预测结合情况。

我们将拟南芥的miRNA: ath-miR156a-5p Fasta格式序列输入,cDNA选择拟南芥最新数据库,点击Upload&Submit:>ath-miR156a-5pMIMAT0000166UGACAGAAGAGAGUGAGCAC结果就是酱紫的:>>>>动物靶基因预测动物靶基因预测数据库比较多,我们只挑选几个最常用的介绍一下。

TargetScan网址:/vert_71/TargetScan()由麻省理工学院的Benjamin Lewis等人在2003年开发,它通过搜索与每个miRNA的种子区匹配的保守位点而预测miRNA的靶基因。

MiRNA常用研究方法

MiRNA常用研究方法

MiRNA常用研究方法
MiRNA(microRNA)是一类短小的非编码RNA分子,它们在调控基因
表达过程中起着重要的作用。

为了研究MiRNA的功能和机制,科学家们开
发出了许多常用的研究方法。

本文将介绍MiRNA常用的研究方法,包括MiRNA检测、MiRNA表达分析、MiRNA功能研究以及MiRNA与疾病相关性
研究。

MiRNA表达分析是研究MiRNA的另一个重要方面。

常用的MiRNA表达
分析方法包括全基因组鉴定、芯片分析和序列分析等。

全基因组鉴定是指
通过测序技术鉴定所有MiRNA,目前已知MiRNA超过2000种。

芯片分析
是一种高通量的MiRNA表达分析方法,可以同时检测数千种MiRNA的表达。

芯片分析可以提供全面的MiRNA表达信息,有助于研究MiRNA在生理和病
理过程中的作用。

序列分析是指通过对MiRNA进行测序和比对,来鉴定新
的MiRNA及其特定的表达模式。

MiRNA与疾病相关性研究是近年来研究热点。

MiRNA与疾病相关性研
究主要采用表达分析、靶基因分析和功能验证等方法。

表达分析是通过比
较疾病样本和正常样本的MiRNA表达水平来寻找与疾病相关的MiRNA。


基因分析是通过预测和鉴定MiRNA的靶基因,来寻找与疾病相关的调控网络。

功能验证是通过过表达或敲除目标MiRNA来验证其对疾病发展的影响。

总之,MiRNA研究是一个多学科的领域,需要结合多种技术和方法。

随着技术的不断发展,我们相信MiRNA研究将在未来取得更大的突破。

miRNA测序概述及实验分析流程

miRNA测序概述及实验分析流程

miRNA测序概述及实验分析流程miRNA是一类具有调控功能的小分子非编码RNA,它在转录后水平上调控基因表达,并参与多种生物过程的调控,如细胞分化、增殖、凋亡等。

miRNA测序是研究miRNA表达谱的一种重要方法,可以揭示miRNA在不同生理和病理状态下的表达变化,并有助于了解其在疾病中的功能和作用机制。

本文将从miRNA测序的基本原理和实验流程两个方面进行概述。

一、miRNA测序的基本原理miRNA测序的基本原理是通过高通量测序技术对miRNA进行全长测序,然后根据序列特征和已知的miRNA数据库进行注释和定量分析。

miRNA测序可以分为两种方法:小RNA-seq和miRNA-seq。

1. 小RNA-seq:小RNA-seq是对全长小RNA进行测序。

首先,从细胞或组织中提取总RNA,然后通过RNA聚合酶II反转录合成cDNA,构建文库。

接着,对文库进行PCR扩增、片段大小选择和高通量测序,最后利用测序数据进行miRNA注释和分析。

2. miRNA-seq:二、miRNA测序的实验流程1.样品准备:首先确定研究的生理或病理状态以及需要比较的组别。

样品可以是细胞、组织或体液,如血液、血清等。

样品的选择要根据具体实验的需求和研究问题进行确定。

2.RNA提取:RNA提取是miRNA测序的关键步骤,目的是保持RNA的完整性和纯度以获得准确的测序结果。

常用的RNA提取方法有酚氯仿法、柱式提取法和磁珠提取法等。

提取的RNA需经过质检,如琼脂糖凝胶电泳和NanoDrop浓度测定。

3.文库构建:文库构建是miRNA测序的关键步骤之一,其目的是将提取到的miRNA转化为测序文库,通常包括以下步骤:首先,为miRNA反转录合成cDNA;然后,添加适配体序列;接着,进行PCR扩增和文库构建。

4.高通量测序:文库构建完成后,进行高通量测序。

根据实验需求,选择合适的测序平台(如illumina HiSeq、Ion torrent等)及测序模式(如单端测序或双端测序)。

miRNA的综述

miRNA的综述

miRNA的综述摘要在动植物基因组中,广泛存在一类非编码蛋白的RNA基因,其产生长度大约为21~24个核苷酸RNA,这些RNA被命名为microRNA(miRNA)。

它是一类具有调节其他基因表达活性的小RNA,在生物的发育过程中发挥着重要作用。

本文就这种小基因的相关研究进展作简要概述。

关键词:小RNA miRNA 功能 RNA基因目录一前言 (1)二本论 (2)2.1 miRNA的发现 (2)2.2 miRNA的生成和结构 (2)2.3 miRNA与siRNA的区别 (3)2.4 miRNA的功能 (3)2.5 其他小RNA的概述 (4)三结论 (6)参考文献 (7)一前言目前,人类已发现了一些不同种类的小RNA分子,其中,miRNA就是新发现的一类小RNA。

现已发现了大约100多种miRNA,它们广泛地存在于多种真核生物中,例如线虫、植物、动物等等,甚至在人类自身都存在有不同的miRNA。

miRNA是一类长度为21~25nt的单链RNA分子片段,属于非蛋白编码RNA,其生成与siRNA相似。

在进化上具有保守性,而在结构、表达和功能上则具有多样性。

它的主要功能是调节内源基因表达,在基因活动调控网络中扮演了重要的角色。

二本论2.1 miRNA的发现最早是Horvitz和Sulston在线虫中发现了一种突变体。

正常情况下,线虫要经过幼虫期的四个阶段才能发育为成虫,而该突变个体可以直接通过蜕皮长大,但是它只能停留在第一阶段,不能进入以后段发育为成虫。

Ambros和Lee等人利用定位克隆法克隆了这个基因(lin-4),并发现该基因具有以下特点:1 其长度较小,2 不编码任何蛋白质,3 转录成有发夹式结构的前体RNA,而这种前体RNA 只有在某种机制下可以被加工成长度约20个核苷酸的RNA。

通过进一步的研究,他们还发现该RNA是线虫异时发育时钟途径蛋白质mRNA的反义翻译抑制物,它可以和mRNA的3′端的UTR序列进行互补,从而抑制其翻译。

miRNA功能筛选鉴定

miRNA功能筛选鉴定

miRNA功能筛选鉴定miRNA是一类非编码RNA分子,其功能主要通过调控靶基因的表达来发挥作用。

在miRNA功能的筛选鉴定过程中,主要包括以下几个方面的研究内容:miRNA的定位、miRNA靶基因的筛选、miRNA功能调控的验证等。

首先,miRNA的定位是miRNA功能鉴定的关键步骤之一、通过高通量测序技术可以对miRNA分子进行全基因组范围的检测和鉴定。

根据测序数据,可以得到miRNA的序列信息,并利用不同的算法和数据库预测并确认miRNA的结构和功能。

第二,miRNA靶基因的筛选是miRNA功能鉴定的另一重要环节。

miRNA通过与靶基因的mRNA结合,进而调控靶基因的表达。

为了找到miRNA的靶基因,可以利用生物信息学方法对miRNA和mRNA序列进行匹配分析,通过预测算法可以筛选出可能的miRNA靶基因。

此外,还可以利用转录组学分析等方法,通过实验验证靶基因的表达是否受到miRNA的调控,从而筛选出真实的miRNA靶基因。

第三,miRNA功能调控的验证是miRNA功能鉴定的重要步骤。

通过对miRNA过表达或沉默的细胞系或动物模型进行功能实验,可以研究miRNA的生物学功能。

例如,可以通过转染miRNA对靶基因的调控效果进行检测,进一步验证miRNA在调控靶基因表达水平方面的作用。

此外,还可以利用RNA干扰技术抑制miRNA的表达,观察其对细胞生物学特性和基因表达模式的影响,进一步验证miRNA的生物学功能。

同时,还可以通过构建miRNA的敲除动物模型,观察miRNA缺失对生理和病理过程的影响,从而揭示miRNA的功能。

综上所述,miRNA功能筛选鉴定的过程主要包括miRNA的定位、miRNA靶基因的筛选和miRNA功能调控的验证。

通过这一系列研究内容的开展,可以全面深入地了解miRNA的功能及其在生物学和疾病相关过程中的作用,为后续的研究提供重要的理论基础和实验依据。

miRNA文献综述1

miRNA文献综述1

miRNA研究综述摘要:miRNA是近年来在真核生物和病毒中发现的一类内源性染色体上的非编码单链RNA。

miRNA调节细胞生长,组织分化,最近的研究表明miRNA参及各种各样的调节途径,包括发育、病毒防御、造血过程、器官形成、细胞增殖和凋亡、脂肪代谢等等。

本文主要从miRNA的生物学特征、生成、功能、miRNA及癌症、miRNA及免疫、miRNA鉴定、miRNA靶基因鉴定等方面作一概述。

关键词:miRNA、癌症、免疫、功能、靶基因miRNA简介:MicroRNA(miRNA)是一类由内源基因编码的长度约为22个核苷酸的非编码单链RNA分子,由具有发夹结构的约70-90个碱基大小的单链 RNA前体经过Dicer酶加工后生成,它们在动植物中参及转录后基因表达调控。

miRNA能够通过及靶mRNA特异性的碱基互补配对,引起靶mRNA降解或者抑制其翻译,从而对基因进行转录后的表达调控。

miRNA的组织特异性和时序性,决定组织和细胞的功能特异性,miRNA在细胞生长和发育过程的调节过程中起多种作用。

到目前为止,在动植物以及病毒中已经发现有4361个miRNA 分子。

第一个被确认的miRNA是在线虫中首次发现的lin-4 和let-7,随后多个研究小组在包括人类、果蝇、植物等多种生物物种中鉴别出数百个miRNA。

miRNA生物学功能:miRNA分子有以下几个明显特征:[1]广泛存在于真核生物中,是一组不编码蛋白质的短序列RNA,它不具有开放阅读框架( ORF) 。

[2]miRNA的长度一般为20-24个nt,但在3’端可以有1-2个碱基的长度变化。

[3]成熟miRNA的5’端有一磷酸基团,3’端为羟基,这一特点使它及大多数寡核苷酸和功能RNA的降解片段区别开来。

[4] miRNA基因在基因组上不是随机排列的,其中一些通常形成基因簇。

来自同一个基因簇的miRNA具有较强的同源性,而不同基因簇的miRNA同源性较弱。

《2024年MicroRNA靶基因的寻找及鉴定方法研究进展》范文

《2024年MicroRNA靶基因的寻找及鉴定方法研究进展》范文

《MicroRNA靶基因的寻找及鉴定方法研究进展》篇一一、引言MicroRNA(miRNA)是一类内源性的、非编码的小RNA分子,它们在生物体内发挥着重要的调控作用。

近年来,随着生物信息学和分子生物学技术的不断发展,对于miRNA靶基因的寻找及鉴定成为了研究热点。

本文旨在探讨MicroRNA靶基因的寻找及鉴定方法的研究进展,为相关研究提供参考。

二、miRNA靶基因的寻找方法1. 生物信息学方法生物信息学方法是通过计算机软件和算法,对已知miRNA 序列进行预测和分析,从而找出潜在的靶基因。

目前常用的软件包括miRanda、TargetScan等。

这些软件利用已知的miRNA与靶基因之间的互补配对规则,通过分析序列的保守性、序列的匹配程度等因素,预测出潜在的靶基因。

2. 实验方法实验方法主要包括基因表达谱分析、荧光素酶报告实验等。

基因表达谱分析是通过比较miRNA表达水平与靶基因表达水平之间的关系,找出潜在的靶基因。

荧光素酶报告实验则是通过构建含有特定miRNA结合位点的荧光素酶报告载体,测定其活性变化来鉴定miRNA的靶基因。

三、miRNA靶基因的鉴定方法1. 分子克隆技术分子克隆技术是通过构建含有miRNA结合位点的基因片段,将其克隆到表达载体中,通过在细胞内表达并检测其表达水平变化来鉴定miRNA的靶基因。

这种方法可以直接观察miRNA对靶基因的表达调控作用。

2. 基因敲除技术基因敲除技术是通过将特定基因敲除或沉默,观察其对细胞或生物体表型的影响,从而确定该基因是否为miRNA的靶基因。

这种方法可以直接验证miRNA与靶基因之间的相互作用关系。

四、研究进展近年来,随着生物信息学和分子生物学技术的不断发展,对于miRNA靶基因的寻找及鉴定方法也在不断进步。

目前,研究人员已经发现了大量的miRNA靶基因,并通过多种方法进行了验证。

同时,一些新的技术和方法也在不断涌现,如高通量测序技术、CRISPR/Cas9基因编辑技术等,这些技术为miRNA靶基因的研究提供了更加准确和高效的手段。

miRNA的常用检测方法研究

miRNA的常用检测方法研究

miRNA的常用检测方法研究miRNA(microRNA)是一类长度约为20-24个核苷酸的非编码RNA,通过与靶基因的3'非翻译区(3'UTR)结合,调控转录后基因的表达。

miRNA在生物体内具有广泛的生理和生化功能,参与细胞周期调控、分化、凋亡以及疾病的发生发展等多个生物学过程。

miRNA在疾病诊断和治疗方面具有潜在的应用价值。

为了研究miRNA的功能和机制,科学家们开发了多种miRNA的检测方法。

下面将介绍几种常用的miRNA检测方法。

1. 靶基因预测:miRNA通过结合靶基因的3'UTR,调节靶基因的表达。

靶基因预测方法通过基因序列比对和计算,预测可能的miRNA靶基因。

这种方法是研究miRNA功能和机制的起点。

2. 荧光原位杂交:荧光原位杂交(fluorescence in situ hybridization,FISH)可以通过DNA探针与目标miRNA结合,使用荧光染料标记来检测miRNA在细胞中的位置和表达水平。

FISH方法可以在细胞水平上观察miRNA的表达和分布情况。

3. 实时荧光定量PCR:实时荧光定量PCR(real-time quantitative PCR,qPCR)是一种准确测量miRNA表达水平的方法。

通过逆转录和PCR扩增,将miRNA转化为cDNA片段,并使用荧光标记的探针来定量miRNA的数量。

qPCR具有高灵敏度、高选择性和高准确性的优点,被广泛应用于miRNA的定量研究。

4. 免疫沉淀:免疫沉淀(immunoprecipitation,IP)可以通过特异性抗体捕捉miRNA 与其他蛋白质或RNA的复合物,然后通过分析沉淀物中的miRNA数量和组成,研究miRNA的功能和作用机制。

这种方法可以帮助鉴定miRNA与特定蛋白质或RNA的相互作用关系。

5. 高通量测序:高通量测序技术(high-throughput sequencing)可以对全基因组的miRNA进行快速、准确的检测和鉴定。

分子生物学中的基因调控机制分析

分子生物学中的基因调控机制分析

分子生物学中的基因调控机制分析基因调控是指生物体内基因表达的调控过程,它决定了细胞发育、分化和功能的定向性。

分子生物学是研究生物体内分子结构、功能和相互作用的科学,因此在分子生物学中,研究基因调控机制是一个重要的课题。

基因调控机制是多种复杂的细胞分子间相互作用的结果,以下将介绍一些常见的基因调控机制。

首先,启动子区域的调控是基因调控的关键。

在DNA序列中,启动子是调控转录是否开始的重要区域。

转录因子是一类能够结合到启动子上的蛋白质,它们通过与启动子结合来激活或抑制基因的转录。

转录因子的结合位点序列可以与特定的DNA序列相互作用,从而使转录因子调控基因的表达。

例如,转录因子结合位点上如果有特定序列的DNA甲基化,可能会阻碍转录因子与启动子的结合,从而抑制基因的表达。

除了启动子区域的调控外,DNA的结构也会影响基因的调控。

染色质是由DNA和蛋白质组成的复杂结构,它决定了DNA的可及性。

在原核生物中,DNA的超螺旋结构可以阻碍转录因子的结合,从而抑制基因的表达。

而在真核生物中,DNA会与核小体蛋白质结合成为染色质纤维,通过染色质重塑和组蛋白修饰等机制,可以调控DNA的可及性。

例如,乙酰化组蛋白可以使染色质解缠,暴露出被转录因子结合的DNA区域,从而促进基因的表达。

此外,微小RNA(miRNA)也是一种重要的基因调控机制。

miRNA是一类小分子RNA,通过与靶基因的3'非编码区域相互作用,干扰编码RNA的翻译或降解靶基因的RNA,从而调控基因的表达。

miRNA可以通过局部互补配对或完全配对来与靶基因结合,进而发挥调控作用。

miRNA在生物体内广泛存在,参与了细胞周期、分化、凋亡等多种生物过程的调控。

另外,表观遗传调控也是基因调控的重要机制之一。

表观遗传调控是指与基因序列无关的遗传信息传递过程。

DNA甲基化是一种常见的表观遗传修饰方式,它涉及到DNA链上的甲基化基团。

DNA甲基化可以影响基因的可读性,从而调控基因的表达。

分子遗传学复习题及答案-

分子遗传学复习题及答案-

分子遗传学复习题1.名词解释:DNA甲基化(DNA methylation):是指由DNA甲基化转移酶介导,催化甲基基团从S-腺苷甲硫氨酸向胞嘧啶的C-5位点转移的过程。

ENCODE计划(The Encyclopedia of DNA Elements Project):即“DNA元件百科全书计划”,简称ENCODE计划,是在完成人类基因组全序列测定后的2003年9月由美国国立人类基因组研究所(National Human Genome Research Institute,NHGRI)组织的又一个重大的国际合作计划,其目的是解码基因组的蓝图,鉴定人类基因组中已知的和还不知功能的多个物种的保守序列等在内的所有功能元件。

ENCODE计划的实施分为3个阶段:试点阶段( a pilot phase)、技术发展阶段(a technology development phase)和生产阶段(a producttion phase)。

gRNA (guide RNA):既指导”RNA(gRNA,guide RNA),能通过正常的碱基配对途径,或通过G—U 配对方式与mRNA上的互补序列配对,指导编辑的进行。

GT--AG规律(GT-AG rule):真核生物所有编码蛋白质的结构基因,其RNA前体在内含子和外显子交界处有两个较短的保守序列,内含子的左端均为GT,右端均为AG,此规律称GT-AG 规律。

miRNA:即小RNA,长度为22nt左右,5′端为磷酸基团、3′端为羟基。

miRNA广泛存在于真核生物中,不具有开放阅读框架,不编码蛋白质,其基因的转录产物是发夹状结构,在RNaseⅢ酶切后以双链形式存在,是近几年在真核生物中发现的一类具有调控功能的非编码RNA,它们主要参与基因转录后水平的调控。

RNA编辑(RNA editing) :是指通过碱基修饰、核苷酸插入或删除以及核苷酸替换等方式改变RNA的碱基序列的转录后修饰方式。

分子生物学中的非编码RNA和编码RNA

分子生物学中的非编码RNA和编码RNA

分子生物学中的非编码RNA和编码RNA随着科学技术的不断发展,对于DNA和RNA的研究也越来越深入。

在分子生物学领域中,RNA被视为至关重要的分子之一,不仅能作为蛋白质合成的参与者,还可以通过其它方式发挥功能。

人们通常熟知的是编码RNA,即mRNA,它们含有编码遗传信息的序列,参与蛋白质合成。

然而,随着对RNA功能的研究逐渐深入,人们也发现了一类新的RNA,它们不含编码信息,但是仍然能够对细胞生物过程产生影响,这便是非编码RNA(ncRNA)。

一. 非编码RNA的种类及特点1. miRNAmiRNA(microRNA),是一类长约20-25个核苷酸的ncRNA。

它们最初被发现是具有调控胚胎发育、细胞增殖和细胞凋亡等功能。

miRNA是由特定的基因转录产生的RNA序列,在细胞中通过与RNA识别复合物(RISC)结合,靶向RNA分子,降解mRNA,从而调节靶标基因的转录和翻译。

2. siRNAsiRNA(small interfering RNA)也是一种短的ncRNA,它们可以促进特定mRNA的菜单轮转和降解。

siRNA的产生是由双链RNA在细胞内互补配对后,在Dicer切割下产生的。

3. piRNApiRNA(Piwi-interacting RNA),是在生殖细胞中产生的一类ncRNA,与Piwi蛋白结合形成复合物,在调节染色体稳定性和抑制静默基因方面具有重要作用。

4. lncRNAlncRNA(long non-coding RNA),是长于200 nt且不编码蛋白质的ncRNA。

lncRNA可以通过多种方式影响基因转录和RNA加工,包括调节染色质构象、调节转录因子作用和稳定mRNA的结构等方面。

二. 编码RNA与非编码RNA的区别编码RNA与非编码RNA之间的最显著的区别在于它们所包含的基因类型和作用方式不同。

编码RNA(mRNA)主要参与蛋白质合成,其中包含了遗传信息来指导蛋白质的组装。

而非编码RNA则不具有编码功能,但是却能够通过其他方式影响基因表达和细胞过程。

《2024年MicroRNA靶基因的寻找及鉴定方法研究进展》范文

《2024年MicroRNA靶基因的寻找及鉴定方法研究进展》范文

《MicroRNA靶基因的寻找及鉴定方法研究进展》篇一一、引言MicroRNA(miRNA)是一类内源性的、非编码的小RNA分子,通过与靶基因的mRNA序列进行互补配对,进而在转录后水平上调控基因的表达。

近年来,随着生物信息学和分子生物学技术的快速发展,对miRNA及其靶基因的研究已经取得了显著进展。

寻找和鉴定miRNA靶基因,对于揭示生物体内复杂的基因调控网络和疾病的发生机制具有重大意义。

本文将综述近年来关于miRNA靶基因寻找及鉴定方法的研究进展。

二、MicroRNA靶基因寻找方法1. 生物信息学预测方法生物信息学预测方法主要依赖于计算机算法和数据库资源,通过分析miRNA与靶基因mRNA序列的互补配对情况,预测潜在的miRNA靶基因。

目前常用的预测软件包括TargetScan、miRDB、PicTar等。

这些软件利用不同的算法和模型,结合基因组学、转录组学等数据,能够预测出大量潜在的miRNA靶基因。

然而,由于存在不完全互补配对和非序列特异性的现象,因此需要通过后续实验验证确定其真正的生物学功能。

2. 分子生物学实验方法除了生物信息学预测方法外,还可以利用分子生物学实验方法来寻找miRNA靶基因。

如采用基因克隆技术,构建miRNA及其靶基因的重组载体,然后通过转染细胞等手段研究其生物学功能。

此外,还有利用免疫共沉淀、蛋白质-RNA相互作用等实验技术来验证miRNA与靶基因的相互作用关系。

这些实验方法能够直接反映miRNA与靶基因之间的相互作用情况,为后续的鉴定工作提供了可靠的依据。

三、MicroRNA靶基因鉴定方法1. 报告基因法报告基因法是一种常用的鉴定miRNA靶基因的方法。

该方法通过构建含有特定miRNA靶位点的报告基因载体,检测该载体在miRNA作用下的表达水平变化,从而确定该靶位点是否为miRNA的真实靶点。

此外,还可以利用荧光素酶报告系统等技术进一步验证结果。

2. 免疫共沉淀技术免疫共沉淀技术可以用于研究蛋白质与蛋白质或蛋白质与RNA之间的相互作用关系。

核小体定位方法及分布特征

核小体定位方法及分布特征

核小体定位方法及分布特征汇报人:日期:contents •核小体概述•核小体定位方法•核小体分布特征•核小体与基因表达调控•研究展望目录核小体概述01CATALOGUE定义核小体是由DNA和蛋白质组成的染色质基本结构单位,是DNA缠绕在组蛋白八聚体核心上的结构。

结构核小体主要由DNA和蛋白质组成,其中DNA是主体,组蛋白是核心,组蛋白八聚体包裹DNA形成核心颗粒。

核小体的定义和结构1核小体的主要功能23核小体的组蛋白八聚体核心可以保护DNA免受内源性酶的攻击,同时也可以防止DNA受到外源性损伤。

保护DNA核小体的组蛋白修饰和DNA甲基化等机制可以调节基因的表达,从而影响细胞的功能。

调节基因表达染色质高级结构是由多个核小体组成的超分子结构,这种结构有利于细胞进行DNA复制和基因转录等生命活动。

染色质高级结构形成核小体定位方法02CATALOGUE蛋白质印迹法通过特异性抗体检测蛋白质表达,并确定其相对分子量及在细胞中的分布位置。

免疫共沉淀利用特异性抗体与待测蛋白质共同沉淀,进一步进行测序或质谱分析,确定蛋白质的相对位置。

基于免疫印迹的定位方法通过对RNA进行测序,获取基因表达信息,间接确定核小体的位置。

转录组测序在更精细的尺度上对RNA进行测序,以揭示核小体在基因内部的分布特征。

亚细胞转录组测序基于测序技术的定位方法利用生物信息学方法将基因序列与已知核小体位置的基因序列进行比对,预测核小体的位置。

机器学习基于大量已知核小体位置的数据,利用机器学习算法训练模型,预测新基因中核小体的位置。

序列比对基于生物信息学的定位方法VS核小体分布特征03CATALOGUE核小体在DNA链上呈间隔分布,平均每100-200个碱基对有一个核小体。

核小体更倾向于分布在富含AT碱基对的区域,这可能与AT碱基对之间的氢键较少有关。

间隔分布富含AT区域异质性分布核小体在细胞核内分布具有异质性,它们通常集中在染色质的结构域中,这些结构域可能涉及基因表达调控。

miRNA研究方法

miRNA研究方法

miRNA研究方法miRNA(microRNA)是一类短链非编码RNA分子,长度约为18-25个核苷酸,参与调控基因表达和蛋白质合成。

miRNA具有高度保守性和多样性,在生物体内广泛存在,对生物体发育、细胞增殖、分化以及肿瘤发生等过程起着重要的调控作用。

为了研究miRNA的功能和表达模式,科学家们开发了多种实验方法。

本文将介绍miRNA研究的主要方法及其特点。

1. miRNA microarray分析miRNA microarray是一种高通量技术,可以同时检测几百至几千种miRNA的表达水平。

该方法通过在芯片上固定检测miRNA的探针,利用荧光标记技术或强化技术检测miRNA与探针的结合情况。

该方法具有高度灵敏性和特异性,适用于发现miRNA的变化模式以及筛选与特定生理和病理过程相关的miRNA。

2.实时定量PCR(qRT-PCR)分析qRT-PCR是一种常用的miRNA定量分析方法。

首先,使用逆转录酶将miRNA逆转录成cDNA,并使用特异性引物与miRNA结合。

然后,通过PCR 扩增获得足够的DNA产物。

该方法具有高度特异性和灵敏性,并且可以通过比较不同样本中miRNA的表达水平进行定量分析。

然而,qRT-PCR的局限性在于需要使用已知miRNA作为参考,并且只能检测已知的miRNA。

3.原位杂交分析原位杂交是一种检测miRNA在细胞和组织中空间和时间表达模式的方法。

该方法通过在miRNA与所用探针相互补的位置上标记放射性同位素或荧光染料,使其与miRNA结合,然后通过显微镜观察探针的绑定情况。

该方法不需要特殊的前期处理,可以直接观察miRNA的表达模式,但是对嵌入固定组织的适用性较弱。

4. NGS(Next-Generation Sequencing)分析NGS是一种高通量测序技术,可以快速、准确地对miRNA进行全序列分析。

通过将miRNA逆转录成cDNA,加入特定的适配体,并通过PCR扩增得到测序所需的文库。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2010年 第55卷 第14期:1335 ~ 1340 英文版见: Liu H D, Zhang D J, Xie J M, et al. Analysis of nucleosome positioning in promoters of miRNA genes and protein-coding genes. Chinese Sci Bull, 2010, 55,doi: 10.1007/s11434-009-3730-2论 文《中国科学》杂志社SCIENCE CHINA PRESS专题: 生物信息学miRNA 基因和编码基因启动子区核小体定位分析刘宏德, 张德金, 谢建明, 袁志栋, 马昕, 卢志远, 龚乐君, 孙啸*东南大学生物电子学国家重点实验室, 南京 210096 * 联系人, E-mail: xsun@ 2009-04-22 收稿, 2009-08-28 接受国家自然科学基金资助项目(60671018, 30800209)摘要 研究了把基因启动子区的核小体定位对于分析基因的转录调控具有重要意义. 利用核小体定位的预测技术——弯曲度谱, 分析了编码基因和miRNA 基因启动子周围核小体定位的特征. 基因的转录起始位点处, 有一个核小体缺失区域, 且在下游约200 bp 处, 有较强的核小体定位信号. 独立转录的内含子miRNA 基因与基因间区miRNA 基因, 在启动子区具有相似的核小体定位特征, 在上游0 ~ −400 bp 间, 有一个较宽的核小体缺失区域, 在该区域分布有较多的转录因子结合位点; 而依赖编码基因转录的内含子miRNA 基因, 其启动子与蛋白编码基因启动子具有相似的核小体定位特征, 在转录起始位点上游−200 ~ −400 bp 和−400 ~ −600 bp 处, 各有一个较强的核小体定位. 这些结果表明, 独立转录的miRNA 基因(包括基因间区miRNA 和独立转录内含子miRNA)和蛋白编码基因, 在启动子区可能具有不同的核小体定位特征. 核小体定位不仅参与编码基因的转录调节, 也影响miRNA 基因的转录.关键词 核小体定位 启动子 miRNA 基因75%~90%的真核基因组DNA 包裹在组蛋白八联体上形成核小体[1]. 核小体定位是指DNA 双螺旋相对于组蛋白核的位置. 这种定位作用封闭了位于核小体上的蛋白结合位点[2,3], 进而阻止蛋白质与DNA 的结合, 以此达到调节基因转录的作用.基因启动子结构和功能的分析对于研究转录调节、构建基因间相互作用网络等都具有重要意义. 目前, 对于编码基因启动子的研究较多, 认识较深入. miRNA 由于在细胞的发育分化、疾病(癌症)的发生发展中的有重要作用, 而备受关注[4,5], 但由于miRNA前体(pri-RNA)的不稳定性和miRNA 的组织特异表达量低等原因, 使得对miRNA 基因自身的转录机制尚不明确[6]. 而从核小体定位的角度分析miRNA 基因的启动子将有助于理解miRNA 基因的转录调节机制[6,7].本文利用作者开发的核小体预测技术——弯曲度谱, 分别分析了编码基因、基因间miRNA 基因和内含子miRNA 基因的启动子区域核小体分布的特征. 结果显示独立转录的miRNA 基因与编码基因在启动子区核小体定位特征上有所差异. 这些分析对于理解miRNA 基因的转录过程具有重要作用.1 数据和方法(ⅰ) 数据. 用一段DNA 序列(人类20号染色体: 83.5~86.1 kb)来检验弯曲度谱的预测能力, 并将结果与Segal 等的模型结果进行比较(http://genie.weizm-ann.ac.il/soft-ware/nucleo_prediction.html, version 3.0)[8], 该段序列的核小体位置实验检测数据来自文献[9].672条蛋白编码基因启动子DNA 序列来自人类20号染色体, 序列取自UCSC (/).2010年5月 第55卷 第14期1336每条序列长度为1400 bp, 转录起始位点(TSS)上游(5′端)1000 bp, 下游(3′端)400 bp. 117种人类miRNA 基因的转录起始位点信息来自文献[6]. 通过UCSC, 以TSS 为对齐点, 分别提取了miRNA 基因TSS 上游1000 bp 和下游400 bp 的DNA 序列进行分析. 表1列出了miRNA 的名称, 其中, 基因间区miRNA 有43种; 根据是否具有独立的启动子, 将74种内含子miRNA 分为两类, 即依赖编码基因转录的内含子miRNA 和独立转录的内含子miRNA, 两者的数量分别为51种和23种. 本文中, 将独立转录的内含子miRNA 基因和基因间区miRNA 基因合称为“独立转录miRNA 基因”.(ⅱ) 核小体预测模型. 核小体预测使用作者此前开发的弯曲度谱[10]. 在以前的研究中, 发现核小体DNA 双螺旋在两端(~50 bp)比在中间(~47 bp)具有更大的弯曲度, 即具有一种模式, 称作核小体弯曲度特征模式; 利用此模式, 建立了弯曲度谱. 本文利用核小体晶体结构信息, 重构了弯曲度特征信号(图1), 以提高预测准确度.利用弯曲度特征预测核小体的方法为: (1) 用eq.(1)计算待测DNA 序列的弯曲度信号[11]()()2112102exp n j j j n ij C n n i νρτν−=π⎛⎞=−−⎜⎟⎝⎠∑, (1) 其中C 的模为弯曲度, 0ν为DNA 的平均周期(10.4 bp), ρ和τ分别表征16种二苷相对于B DNA 结构旋转和倾斜的程度, 21n n −为计算时所取DNA 片段的长度, 本文中为11 bp, 计算步长为1 bp.(2) 预测核小体. 核小体预测以两条信号(DNA 序列的弯曲度信号和核小体DNA 的弯曲特征信号)的卷积运算实现, 卷积结果称作弯曲度谱(curvature profile). 如果弯曲度信号中有一段信号与核小体DNA 弯曲度特征信号相似, 则在弯曲度谱的相应位置会出现一个波峰, 基于此, 便可预测核小体位置. 同时, 我们提供了该方法的在线预测工具(http:// /icons).(ⅲ) 启动子区域核小体定位特征分析. 基因启动子区域的核小体分布特征通过以下过程来计算: 首先计算每条DNA 序列的弯曲度谱, 然后以TSS 为对齐点, 加和所有的弯曲度谱并做平滑. 为了研究启动子区核小体定位与转录因子结合位点(TFBS)之间表1 3类miRNA 的名称a)依赖编码基因转录 的内含子miRNA (总计51种)hsa-mir-548b hsa-mir-550-2 hsa-mir-553 hsa-mir-554 hsa-mir-559 hsa-mir-561 hsa-mir-566 hsa-mir-571 hsa-mir-578 hsa-mir-580 hsa-mir-589 hsa-mir-590 hsa-mir-609 hsa-mir-616 hsa-mir-618 hsa-mir-619 hsa-mir-624 hsa-mir-627 hsa-mir-629 hsa-mir-636 hsa-mir-637 hsa-mir-641 hsa-mir-642 hsa-mir-643 hsa-let-7g hsa-mir-103-1 hsa-mir-140 hsa-mir-148b hsa-mir-149 hsa-mir-152 hsa-mir-16-2 hsa-mir-185 hsa-mir-186 hsa-mir-191 hsa-mir-22 hsa-mir-25 hsa-mir-26b hsa-mir-301 hsa-mir-326 hsa-mir-330 hsa-mir-378 hsa-mir-423 hsa-mir-449 hsa-mir-574 hsa-mir-584 hsa-mir-615 hsa-mir-647 hsa-mir-657 hsa-mir-661 hsa-mir-7-1 hsa-mir-611 独立转录的内含子miRNA(总计23种)hsa-mir-548c hsa-mir-550-1 hsa-mir-604 hsa-mir-634 hsa-mir-635 hsa-mir-639 hsa-let-7c hsa-let-7ehsa-mir-125b-2 hsa-mir-128b hsa-mir-149 hsa-mir-153-1 hsa-mir-20a hsa-mir-30c-1 hsa-mir-339 hsa-mir-33b hsa-mir-340 hsa-mir-450-1 hsa-mir-564 hsa-mir-632 hsa-mir-658 hsa-mir-9-1 hsa-mir-98 基因间miRNA (总计43种)hsa-mir-200b hsa-mir-101-1 hsa-mir-92b hsa-mir-135b hsa-mir-607 hsa-mir-146b hsa-mir-210 hsa-mir-129-2 hsa-mir-612 hsa-mir-100 hsa-mir-200chsa-let-7i hsa-mir-345 hsa-mir-193b hsa-mir-484 hsa-mir-138-2 hsa-mir-195 hsa-mir-365-2 hsa-mir-10a hsa-mir-21 hsa-mir-371 hsa-mir-10bhsa-mir-130b hsa-mir-563 hsa-mir-138-1 hsa-mir-565 hsa-mir-572 hsa-mir-9-2 hsa-mir-146a hsa-mir-219-1 hsa-mir-30c-2 hsa-mir-30a hsa-mir-148ahsa-mir-594 hsa-mir-320 hsa-mir-30b hsa-let-7f-1 hsa-mir-222 hsa-mir-374 hsa-mir-18b hsa-mir-505 hsa-mir-648 hsa-mir-196a-2a) 独立转录的内含子miRNA 基因和基因间区miRNA 基因合称为“独立转录miRNA 基因”, 其数量为66种; 来源于文献[6]1337图1 重构的核小体DNA 弯曲度特征信号, 箭头所指为核小体DNA 的对称位置(Dyad axis)的关系, 本文用JASPAR [12]计算了人类64种转录因子在miRNA 基因启动子上结合位点的分布特征, 转录因子名称见表2. JASPAR 提供了每种转录因子的结合位点权重矩阵(PWM). 对于每条miRNA 基因启动子序列, 首先用64种转录因子的PWM 分别进行扫描, 对每个位点, 加和所有的扫描得分并做归一化处理; 然后计算所有序列每个位点的得分, 得到转录因子结合位点的分布特征.2 结果与讨论2.1 弯曲度谱对一段DNA 序列的核小体预测图2显示了弯曲度谱和Segal 等的模型[8]对一段DNA 片段(人类20号染色体: 83.5~86.1 kb)的核小体预测结果. 在两个预测中(黑色粗线和黑色细线), 波峰表示有核小体定位, 波谷表示不稳定核小体或者没有核小体定位. 实验检测的结果用灰线表示, 该段序列包含10个核小体(椭圆表示)[9]. 两者预测结果见表3, 弯曲度谱具有较高的阳性准确率, 其他指标两者相当. 总体来看, 弯曲度谱具有较好的核小体预测能力.2.2 基因启动子区核小体定位分析图3显示了编码基因TSS 周围核小体的分布, 图中对随机序列的预测信号呈一条较平坦的曲线, 而基因启动子序列的核小体定位有明显的分布特征: 在TSS 处有一个强烈的核小体缺失区域(nuclesome-free region, NFR); 在紧接着的下游约200 bp, 有核小体定位; TSS 上游0~−200 bp 处, 有一个较弱的核小体定位信号. 这些特征与文献报道的结论一致[6~9,13,14].TSS 处包含转录起始复合物的结合位点, 基因转录时, 这些位点的染色质必须处于开放状态, 即不能有核小体占位. 因此, TSS 处的核小体缺失是转录过程中染色质所必须具备的特征.利用弯曲度谱, 本文计算了miRNA 基因的启动子区核小体定位特征(图4). 图4(a)是基因间miRNA 基因启动子特征. 根据是否具有独立启动子, 将内含子miRNA 基因分为依赖编码基因转录(依赖转录) 和独立转录两类(见表1), 图4(b)和(c)分别显示这两类启动子区的核小体定位特征. 结果表明: 3类miRNA表2 人类64种转录因子名称MIZF ; NFYA; ESR1; NR3C1; HNF4A ; NF-kappaB ; TBP ; Cebpa ; REST ; BRAC1 ; TFAP2A ; E2F1 ; ELK1 ; GABPA ; ELK4 ; SPI1 ; SPIB ; ETS1 ; FOXF2 ; FOXD1 ; FOXC1 ; FOXL1 ; FOXI1 ; SOX9 ; SRY ; PBX1 ; NKX3-1 ; Pdx1 ; LHX3 ; TLX1-NFIC; MEF2A; SRF; NR2F1; PPARG-RXRA; PPARG; RORA_1; RORA_2; RXRA-VDR; NR1H2-RXRA; TP53; Pax6; REL; NFKB1; RELA; STAT1; TEAD; IRF1; IRF2; MZF1_1-4; MZF1_5-13; RREB1; SP1; YY1; ZNF354; GATA2; GATA3; NHLH1; Myf; TAL1-TCF3; MAX;MYC-MAX; USF1; CREB1; NFIL3; HLF图2 对一段DNA 序列(人类20号染色体: 83.5~86.1 kb)的核小体预测黑色粗线弯曲度谱; 黑色细线Segal 等的模型的预测; 灰线, 实验测定的该段序列的核小体定位信号[9], 椭圆表示实验检测的核小体. 粗虚线弯曲度谱的预测阀值线; 细虚线, Segal 等的模型的预测阀值线2010年5月 第55卷 第14期1338表3 弯曲度谱和Segal 等的模型的预测结果比较a)TP FP FN 阳性准确率(%) 预测准确率(%) 灵敏度(%)弯曲度谱7 1 3 87.5 70 70 Segal 等的模型[8]7 2 3 77.78 70 70 a) 预测位置和实际位置偏移小于30 bp 定义为真阳性(TP), 偏移超过30 bp 定义为假阳性(FP), 两者位置边界相距超过30 bp 定义为假阴性(FN), 阳性准确率=100×TP/(TP+FP),预测准确率=100×TP/实际的核小体总数=100×TP/10, 灵敏度=100×TP/(TP+FN); 实验数据显示该段序列包含10个“核小体”[9]图3 编码基因转录起始位点(TSS)周围核小体定位特征实线是对编码基因启动子序列的计算结果, 虚线是对等长度的随机序列的结果(随机序列共672条, 每条长度为1400 bp). 椭圆表示定位的核小体, 颜色的深度与核小体的定位概率(稳定性)成正比, 横坐标为相对于TSS 的位置, 纵坐标为弯曲度谱信号强度基因(基因间miRNA 、独立转录内含子miRNA 、依赖转录内含子miRNA)均在TSS 处存在核小体缺失区域, 且在TSS 下游约200 bp 处有一个核小体定位. miRNA 基因的这些特征与编码基因相似(图3和4). 这说明TSS 附近的染色质的开放是编码基因和miRNA 基因共有的特征, 是基因转录的基本条件. 已有的研究证实: RNA 聚合酶II(Pol II)不仅参与编码基因的转录, 也参与miRNA 基因的转录. 尽管有些miRNA 基因利用Pol III 转录, 但两类聚合酶具有相同的启动子元件[15,16]. TSS 处的核小体缺失正是这种相似性的反映, 同时, 这个结果也与实验检测结果吻合[6].基因间miRNA 、独立转录内含子miRNA 和依赖转录内含子miRNA 的启动子区核小体定位的差异主要体现以下方面(见表4): (1)基因间miRNA(图4(a))和独立转录内含子miRNA(图4(c))的启动子在TSS 上游0~−400 bp 范围有一个的较宽核小体缺失区域(NFR). 而依赖转录的内含子miRNA 启动子无此特征(图4(b)),其TSS上游的NFR 小于200 bp. (2)依赖转录的内含子miRNA启动子在TSS 上游−200~−400 bp图4 miRNA 基因启动子核小体定位特征(a) 基因间miRNA 基因启动子; (b) 依赖编码基因转录的内含子miRNA 基因启动子; (c) 独立转录的内含子miRNA 基因启动子. 椭圆表示定位的核小体, 颜色的深度与核小体的定位概率(稳定性)成正比, 横坐标为相对于TSS 的位置, 纵坐标为弯曲度谱信号强度表4 独立转录miRNA基因与编码基因的启动子区核小体定位特征a)上游TSS 下游−400~−600 bp −200~−400 bp 0~−200 bp 0 ~200bp 编码基因启动子NP NP(位置不确定) NP(较强) NFR NP 独立转录miRNA基因启动子b)NP NFRNP(很弱) NFR NPa) 核小体定位; NFR: 核小体缺失区域; b) 包括独立转录内含子miRNA基因和基因间miRNA基因的启动子间有一个较强的核小体定位信号, 这与编码基因启动子的特征相似; 基因间miRNA启动子在此区域没有定位的核小体; 独立转录内含子miRNA启动子在此区域的定位信号非常弱.比较图4(b)和图3发现, 依赖转录的内含子miRNA启动子的核小体定位与编码基因的更为相似. 由于该类miRNA基因的转录依赖其所在的编码基因的启动子, 所以实际上两者共享启动子. 而基因间miRNA基因和独立转录内含子miRNA基因(统称为“独立转录miRNA基因”)启动子与编码基因的启动子具有不同的核小体定位特征(尤其在上游0~−400 bp, 见表4). 这表明独立转录miRNA基因与编码基因在转录上有所差异. 由于核小体定位与蛋白(转录因子)的可接近性有关, 因此, 这种差异说明转录因子在两类启动子上的结合位点分布不同. 需要说明的是, 由于本文涉及的miRNA的启动子是通过染色质结构解析而得的[6], 因此本文的结论可能带有一定的偏向性.如前所述, 独立转录miRNA基因启动子在TSS 上游0 ~ −400 bp范围内有一个较宽的核小体缺失区域, 而编码基因和依赖转录的内含子miRNA基因启动子在此范围的核小体缺失区域较窄(<200 bp), 而在0 ~ −200 bp内有较强的核小体定位信号(依赖转录的内含子miRNA基因启动子在此区的核小体定位稍偏向上游). 由于核小体定位会封闭蛋白的结合位点, 阻碍蛋白在DNA上的结合, 因此, 核小体定位信号很强的区域必然没有或者很少有TFBS, 相反, 核小体定位很弱或空缺的区域, 染色质处于开放状态, 适合蛋白的结合, 所以核小体空缺区域应该分布有较多(密)TFBS[6~9,13,14]. 由此推测: 独立转录miRNA基因的TFBS较多地分布在TSS上游0~−400 bp范围内. 图5证实了这种推测. 图5的阴影曲线表示独立转录miRNA基因的启动子区核小体定位的分布, 在TSS 上游0~−400 bp的范围内, 核小体定位信号很弱, 其中明显的核小体缺失区域以灰色框标注; 图5的黑色图5 独立转录miRNA基因启动子的核小体定位特征(图下部阴影曲线)和转录因子位点扫描得分分布(图上部黑色实线)之间的关系, 扫描的转录因子见表2. 椭圆表示定位的核小体,颜色的深度与核小体稳定性成正比. 横坐标为相对于TSS的位置曲线是TFBS在独立转录miRNA基因的启动子区的分布特征, 峰的高度(归一化)表示TFBS的分布密度.从图5可见: 在核小体缺失区域或弱核小体定位区域,转录因子具有较高的密度, 这有力地支持了核小体缺失区域即为转录因子可能结合位点区域的论断,也说明核小体定位不仅参与编码基因的转录调节,也影响miRNA基因的转录.3 结论本文利用弯曲度谱分析了基因启动子区核小体定位特征, 在基因启动子TSS处, 有一个典型的核小体缺失区域; 同时, 发现独立转录的miRNA基因启动子在TSS上游0~−400 bp范围内有一较宽的核小体缺失区域, 这与编码基因和依赖转录的内含子miRNA基因启动子有明显的差异. 本文的研究对于分析miRNA基因的转录具有重要意义. 遗憾的是,由于本文的预测方法是基于DNA序列的, 因此, 较13392010年5月 第55卷 第14期1340难探查核小体定位的组织特异性, 这也是基于序列依赖性预测核小体位置方法的普遍缺陷. 也许利用组织特异的组蛋白修饰信息是研究组织特异核小体定位的一个途径.参考文献1 Lewin B. Gene VIII. New Jerseg: Prentice Hall, 20042 Segal E, Mittendorf Y F, Chen L, et al. A genomic code for nucleosome positioning. Nature, 2006, 442: 772―7783 Henikoff S. Nucleosome destabilization in the epigenetic regulation of gene expression. Nat Rev Genet, 2008, 9: 15―264 Lagos-Quintana M, Rauhut R, Lendeckel W, et al. Identification of novel genes coding for small expressed RNAs. Science, 2001, 294: 853―8585 Pasquinelli A E, Hunter S, Bracht J. MicroRNAs: A developing story. Curr Opin Gene Dev, 2005, 15: 200―2056 Ozsolak F, Poling L L, Wang Z X, et al. Chromatin structure analyses identify miRNA promoters. Genes Develop, 2008, 22: 3172―31837 Abeel T, Saeys Y, Bonnet E, et al. Generic eukaryotic core promoter prediction using structural features of DNA. Genome Res, 2008, 18: 310―3238 Kaplan N, Moore I K, Mittendorf Y F, et al. The DNA-encoded nucleosome organization of a eukaryotic genome. Nature, 2009, 458: 362―3669 Schones D E, Cui K, Cuddapah S, et al. Dynamic regulation of nucleosome positioning in the human genome. Cell, 2008, 132: 887―898 10 Liu H D, Wu J S, Xie J M, et al. Characteristics of nucleosome core DNA and their applications in predicting nucleosome positions. Bio-phys J, 2008, 94: 4597―460411 Widlund H R, Kuduvalli P N, Bengtsson M, et al. Nucleosome structural features and intrinsic properties of the TATAAACGCC repeatsequence. J Biol Chem, 1999, 274: 31847―3185212 Wasserman W W, Sandelin A. Applied bioinformatics for the identification of regulatory elements. Nat Rev Genet, 2004, 5: 276―287 13 Ozsolak F, Song J S, Liu X S, et al. High-throughput mapping of the chromatin structure of human promoters. Nat Biotechnol, 2007, 25:244―24814 Ioshikhes I, Albert I, Zanton S J, et al. Nucleosome positions predicted through comparative genomics. Nat Genet, 2006, 38: 1210―1215 15 Yoontae L, Kim M, Han J, et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO J, 2004, 23: 4051―406016 Johnson S S, Zhang C, Fromm J, et al. Mammalian Maf1 is a negative regulator of transcription by all three nuclear RNA polymerases.Mol Cell, 2007, 26: 367―379。

相关文档
最新文档