miRNAs及其靶基因的识别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2007年 9月第27卷 第9期
基础医学与临床
Basic &ClinicalMedicine Sep te mber 2007Vol .27 No .9
收稿日期:2007-01-24 修回日期:2007-04-10
3
通讯作者(correspond i n g author):sxr@vi
文章编号:100126325(2007)0921063203
短篇综述
mi RNAs 及其靶基因的识别
宋 宝,宋现让3
,刘 杰,魏 玲
(山东省肿瘤防治研究院基础研究中心,山东济南250117)
摘要:m icr oRNA s (m i RNA s )是人类新发现的一类非编码小分子RNA,广泛分布于真核细胞内。m i RNA s 通过与靶
基因互补位点配对结合,在转录后水平负性调控靶基因的表达,参与生长发育、细胞增殖、细胞凋亡、细胞分化等生命过程。据推测,大约1%的人类已知基因编码m i RNA s,而m i RNA s 可调控人类基因组中10%~30%的基因。本文就如何识别m i RNA s 及其靶基因作一简要介绍。
关键词:m icr oRNA s (m i RNA s );非编码RNA;靶mRNA
中图分类号:R 34916 文献标志码:A
Recogniti on of m icr oRNA s and its 2targeting genes
S ONG Bao,S ONG Xian 2rang 3
,L I U J ie,W E I L ing
(Cancer Research Center,Shandong Tumor Hos p ital and I nstitute,J inan 250117,China )
Abstract: m icroRNA s (m i RNA s )are a recently discovered fam ily of s mall non 2coding RNA s,which exist in eu 2karyotes and regulate gene exp ression post 2transcri p tionally by binding to comp lementary sites on target mRNA s .M i RNA s p lay i m portant roles in regulation of cell p roliferation,devel opment,apop tosis and cell differentiation .It ’s p redicted that about 1%human known genes encode m icroRNA s and m icroRNA s m ay regulate 10~30%of the genes in the human genome .The paper focus on the know ledge about how t o recognize m iRNA s and identify their target mRNA s .
Key words:m icr oRNA s (m i RNA s );non 2coding RNA;target mRNA
1993年Lee 等[1]
首次在线虫中识别出一种长
度为21bp 的单链、非编码小分子RNA L I N 24,通过抑制L I N 214蛋白翻译进而调控线虫发育。近几年来,人们陆续在真核细胞中识别出许多结构和功能与之类似的小RNA 分子,发现这些小分子并不是mRNA 或其他RNA 的简单破碎产物,而是一个庞大的基因家族,在调控基因表达中发挥重要作用,人们将这一类小RNA s 称之为“m icroRNA s ”(m iRNA s )。根据计算机测算,大约1%的人类已知基因可能编码m i RNA s,而m i RNA s 可能调控人类基因组中10%
~30%的基因[2]
。有关m i RNA 的生物发生、作用机
制等已有诸多报道,但是对如何识别m iRNA 及其靶
基因还不很明了,本文在此作一简要介绍。
1 m i RNA s 的识别
2003年,Am bros 等
[3]
提出了m iRNA s 的判断标
准。
(1)m iRNA s 表达标准:①应用Northern 杂交方
法能够检测到大约21nt 的小RNA;②从小分子RNA 构建的cDNA 文库中能获得大约21nt 的序列,这些序列与基因组序列精确匹配。
(2)m iRNA s 生成标准:①具有发夹结构前体,
其中一条臂含有m iRNA s序列,发夹具有最低自由能,结构中不含大的内环或泡;②m iRNA s序列及其二级结构前体具有进化保守性;③随D icer酶功能降低,前体物不断积累。
上述判断标准中表达①和生成②是最必要的条件。
最近几年,m i RNA s研究开始飞速发展,人们应用各种方法寻找和识别各种组织细胞基因组中的m i RNA s分子。多数实验室采用分子克隆技术和生物信息学相结合的方法识别m i RNA s。有的采用构建小RNA s分子克隆文库的方法,首先从细胞中提取细胞总RNA,并进一步分离得到约16~28nt的小分子RNA,将这些小RNA进行反转录,得到cDNA 第一链,然后PCR扩增得到双链cDNA,将双链cDNA克隆入质粒载体并进行测序,应用B lastn软件在该物种基因组数据库中查询,以判断这些分子是m i RNA s还是mRNA s、tRNA s、rRNA s等分子的降解产物;之后再应用一种被称为“mfold”的程序分析具有同源性基因序列的二级结构,将筛选出的小分子RNA进行Northern blot等检测,从中鉴定出符合标准的小RNA。M akarev等[4]采用克隆法识别了2个水蛭眼睛特异性m iRNA s;Sunkar等[5]识别了20个水稻的m iRNA s。
根据比较基因组学原理并结合生物信息软件来进行识别m i RNA s也是一种好方法。已知m i RNA s 前体具有发夹结构且具有相当大的保守性、成熟m i RNA s长度约为21nt、由D icer酶从发夹状前体上切割得来等,根据这些特征在某一物种基因组中进行搜索,查找到符合要求的基因序列,然后应用生物信息软件对这些序列进行评估。这种软件可以根据所预测“m iRNA s”折叠部位上游和下游序列的保守性、内部“膨出”部位的碱基数等特点与对照组(已知的m i RNA s序列)进行比较,计算评分,得分较高的序列为潜在的m iRNA s,之后再应用定量RT2PCR、Northern blot等方法对这些潜在的“m iRNA s”进行进一步验证。目前,国际上较为普遍使用的两个生物信息学软件是m i R seeker和m i R scan。Chatterjee 等[6]在疟蚊中识别了41个m i RNA s;Cui等[7]在单纯疱疹病毒的基因组中找到15个m i RNA s。
近来,人们建立了许多m iRNA s网站,如htt p:// m /、http://www.ma.uni2heidel2
berg.de/app s/z m f/argonaute/interface/、http://m ir2 .t w/等,人们可以从中查询m i RNA基因的名称、来源、所预测的靶基因及其功能等相关信息。
2 靶基因的识别
m iRNA s通过与靶mRNA完全或部分互补配对从而负性调控靶基因表达。由于m iRNA s分子只有19~25bp大小,可以想象在整个基因组中能够与其互补配对的靶基因有很多,而且m i RNA s与其靶mRNA并不完全匹配,要辨别出哪些才是m iRNA s 的精确靶mRNA是一件相当复杂的工作。
人们通过分析已知的m i RNA s及其靶基因,发现靶基因通常具有以下特征:(1)在靶基因3′UTR 区具有与m iRNA s5′端至少7个连续核苷酸的完全配对区域(一般为第2~8碱基),这一区域在其他物种中具有同源保守性;(2)m i RNA s第2~8碱基的七聚体与靶mRNA必须完全配对才可发挥抑制作用;(3)m iRNA s的5′端比3′端具有更多的碱基与靶基因配对,而3′端是决定m iRNA s家族成员特异性的主要因素;(4)m i RNA s与靶mRNA之间具有G ∶U配对,G∶U配对的多少是影响热力学稳定性的因素;(5)每个m i RNA可能有许多靶mRNA,而多个m i RNA s可以结合在同一个基因上,靶位点之间可以有不同程度的重叠。另外,靶位点的临近区域对m i RNA s的特异性有重要影响,比如在L I N241基因上,两个连续的let27位点之间的一个27nt核苷酸插入序列对其发挥调控功能是必不可少的[8]。
研究人员根据上述已知m iRNA s及其靶mRNA 之间的某些特征制定不同运算规则,并开发出相应的计算机软件来进行推断可能的靶基因。Thadani 等[9]应用“M i R scan”算法进行识别靶基因。该软件能够特异性识别2个物种间的同源发卡结构,通过已知m i RNA s的训练后,去给那些发卡结构片段打分,他们应用该方法进行了预测线虫和鼠类m iRNA s 的靶基因。“m iRanda”也是一种预测靶基因的运算方法,它主要是根据m iRNA s∶mRNA位点的特异性原则,即碱基配对优化互补、m iRNA∶mRNA二联体具有最小自由能量和不同物种间靶序列具有保守性等特征,对哺乳动物的靶mRNA进行预测[10]。“PicTar”运算方法是根据m iRNA∶mRNA结合的动