真核生物mRNA选择性剪接体检测方法研究进展
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1可变剪接机制介绍
真核生物基因由多个序列长短不同的内含子和外显子组成,经过转录后生成前体mRNA。
前体mRNA通过可变剪接过程,将其内含子去掉,外显子被选择性地组合、连接在一起,形成成熟的mRNA。
通过这种机制基因可以表达出功能各异,甚至具有相互拮抗的功能和结构的蛋白质亚型[1]。
例如,两个由bclx基因转录的mRNA利用不同的5’端剪接位点导致翻译出的蛋白有完全相反的功能,短的能启动凋亡,而长的则能抑制细胞死亡。
而一个基因通过选择性剪接产生几种到几十种剪接体的现象也是很常见的。
有些基
因甚至能够产生成千上万种剪接体。
最突出的例子是果蝇的Dscam 基因,可以通过选择性剪接产生38,000多种剪接体[2]。
选择性剪接有五种基本形式(图1):(1)内含子保留、(2)可变的5’端、(3)可变的3’端、(4)外显子盒、(5)互斥外显子(一组外显子中只选其一)。
自1977年Walter Gilbert 首先提出选择性剪接(Alternative splicing,AS)的概念,到1980年Baltimore在小鼠IgM基因发现第一个选择性剪接产生膜型、分泌型IgM到现在已经预测到约有60%的基因具有一种以上选择性剪接体[5,6,8]。
从选择性剪接涉及的基因分布格局分析,选择性剪接多发生在参与信号传导和表达调节等复杂过程的基因上,如受体、信号传导通路(凋亡)、转录因子等。
已经证明涉及到人类疾病的大量遗传突变被定位在可调节剪接的剪接信号或序列上。
因此,对选择性剪接的深入研究对生物调节,疾病机制和药物筛选等方面都极其重要。
目前对大多数基因的选择性剪接的认识还不是很清楚,而鉴定选择性剪接体是所有这些工作的基础。
2选择性剪接检测方法
2.1RT-PCR法
RT-PCR是一种比较简单的方法,通过PCR克隆全长基因,电泳检测产物的大小可以进行初步鉴定是否具有选择性剪接,还可以初步鉴定有几个剪接体,通过测序可以精确鉴定外显子的剪接情况。
在早期应用这种方法进行基因的选择性剪接鉴定比较多。
如许先国等用RT-PCR方法鉴定了9个新的RHD基因的可变剪接体[13]。
2.2表达标签序列测序和生物信息学
上个世纪九十年代建立起来的表达标签序列(EST)测定方法,加快了基因克隆和基因的外显子选择性剪接的鉴定进程。
构建cDNA文库,通过随机挑选库中的克隆进行序列测定,可以获得成千上万了mRNA序列,对一个基因的ESTs 或mRNA 序列进行聚类,然后对基因的同一类序列之间进行比对,这其中可能具有相对较大的插入或删除,预测基因的各种选择性剪接形式。
每个可能的选择性剪
真核生物mRNA选择性剪接体检测方法研究进展
张晓娜1,2,肖华胜1*
(1.上海生物芯片有限公司/生物芯片上海国家研究中心,上海;
2.上海交通大学,上海。
Email: huasheng_xiao@shbiochip.com)
摘要选择性剪接是指从一个mRNA前体中通过不同的剪接方式(选择不同的剪接位点组合)产生不同的mRNA异构体的过程。
它是一种在转录后RNA水平调控基因表达的重要机制,也是蛋白质组多样性的重要机制。
选择性剪接的鉴定对不同的mRNA异构体的研究具有重要作用。
本文简要综述了检测选择性剪接的主要方法:RT-PCR,生物信息学方,以及生物芯片的进展。
关键词
选择性剪接,外显子,芯片
8
接体可以通过将ESTs 与其对应的基因组序列精确比对获得其确切的选择性剪接形式[3]。
与基因组序列匹配的部分为外显子,外显子之间被内含子所分离,内含子序列在剪接位点具有高度保守性(99.24%的剪接位点符合↓GT - AG↓规则,两侧具有高度保守的一致序列),它们可用来验证内含子- 外显子边界,获得剪接位点相对于基因组序列的准确的位置信息[4]。
Shobhit等在利用EST序列比对方法对28种不同人类组织及肿瘤基因的分析中预测到427个基因至少在一种组织中存在选择性剪接体,其中在脑、睾丸、胎盘中特异表达的剪接体约占了一半;1120个基因表现出肿瘤特异的剪接体[14]。
Qiang Xu和Barmak等也在人类基因EST的研究中对46种不同组织EST分析预测到667个组织特异剪接体,并发现脑组织是特异剪接体数最多的组织[15]。
2.3生物芯片法
生物芯片是一种高通量、快速的检测手段,针对外显子进行探针设计的芯片是可变剪接鉴定的一种非常重要的工具。
目前推出的针对外显子设计探针的商业芯片有Affymetrix公司的外显子芯片和ExonHit公司的基于Affymetrix公司和Agilent公司芯片平台的Splice Array。
Affymetrix公司的外显子芯片是一种基于单个外显子的表达水平而设计探针的光刻原位合成芯片。
在探针选择时基本上包括了整个基因组的经验性和更多的
预测的全部外显子,使检测目标放宽到了整个转录本的所有区域。
探针设计包括了几个数据库如:Ensembl , GenScan , Twinscan, SLAM , 以及对cDNA直接进行比对的RefSeq mRNAs, GenBank mRNAs和dbESTs,每个可能的外显子被定义为一个探针选择区域(Probe Selection Regions, PSR)。
这样多种序列和注释来源的设计方式使检测范围更广。
探针选择区域的平均长度为119个碱基,每个探针选择区域设计最优的四个探针,每个探针长度是25个碱基。
90%以上的的探针选择区域设计4个探针,少量的探针选择区域过短则根据实际长度设计探针,至少包括一个。
考虑到5’和3’端可变剪接位点的检测,如果有序列证明外显子有交叠(如可变受体和供体位点),则把这个外显子分配为多个探针选择区域。
这样就可以检测到剪接位点的变化。
整张芯片包括140万个探针选择区域,超过960万个探针[9,10,11],代表了17000多个功能明确的已知基因,芯片的设计的策略见图二。
这样的以外显子为单位的研究方法使我们能够检
ExonHit公司提供设计方案,Affymetrix和Agilent两家公司负责生产和服务。
Affymetrix公司有Apoptosis Gene Family SpliceArray 和Druggable GeneFamilies SpliceArray。
Agilent公司有GPCRSpliceArray,Ion Channel SpliceArray,Nuclear Recep-tor and Co-regulator SpliceArray,ApoptosisSpliceArray,Cytokine SpliceArray 和Protein KinaseSpliceArray。
最近几年,利用针对外显子设计得芯片的应用研究取得了很好的研究结果,已经有多篇文献报道利用Affymetrix外显子芯片进行Exon特异性表达的研究,包括多种肿瘤特异外显子的研究,如肠癌,乳腺癌,神经胶质瘤等;哺乳动物基因保守性的研究以及人类基因组织特异性外显子的研究。
Paul JGardina等在对结肠癌的研究中使用Affymetrix外显子芯片对20对肿瘤-正常组织进行分析,发现了9个在正常组织与肿瘤组织中有不同剪接情况的基因,并且得到了RT-PCR验证,与EST预测结果重复性很测到外显子水平表达变化,量化了可变剪接模式。
ExonHit公司的Splice Array是基于Affymetrix和Agilent两家公司芯片平台的专业芯片。
ExonHit公司的Splice Array的探针设计策略是利用联合探针设计,针对每个剪接事件的探针设计包括了外显子部分及连接部分(见图3)。
探针 A 用来检测长的和短的亚型,探针 B, C, D 用来检测长的亚型,探针 E 用来检测短的亚型。
这样的探针设计的优点在于对于长的
和短的剪接亚型都能很好的检测。
9
高[16]。
FrenchPJ 等对26个胶质母细胞瘤组织和22个少突胶质细胞瘤组织及6个正常脑组织进行外显子芯片分析,结果发现了49个胶质母细胞瘤特异性剪接,459个少突胶质细胞瘤特异性剪接,分别有47%和33%得到RT-PCR验证[17]。
XingY等在哺乳动物基因保守性的研究中使用外显子芯片对多种组织进行分析, 结果发现人和小鼠基因具有高度保守性[18]。
Tyson A Clark等使用Affymetrix外显子芯片分析了16个不同的正常人组织,在19221个转录本中得到8837个转录本中至少有一个探针存在可变剪接,约占73%。
其中11个基因的17个新的组织特异性外显子得到了RT-PCR验证[9]。
Tony Kwan,Jacek Majewski等用Affymetrix 的EXon芯片研究了人的基因组中的选择性剪接体的变异影响剪接体的表达。
发现了324个基因在SNP和转录的关系上具有重要意义。
其中39%的基因在基因水平有变化,55%的基因在可变剪接水平有变化。
证明了mRNA通过可变剪接的过程,受到这些SNP的遗传调控[19]。
我们也在最近的工作中对5种中国正常人类组织分析,结果发现了三千多个组织特异性的剪接体。
3展望
选择性剪接在生命过程起着十分重要的作用,目前对大部分基因的选择性剪接方式还不是很清楚,那么对选择性剪接鉴定的工作就显得尤为重要和迫切。
前面介绍了三种鉴定方法,而每种方法各有优缺点,分别适应不同的实验需求。
RT-PCR法比较简单,大部分实验室都具备实验条件,而且费用也相对低廉。
但这种方法得到的结果并不确切,需要测序验证,而且通量低。
生物信息学方法鉴定可变剪接几乎不需要实验成本,而且鉴定周期短,用来辅助快速的鉴定,促进实验研究进展。
但是生物信息学鉴定的可变剪接形式只是预测的结果,需要实验去证明。
除此生物信息学方法还存在一些问题。
虽然EST能够提供丰富的转录信息,但EST 的数据具有一定的偏向性, 通常从3’或者5’端测序,则两端的信息比较较丰富而中间区域的信息较少[12]。
并且因为早期高通量EST 测序的主要目的是为了快速发现新基因,EST测序测序的平均质量不高,而且EST 序列还可能被其它序列污染,则得到的结果并不完全可靠。
还有EST测序时,只是对某种细胞的某个状态进行的,并没有覆盖所有的细胞,组织,发育状态。
由于EST质量的问题,使得生物信息学方法得出的结果有局限性。
利用专门的针对外显子设计探针的生物芯片来进行选择性剪接鉴定,是一种新的鉴定方法。
它的检测通量非常大,Affymetrix公司的外显子芯片包括约140万个外显子,也就是做一张这样的芯片一次就能鉴定140万个外显子,是一种强有力的工具。
并且生物芯片结果与生物信息分析结果两者相辅相成,互相补充。
这些新的技术方法的成熟和应用,将为选择性剪接的研究提供更多的技术方法。
参考文献
[1]Roberts GC,Smith CW. Alternative splicing:combinato-rial output fromthe genome. Curr Opin ChemBiol,2002,6(3):375 - 383.
[2]Paul M,Harrison,Anuj Kumar,et al. Aquestion of size:the eukaryotic proteome andthe problems in defiming .Nucleic
Acids Research,2002,30(5):1083 - 1090.[3]Lopez A. Alternative splicing of pre -mRNA:developmentalconsequences andmechanisms of regulation. Ann. Rev. Genet,1998,32:279 - 305.
[4]Modrek B,Lee C. A genomic view of alternative splicing. Na-ture Genet,2002,30:13 -19.
[5]Ast G. How did alternative splicing evolve? Nat Rev Genet,2004, 5(10): 773-782.
[6]Cartegni L, Chew S L, Krainer A R. Listening to silence andunderstanding nonsense: exonic mutations that affect splicing.
Nat Rev Genet, 2002, 3(4): 285-298.
[7]Legler T J, Maas J H, Kohler M, Wagner T, Daniels G L, PercoP, Panzer S. RHDsequencing: a new tool for decision making on
transfusion therapy and provision of Rh prophylaxis. Transfu-
sion Med, 2001, 11(5): 383-388.
[8]Nuno Andre Faustino ,Thomas A.Cooper.Pre-mRNA splicingand human disease.genes&development,2003,17:419-437[9]Tyson A Clark,etc.Discovery of tissue-specific exons using com-prehensive human exon microarrays.Genome Biology 2007, 8:
R64
[10]Xing Y,Ouyang ZQ,etc.Assessingthe Conservation of Mamma-lian Gene Expression UsingHigh-Density Exon Arrays.Mol.
Biol. Evol. 2007, 24(6):1283–1285.
[11]Karen Kapur,etc.Exon arrays provide accurate assessments ofgene expression.Genome Biology. 2007, 8:R82
[12]李稚锋,,王正志,张成岗,真核基因可变剪接现状与展望,生物信息学,2004,2:35-38。
[13]许先国,吴俊杰等,鉴定9个新的RHD基因mRNA可变剪接体.遗传, 2006, 28(10):1212-1218。
[14]Shobhit G, etc. Strengths and weaknesses of EST-based pre-diction of tissue-specific alternative splicing. BMC Genomics.
2004, 5:72.
[15]Xu Q,etc.Genome-wide detection of tissue-specific alternative
10
splicing in the human transcriptome. Nucleic Acids Research.
2002,30(17): 3754-66.
[16]Paul J Gardina,etc.Alternative Splicing and differential gene ex-pression in colon cancer detectedby a whole genome exon array.BMC Genomics.2006,7:325.
[17]FrenchPJ,etc. Identification of differentially regulatedsplicevariants andnovel exons in glial brain tumors using exon ex-
pression arrays. Cancer Res. 2007;15;67(12):5635-42.
[18]XingY,etc. Assessingthe conservation of mammalian gene ex-pression usinghigh-density exon arrays. Mol Biol Evol. 2007;
24(6):1283-5.
[19]Tony Kwan,Jacek Majewski,etc. Genome-wide analysis oftranscript isoform variation in humans. Nature Genetics. 2008,
40(2):225-31.
Progress on the methodof identification of alternative splicing
Xiaona Zhang1,2, HuashengXiao1*
(1.Shanghai Biochip Co.Ltd/ National EngineeringCenter for Biochip at Shanghai,Shanghai;
2. Shanghai JiaotongUniversity,Shanghai)
Abstract Alternative splicing is the process from pre-mRNA to several different mRNA splice isoformby different splicingmodel.
It is the most important mechanism for controlling gene expression andincreasingdiversity in the proteomic. Identification of alternative
splicing is basis to study the mechanismof alternative splicing. In this paper we briefly reviewthe main methodof identify alternative
splicing is RT-PCR,Bioinformatics,Exon microarray.
Key words Alternative splicing, exon, m
icroarray
11。