可变剪接与蛋白质组多样性及其调节机制解读
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可变剪接与蛋白质组多样性及其调节机制
武春晓 2001级博士生专业:免疫学导师:马大龙教授
前言
可变剪接是指从一个mRNA 前体中通过不同的剪接方式(选择不同的剪接位点组合)产生不同的mRNA 剪接异构体的过程。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制。剪接过程受多种顺式作用序列和反式作用因子相互作用调节。包括SR 和hnRNP 家族蛋白在内的多种剪接因子参与这一调节过程。转录机器(machine )也参与可变剪接的调节。本文将讨论:一. 可变剪接与蛋白质组多样性二. 可变剪接的调节机制。.
第一部分可变剪接与蛋白质组多样性5
据预测,人类基因组可能有约35,000个基因,果蝇约14,000个,而简单的模式生物线虫约19,000个基因。生物的复杂性与其基因组基因数量似乎存在明显差异。原因在蛋白质组。基因重排,RNA 编辑,和可变剪接等机制可以从一个基因产生多种蛋白,从而使蛋白质组中蛋白质的数量超过基因组中基因的数量。其中,从影响的基因数量和生物种类范围来
-看,可变剪接是扩大蛋白质多样性的最重要的机制14。
一、可变剪接的频率。5,6
1. 5%。从1977年Walter Gilbert提出可变剪接概念,1980年Baltimore 在小鼠IgM 基因发现第一个可变剪接产生膜型、分泌型IgM ,至2001年,用经典分子生物学实验的方法研究,一共仅发现了数百种有可变剪接的基因。并推测在高级真核细胞生物约5%的基因有可变剪接。
2. 35%-60%。高通量的基因组测序和EST 测序,使得生物信息学的方法研究可变剪接成为可能。EST 来源于完全加工的mRNA, 它们提供了一个广泛的mRNA 多样性的样品库。这种多样性可以用计算机分析。最近两年,多个研究小组通过不
同的生物信息学的方法,从整个人基因组的水平进行分析,结果一致显示约35%-60%的人基因有可变剪接形式。而且,由于对大多数基因来说,每个基因只测了很少几EST 甚至没有EST ;EST 不是全长的mRNA ,多位于mRNA 的5’和3’端;EST 来源于有限的组织和发育阶段;很有可能存在有更多的可变剪接而在现在的EST 库中没有显示。因此实际可变剪接的频率可能比预测的更高。这还有待于建立新的高通量的分子生物学方法,如生物芯片的方法,以进一步实验验证。
二、单个基因可变剪接产生的多样性5。
一个基因可以通过如下几种方式产生多个转录体,如不同的转录起始位点,可变剪接,选择不同的加尾信号位点,RNA 编辑等。可变剪接包括3种类型:1. 内含子的保留;2. 可变外显子的保留或切除;3. 3’和5’剪接位点的转移(shift )导致外显子的增长或缩短。可变剪接对蛋白质结构的影响也是多样性的,如多肽链中一个到数百个氨基酸的增加或减少;某功能域的有无;如果可变剪接使读码框架改变,则可能无法有效翻译,mRNA 被监视系统降解。
单独一个基因通过可变剪接产生的十几种剪接异构体的现象很常见。有些基因甚至能够产生成千上万种剪接异构体。最突出的例子是果蝇(Drosophila melanogaster )的Dscam 基因,可以通过可变剪接产生38,000多种mRNA 异构体。Dscam 基因编码一个神经元轴突定向受体,它细胞外有一个由10个免疫球蛋白重复序列组成的结构域,第2,3,7个免疫球蛋白重复序
列分别由第4,6,9号外显子编码,4号外显子盒(cassette )有12个变异体,6号外显子有48个变异体,9号外显子有33个变异体,再加上17号外显子的2个变异体。每个成熟的Dscam mRNA 分别只有一个有4,6,9,17号外显子的变异体,由此理论推测Dscam 基因共有12×48×33×2=38016剪接异构体。对Dscam 基因50个cDNA 克隆随机测序发现了49种不同的剪接异构体,说明实际存在的剪接异构体即使没有理论那么多,也至少有上千种。人的Neurexins, n-Cadherins, calcium-activated potassium channels等基因也有类似的高度多样的剪接异构体。
上述现象非常类似于淋巴细胞TCR 或免疫球蛋白的胚系基因重排,不同之处在于后者发生在DNA 水平,前者发生在RNA 水平。基因重排产生的高度多样抗原受体库可以识别高度复杂的自身和异己抗原。而Dscam 基因的转录异构体可能有神经系统的发育有关。神经元的定向迁移和相互连接可能是发育过程中最复杂的事件。果蝇约有25,000个神经元,要使它们生长的轴突准确的,可重复性的到达目的地,使这些神经元准确的连接在一起,必然需要一个特殊的系统。Dscam 基因的38,000多种mRNA 异构体,每个异构体各编码一个不同的受体,每个受体具有识别不同分子定向信号的潜能,从而有能力指导各个生长的轴突到达准确的位置。
如果将可变剪接与其它RNA 加工过程(如RNA 编辑)联系起来共同考虑,基因产物会更复杂。例如,果蝇的para 基因(voltage-gated action potential sodium channel)有13个可变外显子,可编码1536种不同的mRNA ,另外,para 的转录体还要经过在11个已知位点的RNA 编辑,这样理论上一共可以产生1,032,192个不同的para 转录异构体。
根据受可变剪接影响的基因的概率,以及单个基因可能产生的可变剪接体的数目,足以表明可变剪接对蛋白质组多样性的巨大影响。
三、可变剪接的功能和生物学意义5,11
1. 可变剪接是在RNA 水平调控基因表达的机制之一。
一个基因通过可变剪接产生多个转录异构体,各个不同的转录异构体编码结构和功能不同的蛋白质,它们分别在细胞/个体分化发育不同阶段,在不同的组织,有各自特异的表达和功能。因此,可变剪接是一种在转录后RNA 水平调控基因表达的重要机制。
目前已知的可变剪接异构体中,只有一小部分明确确定了功能和生物学意义。第一个确定的可变剪接异构体功能是 IgM 基因,其末端最后两个外显子的可变剪接,决定了所编码的膜型/分泌型IgM 的产生。最著名的例子是果蝇性别决定系