可变剪接与疾病的生物信息学研究概况

合集下载

生物信息学中RNA序列分析与可变剪接预测方法研究

生物信息学中RNA序列分析与可变剪接预测方法研究

生物信息学中RNA序列分析与可变剪接预测方法研究RNA序列是生物信息学研究中的重要内容之一。

它是由DNA转录而来的一种核酸分子,在细胞中具有多种功能,如编码蛋白质、调控基因表达等。

随着高通量测序技术的发展,越来越多的RNA序列数据被产生出来,这使得RNA序列分析与可变剪接预测方法的研究变得尤为重要。

RNA序列分析是对RNA序列进行全面的研究和挖掘,以了解其功能和作用机制。

在RNA序列分析中,首先需要对RNA序列进行质量控制和清洗,以确保后续分析的准确性和可靠性。

接下来,常见的RNA序列分析方法包括差异表达分析、富集分析、转录因子结合位点预测等。

其中,差异表达分析可以帮助我们发现在不同条件下表达水平发生显著变化的基因,从而了解这些基因在生物过程中的功能和调控机制。

富集分析则可以帮助我们发现在特定的功能模块或通路中富集的基因,从而揭示这些功能模块或通路在生物过程中的作用。

转录因子结合位点预测可以帮助我们发现哪些转录因子与RNA序列相互作用,从而推断其可能的调控关系。

RNA的可变剪接是由于同一基因在转录过程中剪接方式的不同而产生的多种剪接异构体。

可变剪接对于生物体的功能多样性和复杂性起到重要作用。

因此,预测可变剪接的方式也成为RNA序列分析的一个重要研究方向。

常见的可变剪接预测方法包括基于比对的方法和基于组装的方法。

基于比对的方法首先对RNA序列进行比对,然后通过分析比对结果来预测可变剪接位点。

基于组装的方法则将RNA序列比对到基因组参考序列上,然后通过组装比对结果来预测可变剪接位点。

这些预测方法的准确性和可靠性对于研究人员能否准确地预测和理解可变剪接的功能至关重要。

除了RNA序列分析和可变剪接预测方法外,还有一些与RNA序列相关的研究方法和工具。

例如,RNA二级结构预测可以帮助我们了解RNA序列中的空间结构和相互作用方式,有助于理解其功能和调控机制。

RNA序列比对和聚类分析可以帮助我们了解不同物种或不同基因之间的相似性和差异性。

《肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》篇一一、引言肺腺癌是一种常见的肺癌类型,其发病率和死亡率在全球范围内持续上升。

由于肺腺癌的复杂性和异质性,研究其发生发展的分子机制对治疗和预防具有重要意义。

随着新一代测序技术的发展,可变剪接事件在肺腺癌中的研究逐渐成为热点。

本文旨在探讨肺腺癌特异性可变剪接事件的识别与分析,以期为肺腺癌的诊疗提供新的思路和方法。

二、可变剪接事件概述可变剪接是指在基因转录过程中,由于内含子的保留或外显子的选择性拼接,导致同一基因产生多种不同的剪接产物。

这些剪接产物在蛋白质编码、转录调控等方面具有重要作用。

在肺腺癌中,可变剪接事件的发生与肿瘤的发生、发展和转移密切相关。

因此,研究肺腺癌中的可变剪接事件,有助于揭示肺腺癌的发病机制,为临床诊断和治疗提供新的靶点。

三、肺腺癌特异性可变剪接事件的识别为了识别肺腺癌特异性可变剪接事件,本研究采用RNA-Seq 等高通量测序技术,对肺腺癌组织及正常肺组织进行测序分析。

通过比对分析,我们发现肺腺癌组织中存在大量可变剪接事件。

其中,部分事件在肺腺癌中具有特异性,可能与肺腺癌的发生、发展密切相关。

我们通过生物信息学分析方法,对识别到的可变剪接事件进行分类和筛选。

首先,根据剪接事件的类型(如外显子跳跃、内含子保留等),将其分为不同类别。

然后,结合文献报道和数据库信息,对筛选出的特异性剪接事件进行功能注释和预测。

最后,通过实时荧光定量PCR和Western blot等技术,验证了部分剪接事件的表达情况。

四、肺腺癌特异性可变剪接事件的分析通过对识别到的肺腺癌特异性可变剪接事件进行分析,我们发现这些事件主要涉及肿瘤相关基因、信号通路和转录调控等方面。

其中,部分剪接事件可能导致蛋白质编码序列的改变,从而影响蛋白质的功能和结构。

此外,我们还发现这些剪接事件在肺腺癌的不同阶段和亚型中存在差异,提示其在肺腺癌发生、发展中的作用可能具有阶段性和亚型特异性。

五、结论本研究通过高通量测序技术和生物信息学分析方法,成功识别了肺腺癌特异性可变剪接事件。

可变剪接在遗传学研究中的应用

可变剪接在遗传学研究中的应用

可变剪接在遗传学研究中的应用可变剪接是一种广泛存在于真核生物中的基因表达调控机制。

自上世纪70年代发现以来,人们逐渐认识到可变剪接在生命科学中的重要性和应用潜力。

在遗传学研究中,可变剪接已经成为一个热门的领域,被广泛用于研究各种生命现象,如生长发育、疾病发生、表观遗传变异等。

本文将介绍可变剪接在遗传学研究中的应用,重点探讨可变剪接在疾病诊断和药物开发中的意义。

一、基因可变剪接的定义及其重要性基因剪接是真核生物在mRNA转录过程中,将大量非编码序列(内含子)从初级转cript中剪除,剩余部分经过拼接形成成熟mRNA的过程。

在这个过程中,可变剪接是指同一基因可产生多种亚型mRNA的现象,这些亚型诱导的蛋白质具有不同的结构和功能特征。

可变剪接可以大幅度增强生物体对基因信息的表达和运用,也可以通过调控表达多种形态的蛋白质来影响机体形态和功能。

在许多细胞特异性和组织特异性表达的动物基因中,可变剪接现象尤为常见。

随着技术的进步和对可变剪接的深入研究,越来越多的证据表明可变剪接在常见疾病、遗传疾病的发生中发挥了重要作用。

二、可变剪接在常见疾病的诊断中的应用1、癌症研究癌症是世界范围内最常见的疾病之一,具有异质性和复杂性。

许多肿瘤标志物也来自可变剪接产物和可变剪接因子。

可变剪接缺陷和异常播放被认为是许多肿瘤的发生和发展的一个关键因素。

研究已表明,癌症细胞中存在大量的可变剪接事件,这些事件产生的蛋白质可能会影响癌症的病理进程并诱导癌症征象。

因此,可变剪接在癌症的早期诊断和治疗中具有巨大的应用潜力。

2、糖尿病研究糖尿病是一种常见的慢性代谢性疾病,主要由胰岛素异常分泌和胰岛素抵抗所引起。

与正常人相比,2型糖尿病患者的可变剪接活动水平更高。

一项研究表明,2型糖尿病患者中可变剪接的不同,可能导致过度表达不良的胰岛素亚型,在胰岛素分泌和胰岛素抵抗上产生了负面影响。

此外,糖尿病相关SNP的剪接性质与糖尿病的发病率密切相关。

可变剪接可以影响胰岛素的功能和胰腺的分泌,因此在糖尿病的诊断和治疗中具有潜力。

《肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》篇一一、引言肺腺癌是一种常见的肺癌类型,其发病率和死亡率均居高不下。

近年来,随着基因组学和生物信息学技术的快速发展,对于肺腺癌的研究已经从传统的组织病理学研究逐渐转向了分子层面。

在肺腺癌的研究中,基因的异常表达和剪接变异成为了一个重要的研究方向。

其中,可变剪接事件是导致基因表达多样性的重要原因之一。

因此,对肺腺癌特异性可变剪接事件的识别与分析,对于深入了解肺腺癌的发病机制、诊断和治疗具有重要意义。

二、材料与方法(一)材料本研究选取了肺腺癌组织样本及正常肺组织样本,通过高通量测序技术获取了样本的基因表达数据。

(二)方法1. 数据预处理:对基因表达数据进行质量控制和标准化处理。

2. 可变剪接事件识别:利用生物信息学分析工具,对标准化处理后的数据进行可变剪接事件的识别。

3. 事件分类与筛选:根据可变剪接事件的类型和表达水平,进行事件分类与筛选,确定肺腺癌特异性可变剪接事件。

4. 统计分析:对筛选出的肺腺癌特异性可变剪接事件进行统计分析,分析其在肺腺癌发生、发展中的作用。

三、结果(一)可变剪接事件识别结果通过生物信息学分析,我们成功识别了大量可变剪接事件。

这些事件包括外显子跳跃、内含子保留、选择性5'剪接位点和选择性3'剪接位点等类型。

(二)肺腺癌特异性可变剪接事件筛选结果在所有识别出的可变剪接事件中,我们筛选出了一批在肺腺癌组织中特异性表达的剪接事件。

这些事件主要涉及一些与肺癌发生、发展相关的基因,如TP53、KRAS、EGFR等。

(三)统计分析结果通过对筛选出的肺腺癌特异性可变剪接事件进行统计分析,我们发现这些事件在肺腺癌组织中的表达水平与正常肺组织相比存在显著差异。

进一步分析表明,这些事件在肺腺癌的发生、发展过程中可能起着重要的调控作用。

四、讨论本研究通过高通量测序技术和生物信息学分析,成功识别了肺腺癌特异性可变剪接事件。

这些事件主要涉及一些与肺癌发生、发展相关的基因,表明可变剪接在肺腺癌的发病机制中起着重要作用。

基因可变剪接的生物学意义

基因可变剪接的生物学意义

基因可变剪接的生物学意义基因可变剪接是一种广泛存在于真核生物中的基因表达调控机制。

它使得一个基因可以通过剪接不同的外显子,产生多个不同的转录本和蛋白质。

这一现象的生物学意义非常重要,它不仅扩大了基因的功能潜力,还可以增加基因组的复杂度和多样性。

基因可变剪接可以增加基因功能的多样性。

通过剪接不同的外显子,一个基因可以产生多个不同的转录本,从而编码多个具有不同功能的蛋白质。

这种多样性在许多生物学过程中起着重要作用,比如细胞分化和发育过程中的基因调控。

通过选择不同的外显子组合,细胞可以产生不同的蛋白质亚型,从而适应不同的环境和功能需求。

这种基因功能的多样性为生物体的适应性演化提供了重要的基础。

基因可变剪接可以增加基因组的复杂度。

通过剪接不同的外显子,一个基因可以产生多个转录本,这些转录本可以在不同的组织和细胞类型中表达。

这种组织特异性的剪接可以增加基因组的复杂度,从而使得基因可以在不同的组织和细胞类型中发挥不同的功能。

例如,在人类基因组中,约有90%的基因存在可变剪接现象,这种复杂性使得生物体能够更加精细地调控基因表达。

基因可变剪接还可以对基因功能进行调控。

通过剪接不同的外显子,细胞可以选择性地调控基因的表达水平。

一些外显子具有调控元件的功能,它们可以通过剪接的方式参与转录调控网络,从而影响基因的表达。

这种转录后调控机制可以使得基因表达更加灵活和精细,从而适应细胞内外环境的变化。

基因可变剪接还与一些疾病的发生和发展密切相关。

许多疾病,如癌症和神经系统疾病,都与基因可变剪接异常有关。

一些研究表明,基因可变剪接的异常可以导致基因的错义剪接、缺失剪接或错位剪接,从而产生功能异常的蛋白质。

这些异常的蛋白质可能会对细胞的正常功能产生不利影响,从而导致疾病的发生和发展。

因此,研究基因可变剪接的生物学意义对于理解疾病的发生机制和寻找治疗方法具有重要的意义。

基因可变剪接是一种重要的基因表达调控机制,它可以增加基因功能的多样性,增加基因组的复杂度,调控基因的表达水平,并与一些疾病的发生和发展密切相关。

《肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》篇一一、引言肺腺癌是肺癌的主要亚型之一,具有高度异质性和复杂的遗传背景。

近年来,随着基因组学和生物信息学技术的不断发展,可变剪接事件在肺腺癌发生发展中的作用逐渐受到关注。

可变剪接是一种重要的转录后修饰过程,能够产生多种剪接异构体,从而影响基因的表达和功能。

因此,识别和分析肺腺癌特异性可变剪接事件对于深入了解肺腺癌的发病机制、诊断和治疗具有重要意义。

本文旨在通过生物信息学方法,对肺腺癌特异性可变剪接事件进行识别和分析,以期为肺腺癌的研究提供新的思路和方法。

二、材料与方法1. 数据来源本研究使用的肺腺癌基因表达数据和可变剪接事件数据来自公共数据库(如TCGA、GEO等)。

2. 生物信息学分析方法(1)基因表达谱分析:利用R语言和相关生物信息学软件,对肺腺癌基因表达数据进行预处理、标准化和差异表达分析,筛选出与肺腺癌相关的基因。

(2)可变剪接事件识别:采用已知的可变剪接事件数据库和新一代测序技术,对肺腺癌样本进行可变剪接事件的检测和识别。

(3)特异性可变剪接事件分析:结合基因表达谱分析和可变剪接事件识别结果,筛选出肺腺癌特异性可变剪接事件,并进行功能注释和通路分析。

(4)验证实验:通过RT-PCR、Western blot等实验方法,对部分关键可变剪接事件进行验证。

三、结果1. 基因表达谱分析结果通过对肺腺癌基因表达数据进行差异表达分析,我们筛选出了一批与肺腺癌相关的基因。

这些基因在肺腺癌组织中的表达水平与正常组织相比存在显著差异,可能参与了肺腺癌的发生发展过程。

2. 可变剪接事件识别结果通过新一代测序技术和已知的可变剪接事件数据库,我们检测和识别了大量的可变剪接事件。

这些事件涉及到的基因涵盖了多种生物学功能,包括细胞增殖、凋亡、侵袭和转移等。

3. 肺腺癌特异性可变剪接事件分析结果结合基因表达谱分析和可变剪接事件识别结果,我们筛选出了一批肺腺癌特异性可变剪接事件。

《2024年肺腺癌特异性可变剪接事件的识别与分析》范文

《2024年肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》篇一一、引言肺腺癌作为最常见的肺癌类型之一,近年来发病率逐年上升,对人们的健康构成严重威胁。

在癌症基因组学研究中,RNA可变剪接在癌症的生物过程中发挥着重要作用。

而肺腺癌中存在大量特异性可变剪接事件,对这些事件的识别与分析有助于理解肺癌的发生机制、预后判断和潜在治疗策略的开发。

本文将探讨肺腺癌特异性可变剪接事件的识别与分析,为肺腺癌的深入研究提供理论支持。

二、肺腺癌特异性可变剪接事件概述可变剪接是指通过改变前体mRNA的剪接方式,从而产生多种不同的mRNA剪接异构体的过程。

在肺腺癌中,由于基因组的不稳定性和表达调控的复杂性,导致可变剪接事件的发生频率和类型均有所增加。

这些特异性可变剪接事件可能涉及肿瘤细胞的增殖、侵袭、转移等过程,成为肺腺癌发生发展的重要机制。

三、肺腺癌特异性可变剪接事件的识别(一)生物信息学分析利用生物信息学工具,如RNA-seq数据和基因组注释文件,对肺腺癌样本进行全基因组可变剪接事件的识别。

通过比较正常组织和肿瘤组织的转录组数据,发现差异表达的可变剪接事件。

(二)实验验证利用PCR、RT-PCR、 Western Blot等实验方法,对识别的可变剪接事件进行验证。

通过比较不同肺癌细胞系和正常细胞的可变剪接异构体表达水平,确定其特异性。

四、肺腺癌特异性可变剪接事件的分析(一)功能分析通过基因功能富集分析、蛋白质互作网络分析等方法,探讨肺腺癌特异性可变剪接事件的功能。

这些事件可能涉及肿瘤细胞的增殖、侵袭、转移、凋亡等过程,以及与肿瘤发生发展相关的信号通路。

(二)临床意义分析结合患者的临床资料,分析肺腺癌特异性可变剪接事件与患者预后之间的关系。

通过分析不同剪接异构体的表达水平与患者生存期、复发率等指标的关系,评估这些事件在临床上的应用价值。

五、结论通过对肺腺癌特异性可变剪接事件的识别与分析,我们了解了这些事件在肺癌发生发展过程中的重要作用。

可变剪接的生物信息数据分析综述

可变剪接的生物信息数据分析综述

可变剪接的生物信息数据分析综述章天骄【摘要】前体mRNA的可变剪接是扩大真核生物蛋白质组多样性的重要基因调控机制.可变剪接的错误调节可以引起多种人类疾病.由于高通量技术的发展,生物信息学成为可变剪接研究的主要手段.本文总结了可变剪接在生物信息学领域的研究方法,同时也分析并预测了可变剪接的发展方向.%Alternative pre - mRNA splicing is an important gene regulation mechanism for expanding proteomic diversity in higher eukaryotes. The misregulation of alternative splicing underlies many human diseases. With the development of high - throughput technology, bioinformatics becomes to the main method in study of alternative splicing. This article summarizes the bioinformatics methods in alternative splicing research, as well as analyzes and predicts the direction of alternative splicing.【期刊名称】《生物信息学》【年(卷),期】2012(010)001【总页数】4页(P61-64)【关键词】可变剪接;高通量技术;生物信息学【作者】章天骄【作者单位】哈尔滨工业大学计算机科学与技术学院,哈尔滨150001【正文语种】中文【中图分类】Q811可变剪接是指一个前体mRNA通过不同的剪接方式(选择不同的剪接位点组合)产生不同mRNA剪接异构体的过程。

基因剪接和可变剪切在疾病发生中的作用

基因剪接和可变剪切在疾病发生中的作用

基因剪接和可变剪切在疾病发生中的作用随着科学技术的不断更新,生物学研究也日新月异,其中基因剪接和可变剪切技术的发展成为了疾病研究的一个热点话题。

现代医学研究发现,多种疾病都与基因剪接和可变剪切紧密相关,这些技术不仅有改善疾病治疗的前景,也有助于加深我们对基因调节和表达的理解。

什么是基因剪接?基因是掌握生命本质的“基础设施”,是生命中最基本的物质,但基因并不像传统中所说的那样是不可变的,事实上基因的构成存在一些变异,其中最普遍的变异形式是剪接(splicing)。

基因剪接指的是在转录过程中,RNA分子从原始RNA中剪切出部分序列,随后剩余序列通过连接并在核外翻译成蛋白质。

基因序列中,核苷酸的秩序是非常重要的,因为它决定了蛋白质的合成。

然而,由于基因的复杂性,基因不是一长段的连续码序列,而是由阻断(内含子)和可翻译的区域(外显子)交替组成的。

在基因剪接过程中,RNA分子会选择把内含子剪除,这样就形成了不同的剪接变异体。

基因剪接可以使得一个基因编码出多种蛋白质,进而有不同的生化功能及表达模式。

剪接的重要性人类染色体中有大量位于基因内部的内含子,所有这些内含子都必须在剪接过程中被精确地拼接起来才能形成正确的mRNA (messenger RNA)。

剪接不正确会因为导致拼接不完整差异表达,这可能会是人类表型发生变化的主要原因之一。

基因剪接的影响针对这一过程的失调,相关研究者已经在已知的许多疾病中观察到了相关的表观遗传改变,证明了基因剪接在与基因相关的疾病中扮演着至关重要的角色。

例如,何杰金森病、先天性红细胞过多症、基础隆周氏综合征、囊性纤维化等疾病都和基因剪接机制失调相关,并已证实基于剪接机制的RNA疗法已经在临床试验中取得了一定的进展。

什么是可变剪切?可变剪切是指,在同一个真核基因的不同外显子中的可变组分(也称为可变包容体),允许在基因转录中的复杂前后处理过程中,产生不同的翻译产物。

不同的剪接变异体通过合成不同的mRNA来表达,从而产生不同的蛋白质。

可变剪切与复杂疾病论文

可变剪切与复杂疾病论文

可变剪切与复杂疾病摘要:大多数真核生物的基因都是断裂基因,断裂基因的转录产物需要通过剪接,去除插入部分(部分内含子),使编码区(外显子)连接起来成为连续序列。

剪接是真核生物转录调控的一个重要环节,是一个非常复杂的过程,如果剪接发生异常,则会引起一些疾病。

并且对剪接认识的加深,也为这类疾病的治疗提供了一些方法。

关键字:断裂基因,外显子,内含子,可变剪接,疾病。

1剪接概述剪接是真核生物表达调控的一个重要过程,它涉及到很多的调控因子,并且发生在特定的调控位点。

并不是所有的位点都可以发生剪接,而是只有在特定的剪接位点才会发生剪接,如果剪接发生在不正常的位点就会出现剪接异常。

1.1剪接位点的特点内含子切割位点有2个特点(1)内含子的两个末端并不存在同源或互补。

这就排除了存在二级结构的可能。

(2)连接点具有很短的保守序列,称为边界顺序。

其规律称为GT-AG法则(GT-AGrule)Chambon法则。

并且我们称左边的剪接位点称供体(donor)位点,右边的剪接位点称受体(acceptor)位点。

在不同的真核生物中,内含子的一致顺序有不少变化,动物中典型的剪接位置一致顺序组成为:5'AGGTAAGU--------------YNYURAY--Y10-20--YAG3'其中Y为U或C,N为任何核苷酸。

但是需要注意的一点是仅仅GT-AG边界顺序并不能保证内含子的正确剪切,因为在内含子中有不少相同的GU-AG顺序。

内含子中还有另一段识别剪接边界必不可少的序列称为分枝点,位于3‘-端剪接位的上游,具有特征性组成:-YNCURAY-,Y表示嘧啶(U或C),R表示嘌呤(A或G),A是剪接时参与形成分枝的特别位点。

紧接在分枝点的下游有一段多嘧啶序列,也是参与剪接事件蛋白接合的位置。

1.2剪接的类型剪接是基因表达调控的一个重要环节,由于内含子具有多种多样的结构,剪接机制也是多种多样的。

有些内含子可以催化自身剪接,而有些内含子需在剪接体作用下才能剪接。

《2024年肺腺癌特异性可变剪接事件的识别与分析》范文

《2024年肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》篇一一、引言肺腺癌是一种常见的肺癌类型,其发病机制复杂,涉及多种基因变异和转录后修饰。

可变剪接(Alternative Splicing)是基因表达调控的重要手段,能够产生多种蛋白质异构体,参与细胞的生命活动。

近年来,随着高通量测序技术的发展,肺腺癌中特异性可变剪接事件的研究逐渐成为热点。

本文旨在通过分析肺腺癌中特异性可变剪接事件,为肺癌的诊疗提供新的思路和方法。

二、材料与方法2.1 样本来源本研究选取了肺腺癌患者手术切除的肿瘤组织及配对的正常肺组织作为研究对象。

所有样本均经过病理学确诊,并获得患者知情同意。

2.2 实验方法(1)RNA提取与测序:对样本进行RNA提取,并利用高通量测序技术进行转录组测序。

(2)数据预处理:对测序数据进行质量评估、去冗余、去除低质量序列等预处理操作。

(3)可变剪接事件识别:利用生物信息学分析软件,对预处理后的数据进行可变剪接事件的识别与分类。

(4)统计分析:对识别出的可变剪接事件进行统计分析,筛选出肺腺癌特异性可变剪接事件。

三、结果3.1 可变剪接事件总体情况通过对转录组测序数据的分析,我们共识别出数千个可变剪接事件。

这些事件主要涉及外显子跳跃、内含子保留、互斥外显子等多种类型。

3.2 肺腺癌特异性可变剪接事件分析在所有识别出的可变剪接事件中,我们通过统计分析,筛选出在肺腺癌组织中显著富集的特异性可变剪接事件。

这些事件主要涉及肿瘤相关基因的剪接,可能对肺腺癌的发生、发展起到重要作用。

3.3 特异性可变剪接事件与临床特征的关系我们对筛选出的肺腺癌特异性可变剪接事件与患者临床特征进行了关联分析。

结果显示,某些特异性可变剪接事件与患者的预后、分期等临床特征密切相关,可能成为肺腺癌诊疗的潜在生物标志物。

四、讨论4.1 肺腺癌特异性可变剪接事件的生物学意义本研究发现,肺腺癌中存在大量特异性可变剪接事件,这些事件主要涉及肿瘤相关基因的剪接。

基因剪接机制及其与疾病的关系研究

基因剪接机制及其与疾病的关系研究

基因剪接机制及其与疾病的关系研究基因剪接是一种重要的基因表达机制,它能够对基因进行多种方式的剪接,从而生成不同的蛋白质形式。

它在维持机体正常生理功能中发挥着至关重要的作用。

然而,当基因剪接机制发生异常,就可能会导致多种疾病的发生。

因此,研究基因剪接机制及其与疾病的关系具有重要意义。

一、基因剪接机制的概述基因剪接是指RNA分子在转录过程中通过不同的剪接方式从同一基因中生成多个具有不同功能的蛋白质形式。

这种机制可以大大扩展基因编码的蛋白质的复杂性和多样性。

在基因剪接过程中,先是由RNA聚合酶将DNA模板转录成先驱mRNA,然后,先驱mRNA与小核RNA共同形成剪接体系。

在小核RNA的催化下,先驱mRNA中不需要的区域被切除掉,而需要保留的区域则通过连接作用得到连接,从而形成成熟mRNA。

二、基因剪接与疾病的关系在正常情况下,基因剪接机制可以保证基因的正常表达,维持机体正常的生理功能。

然而,在某些情况下,基因剪接机制会发生异常,从而导致多种疾病的发生。

1.肿瘤肿瘤是许多致死性疾病之一,它的发生与基因剪接机制异常密切相关。

许多肿瘤相关基因的突变可以导致基因剪接异常。

例如,BRCA1和BRCA2基因的突变往往会导致乳腺癌和卵巢癌的发生。

这些基因在正常情况下会参与DNA修复机制,而突变会导致这些基因的功能失调,从而导致剪接异常,最终导致肿瘤的发生。

2.神经系统疾病神经系统疾病是一类在全球范围内影响人类健康的重要疾病。

多个研究表明,神经系统疾病的发生与基因剪接机制异常密切相关。

例如,在亨廷顿舞蹈病和肌张力障碍等疾病中,mRNA剪接异常是导致这些疾病发生的重要原因之一。

3.心血管疾病心血管疾病是一种常见的疾病,它的发生与基因剪接机制异常也有很大关系。

在小鼠模型中,SRSF3基因的异常剪接可以导致心肌细胞肥大和心肌病的发生。

而在另一项研究中,SMN基因的背景异常剪接也被认为是多种心血管疾病的主要驱动因素之一。

三、基因剪接机制研究的现状目前,基因剪接机制的研究已经成为生命科学研究的热点之一。

可变剪切的生物学意义

可变剪切的生物学意义

可变剪切的生物学意义摘要:一、引言二、可变剪切的定义与类型1.剪切位点选择2.外显子跳跃3.替代性剪切4.RNA编辑三、可变剪切在生物学中的作用1.基因表达调控2.蛋白质多样性3.细胞功能调控四、可变剪切与疾病关联1.遗传病2.肿瘤3.神经退行性疾病五、研究可变剪切的实验方法与技术1.高通量测序技术2.生物信息学分析3.基因敲除/敲入实验六、未来展望与挑战1.个性化治疗2.药物研发3.伦理与法律问题七、结论正文:可变剪切的生物学意义一、引言可变剪切(Alternative Splicing,AS)作为一种基因表达调控机制,广泛存在于真核生物的转录过程中。

近年来,随着高通量测序技术的发展,对可变剪切的研究越来越受到广泛关注。

本文将探讨可变剪切的定义、类型及其在生物学中的作用,进一步讨论与疾病关联以及研究方法,最后对未来的挑战和机遇进行展望。

二、可变剪切的定义与类型1.剪切位点选择:在转录过程中,RNA聚合酶会在特定的剪切位点将前体RNA剪切成成熟RNA。

剪切位点选择是指转录本在剪切过程中,可以选择不同的剪切位点产生不同的成熟RNA。

2.外显子跳跃:外显子跳跃是指在剪切过程中,部分外显子被跳过,从而产生不同长度和功能的RNA。

这种现象使得同一个基因可以编码具有不同功能的蛋白质。

3.替代性剪切:替代性剪切是指在转录本剪切过程中,可以选择不同的剪切模式产生具有不同氨基酸序列的成熟RNA。

这种现象使得同一个基因可以编码多种蛋白质。

4.RNA编辑:RNA编辑是指在剪切过程中,部分核苷酸被替换、添加或删除,从而改变RNA序列和编码的蛋白质。

这种现象可以在基因表达调控中发挥重要作用。

三、可变剪切在生物学中的作用1.基因表达调控:可变剪切作为一种重要的基因表达调控机制,可以影响基因的表达水平和活性。

通过可变剪切,同一个基因可以产生不同转录本,从而在不同的时间和空间调控基因表达。

2.蛋白质多样性:可变剪切导致前体RNA经过不同的剪切和RNA编辑过程,产生具有不同氨基酸序列的成熟RNA。

人类基因组中的可变剪接机制研究

人类基因组中的可变剪接机制研究

人类基因组中的可变剪接机制研究人类基因组是由我们身体内的DNA组成的,这些DNA分为不同的基因,控制我们的生理和行为表现。

然而,在一个完整的基因序列中,大多数基因不是一整段编码蛋白质的DNA序列,而是由多个片段组成的。

这些片段通过一个称为可变剪接的过程,被拼接在一起形成完整的基因,从而产生多个不同的蛋白质变体。

在这个过程中,一个基因可以产生多个不同功能的蛋白质,这就是可变剪接机制的重要性。

那么,什么是可变剪接呢?它是指在RNA成熟过程(转录后修饰)中,将一个基因变形为多种可能的mRNA亚型的过程。

可变剪接的方式很多,主要有以下几种:第一种是外显子跳跃,即基因中某些外显子间,出现了被完全或部分跳跃掉的情况。

第二种是另一类基因选择性剪接,即某个外显子有多种机会拼接到基因的不同位置上,形成不同的mRNA亚型。

第三种是剪切变异,这是指不同的剪接结合物促使外显子的范围扩大或缩小。

这些可变剪接机制在许多重要的生物过程中发挥着作用,包括发育、细胞分化、疾病以及选择行为等。

如果可变剪接机制失调,那么就可能会导致一些疾病的出现,如抗氧化应激、病毒感染以及人类的肿瘤问题。

在这种情况下,了解这些机制的作用,对于深入理解生物学是十分必要的。

因此,对于这一领域的研究,一直是科学家们极为重视和关注的。

当前,研究人员主要通过在RNA上检查可变剪接函数的特征来研究此类机制。

包括对完整基因组的生物信息学分析,以及对分离RNA的功能性分析。

同时,也有科学家在研究中使用了直接观察可变剪接过程的技术模型,这种技术是基于光学显微镜和分子成像技术实现的。

可以预见的是,在科技如此飞速的今天,这个领域将会得到更多的创新和进步。

而在未来,人们对可变剪接机制的探索和研究,也将会给人类生命科学的发展带来巨大的贡献。

可变剪接的鉴定

可变剪接的鉴定

可变剪接的鉴定:揭示基因表达的奥秘在生命科学领域,基因的表达调控是一个复杂而有趣的话题。

其中,可变剪接作为一种重要的基因表达调控方式,引起了科学家们的广泛关注。

本文将探讨可变剪接的鉴定方法,以期为深入了解基因表达的奥秘提供思路。

一、可变剪接概述可变剪接是指在基因转录过程中,由于外显子选择、跳跃、重叠或组合的差异,导致同一基因产生多种不同的转录本。

这些转录本在细胞、组织或个体发育过程中表达,从而影响生物体的表型和功能。

可变剪接的异常与多种疾病的发生发展密切相关,因此对可变剪接的鉴定具有重要的生物学意义。

二、可变剪接的鉴定方法1.基因组学方法基因组学方法是通过比较不同物种或同一物种不同发育阶段的基因组序列,寻找可变剪接位点。

随着新一代测序技术的发展,全基因组测序和转录组测序已成为鉴定可变剪接的主要手段。

通过对测序数据进行深入分析,可以发现不同转录本的表达模式,进而揭示可变剪接的规律。

2.生物信息学方法生物信息学方法是通过分析基因表达谱、转录组数据等大规模生物数据,挖掘可变剪接事件。

常用的生物信息学工具有:ASprofile、ASPIRE、DEXSeq等。

这些工具可以帮助研究人员快速准确地鉴定可变剪接事件,并对其功能进行预测和分析。

3.实验验证方法实验验证是鉴定可变剪接的可靠手段。

通过实时荧光定量PCR、Northern blot、Western blot等技术,可以检测不同转录本在特定组织或发育阶段的表达情况。

此外,利用细胞和分子生物学技术,可以进一步研究可变剪接对蛋白质功能的影响。

例如,通过蛋白质相互作用实验、亚细胞定位等手段,可以揭示可变剪接对蛋白质功能的影响。

三、可变剪接的生物学意义1.促进物种多样性可变剪接作为一种重要的基因表达调控方式,在物种进化过程中发挥了重要作用。

通过可变剪接,同一基因可以产生多种不同的转录本,从而增加物种的多样性。

研究表明,可变剪接在不同物种间具有保守性,但也存在一定程度的变异。

RNA可变剪接机制及其在肿瘤治疗中的应用

RNA可变剪接机制及其在肿瘤治疗中的应用

RNA可变剪接机制及其在肿瘤治疗中的应用随着生物技术的发展,RNA可变剪接机制成为了学术研究热点之一。

RNA可变剪接是指在RNA转录后过程中,原始mRNA前体通过剪接机制,形成不同的外显子结构,从而生成不同的成熟mRNA。

这个过程可以通过剪接酶和辅助蛋白质的参与来实现。

而作为一种功能多样性的调控方式,RNA可变剪接机制在调控细胞内部信号传导、代谢途径、mRNA稳定等方面扮演着重要角色。

目前,越来越多的研究表明,RNA可变剪接异常与肿瘤的发生、进展和耐药性密切相关,因此RNA可变剪接机制成为了肿瘤治疗的有力工具。

RNA可变剪接机制在发生和发展过程中的作用RNA可变剪接机制包括基本剪接、选择性剪接、纯化剪接、外显子-skipping剪接和略过内含子剪接等不同形式。

其中,选择性剪接是指不同的可变剪接方式,从而影响基因不同的转录本的表达。

基因受到各种因素的调控,包括外在信号、组蛋白修饰、RNA甲基化和非编码RNA等。

对于基因调控来说,选择性剪接起着至关重要的作用。

RNA可变剪接机制并不是一种完美的过程,常常会出现错误和异常。

越来越多的研究表明,RNA可变剪接异常与各种疾病的发生和进展密切相关,如肿瘤、多种神经系统疾病和心血管疾病。

特别是在肿瘤中,RNA可变剪接异常非常常见。

RNA可变剪接机制在肿瘤治疗中的应用相比传统的肿瘤治疗方式,RNA可变剪接机制可以更为精准地识别和靶向治疗恶性肿瘤细胞。

在肿瘤治疗中,RNA干扰技术(RNAi)和小分子化学品是常见的在RNA可变剪接机制上实现靶向治疗的方法。

其中,RNAi技术通过siRNA或shRNA进行靶向RNA内切酶的基因沉默,进而影响RNA可变剪接机制的正常功能。

此外,在肿瘤治疗中,研究人员也在进行RNA可变剪接相应的小分子化学品筛选,用于针对RNA可变剪接机制进行治疗。

小分子化学品的设计取决于目标基因的不同,因此肿瘤治疗的效果和毒副作用也存在较大差异。

近年来的一项研究表明,在肝癌治疗中,RNA干扰技术可以通过靶向ESE-1启动子上的结合蛋白(hnRNP A1),从而阻止可变剪接。

《2024年肺腺癌特异性可变剪接事件的识别与分析》范文

《2024年肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》篇一一、引言肺腺癌是一种常见的肺癌类型,其发病率和死亡率均居高不下。

随着基因组学和生物信息学的发展,越来越多的研究表明,肺腺癌的发生和发展与基因的异常表达和剪接密切相关。

可变剪接是一种重要的基因表达调控机制,它能够产生多种不同的蛋白质异构体,从而影响细胞的功能和代谢。

因此,对肺腺癌特异性可变剪接事件的识别与分析,对于揭示肺腺癌的发病机制、诊断和治疗具有重要意义。

二、材料与方法本研究采用了高通量测序技术对肺腺癌组织样本进行RNA 测序,通过对测序数据的分析,识别出肺腺癌特异性可变剪接事件。

具体方法包括:1. 样本收集与RNA提取:收集肺腺癌患者的肿瘤组织和正常肺组织样本,采用合适的RNA提取方法,提取总RNA。

2. RNA测序与数据处理:将提取的RNA进行高通量测序,获得原始测序数据。

对原始数据进行质量控制、序列比对等处理,得到可用于分析的基因表达数据。

3. 可变剪接事件识别:采用生物信息学软件和算法,对基因表达数据进行可变剪接事件的识别和分析。

包括识别可变外显子、可变剪接位点等关键剪接事件。

4. 统计分析:对识别出的可变剪接事件进行统计分析,比较肺腺癌组织与正常肺组织之间的差异,筛选出肺腺癌特异性可变剪接事件。

三、结果通过高通量测序和生物信息学分析,我们成功识别出肺腺癌特异性可变剪接事件。

这些事件主要涉及可变外显子的跳跃、可变剪接位点的使用等。

通过与正常肺组织样本的比较,我们发现肺腺癌组织中存在大量的可变剪接事件,这些事件可能与肺腺癌的发生和发展密切相关。

进一步的分析表明,某些特定的可变剪接事件在肺腺癌组织中显著富集,这些事件可能涉及到重要的生物学过程和信号通路。

这些结果为进一步研究肺腺癌的发病机制、诊断和治疗提供了重要的线索。

四、讨论本研究的成果为揭示肺腺癌的发病机制提供了新的视角。

通过对肺腺癌特异性可变剪接事件的识别与分析,我们可以更好地理解肺腺癌的发生和发展过程,为诊断和治疗提供新的思路和方法。

可变剪接与疾病的生物信息学研究概况

可变剪接与疾病的生物信息学研究概况

可变剪接与疾病的生物信息学研究概况王科俊1*,吕俊杰1,冯伟兴1,王鑫2(1.哈尔滨工程大学自动化学院,中国黑龙江哈尔滨150001;2.剑桥大学癌症分子研究中心英国剑桥)摘要:可变剪接是真核基因转录后期的重要调控机制,它使得同一条蛋白质编码基因能够产生多种转录体,极大的扩展了遗传信息的应用.研究发现,可变剪接与人类疾病有着密切的联系.错误的剪接会导致疾病,增加疾病的易感性与病变程度,甚至直接导致癌变.现对可变剪接调控机制与疾病的生物信息学研究进展进行综述.关键词:可变剪接;疾病;癌症;生物信息学中图分类号:Q752文献标识码:A文章编号:1007-7847(2011)01-0086-09The Application of Bioinformatics in the Research ofAlternative Splicing and DiseaseWANG Ke -jun 1,L 譈Jun -jie 1*,FENG Wei -xing 1,WANG Xin 2(1.College of Automation ,Harbin Engineering University ,Harbin 150001,Heilongjiang ,China ;2.Cancer Research Center ,Cambridge University ,Cambridge ,England )收稿日期:2010-09-01;修回日期:2010-12-01基金项目:国家自然科学基金资助项目(61071174);国家863计划项目(2008AA01Z148)作者简介:王科俊(1962-),男,黑龙江哈尔滨人,哈尔滨工程大学自动化学院教授,博士生导师,主要从事模式识别、多模态生物特征识别、生物信息学研究,E -mail :wangkejun@ ;吕俊杰(1982-),女,黑龙江齐齐哈尔人,博士研究生,主要从事生物信息学研究.Abstract :Alternative splicing is an important mechanism in regulating eukaryotic gene expression during post -transcriptional processing as it generates numerous transcripts from a single protein -coding gene ,whichlargely increases the use of genetic information.Researches showed that alternative splicing was highly relevant to human diseases.Wrong splicing patterns could cause disease ,contribute to disease severity and susceptibility ,and even cause cancer directly.Research progress of bioinformatics in alternative splicing regulation mechanism and disease was summarized.Key words :alternative splicing ;disease ;cancer ;bioinformatics(Life Science Research ,2011,15(1):086~094)1977年Walter Gilbert 在对Adenovirus hexon基因的研究中发现并提出可变剪接现象[1],同时,他表明一个基因的不同编码区可以拼接在一起被剪接下来,产生功能不同的信使核糖核酸,这是对可变剪接的最早描述.随后Sharp 和Roberts 发现高等生物基因的编码区被非编码区所分割,并提出分割的基因结构[2,3].这一发现推翻了传统生物学关于“一种基因对应一种蛋白质”的观点,接下来1981年,第一次在哺乳动物编码荷尔蒙降血钙素的基因中发现可变剪接现象[4],20世纪80年代初,在编码免疫球蛋白的基因中发现可变剪接[4,5].此后,可变剪接被发现广泛存在于真核生物中[6].大量关于可变剪接的实验性文章不断发表出来.很长一段时间,对可变剪接机制的研究多停留在对单个基因的可变剪接现象和机制的研究上,而缺少更为系统更为综第15卷第1期生命科学研究Vol.15No.12011年2月Life Science ResearchFeb.2011·综述·第1期图1可变剪接主要类型黑色方块表示内含子,灰色方块表示外显子;折线表示发生剪接,方块上方的折线表示正常剪接发生的位置,方块下方的折线表示发生可变剪接的位置.Fig.1Main patterns of alternative splicingBlack boxes mean exons ,gray boxes mean introns ;fold lines mean splicing ,up -fold lines mean the sites of constitutive splicing ,and down -fold lines mean the sites of alternative splicing.合的分析.究竟什么是影响基因产生可变剪接的因素,这些基因在产生可变剪接时有着怎样的机制或规律,不同的可变剪接的产物对蛋白质的功能有什么样的影响,等等诸多问题单纯的靠逐个基因地进行实验是无法解决的.近20年来,应用计算方法对可变剪接现象进行研究开始引起人们的关注.我国对可变剪接的研究起步比较晚,近几年才在个别单位开展,目前开展这方面研究的研究机构主要有:中科院上海生命科学研究院、清华大学生物信息研究所智能技术与系统国家重点实验室、国防科学技术大学、北京大学、上海交通大学、中科院华大基因研究中心、中科院生物物理所、天津大学、内蒙古工业大学等.可变剪接受时间和空间的限制,在不同的组织中,在相同组织的不同细胞中,在同一组织的不同发育阶段,对病理过程的不同反应等等过程中均会产生不同的剪接变体.研究发现[7]:94%以上的人类基因存在可变剪接,平均每个人类的基因有多于5个转录物变体,其中多达50%的致病突变会影响剪接;可变剪接的异常改变使得基因在转录后期产生异常的剪接变体,编码出异常的蛋白质,从而导致人类遗传疾病,甚至癌变.目前,对可变剪接与疾病的相关性已在单基因与单癌症水平上展开了研究[7].对可变剪接机制与疾病相关性的深入研究,可以为人类遗传疾病与癌症的临床诊断、预测,治疗方案的制定以及相关的生物制药提供理论上的指导.1可变剪接的基本类型可变剪接的类型主要有7种(如图1所示),分别为内含子保留(图a ,intron retention )、可变3'剪接位点(图b ,alternative 3′splice site )、可变5'剪接位点(图c ,alternative 5′splice site )、外显子跳过(图d ,exon skipping )、互斥可变外显子(图e ,mutually exclusive exons )、可变初始外显子(图f ,alternative initial exon )和可变终末外显子(图g ,alternative last exon ).表1为Christo -pher Burge 实验室基于RNA -seq 的最新实验数据,预测出人类基因里各种模式的可变剪接类型所占的比例[8].表1可变剪接类型及所占比例Table 1Patterns and percentage of alternative splicingPatterns of alternative splicing Proportion/(%)Intron retentionAlternative 3′splice site Alternative 5′splice site Exon skippingMutually exclusive exons Alternative initial exon Alternative last exo11615354138a c ebdfg王科俊等:可变剪接与疾病的生物信息学研究概况87生命科学研究2011年2可变剪接调控机制剪接体的核心部分包括一组小核RNA(small nuclear RNA,snRNA)以及与之结合的蛋白质,它们以严格的程序组装成剪接体(splicesome). snRNA成员分别为U1、U2、U4、U5和U6,长度在106(U6)~185(U2)个核苷酸之间.snRNA 与蛋白质结合在一起形成小核核糖核蛋白(small nuclear ribonucleic protein,snRNP),剪接体复合物中还有大量的其它因子.如SR蛋白质及其相关蛋白质.这些剪接因子与调节蛋白相互作用来调节剪接,可变剪接过程的调控机制多种多样.按剪接调控因子结合在RNA上的位置及作用方式,可以分为外显子增强子(ESE)、外显子抑制子(ESS)、内含子增强子(ISE)和内含子抑制子(ISS)[9].可变剪接的各调控元件,不同的增强子和抑制因子的排列组合共同决定剪接模式的变化.目前已逐步开展对于这些剪接调控因子的作用机理、作用位置及其对剪接模式的影响等的研究.近年来对于剪接增强机制的研究主要集中在对SR蛋白质的调控机制上.SR蛋白质对3′剪接位点的增强通过吸引U2AF65结合在信号较弱的多嘧啶区域.另外一种3′增强机制则不需要吸引U2AF65,而是通过SRm160和SRm300等剪接调控因子桥接ESE和剪接体组成元件来实现[10].这些调控因子含有RS(arginine-serine-rich)区域,但没有RRM(RNA recognition motif)区域,并能和snRNP、SR蛋白质之间形成多重作用关系.内含子增强因子主要通过结合某些反式作用的蛋白质来增强剪接位点的信号.剪接信号的抑制通常由hnRNP蛋白质家族(如SXL、PTB和hnRNPA1等)的作用来实现.最简单的一种机制是:结合在抑制因子上的蛋白质会直接阻止剪接体的结合.然而,剪接的抑制经常需要通过结合到多个同类型的抑制因子的蛋白质之间的协调作用来完成.已发现的有两种协调抑制的形式[11,12],这两种调控形式或通过结合在高结合强度的抑制因子上的蛋白质的增殖,或通过在RNA外将蛋白质形成环形来产生一个“抑制区域”.在这两种情况下,外显子、剪接位点和增强因子都无法接触剪接因子.在许多情况下,可变剪接事件可能由更为复杂的机制造成,比如多个增强和抑制因子同时作用.哺乳动物src N1外显子的神经系统特有的可变剪接是一个典型的多因子调控剪接例子[13].在非神经系统的细胞中,N1外显子的剪接取决于4个侧翼的CUCUCU元件,它们和PTB协调地进行结合.U2-snRNP结合在与PTB结合位置相反的上游内含子中.相反,U1snRNP的结合则不受PTB的抑制影响.在神经系统的细胞中,N1的包含则有赖于下游的ISE.该ISE和其中的一个CUCUCU元件重叠,并与hnRNPF,hnRNPH和KH类型的剪接调控蛋白质作用.该ISE复合体被nPTB蛋白质所吸引,该nPTB结合在CUCUCU元件,但没有PTB的抑制能力强. nPTB有双重作用,一方面会对抗抑制因子,另一方面却促进ISE复合体.nPTB的表达量有限,因此不足以激活N1的剪接.N1外显子中的ESE 结合SF2/ASF、hnRNPF和hnRNPH,而hnRNPA1的结合则起到抑制的调控作用.该剪接机制极为复杂,尚未完全明确.3可变剪接与遗传性疾病可变剪接是一个各种影响因素高度协调的机制,其中任何一个关键因素产生突变,都会改变正常的剪接模式,得到变异的转录体,编码出异常的蛋白质,从而导致疾病甚至癌变.已有大量与可变剪接相关的疾病记载,但是,因为有一些疾病中的突变不是致病的关键因素,所以记载的数目远远低于实际发生的数量(表2给出了现有典型与可变剪接相关疾病的信息).对可变剪接机制与疾病相关性的深入研究,可以为疾病与癌症提供合理的治疗方案.下面讨论几种与疾病有密切联系的典型剪接变异.3.1点突变早在1992年,Krawczak M等就在对101个造成人类遗传疾病的点突变研究中发现,多达15%的点突变会破坏mRNA的剪接[14].该比例在2005年提高到60%[15].2009年1月最新公布的人类基因突变数据库(Human Gene Mutation Database,HGMD[16])中有多达8532个人类基因的点突变与遗传病相关,占数据库总数的10%.需要注意的是,这个数据是来自于具体的文献记载的实验数据.实际的破坏剪接的致病点突变所占比例远远高于10%.对由于剪接位点的选择变化所导致的疾病研究较为充分的代表是地中海贫血[17]和家族性自律神经失调.家族性自律神88第1期经失调是一种由i-kappa-B蛋白激酶及其相关的复杂蛋白质功能丧失引起的隐性疾病,在德系犹太人中,发病率达1/3600[18].患儿的和脱髓鞘相关的神经系统发育异常,临床表现为呕吐、病危、步态不稳、对疼痛感减弱或消失.99.5%以上的家族性自律神经失调患者的20号外显子的5′剪接位点在20号内含子的位置6处由T突变为C.这个点突变打断了与U1-snRNA的碱基配对,U1-snRNA与上游外显子的最后3个核苷酸以及下游内含子的前6个核苷酸相配对.大多数5′剪接位点处形成7对与U1-snRNA互补的碱基对.这意味着,将导致5′剪接位点和U1-snRNA 有3个是错配的.生物信息学分析表明[19],这些错配不是随机分布的.他们或者削弱5′剪接位点的外显子部分,然后通过增加结合到内含子的部分做补偿,或者削弱5′剪接位点的内含子部分,然后通过增加结合到外显子的部分做补偿.在IKBKAP基因的20号外显子中,剪接位点的外显子部分是被削弱的,由于在位置-1处是A,与其配对的T突变为C削弱了5′剪接位点的内含子部分,导致外显子跳过[19].家族性自律神经失调的例子说明了剪接位点突变的复杂性,同时也要联系其他调控元件仔细分析,它进一步表明,关键调控基因的错误剪接会严重影响其它基因.表2互联网上关于遗传疾病的信息Table2Information about genetic diseases on the webGeneral information about alternative splicing http:///Familial dysautonomiaSubstances that influence alternative splicingTauopathiesHutchinson-Gilford progeria syndromeSpinal muscular atrophyPrader-Willi syndromeMyotonic dystrophyMedium-chain acyl-CoA dehydrogenase(MCAD)deficiency Myotonic dystrophy Frontotemporal lobar dementias/-amyotrophic lateral sclerosis / /cpds.htm http://www.molgen.ua.ac.be/ADMutations/ /////mcad_fam.htm /3.2与疾病相关的短重复元件突变在很多外显子中检测出短重复序列,这些重复序列有助于某些剪接因子的识别[20].它们长度的变化还会改变基因的剪接模式,例如:内皮细胞一氧化氮合成酶基因包含一个内含子多态化的CA重复区,该重复区与冠状动脉疾病、高同型半胱氨酸血症,在性别特异性剪接模式上的患病几率有着密切的联系[21];SELEX实验和功能研究表明[22]:CA重复元件与hnRNP L结合,并且hnRNP L活性的激活依赖于CA重复元件的长度.基因芯片的研究表明[23]:内含子序列中丰富的CA重复序列可以影响可变剪接,并且其中某些CA重复元件的多态性会引起人类疾病.另一个与疾病相关的短重复元件是UG,它会引起CFTR基因的9号外显子剪接异常,导致囊性纤维化[23].Alu重复元件是人类基因组中最大的重复群体,他们约占基因组序列总数的10%[24],Alu重复元件包含潜在的剪接位点,可以进化成外显子[25],大约5%以上的人类可变外显子都来源于Alu重复序列[26].毫无疑问,Alu重复元件中的突变会产生异常的mRNA,从而导致人类疾病,例如Alport综合症[27]、先天性白内障[28]、异形面神经综合症[28]、VII型黏多糖症[29].这些例子解释了短重复序列是如何改变可变剪接调控平衡的,尽管他们有时位于内含子中或者看似与mRNA无关.外显子化的Alu重复元件表明了如何利用新的重复元件通过进化获得新的功能,不当外显子化的Alu重复元件所引起的疾病可以被看作是失败的进化尝试.3.3可变剪接产生蛋白质亚型的比例改变神经退化性疾病是一组描述几种中枢神经系统的疾病,它们的一个共同的病理特征是:细胞内存在异常堆积的tau蛋白.该tau蛋白是由位于17号染色体上的单个基因编码的,这个基王科俊等:可变剪接与疾病的生物信息学研究概况89生命科学研究2011年因存在广泛的可变剪接,16个外显子中有8个经历可变剪接[30].人类基因的可变剪接受时间和空间的限制,例如,2号外显子、3号外显号子和10号外显子具有成人细胞组织特异性,在脑组织的不同区域中剪接是有显著差异的[30].Tau 蛋白通过微管重复区域与微管结合.这些微管蛋白结合区中有一个是由可变10号外显子编码的,10号外显子包含会产生有4个微管重复区域的蛋白质(4R),而10号外显子跳过则会产生有3个微管重复区域的蛋白质(3R).在成人中这个剪接事件具有物种特异性.在人类基因中,10号外显子在成年人细胞中是可变剪接的,而在小鼠中,这个外显子是组成性的.在这两个物种中,该外显子的作用都是在发育过程中被调节的.Andreadis对Tau基因的研究发现[30]:Tau基因中罕见的显性突变会导致额颞叶痴呆症、帕金森病以及17号染色体疾病.大多数的突变会影响10号外显子编码微管结合点的部分.Tau的10号外显子的突变导致调节元件分解.该外显子表现为由4个增强子和3个沉默子组成的可变外显子.增强子调控区的突变会减弱外显子的作用,反之,沉默子调控区的突变则会增加外显子的作用.研究发现10号外显子的突变改变其正常包含的前体mRNA编码3R和4R重复Tau 亚型的数量,这和17号染色体疾病相关[31,32].这些数据清楚地表明,剪接突变通过改变4R和3R 亚型的比例导致了神经系统的疾病.这个例子表明,由可变剪接产生的蛋白质亚型比例变化可引起人类疾病.进一步说明如何分析基因的变异体有助于理解剪接调控机制.剪接存在复杂的物种特异性,但可以通过建立动物模型来研究人类病理.3.4单核苷酸多态性高胆固醇是导致动脉粥样硬化的主要因素.低密度脂蛋白受体(LDLR)将血液中的低密度脂蛋白去除.低密度脂蛋白受体基因突变是导致高胆固醇血症的主要原因,同时高血脂是引起LDLR突变的主要因素[33].研究发现[34]:在LDLR 的12号外显子中发现一个单核苷酸多态性(SNP)可以促使这一外显子跳过.该SNP可以促使更年期前的妇女肝脏中12号外显子跳过,但是,对更年期后的妇女或者男子并没有该作用.在更年期前的妇女肝脏组织中该SNP和剪接模式都与胆固醇水平相关,在男子中却不存在这种情况.12号外显子跳过产生一个截短的LDLR,该LDLR缺乏膜结合和内化必要的跨膜区.这可能是因为由12号外显子跳过产生的异常蛋白严重阻止吸收低密度脂蛋白.这个实例阐述了由SNP引起的12号外显子跳过与胆固醇水平有关这一现象.该SNP依赖于性别的原因尚不清楚,但可能是高雌激素水平影响基因的转录水平或者可变剪接[33].载脂蛋白E(ApoE基因)是低密度脂蛋白受体的配体,载脂蛋白E的等位状态是导致阿尔茨海默氏病的一个重大因素.因此,需要研究LDLR的12号外显子中SNP是否与阿尔茨海默氏症有关.研究发现,在男性中该SNP和阿尔茨海默氏病相关,在女性中却不存在这种情况[34].这个例子很好地说明了单核苷酸多态性能够影响可变剪接,从而导致人类疾病.也反映出可变外显子调控机制是由各种因素综合控制的,一个突变依赖于其他因素,在上述实例中依赖于性别和年龄.3.5剪接因子的缺失反式作用因子如果受到剪接的影响,则可能会导致其所调控或参与调控的所有基因的表达发生异常而导致疾病.剪接体由5种snRNP和200多种蛋白质组成,这些蛋白质包括蛋白激酶、磷酸酶和解旋酶等剪接体所需要的酶,以及相关的mRNA输出因子、转录因子和剪接反式作用因子等等[35].因此,生成这些蛋白质和snRNP的基因如果由于可变剪接被破坏,将会使它们在剪接过程中的调控功能丧失,最终可能导致某种疾病.Mordes等对脊髓性肌萎缩(spinal muscular atrophy,SMA)[36]的研究,以及Winkler等对色素性视网膜炎(retinitis pigmentosa)[37]的分析表明:这两种遗传疾病都是由于生成snRNP的基因发生突变所导致的.SMA是一种影响运动神经的常染色体隐性紊乱,由于SMN1基因产物的遗失(即:突变造成该基因所生成的蛋白质异常)而导致.该基因产物是细胞质中生成核心snRNP复合物所需要的,而失去snRNP已被证明和疾病有直接联系[38].色素性视网膜炎是导致失明的一种最常见的原因,4000个人里便有一人患有此疾病[37].生成U4U5U6三聚snRNP的基因中包含色素性视网膜炎的3个主要基因———PRPF31、PRPF8和HPRP3.而U4U5U6是剪接体的主要组成部分.90第1期上述两个实例是典型的由剪接因子缺失导致剪接异常而产生的疾病,说明剪接因子在剪接调控过程中的重要性,也说明了剪接调控机制的复杂性.4可变剪接与癌症除了上述的人类遗传疾病外,剪接异常也是众多癌症的一个常见特征.和癌症相关的细胞迁移、细胞生长调控、荷尔蒙响应性、细胞死亡和化疗反应中基因表达变化都可能和可变剪接相关[39~41].有证据表明影响致癌基因(oncogene)、抑癌基因(tumour suppressor)和其它癌症相关的基因剪接的突变在癌症的起始和过程中都有因果关系[41].目前,对导致癌症中剪接缺陷的机制理解尚不清楚.在一些个案研究中发现,顺式作用元件中的遗传和体细胞突变,反式调节因子的成分、浓度、定位以及活性的变异,都会影响剪接位点的识别和作用,从而导致癌变[39,40].表3给出了典型的由可变剪接异常导致的癌症实例.我们通过已经得到很好研究的具体实例来阐述癌症中剪接机制的典型改变、致病机理,分析可变剪接对抑癌基因与致癌基因的作用原理,为今后癌症的治疗提供理论上的参考.表3可变剪接异常导致的癌症Table3Cancer caused by alternative splicingGene Splice variant Cancer typeSurvivin[42,43]FHIT[44,45]AIB1[46]VEGF[47]Actinin4[48]Cathepsin B[49]RON[50]Survivin2B with pro-apoptotic propertiesAberrant transcriptsIsoform lacking exon3Isoforms lacking exon6Variant VaCertain isoformsRonΔ165RonΔ160RonΔ155Breast carcinoma and late stage or metastatic gastric cancerGastric,cervical,thyroid and testicular germ-cell tumoursBreast cancerNon-small cell lung cancerSmall cell lung cancerColon cancerColorectal carcinoma4.1致癌信号CD44是一种多功能细胞表面糖蛋白,参与细胞增殖、分化、黏附和迁移等过程[51].通过其内部外显子的10种变体的组合与包含可以产生多种CD44亚型,某些特定的CD44剪接变体,特别是那些包含外显子v5、v6以及v7变体的亚型,在多种肿瘤中都过分表达,已经有研究证实这些变体在肿瘤细胞侵袭和转移过程中起着重要的作用[51,52].Konig和Matter等的研究表明[53,54]:外显子v5包含是由外显子的剪接调控元件———剪接增强子和剪接抑制子共同调节的.致癌的RAS信号转导途径的激活刺激外显子v5包含.由于诱导型剪接不需要蛋白的重新合成,其剪接调控可能是由后转译调节或通过控制剪接因子的细胞内定位实现的.近来对STAR(信号转导和RNA激活)蛋白质家族的一员Sam68的研究表明[55]:对ERK MAP酶磷酸化使得其被激活,进而证明是RAS诱导突变引起的外显子v5包含,从而导致的癌变.4.2顺式作用元件的破坏与癌症与疾病相关的点突变至少有15%会导致剪接缺陷,这表明顺式调控元件的破坏会导致大量的错误剪接.已经在许多易发生癌变的基因中发现导致剪接缺陷的胚系突变,例如BRCA1、BRCA2、CDKN2A和APC基因[56~61],而由于体细胞性突变导致的剪接缺陷则很少发生.胚系序列中的点突变和调节元件突变都会增加癌症的易感性,例如,BRCA1基因的18号外显子中的一个遗传性无义突变破坏一个外显子剪接增强子(ESE)及SR蛋白质SF2/ASF的结合位点,从而结构性18号外显子的不当跳过[62].抗原递呈细胞(APC)的胚系突变会导致家族性多发性腺癌(FAP).突变发生在基因的各个位置,特定位置决定疾病的严重程度[60].最近的研究发现两个破坏剪接调控元件的突变.在4号内含子的供体位点保守模体GT处插入一个T引起4号外显子跳过,从而导致轻度的家族性多发性腺癌[60];7号内含子受体位点处一个G由A替代会产生一个隐秘的剪接位点,导致8号外显子的起始处有一个单核苷酸缺失;一个单碱基移码导致APC缩短,进而引致典型息肉症[57].经常在神经纤维瘤的NF1基因中发现胚系突变和体细胞突变的杂合性缺失.Serra等对NF1体细胞突变做了系统的研究[62],结果表明大多数点突变会导致剪接缺陷,包括外显子跳跃、可变5′剪接位点和可变3′剪接位点的使用.据我们的了解,这是唯一的体王科俊等:可变剪接与疾病的生物信息学研究概况91生命科学研究2011年细胞突变导致剪接位点识别改变的研究.4.3反式调节因子的破坏与癌症许多研究表明在肿瘤中,剪接因子的表达会发生特异性的改变.已在人类卵巢癌和小鼠的乳腺癌模型发育过程中发现Tra26、YB-1、SR蛋白质SC35和ASF/SF2的高度磷酸化,mRNA过高表达.此外,这些改变还与CD44剪接模式增加的复杂性有关[63].虽然在癌症中很少发现体细胞剪接突变,但是排除了高突变率是剪接缺陷的主要原因这一假设.一般来说,剪接增强子和沉默子,特别是那些在内含子深处的,保守性不强的,因此,它们的识别以及评价单核苷酸替代对剪接效率的影响,主要视情况应用实验的方法.目前,很多突变被归类为中性、错义或无义的,进而可能影响剪接的过程.这使得研究人员致力于研究肿瘤是否有错配修复缺陷及较高的剪接缺陷率.如果一个剪接因子的表达式或活性在一个癌细胞中发生改变,它很可能会影响其他基因的剪接.因此,应该根据剪接缺陷为癌症分类.到目前为止,如何评价剪接因子的表达式或活性改变?这些改变在人类癌症中发生的频率?以及什么基因受到影响?有多少基因受到影响?等等研究还没有开展.5研究策略上面讨论的实例清晰的表明:异常的可变剪接调节是导致人类遗传疾病与癌症的主要来源.要深入了解疾病的致病机理,研究开发遗传疾病与癌症的治疗方案,以及相应的基因靶向疗法、生物药物设计等,可以在可变剪接层面上展开研究,即对可变剪接进行深入细致的研究,从而找到与疾病相关的异常剪接因素.对于这方面的研究,主要从顺式调节元件与反式作用因子两方面着手.由于受计算技术与生物技术的限制,在对顺式作用元件的早期研究上,主要基于剪接位点附近的外显子与内含子中某些特定调节元件的研究上[21,26],仅仅对单个基因或者某个组织进行研究[11,21],缺乏在基因组范围的分析,随着生物信息技术的发展,使得在基因组范围内研究可变剪接成为可能.近期的研究热点转向对各组织的可变剪接调节元件进行综合分析,我们在对11对人类组织的可变剪接进行研究中发现[64]:某些剪接在各个组织中都发生,而有些剪接只发生在特定的组织中,即在很多组织中都存在自己特异的剪接模式,或者某些剪接模式在特定的组织中过分的表达,这些具有组织特异性的剪接模式发生突变将导致相应的组织疾病,甚至癌变.为进一步研究顺式作用元件与疾病的相关性,对顺式作用元件的研究热点将集中在疾病的组织特异性剪接、癌症特异性剪接、物种特异性剪接等方向.与疾病相关的另一重要机制是反式作用因子,即调节可变剪接的各蛋白质、酶、小核RNA、hnRNP等,研究这些调节因子的异常作用与疾病的相关性,首先需要对这些因子的调节机制的进行深入分析,这些调节因子通过RNA-RNA、RNA-蛋白质、蛋白质-蛋白质等的相互作用来调节可变剪接.例如:剪接调节因子结合在基因序列的不同位置上,将对剪接产生不同的影响,精确识别出剪接因子结合到基因序列上的位置,对于可变剪接与疾病的治疗均具有重大的意义,以往对这一课题的研究主要集中在对基因序列的分析上,仅考虑序列信息,忽视了结构因素对结合位置的影响,我们将结构因素考虑进来,结合序列信息与结构信息对结合位点进行研究发现,结合了结构因素后可以显著提高结合位点的识别率[65],这说明,结构因素同样影响可变剪接,结构的改变也会导致异常的剪接,从而导致疾病.我们考虑的结构信息仅是应用Vienner软件中的Mfold软件包对最稳定的二级结构进行预测,这是基于最小自由能开发的二级结构预测程序,预测的仅是最稳定的折叠,与生物实际的二级结构存在差异,要进一步研究结构对剪接作用因子与基因序列结合位置的影响,还需要对二级结构进行进一步的研究,这也将是未来的研究热点.6结论可变剪接机制是基因在后转录时期的一项复杂而精密的调控机制,与人类遗传疾病有着密切的关系,更是癌症表达的天然来源.对可变剪接调控机制与疾病相关性的研究,有助于对致病机理的理解与深入分析;也可以为重大遗传病诊断与治疗提供理论上的指导;为肿瘤的靶向基因疗法提供准确的定位,为开发癌症的治疗方法提供新的思路;更有助于相关疾病的生物制药方案的制定.目前已有学者提出了在RNA剪接层次上治疗人类遗传疾病和癌症的思路[66~68],如:92。

如何利用生物大数据技术分析基因组可变剪接

如何利用生物大数据技术分析基因组可变剪接

如何利用生物大数据技术分析基因组可变剪接在基因组学领域,可变剪接(alternative splicing)是一种重要的基因表达调控机制。

它指的是同一个基因在转录过程中,通过对其预mRNA分子的不同区域进行选择性剪接,从而产生不同的mRNA剪接异构体。

这一过程使得一个基因能够编码多个不同的蛋白质变体,进而拓宽了生物体在基因表达上的多样性。

如何利用生物大数据技术来分析基因组可变剪接,成为了研究者们关注的焦点之一。

本文将深入探讨如何利用生物大数据技术分析基因组可变剪接,并介绍相关的方法和工具。

首先,生物大数据技术使得我们能够获取大规模的转录组数据。

转录组是指某个生物体在特定情况下所有被转录的RNA序列的总和。

通过高通量测序技术,我们可以获取到大量的转录组数据,包括mRNA的序列信息。

这些数据能够提供基因剪接的全景图,揭示不同组织、不同发育阶段、不同疾病状态下基因可变剪接的变化规律。

同时,这些数据也为我们提供了用于分析剪接异构体的丰富材料。

基因组可变剪接的分析需要从转录组数据中鉴定各个基因的剪接异构体以及其相对表达水平。

近年来,研究者们提出了许多分析剪接异构体的方法和工具。

其中,比较常用的方法包括Cufflinks、MISO、rMATS等。

这些方法主要基于统计学原理,通过对转录组数据中的reads进行分析,确定不同剪接事件的发生概率,并进一步推导出各个剪接异构体的表达水平。

这些方法的基本操作流程是:首先,利用软件将测序数据进行处理,包括去除低质量的reads、去除合成引物和连接器等。

接着,将所得到的高质量reads与参考基因组序列进行比对,得到每个基因的reads覆盖情况。

然后,利用软件对每个基因的剪接事件进行鉴定,得到其剪接异构体的列表。

最后,利用统计学方法计算不同剪接事件的发生概率和各个剪接异构体的相对表达水平。

此外,在分析基因组可变剪接时,还需要注意一些技术细节。

例如,对于测序数据的处理,要考虑到对splice junction支持度的要求,以排除低质量的reads和剪接事件。

基因剪接的分子机制及其与疾病相关性研究

基因剪接的分子机制及其与疾病相关性研究

基因剪接的分子机制及其与疾病相关性研究在人体的基因中,存在着许多不同的片段,它们被称作外显子和内含子。

外显子是真正会进行蛋白质合成的部分,而内含子适时被剪辑掉,不参与蛋白质的合成。

这个称为基因剪接的过程,是生物体调节基因表达和蛋白合成的一个极其重要的机制。

随着科技的不断发展,人们对基因剪接的分子机制及其与疾病相关性的研究越来越深入。

首先,我们来看看基因剪接的基本过程。

基因剪接是细胞分子生物学中极其复杂的过程之一。

那么,组成基因的外显子与内含子应该是如何剪辑的呢?其实,这还要从信使RNA(mRNA)的生成说起。

在人体中,DNA中的一个基因被转录成为mRNA后,还要经过详细的处理步骤才能成为成熟的mRNA。

其中,基因剪接就是mRNA的一部分处理过程,它在这里扮演着重要的角色。

简单地说,基因剪接的具体过程是由snRNP(small nuclear ribonucleoprotein particle,小核黄体核糖核蛋白复合体)引发的。

snRNP是由一个RNA分子和许多蛋白质组成的大分子复合物。

在剪接的过程中,特定的snRNP会与mRNA结合,然后带动RNA结构的改变,成熟的mRNA就由此诞生了。

不过,基因剪接的过程并不完美,也会有失误。

如果内含子的剪切不准确,就有可能产生位点错位或失踪的错误mRNA;如果剪接没有正确地进行,就会引起基因底物表达的混乱,或者在翻译过程中出现问题。

这些都会对生命信号传递、细胞生命周期、基因调控等方面产生影响。

基因剪接的失误也会导致疾病的发生。

例如,一个基因内含有缺陷的某些内含子,被剪接后就会出现变异。

这可能引起一些重大疾病,例如血友病、珂瑞氏锥体外轻塌症、先天愚型、纤维囊性骨病等等。

因此,对基因剪接的研究与相关疾病的治疗和预防密不可分。

为了更好地研究基因剪接及其与疾病相关性,在近年来,科学家们在分子遗传学、分子生物学和生物信息学等领域中做了很多努力。

他们通过基因组扫描、RNA测序等技术研究了基因剪接的异常形式和机理,也找出了一些对基因剪接的调控因子。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

可变剪接与疾病的生物信息学研究概况王科俊1*,吕俊杰1,冯伟兴1,王鑫2(1.哈尔滨工程大学自动化学院,中国黑龙江哈尔滨150001;2.剑桥大学癌症分子研究中心英国剑桥)摘要:可变剪接是真核基因转录后期的重要调控机制,它使得同一条蛋白质编码基因能够产生多种转录体,极大的扩展了遗传信息的应用.研究发现,可变剪接与人类疾病有着密切的联系.错误的剪接会导致疾病,增加疾病的易感性与病变程度,甚至直接导致癌变.现对可变剪接调控机制与疾病的生物信息学研究进展进行综述.关键词:可变剪接;疾病;癌症;生物信息学中图分类号:Q752文献标识码:A文章编号:1007-7847(2011)01-0086-09The Application of Bioinformatics in the Research ofAlternative Splicing and DiseaseWANG Ke -jun 1,L 譈Jun -jie 1*,FENG Wei -xing 1,WANG Xin 2(1.College of Automation ,Harbin Engineering University ,Harbin 150001,Heilongjiang ,China ;2.Cancer Research Center ,Cambridge University ,Cambridge ,England )收稿日期:2010-09-01;修回日期:2010-12-01基金项目:国家自然科学基金资助项目(61071174);国家863计划项目(2008AA01Z148)作者简介:王科俊(1962-),男,黑龙江哈尔滨人,哈尔滨工程大学自动化学院教授,博士生导师,主要从事模式识别、多模态生物特征识别、生物信息学研究,E -mail :wangkejun@ ;吕俊杰(1982-),女,黑龙江齐齐哈尔人,博士研究生,主要从事生物信息学研究.Abstract :Alternative splicing is an important mechanism in regulating eukaryotic gene expression during post -transcriptional processing as it generates numerous transcripts from a single protein -coding gene ,whichlargely increases the use of genetic information.Researches showed that alternative splicing was highly relevant to human diseases.Wrong splicing patterns could cause disease ,contribute to disease severity and susceptibility ,and even cause cancer directly.Research progress of bioinformatics in alternative splicing regulation mechanism and disease was summarized.Key words :alternative splicing ;disease ;cancer ;bioinformatics(Life Science Research ,2011,15(1):086~094)1977年Walter Gilbert 在对Adenovirus hexon基因的研究中发现并提出可变剪接现象[1],同时,他表明一个基因的不同编码区可以拼接在一起被剪接下来,产生功能不同的信使核糖核酸,这是对可变剪接的最早描述.随后Sharp 和Roberts 发现高等生物基因的编码区被非编码区所分割,并提出分割的基因结构[2,3].这一发现推翻了传统生物学关于“一种基因对应一种蛋白质”的观点,接下来1981年,第一次在哺乳动物编码荷尔蒙降血钙素的基因中发现可变剪接现象[4],20世纪80年代初,在编码免疫球蛋白的基因中发现可变剪接[4,5].此后,可变剪接被发现广泛存在于真核生物中[6].大量关于可变剪接的实验性文章不断发表出来.很长一段时间,对可变剪接机制的研究多停留在对单个基因的可变剪接现象和机制的研究上,而缺少更为系统更为综第15卷第1期生命科学研究Vol.15No.12011年2月Life Science ResearchFeb.2011·综述·第1期图1可变剪接主要类型黑色方块表示内含子,灰色方块表示外显子;折线表示发生剪接,方块上方的折线表示正常剪接发生的位置,方块下方的折线表示发生可变剪接的位置.Fig.1Main patterns of alternative splicingBlack boxes mean exons ,gray boxes mean introns ;fold lines mean splicing ,up -fold lines mean the sites of constitutive splicing ,and down -fold lines mean the sites of alternative splicing.合的分析.究竟什么是影响基因产生可变剪接的因素,这些基因在产生可变剪接时有着怎样的机制或规律,不同的可变剪接的产物对蛋白质的功能有什么样的影响,等等诸多问题单纯的靠逐个基因地进行实验是无法解决的.近20年来,应用计算方法对可变剪接现象进行研究开始引起人们的关注.我国对可变剪接的研究起步比较晚,近几年才在个别单位开展,目前开展这方面研究的研究机构主要有:中科院上海生命科学研究院、清华大学生物信息研究所智能技术与系统国家重点实验室、国防科学技术大学、北京大学、上海交通大学、中科院华大基因研究中心、中科院生物物理所、天津大学、内蒙古工业大学等.可变剪接受时间和空间的限制,在不同的组织中,在相同组织的不同细胞中,在同一组织的不同发育阶段,对病理过程的不同反应等等过程中均会产生不同的剪接变体.研究发现[7]:94%以上的人类基因存在可变剪接,平均每个人类的基因有多于5个转录物变体,其中多达50%的致病突变会影响剪接;可变剪接的异常改变使得基因在转录后期产生异常的剪接变体,编码出异常的蛋白质,从而导致人类遗传疾病,甚至癌变.目前,对可变剪接与疾病的相关性已在单基因与单癌症水平上展开了研究[7].对可变剪接机制与疾病相关性的深入研究,可以为人类遗传疾病与癌症的临床诊断、预测,治疗方案的制定以及相关的生物制药提供理论上的指导.1可变剪接的基本类型可变剪接的类型主要有7种(如图1所示),分别为内含子保留(图a ,intron retention )、可变3'剪接位点(图b ,alternative 3′splice site )、可变5'剪接位点(图c ,alternative 5′splice site )、外显子跳过(图d ,exon skipping )、互斥可变外显子(图e ,mutually exclusive exons )、可变初始外显子(图f ,alternative initial exon )和可变终末外显子(图g ,alternative last exon ).表1为Christo -pher Burge 实验室基于RNA -seq 的最新实验数据,预测出人类基因里各种模式的可变剪接类型所占的比例[8].表1可变剪接类型及所占比例Table 1Patterns and percentage of alternative splicingPatterns of alternative splicing Proportion/(%)Intron retentionAlternative 3′splice site Alternative 5′splice site Exon skippingMutually exclusive exons Alternative initial exon Alternative last exo11615354138a c ebdfg王科俊等:可变剪接与疾病的生物信息学研究概况87生命科学研究2011年2可变剪接调控机制剪接体的核心部分包括一组小核RNA(small nuclear RNA,snRNA)以及与之结合的蛋白质,它们以严格的程序组装成剪接体(splicesome). snRNA成员分别为U1、U2、U4、U5和U6,长度在106(U6)~185(U2)个核苷酸之间.snRNA 与蛋白质结合在一起形成小核核糖核蛋白(small nuclear ribonucleic protein,snRNP),剪接体复合物中还有大量的其它因子.如SR蛋白质及其相关蛋白质.这些剪接因子与调节蛋白相互作用来调节剪接,可变剪接过程的调控机制多种多样.按剪接调控因子结合在RNA上的位置及作用方式,可以分为外显子增强子(ESE)、外显子抑制子(ESS)、内含子增强子(ISE)和内含子抑制子(ISS)[9].可变剪接的各调控元件,不同的增强子和抑制因子的排列组合共同决定剪接模式的变化.目前已逐步开展对于这些剪接调控因子的作用机理、作用位置及其对剪接模式的影响等的研究.近年来对于剪接增强机制的研究主要集中在对SR蛋白质的调控机制上.SR蛋白质对3′剪接位点的增强通过吸引U2AF65结合在信号较弱的多嘧啶区域.另外一种3′增强机制则不需要吸引U2AF65,而是通过SRm160和SRm300等剪接调控因子桥接ESE和剪接体组成元件来实现[10].这些调控因子含有RS(arginine-serine-rich)区域,但没有RRM(RNA recognition motif)区域,并能和snRNP、SR蛋白质之间形成多重作用关系.内含子增强因子主要通过结合某些反式作用的蛋白质来增强剪接位点的信号.剪接信号的抑制通常由hnRNP蛋白质家族(如SXL、PTB和hnRNPA1等)的作用来实现.最简单的一种机制是:结合在抑制因子上的蛋白质会直接阻止剪接体的结合.然而,剪接的抑制经常需要通过结合到多个同类型的抑制因子的蛋白质之间的协调作用来完成.已发现的有两种协调抑制的形式[11,12],这两种调控形式或通过结合在高结合强度的抑制因子上的蛋白质的增殖,或通过在RNA外将蛋白质形成环形来产生一个“抑制区域”.在这两种情况下,外显子、剪接位点和增强因子都无法接触剪接因子.在许多情况下,可变剪接事件可能由更为复杂的机制造成,比如多个增强和抑制因子同时作用.哺乳动物src N1外显子的神经系统特有的可变剪接是一个典型的多因子调控剪接例子[13].在非神经系统的细胞中,N1外显子的剪接取决于4个侧翼的CUCUCU元件,它们和PTB协调地进行结合.U2-snRNP结合在与PTB结合位置相反的上游内含子中.相反,U1snRNP的结合则不受PTB的抑制影响.在神经系统的细胞中,N1的包含则有赖于下游的ISE.该ISE和其中的一个CUCUCU元件重叠,并与hnRNPF,hnRNPH和KH类型的剪接调控蛋白质作用.该ISE复合体被nPTB蛋白质所吸引,该nPTB结合在CUCUCU元件,但没有PTB的抑制能力强. nPTB有双重作用,一方面会对抗抑制因子,另一方面却促进ISE复合体.nPTB的表达量有限,因此不足以激活N1的剪接.N1外显子中的ESE 结合SF2/ASF、hnRNPF和hnRNPH,而hnRNPA1的结合则起到抑制的调控作用.该剪接机制极为复杂,尚未完全明确.3可变剪接与遗传性疾病可变剪接是一个各种影响因素高度协调的机制,其中任何一个关键因素产生突变,都会改变正常的剪接模式,得到变异的转录体,编码出异常的蛋白质,从而导致疾病甚至癌变.已有大量与可变剪接相关的疾病记载,但是,因为有一些疾病中的突变不是致病的关键因素,所以记载的数目远远低于实际发生的数量(表2给出了现有典型与可变剪接相关疾病的信息).对可变剪接机制与疾病相关性的深入研究,可以为疾病与癌症提供合理的治疗方案.下面讨论几种与疾病有密切联系的典型剪接变异.3.1点突变早在1992年,Krawczak M等就在对101个造成人类遗传疾病的点突变研究中发现,多达15%的点突变会破坏mRNA的剪接[14].该比例在2005年提高到60%[15].2009年1月最新公布的人类基因突变数据库(Human Gene Mutation Database,HGMD[16])中有多达8532个人类基因的点突变与遗传病相关,占数据库总数的10%.需要注意的是,这个数据是来自于具体的文献记载的实验数据.实际的破坏剪接的致病点突变所占比例远远高于10%.对由于剪接位点的选择变化所导致的疾病研究较为充分的代表是地中海贫血[17]和家族性自律神经失调.家族性自律神88第1期经失调是一种由i-kappa-B蛋白激酶及其相关的复杂蛋白质功能丧失引起的隐性疾病,在德系犹太人中,发病率达1/3600[18].患儿的和脱髓鞘相关的神经系统发育异常,临床表现为呕吐、病危、步态不稳、对疼痛感减弱或消失.99.5%以上的家族性自律神经失调患者的20号外显子的5′剪接位点在20号内含子的位置6处由T突变为C.这个点突变打断了与U1-snRNA的碱基配对,U1-snRNA与上游外显子的最后3个核苷酸以及下游内含子的前6个核苷酸相配对.大多数5′剪接位点处形成7对与U1-snRNA互补的碱基对.这意味着,将导致5′剪接位点和U1-snRNA 有3个是错配的.生物信息学分析表明[19],这些错配不是随机分布的.他们或者削弱5′剪接位点的外显子部分,然后通过增加结合到内含子的部分做补偿,或者削弱5′剪接位点的内含子部分,然后通过增加结合到外显子的部分做补偿.在IKBKAP基因的20号外显子中,剪接位点的外显子部分是被削弱的,由于在位置-1处是A,与其配对的T突变为C削弱了5′剪接位点的内含子部分,导致外显子跳过[19].家族性自律神经失调的例子说明了剪接位点突变的复杂性,同时也要联系其他调控元件仔细分析,它进一步表明,关键调控基因的错误剪接会严重影响其它基因.表2互联网上关于遗传疾病的信息Table2Information about genetic diseases on the webGeneral information about alternative splicing http:///Familial dysautonomiaSubstances that influence alternative splicingTauopathiesHutchinson-Gilford progeria syndromeSpinal muscular atrophyPrader-Willi syndromeMyotonic dystrophyMedium-chain acyl-CoA dehydrogenase(MCAD)deficiency Myotonic dystrophy Frontotemporal lobar dementias/-amyotrophic lateral sclerosis / /cpds.htm http://www.molgen.ua.ac.be/ADMutations/ /////mcad_fam.htm /3.2与疾病相关的短重复元件突变在很多外显子中检测出短重复序列,这些重复序列有助于某些剪接因子的识别[20].它们长度的变化还会改变基因的剪接模式,例如:内皮细胞一氧化氮合成酶基因包含一个内含子多态化的CA重复区,该重复区与冠状动脉疾病、高同型半胱氨酸血症,在性别特异性剪接模式上的患病几率有着密切的联系[21];SELEX实验和功能研究表明[22]:CA重复元件与hnRNP L结合,并且hnRNP L活性的激活依赖于CA重复元件的长度.基因芯片的研究表明[23]:内含子序列中丰富的CA重复序列可以影响可变剪接,并且其中某些CA重复元件的多态性会引起人类疾病.另一个与疾病相关的短重复元件是UG,它会引起CFTR基因的9号外显子剪接异常,导致囊性纤维化[23].Alu重复元件是人类基因组中最大的重复群体,他们约占基因组序列总数的10%[24],Alu重复元件包含潜在的剪接位点,可以进化成外显子[25],大约5%以上的人类可变外显子都来源于Alu重复序列[26].毫无疑问,Alu重复元件中的突变会产生异常的mRNA,从而导致人类疾病,例如Alport综合症[27]、先天性白内障[28]、异形面神经综合症[28]、VII型黏多糖症[29].这些例子解释了短重复序列是如何改变可变剪接调控平衡的,尽管他们有时位于内含子中或者看似与mRNA无关.外显子化的Alu重复元件表明了如何利用新的重复元件通过进化获得新的功能,不当外显子化的Alu重复元件所引起的疾病可以被看作是失败的进化尝试.3.3可变剪接产生蛋白质亚型的比例改变神经退化性疾病是一组描述几种中枢神经系统的疾病,它们的一个共同的病理特征是:细胞内存在异常堆积的tau蛋白.该tau蛋白是由位于17号染色体上的单个基因编码的,这个基王科俊等:可变剪接与疾病的生物信息学研究概况89生命科学研究2011年因存在广泛的可变剪接,16个外显子中有8个经历可变剪接[30].人类基因的可变剪接受时间和空间的限制,例如,2号外显子、3号外显号子和10号外显子具有成人细胞组织特异性,在脑组织的不同区域中剪接是有显著差异的[30].Tau 蛋白通过微管重复区域与微管结合.这些微管蛋白结合区中有一个是由可变10号外显子编码的,10号外显子包含会产生有4个微管重复区域的蛋白质(4R),而10号外显子跳过则会产生有3个微管重复区域的蛋白质(3R).在成人中这个剪接事件具有物种特异性.在人类基因中,10号外显子在成年人细胞中是可变剪接的,而在小鼠中,这个外显子是组成性的.在这两个物种中,该外显子的作用都是在发育过程中被调节的.Andreadis对Tau基因的研究发现[30]:Tau基因中罕见的显性突变会导致额颞叶痴呆症、帕金森病以及17号染色体疾病.大多数的突变会影响10号外显子编码微管结合点的部分.Tau的10号外显子的突变导致调节元件分解.该外显子表现为由4个增强子和3个沉默子组成的可变外显子.增强子调控区的突变会减弱外显子的作用,反之,沉默子调控区的突变则会增加外显子的作用.研究发现10号外显子的突变改变其正常包含的前体mRNA编码3R和4R重复Tau 亚型的数量,这和17号染色体疾病相关[31,32].这些数据清楚地表明,剪接突变通过改变4R和3R 亚型的比例导致了神经系统的疾病.这个例子表明,由可变剪接产生的蛋白质亚型比例变化可引起人类疾病.进一步说明如何分析基因的变异体有助于理解剪接调控机制.剪接存在复杂的物种特异性,但可以通过建立动物模型来研究人类病理.3.4单核苷酸多态性高胆固醇是导致动脉粥样硬化的主要因素.低密度脂蛋白受体(LDLR)将血液中的低密度脂蛋白去除.低密度脂蛋白受体基因突变是导致高胆固醇血症的主要原因,同时高血脂是引起LDLR突变的主要因素[33].研究发现[34]:在LDLR 的12号外显子中发现一个单核苷酸多态性(SNP)可以促使这一外显子跳过.该SNP可以促使更年期前的妇女肝脏中12号外显子跳过,但是,对更年期后的妇女或者男子并没有该作用.在更年期前的妇女肝脏组织中该SNP和剪接模式都与胆固醇水平相关,在男子中却不存在这种情况.12号外显子跳过产生一个截短的LDLR,该LDLR缺乏膜结合和内化必要的跨膜区.这可能是因为由12号外显子跳过产生的异常蛋白严重阻止吸收低密度脂蛋白.这个实例阐述了由SNP引起的12号外显子跳过与胆固醇水平有关这一现象.该SNP依赖于性别的原因尚不清楚,但可能是高雌激素水平影响基因的转录水平或者可变剪接[33].载脂蛋白E(ApoE基因)是低密度脂蛋白受体的配体,载脂蛋白E的等位状态是导致阿尔茨海默氏病的一个重大因素.因此,需要研究LDLR的12号外显子中SNP是否与阿尔茨海默氏症有关.研究发现,在男性中该SNP和阿尔茨海默氏病相关,在女性中却不存在这种情况[34].这个例子很好地说明了单核苷酸多态性能够影响可变剪接,从而导致人类疾病.也反映出可变外显子调控机制是由各种因素综合控制的,一个突变依赖于其他因素,在上述实例中依赖于性别和年龄.3.5剪接因子的缺失反式作用因子如果受到剪接的影响,则可能会导致其所调控或参与调控的所有基因的表达发生异常而导致疾病.剪接体由5种snRNP和200多种蛋白质组成,这些蛋白质包括蛋白激酶、磷酸酶和解旋酶等剪接体所需要的酶,以及相关的mRNA输出因子、转录因子和剪接反式作用因子等等[35].因此,生成这些蛋白质和snRNP的基因如果由于可变剪接被破坏,将会使它们在剪接过程中的调控功能丧失,最终可能导致某种疾病.Mordes等对脊髓性肌萎缩(spinal muscular atrophy,SMA)[36]的研究,以及Winkler等对色素性视网膜炎(retinitis pigmentosa)[37]的分析表明:这两种遗传疾病都是由于生成snRNP的基因发生突变所导致的.SMA是一种影响运动神经的常染色体隐性紊乱,由于SMN1基因产物的遗失(即:突变造成该基因所生成的蛋白质异常)而导致.该基因产物是细胞质中生成核心snRNP复合物所需要的,而失去snRNP已被证明和疾病有直接联系[38].色素性视网膜炎是导致失明的一种最常见的原因,4000个人里便有一人患有此疾病[37].生成U4U5U6三聚snRNP的基因中包含色素性视网膜炎的3个主要基因———PRPF31、PRPF8和HPRP3.而U4U5U6是剪接体的主要组成部分.90第1期上述两个实例是典型的由剪接因子缺失导致剪接异常而产生的疾病,说明剪接因子在剪接调控过程中的重要性,也说明了剪接调控机制的复杂性.4可变剪接与癌症除了上述的人类遗传疾病外,剪接异常也是众多癌症的一个常见特征.和癌症相关的细胞迁移、细胞生长调控、荷尔蒙响应性、细胞死亡和化疗反应中基因表达变化都可能和可变剪接相关[39~41].有证据表明影响致癌基因(oncogene)、抑癌基因(tumour suppressor)和其它癌症相关的基因剪接的突变在癌症的起始和过程中都有因果关系[41].目前,对导致癌症中剪接缺陷的机制理解尚不清楚.在一些个案研究中发现,顺式作用元件中的遗传和体细胞突变,反式调节因子的成分、浓度、定位以及活性的变异,都会影响剪接位点的识别和作用,从而导致癌变[39,40].表3给出了典型的由可变剪接异常导致的癌症实例.我们通过已经得到很好研究的具体实例来阐述癌症中剪接机制的典型改变、致病机理,分析可变剪接对抑癌基因与致癌基因的作用原理,为今后癌症的治疗提供理论上的参考.表3可变剪接异常导致的癌症Table3Cancer caused by alternative splicingGene Splice variant Cancer typeSurvivin[42,43]FHIT[44,45]AIB1[46]VEGF[47]Actinin4[48]Cathepsin B[49]RON[50]Survivin2B with pro-apoptotic propertiesAberrant transcriptsIsoform lacking exon3Isoforms lacking exon6Variant VaCertain isoformsRonΔ165RonΔ160RonΔ155Breast carcinoma and late stage or metastatic gastric cancerGastric,cervical,thyroid and testicular germ-cell tumoursBreast cancerNon-small cell lung cancerSmall cell lung cancerColon cancerColorectal carcinoma4.1致癌信号CD44是一种多功能细胞表面糖蛋白,参与细胞增殖、分化、黏附和迁移等过程[51].通过其内部外显子的10种变体的组合与包含可以产生多种CD44亚型,某些特定的CD44剪接变体,特别是那些包含外显子v5、v6以及v7变体的亚型,在多种肿瘤中都过分表达,已经有研究证实这些变体在肿瘤细胞侵袭和转移过程中起着重要的作用[51,52].Konig和Matter等的研究表明[53,54]:外显子v5包含是由外显子的剪接调控元件———剪接增强子和剪接抑制子共同调节的.致癌的RAS信号转导途径的激活刺激外显子v5包含.由于诱导型剪接不需要蛋白的重新合成,其剪接调控可能是由后转译调节或通过控制剪接因子的细胞内定位实现的.近来对STAR(信号转导和RNA激活)蛋白质家族的一员Sam68的研究表明[55]:对ERK MAP酶磷酸化使得其被激活,进而证明是RAS诱导突变引起的外显子v5包含,从而导致的癌变.4.2顺式作用元件的破坏与癌症与疾病相关的点突变至少有15%会导致剪接缺陷,这表明顺式调控元件的破坏会导致大量的错误剪接.已经在许多易发生癌变的基因中发现导致剪接缺陷的胚系突变,例如BRCA1、BRCA2、CDKN2A和APC基因[56~61],而由于体细胞性突变导致的剪接缺陷则很少发生.胚系序列中的点突变和调节元件突变都会增加癌症的易感性,例如,BRCA1基因的18号外显子中的一个遗传性无义突变破坏一个外显子剪接增强子(ESE)及SR蛋白质SF2/ASF的结合位点,从而结构性18号外显子的不当跳过[62].抗原递呈细胞(APC)的胚系突变会导致家族性多发性腺癌(FAP).突变发生在基因的各个位置,特定位置决定疾病的严重程度[60].最近的研究发现两个破坏剪接调控元件的突变.在4号内含子的供体位点保守模体GT处插入一个T引起4号外显子跳过,从而导致轻度的家族性多发性腺癌[60];7号内含子受体位点处一个G由A替代会产生一个隐秘的剪接位点,导致8号外显子的起始处有一个单核苷酸缺失;一个单碱基移码导致APC缩短,进而引致典型息肉症[57].经常在神经纤维瘤的NF1基因中发现胚系突变和体细胞突变的杂合性缺失.Serra等对NF1体细胞突变做了系统的研究[62],结果表明大多数点突变会导致剪接缺陷,包括外显子跳跃、可变5′剪接位点和可变3′剪接位点的使用.据我们的了解,这是唯一的体王科俊等:可变剪接与疾病的生物信息学研究概况91生命科学研究2011年细胞突变导致剪接位点识别改变的研究.4.3反式调节因子的破坏与癌症许多研究表明在肿瘤中,剪接因子的表达会发生特异性的改变.已在人类卵巢癌和小鼠的乳腺癌模型发育过程中发现Tra26、YB-1、SR蛋白质SC35和ASF/SF2的高度磷酸化,mRNA过高表达.此外,这些改变还与CD44剪接模式增加的复杂性有关[63].虽然在癌症中很少发现体细胞剪接突变,但是排除了高突变率是剪接缺陷的主要原因这一假设.一般来说,剪接增强子和沉默子,特别是那些在内含子深处的,保守性不强的,因此,它们的识别以及评价单核苷酸替代对剪接效率的影响,主要视情况应用实验的方法.目前,很多突变被归类为中性、错义或无义的,进而可能影响剪接的过程.这使得研究人员致力于研究肿瘤是否有错配修复缺陷及较高的剪接缺陷率.如果一个剪接因子的表达式或活性在一个癌细胞中发生改变,它很可能会影响其他基因的剪接.因此,应该根据剪接缺陷为癌症分类.到目前为止,如何评价剪接因子的表达式或活性改变?这些改变在人类癌症中发生的频率?以及什么基因受到影响?有多少基因受到影响?等等研究还没有开展.5研究策略上面讨论的实例清晰的表明:异常的可变剪接调节是导致人类遗传疾病与癌症的主要来源.要深入了解疾病的致病机理,研究开发遗传疾病与癌症的治疗方案,以及相应的基因靶向疗法、生物药物设计等,可以在可变剪接层面上展开研究,即对可变剪接进行深入细致的研究,从而找到与疾病相关的异常剪接因素.对于这方面的研究,主要从顺式调节元件与反式作用因子两方面着手.由于受计算技术与生物技术的限制,在对顺式作用元件的早期研究上,主要基于剪接位点附近的外显子与内含子中某些特定调节元件的研究上[21,26],仅仅对单个基因或者某个组织进行研究[11,21],缺乏在基因组范围的分析,随着生物信息技术的发展,使得在基因组范围内研究可变剪接成为可能.近期的研究热点转向对各组织的可变剪接调节元件进行综合分析,我们在对11对人类组织的可变剪接进行研究中发现[64]:某些剪接在各个组织中都发生,而有些剪接只发生在特定的组织中,即在很多组织中都存在自己特异的剪接模式,或者某些剪接模式在特定的组织中过分的表达,这些具有组织特异性的剪接模式发生突变将导致相应的组织疾病,甚至癌变.为进一步研究顺式作用元件与疾病的相关性,对顺式作用元件的研究热点将集中在疾病的组织特异性剪接、癌症特异性剪接、物种特异性剪接等方向.与疾病相关的另一重要机制是反式作用因子,即调节可变剪接的各蛋白质、酶、小核RNA、hnRNP等,研究这些调节因子的异常作用与疾病的相关性,首先需要对这些因子的调节机制的进行深入分析,这些调节因子通过RNA-RNA、RNA-蛋白质、蛋白质-蛋白质等的相互作用来调节可变剪接.例如:剪接调节因子结合在基因序列的不同位置上,将对剪接产生不同的影响,精确识别出剪接因子结合到基因序列上的位置,对于可变剪接与疾病的治疗均具有重大的意义,以往对这一课题的研究主要集中在对基因序列的分析上,仅考虑序列信息,忽视了结构因素对结合位置的影响,我们将结构因素考虑进来,结合序列信息与结构信息对结合位点进行研究发现,结合了结构因素后可以显著提高结合位点的识别率[65],这说明,结构因素同样影响可变剪接,结构的改变也会导致异常的剪接,从而导致疾病.我们考虑的结构信息仅是应用Vienner软件中的Mfold软件包对最稳定的二级结构进行预测,这是基于最小自由能开发的二级结构预测程序,预测的仅是最稳定的折叠,与生物实际的二级结构存在差异,要进一步研究结构对剪接作用因子与基因序列结合位置的影响,还需要对二级结构进行进一步的研究,这也将是未来的研究热点.6结论可变剪接机制是基因在后转录时期的一项复杂而精密的调控机制,与人类遗传疾病有着密切的关系,更是癌症表达的天然来源.对可变剪接调控机制与疾病相关性的研究,有助于对致病机理的理解与深入分析;也可以为重大遗传病诊断与治疗提供理论上的指导;为肿瘤的靶向基因疗法提供准确的定位,为开发癌症的治疗方法提供新的思路;更有助于相关疾病的生物制药方案的制定.目前已有学者提出了在RNA剪接层次上治疗人类遗传疾病和癌症的思路[66~68],如:92。

相关文档
最新文档