癌症与可变剪接
rna的可变剪接名词解释
rna的可变剪接名词解释在生物学领域中,RNA的可变剪接是一个重要的概念。
在这篇文章中,我们将对可变剪接进行详细的解释和探讨。
1. 什么是RNA的可变剪接?RNA可变剪接是指基因表达过程中,通过在RNA转录过程中选择性剪切外显子(exon)和内含子(intron),从而产生多种不同的mRNA亚型的过程。
这种剪接过程使得一个基因能够编码多种不同的蛋白质,增加了基因的功能和表达的多样性。
2. 可变剪接的机制可变剪接的机制涉及到多种蛋白质和核酸的相互作用。
在RNA转录过程中,剪接酶会识别内含子与外显子的边界,并切断两者之间的连接。
然后,外显子会被连起来,形成成熟的mRNA,而内含子则会被剪除。
这个剪接过程通常由剪接信号序列来指导,而这些信号序列存在于基因的DNA序列中。
3. 可变剪接的类型可变剪接有多种类型,包括:- 保留外显子:某些外显子可能会被选择性地保留在成熟的mRNA中,从而影响蛋白质的功能和结构。
- 选择性剪切:在剪接过程中,一些外显子或内含子可能会被选择性地剪除或保留,产生不同的mRNA亚型。
- 备用剪接位点:在剪接过程中,可发生在不同的剪接位点上,从而产生具有不同外显子组合的mRNA亚型。
4. 可变剪接的意义与功能RNA的可变剪接对于生物体具有重要的意义和功能,如下所示:- 增加蛋白质的多样性:通过可变剪接,单个基因可以产生多个mRNA亚型,从而编码多种不同的蛋白质。
这种多样性使得生物体能够在不同的条件下调节基因的表达和功能。
- 调节基因表达:可变剪接可以影响mRNA的稳定性和翻译效率,进而调节基因的表达水平。
- 调控生物过程:可变剪接在生物体的许多生物过程中发挥着重要的调控作用,包括细胞分化、发育、免疫应答等。
- 疾病与可变剪接:许多疾病与可变剪接异常相关,如某些癌症、神经系统疾病等。
研究可变剪接异常可以帮助我们更好地理解疾病的发生机制,并开发相应的治疗方法。
5. 可变剪接研究的进展近年来,随着高通量测序技术和生物信息学的快速发展,可变剪接研究取得了许多重要进展。
基因可变剪接的生物学意义
基因可变剪接的生物学意义基因可变剪接是一种广泛存在于真核生物中的基因表达调控机制。
它使得一个基因可以通过剪接不同的外显子,产生多个不同的转录本和蛋白质。
这一现象的生物学意义非常重要,它不仅扩大了基因的功能潜力,还可以增加基因组的复杂度和多样性。
基因可变剪接可以增加基因功能的多样性。
通过剪接不同的外显子,一个基因可以产生多个不同的转录本,从而编码多个具有不同功能的蛋白质。
这种多样性在许多生物学过程中起着重要作用,比如细胞分化和发育过程中的基因调控。
通过选择不同的外显子组合,细胞可以产生不同的蛋白质亚型,从而适应不同的环境和功能需求。
这种基因功能的多样性为生物体的适应性演化提供了重要的基础。
基因可变剪接可以增加基因组的复杂度。
通过剪接不同的外显子,一个基因可以产生多个转录本,这些转录本可以在不同的组织和细胞类型中表达。
这种组织特异性的剪接可以增加基因组的复杂度,从而使得基因可以在不同的组织和细胞类型中发挥不同的功能。
例如,在人类基因组中,约有90%的基因存在可变剪接现象,这种复杂性使得生物体能够更加精细地调控基因表达。
基因可变剪接还可以对基因功能进行调控。
通过剪接不同的外显子,细胞可以选择性地调控基因的表达水平。
一些外显子具有调控元件的功能,它们可以通过剪接的方式参与转录调控网络,从而影响基因的表达。
这种转录后调控机制可以使得基因表达更加灵活和精细,从而适应细胞内外环境的变化。
基因可变剪接还与一些疾病的发生和发展密切相关。
许多疾病,如癌症和神经系统疾病,都与基因可变剪接异常有关。
一些研究表明,基因可变剪接的异常可以导致基因的错义剪接、缺失剪接或错位剪接,从而产生功能异常的蛋白质。
这些异常的蛋白质可能会对细胞的正常功能产生不利影响,从而导致疾病的发生和发展。
因此,研究基因可变剪接的生物学意义对于理解疾病的发生机制和寻找治疗方法具有重要的意义。
基因可变剪接是一种重要的基因表达调控机制,它可以增加基因功能的多样性,增加基因组的复杂度,调控基因的表达水平,并与一些疾病的发生和发展密切相关。
妇科癌症典型突变基因阐述
一、子宫内膜癌现有基因功能概述1、PTEN:phosphatase and tensin homolog,磷酸酶与张力蛋白同源因子,Loc.10q23.31,拥有九个外显子加上一个在转录过程中切掉的5B,8号外显子的3’端是可变剪切位点。
与其相关的其他疾病:Cowden综合症、巨形脑症、自闭症、黑色素瘤、PTEN基因错构综合症、鳞状细胞癌、甲状腺癌、脑膜癌、前列腺癌。
功能:PTEN基因编码广泛的两性磷酸酶肿瘤抑制因子,这些因子可以通过它的磷脂酶活性反作用于PI3K信号通路,抑制MAPK通路。
PTEN的结构中存在磷酸酶结构,其中的C2结构的破坏可导致其抑制胶质瘤细胞生长的活性降低,C2结构的具体作用应为将酶的催化活性位点定位于细胞膜上。
PTEN的下游有一个P53直接结合元件,此元件对于P53激活PTEN是必须的,同时也发现了一个防止PTEN持续表达的P53非依赖性元件,与P53突变细胞系相比,P53野生型更能提高PTEN的表达水平,PTEN是P53介导的鼠胚胎成纤维细胞凋亡的必须因子。
PTEN是广泛的肿瘤抑制因子。
PTEN 过分的表达会使细胞死亡。
2、PIK3CA:phosphatidylinostiol-3-kinase,catalytic-α磷脂酰激醇3磷酸激酶;Loc.3q26.32与其相关的其他疾病:乳腺癌、丁香综合征、大肠癌、Cowden综合征5、胃癌、肝癌、脂溢性角化症、多小脑回、脑积水综合征、非小细胞肺癌、卵巢癌。
功能:杂交基因组学显示有大约40%的卵巢或者其他癌症带有PIK3CA基因的高表达,PIK3CA的表达量与其活性间的关系使其成为癌症候选基因,因为很多癌症的功能与其相关,在卵巢癌中PIK3CA的表达量总是显著增加,相反如果加入PI3激酶的抑制剂则可以减少细胞的增值和促进癌细胞的凋亡,因此PIK3CA是卵巢癌当中相当重要的致癌基因。
在宫颈癌中同样检测到PIK3CA的高表达,并伴随着强的具有磷酸酶活性的产物产生,高表达的PIK3CA可以促进宫颈癌细胞的增值和抗凋亡能力。
肺腺癌和肺鳞癌中mRNA可变剪接特征的比较
肺腺癌和肺鳞癌中mRNA可变剪接特征的比较陈梦竹;王秀杰;夏立新【期刊名称】《深圳大学学报(理工版)》【年(卷),期】2017(034)001【摘要】Lung cancer is a common disease with high morbidity and mortality.Studies have shown that alternative splicing(AS)is closely associated with lung carcinogenesis,but the difference of alternative splicing between lung adenocarcinoma(LUAD)and lung squamous carcinoma(LUSC)remains unclear.Here,we analyze the RNA-Seq data of LUAD and LUSC from TCGA using SUPPA software,and find that skipping exon(SE)is the most frequently occurred AS transcript among seven main AS transcripts identified.By comparing tumor tissues with normal ones,we systematically identify differentially expressed AS transcripts in both LUAD and LUSC,of which around 60%are identical between these two subtypes.Functional analysis reveals that tumor-specific AS transcripts are mainly enriched among genes associated with cell cycleregulation,deoxyribonucleic acid metabolism and RNAmetabolism,whereas normal-specific AS transcripts are enriched among genes mainly involved in vesicle-mediated transport,peptide transport and lipid transport.By comparing AS transcripts of cancer-driven genes between LUAD and LUSC,we identify some common and subtype-specific AS transcripts with cancer-driven potentiality.%利用SUPPA(a super-fastpipeline for alternative splicing)软件分析癌症基因组数据库癌基因组图谱中肺腺癌和肺鳞癌样本的RNA-Seq数据,发现在鉴定的7种主要可变剪接转录本中外显子跳跃转录本发生频率最高.通过癌组织与癌旁组织的比较,系统地鉴定了肺腺癌和肺鳞癌中差异表达的可变剪接转录本,发现约60%的差异可变剪接转录本是两种肺癌亚型所共有的.功能富集分析表明,癌组织特异的可变剪接转录本主要富集在细胞周期调控、脱氧核糖核酸代谢和核糖核酸代谢等生物过程中,而癌旁组织特异的可变剪接转录本则主要富集在囊泡介导转运、多肽转运和脂质转运等生物过程中.通过肺癌驱动基因可变剪接转录本的比较分析,鉴定了两种肺癌亚型共有或特有的可能具有癌驱动功能的可变剪接转录本.【总页数】13页(P33-45)【作者】陈梦竹;王秀杰;夏立新【作者单位】深圳大学医学部,呼吸疾病国家重点实验室深圳大学变态反应分室,广东深圳518060;中国科学院遗传与发育生物学研究所,北京100101;深圳大学医学部,呼吸疾病国家重点实验室深圳大学变态反应分室,广东深圳518060【正文语种】中文【中图分类】R734.2;Q811.4【相关文献】1.应用原位杂交技术比较肺腺癌和肺鳞癌的内在分子机制 [J], 沈华;朱雨;吴雨洁;仇海荣;束永前2.吉西他滨联合顺铂对晚期肺鳞癌及肺腺癌治疗的临床疗效比较 [J], 李淼;晋国权3.肺腺癌及肺鳞癌MRP-mRNA的表达及临床意义 [J], 杨俊兰;石廷章;魏秀芳4.吉西他滨联合顺铂对晚期肺鳞癌及肺腺癌治疗的临床疗效比较 [J], 刘柳5.GP方案治疗晚期肺鳞癌与肺腺癌的疗效比较 [J], 方立萍;吴紫权;赵金波;张阳因版权原因,仅展示原文概要,查看原文内容请购买。
可变剪接分析
可变剪接介绍 使用UCSC Genome browser分析 可变剪接成因分析 其它分析工具及数据库 基因表达谱
一、可变剪接介绍
可变剪接 (alternative splicing) 即一个 mRNA 前体通过不同的内含子去除方式可 以获得不同成熟mRNA 。
可变剪接示意图
可变剪接是生物多样性的重要成因
可变剪接的生理意义
可变剪接与基因表达的时空性息息相关, 在不同时期,不同组织基因的表达形式 可能不同,与物种发育的不同时期对应。
可变剪接的调控与生物体的健康息息相 关,其突变可以直接导致疾病。
1.1 可变剪接背景知识
内含子剪接信号
内含子剪接需要区分外显子及内含子,识别信 号主要包括 内含子5‘ 及 3’ 末端序列及中间 分支点(branch site)附近的序列。
1.3 可变剪接的调控
可变剪接的调控机制目前还不清楚。但 越来越多的研究表明,可变剪接的调控 是通过基因序列上的顺式作用元件和核 内反式作用分子的相互作用进行的。
可变剪接的调控
主要的顺式作用元件有:
– ESE: exon splicing enhancer 外显子剪接增强子 – ISE: intron splicing enhancer 内含子剪接增强子 – ESS: exon splicing silencer 外显子剪接沉默子 – ISS: intron splicing silencer 内含子剪接沉默子
反式作用因子
SR 蛋白
因富含serine/arginine 得名,该蛋白通常含有一至两 个RNA 识别模体(RRM,RNA Recognition Motif), 羧基端有RS结构域(RS 二肽富集区)。 RRM负责介导RNA结合,决定各SR蛋白的底物特异性。 RS结构域主要参与蛋白-蛋白相互作用。
乳腺癌中c-MYC调节的剪接基因鉴定及其临床意义分析
乳腺癌中c-MYC调节的剪接基因鉴定及其临床意义分析张永明;王一澎;马飞【摘要】Objective To identify the c-MYC regulated splicing genes and assess the potential prognostic value of candidate genes in breast cancer. Method The TCGA database was used to identify genes which are co-expressed with c-MYC in breast cancer, functional enrichment analysis was performed to validate splicing genes, the interactive network analysis between splicing genes was analyzed by String database, combined with the previously reported results in lym-phoma to determine candidate genes, somatic mutations, copy number amplifications or deletions were analyzed using TCGA database, the relationship between candidate genes and breast cancer patients''survival was analyzed using the Ka-plan-Meier plotter online tools. Result A total of 16 splicing genes that were co-expressed with c-MYC were found in breast cancer, which were mainly spliceosome complexes, U12-type spliceosome complexes and spliceosomal snSNP complexes. There were different proportions of copy number amplifications at genomic level for the 16 ones. Three genes, i.e., WDR77, GEMIN4, and SNRPD1 were identified as overlapped with those previously reported in lymphoma, and were significantly associated with the overall survival and relapse-free survival of breast cancer patients. Conclusion 16 c-MYC regulated splicing genes were identified, most of them are amplified at genomic level, in which WDR77, GEM-IN4, and SNRPD1 may be prospective predictors for prognosis of breast cancerpatients.%目的鉴定c-MYC调节的剪接相关基因,分析其基因组水平的改变,并评价其潜在的预后价值.方法采用癌症和肿瘤基因图谱(TCGA)数据库分析乳腺癌中与c-MYC共表达的基因;功能富集分析剪接相关基因;采用String蛋白数据库绘制剪接基因互作网络图;采用TCGA数据库分析剪接基因在基因组水平的改变,包括突变、扩增和缺失等,对比淋巴瘤剪接基因研究确定候选基因;采用Kaplan-Meier plotter 数据库分析候选基因与乳腺癌患者生存的关系.结果乳腺癌中与c-MYC共表达的基因中剪接基因共有16个,主要为剪接体复合物、U12-型剪接体复合物和剪接体snSNP复合物.这16个剪接基因在乳腺癌中均有不同比例的拷贝数扩增.本研究分析的乳腺癌数据中与c-MYC共表达的基因与已知的淋巴瘤中的基因存在多个重叠基因,即WDR77、GEMIN4和SNRPD1,这3个基因的表达与乳腺癌患者的总生存期和无复发生存期均有关.结论在乳腺癌中鉴定了16个c-MYC调节的剪接基因,这些基因在乳腺癌中大多存在拷贝数扩增,其中WDR77、GEM-IN4和SNRPD1可作为乳腺癌预后的标志分子.【期刊名称】《癌症进展》【年(卷),期】2018(016)005【总页数】5页(P558-562)【关键词】乳腺癌;c-MYC;可变剪接;预后【作者】张永明;王一澎;马飞【作者单位】国家癌症中心/中国医学科学院北京协和医学院肿瘤医院教育处,北京1000210;国家癌症中心/中国医学科学院北京协和医学院肿瘤医院乳腺外科,北京1000210;国家癌症中心/中国医学科学院北京协和医学院肿瘤医院肿瘤内科,北京1000210【正文语种】中文【中图分类】R737.9RNA剪接是指从DNA模版链转录出的初级转录本中去除内含子,并将外显子拼接在一起,产生成熟的信使RNA的过程。
我国科学家揭示致癌蛋白作用新机制
我 国首个 交流 直接 供 电 L D 明灯 问世 E照
近期 , 由陕西省科技厅组织的专家鉴定会对陕西西电科
大华 成 电 子股 份 有 限 公 司 研 制 的 交 流 电源 直 接 供 电 LD 照 E 明灯进行 了鉴定 ,专 家组一致认 为 ,该项 目解决 了国内外 L D灯 具 的控 制 问题 ,属 于 国 内首 创 领下, 就高炉矿渣 等工业废弃物 资源化 开发进行 了大量的研究和实践,终于取得 了突破性 的成果 。 经过多年研究 , 他们成熟地掌握了高炉矿渣超细粉大 比例地 替代水泥 熟料制备高性能混凝土的配 比和方法 , 开发 了高炉 矿渣超细粉 的加工工艺 ,研究水平居国际领先 水平 。 目前 , 西 安 建 大 粉 体 所 为 太 原 钢 铁 集 团 等 5 家 钢 铁 企 业 设 计 的年
因组 上 的 4 0多 万个 结合 标 签 序 列 。 0 据介绍 , 该成果在理论和方法上的突破,将带来蛋 白质
一
西 安 交大 研 制 出 无铅 压 电材 料
用 电脑 、玩手机 ,有望不再担心铅污染。西安交大近期 研发 出一种无铅 的锆钛酸钡钙材料 , 以取代世界上广泛使 可
用了5 0多年的锆钛 酸铅 压电材料 。 这种无铅压 电材料叫锆钛酸钡钙 , 是交大 多学科材料研
方面取得 了较快的发展。 这一成果的取得 为研制更大功率 的
可变剪接国自然标书
可变剪接国自然标书1.引言1.1 概述概述可变剪接是指在基因表达过程中,基因的前体mRNA经过不同的剪接方式产生不同的成熟mRNA,进而编码不同的蛋白质。
这是一种常见且重要的基因调控机制,能够增加基因的功能多样性和复杂性。
可变剪接在生物体的生长发育、疾病的发生和进展等方面起着重要的作用,因此成为了生命科学研究的热门领域之一。
可变剪接的重要性和应用已经在许多领域得到了广泛的认可。
首先,可变剪接可以使一个基因表达多个异构体蛋白质,从而增加了蛋白质的结构和功能的多样性。
这种多样性有助于生物体适应环境的变化,并发挥复杂的生物学功能。
其次,可变剪接还可以调节基因的表达水平,通过剪接异质化来精确地调控基因的转录和翻译过程。
这种调控机制能够确保基因在特定时期、特定组织或特定环境下的准确表达,进而影响细胞和生物体的正常功能。
此外,可变剪接在疾病的发生和发展中也起着重要的作用。
许多疾病,如癌症、神经系统疾病等,都与可变剪接异常相关。
因此,对可变剪接的深入研究有助于揭示疾病的发生机制,为疾病的诊断和治疗提供新的思路和方法。
本文将重点介绍可变剪接的定义、原理及其在生物学中的重要性和应用。
首先,将对可变剪接进行详细的解释,包括其定义、原理和调控机制。
其次,将探讨可变剪接在生物学中的重要性,包括其对基因功能和表达的影响。
最后,将总结目前可变剪接的研究现状,并展望其未来的发展方向。
通过对可变剪接的深入研究,我们将能够更好地理解基因组的组织和调控机制,为生命科学的发展做出更大的贡献。
文章结构部分的内容可以按照以下方式编写:文章结构:本文主要分为引言、正文和结论三个部分。
1. 引言引言部分主要包括概述、文章结构和目的三个方面。
1.1 概述在概述部分,我们将对可变剪接进行简要介绍。
可变剪接是一种基因表达调控机制,通过在转录过程中选择不同的外显子组合,可以产生多个不同的mRNA转录本。
这一过程在真核生物中普遍存在,并对基因功能和生物多样性具有重要影响。
基于TCGA数据库分析富含丝氨酸精氨酸剪接因子家族在不同癌症中的表达及其预后意义
·402·作为调控基因表达的重要转录后调节因子,可变剪接可产生相同RNA的不同同工型,并表达产生多种功能蛋白[1]。
约90%的人类基因经历选择性剪接事件,从而显著增强人类基因组的编码能力[2]。
根据有关顺式作用元件或反式作用剪接因子的信息,机体通过选择性纳入外显子并排除内含子信息,组装成熟的mRNA [3]。
反映转录组和蛋白质组的各种RNA亚型的多样性受到多个选择性剪接调节的严格控制,以确保在特定时间特定细胞中mRNA 转录本正确表达[4]。
研究[5]报道,与正常组织相比,癌组织中某些选择性剪接模式失调,这表明异常的RNA剪接是癌症的新标志。
某些选择性剪接事件与癌症的增殖、侵袭和转移有关[6-7],如NUMB 基因的长剪接变体可促进肝癌细胞的增殖、迁移和侵袭,而短剪接变体可抑制这些生物学行为,并在肝细胞癌中发挥相反作用[8]。
在前列腺癌中,蛋白前体加工酶PACE4基因通过选择性剪接产生新的剪接变体PACE4-altCT,该剪接变体在前列腺癌中高度表达,并可诱导前列· 论著 ·基于TCGA数据库分析富含丝氨酸/精氨酸剪接因子家族在不同癌症中的表达及其预后意义刘经纬,李浩,任玲,邢承忠 (中国医科大学附属第一医院肛肠外科,沈阳 110001)摘要 目的 揭示不同类型癌症中富含丝氨酸/精氨酸剪接因子 (SRSF ) 的整体表达及其对预后的作用。
方法 从癌症基因组图谱数据库 (TCGA ) 中下载患者SRSF 表达和临床信息,分析33种癌症类型中SRSF 基因家族的表达差异及预后价值。
利用R 语言分析SRSF 基因表达、突变及其相关细胞信号通路。
结果 SRSF 在多种癌症中异常表达,并与G 2/M 检查点、DNA 修复、IL -2/STAT5信号转导、缺氧和 KRAS 多种信号转导通路以及免疫细胞浸润密切相关。
SRSF 的异常表达与癌症患者的预后显著相关。
结论 SRSF 基因异常表达可以预测癌症的预后,其可能作为癌症潜在标志物。
可变剪接与疾病的生物信息学研究概况
可变剪接与疾病的生物信息学研究概况王科俊1*,吕俊杰1,冯伟兴1,王鑫2(1.哈尔滨工程大学自动化学院,中国黑龙江哈尔滨150001;2.剑桥大学癌症分子研究中心英国剑桥)摘要:可变剪接是真核基因转录后期的重要调控机制,它使得同一条蛋白质编码基因能够产生多种转录体,极大的扩展了遗传信息的应用.研究发现,可变剪接与人类疾病有着密切的联系.错误的剪接会导致疾病,增加疾病的易感性与病变程度,甚至直接导致癌变.现对可变剪接调控机制与疾病的生物信息学研究进展进行综述.关键词:可变剪接;疾病;癌症;生物信息学中图分类号:Q752文献标识码:A文章编号:1007-7847(2011)01-0086-09The Application of Bioinformatics in the Research ofAlternative Splicing and DiseaseWANG Ke -jun 1,L 譈Jun -jie 1*,FENG Wei -xing 1,WANG Xin 2(1.College of Automation ,Harbin Engineering University ,Harbin 150001,Heilongjiang ,China ;2.Cancer Research Center ,Cambridge University ,Cambridge ,England )收稿日期:2010-09-01;修回日期:2010-12-01基金项目:国家自然科学基金资助项目(61071174);国家863计划项目(2008AA01Z148)作者简介:王科俊(1962-),男,黑龙江哈尔滨人,哈尔滨工程大学自动化学院教授,博士生导师,主要从事模式识别、多模态生物特征识别、生物信息学研究,E -mail :wangkejun@ ;吕俊杰(1982-),女,黑龙江齐齐哈尔人,博士研究生,主要从事生物信息学研究.Abstract :Alternative splicing is an important mechanism in regulating eukaryotic gene expression during post -transcriptional processing as it generates numerous transcripts from a single protein -coding gene ,whichlargely increases the use of genetic information.Researches showed that alternative splicing was highly relevant to human diseases.Wrong splicing patterns could cause disease ,contribute to disease severity and susceptibility ,and even cause cancer directly.Research progress of bioinformatics in alternative splicing regulation mechanism and disease was summarized.Key words :alternative splicing ;disease ;cancer ;bioinformatics(Life Science Research ,2011,15(1):086~094)1977年Walter Gilbert 在对Adenovirus hexon基因的研究中发现并提出可变剪接现象[1],同时,他表明一个基因的不同编码区可以拼接在一起被剪接下来,产生功能不同的信使核糖核酸,这是对可变剪接的最早描述.随后Sharp 和Roberts 发现高等生物基因的编码区被非编码区所分割,并提出分割的基因结构[2,3].这一发现推翻了传统生物学关于“一种基因对应一种蛋白质”的观点,接下来1981年,第一次在哺乳动物编码荷尔蒙降血钙素的基因中发现可变剪接现象[4],20世纪80年代初,在编码免疫球蛋白的基因中发现可变剪接[4,5].此后,可变剪接被发现广泛存在于真核生物中[6].大量关于可变剪接的实验性文章不断发表出来.很长一段时间,对可变剪接机制的研究多停留在对单个基因的可变剪接现象和机制的研究上,而缺少更为系统更为综第15卷第1期生命科学研究Vol.15No.12011年2月Life Science ResearchFeb.2011·综述·第1期图1可变剪接主要类型黑色方块表示内含子,灰色方块表示外显子;折线表示发生剪接,方块上方的折线表示正常剪接发生的位置,方块下方的折线表示发生可变剪接的位置.Fig.1Main patterns of alternative splicingBlack boxes mean exons ,gray boxes mean introns ;fold lines mean splicing ,up -fold lines mean the sites of constitutive splicing ,and down -fold lines mean the sites of alternative splicing.合的分析.究竟什么是影响基因产生可变剪接的因素,这些基因在产生可变剪接时有着怎样的机制或规律,不同的可变剪接的产物对蛋白质的功能有什么样的影响,等等诸多问题单纯的靠逐个基因地进行实验是无法解决的.近20年来,应用计算方法对可变剪接现象进行研究开始引起人们的关注.我国对可变剪接的研究起步比较晚,近几年才在个别单位开展,目前开展这方面研究的研究机构主要有:中科院上海生命科学研究院、清华大学生物信息研究所智能技术与系统国家重点实验室、国防科学技术大学、北京大学、上海交通大学、中科院华大基因研究中心、中科院生物物理所、天津大学、内蒙古工业大学等.可变剪接受时间和空间的限制,在不同的组织中,在相同组织的不同细胞中,在同一组织的不同发育阶段,对病理过程的不同反应等等过程中均会产生不同的剪接变体.研究发现[7]:94%以上的人类基因存在可变剪接,平均每个人类的基因有多于5个转录物变体,其中多达50%的致病突变会影响剪接;可变剪接的异常改变使得基因在转录后期产生异常的剪接变体,编码出异常的蛋白质,从而导致人类遗传疾病,甚至癌变.目前,对可变剪接与疾病的相关性已在单基因与单癌症水平上展开了研究[7].对可变剪接机制与疾病相关性的深入研究,可以为人类遗传疾病与癌症的临床诊断、预测,治疗方案的制定以及相关的生物制药提供理论上的指导.1可变剪接的基本类型可变剪接的类型主要有7种(如图1所示),分别为内含子保留(图a ,intron retention )、可变3'剪接位点(图b ,alternative 3′splice site )、可变5'剪接位点(图c ,alternative 5′splice site )、外显子跳过(图d ,exon skipping )、互斥可变外显子(图e ,mutually exclusive exons )、可变初始外显子(图f ,alternative initial exon )和可变终末外显子(图g ,alternative last exon ).表1为Christo -pher Burge 实验室基于RNA -seq 的最新实验数据,预测出人类基因里各种模式的可变剪接类型所占的比例[8].表1可变剪接类型及所占比例Table 1Patterns and percentage of alternative splicingPatterns of alternative splicing Proportion/(%)Intron retentionAlternative 3′splice site Alternative 5′splice site Exon skippingMutually exclusive exons Alternative initial exon Alternative last exo11615354138a c ebdfg王科俊等:可变剪接与疾病的生物信息学研究概况87生命科学研究2011年2可变剪接调控机制剪接体的核心部分包括一组小核RNA(small nuclear RNA,snRNA)以及与之结合的蛋白质,它们以严格的程序组装成剪接体(splicesome). snRNA成员分别为U1、U2、U4、U5和U6,长度在106(U6)~185(U2)个核苷酸之间.snRNA 与蛋白质结合在一起形成小核核糖核蛋白(small nuclear ribonucleic protein,snRNP),剪接体复合物中还有大量的其它因子.如SR蛋白质及其相关蛋白质.这些剪接因子与调节蛋白相互作用来调节剪接,可变剪接过程的调控机制多种多样.按剪接调控因子结合在RNA上的位置及作用方式,可以分为外显子增强子(ESE)、外显子抑制子(ESS)、内含子增强子(ISE)和内含子抑制子(ISS)[9].可变剪接的各调控元件,不同的增强子和抑制因子的排列组合共同决定剪接模式的变化.目前已逐步开展对于这些剪接调控因子的作用机理、作用位置及其对剪接模式的影响等的研究.近年来对于剪接增强机制的研究主要集中在对SR蛋白质的调控机制上.SR蛋白质对3′剪接位点的增强通过吸引U2AF65结合在信号较弱的多嘧啶区域.另外一种3′增强机制则不需要吸引U2AF65,而是通过SRm160和SRm300等剪接调控因子桥接ESE和剪接体组成元件来实现[10].这些调控因子含有RS(arginine-serine-rich)区域,但没有RRM(RNA recognition motif)区域,并能和snRNP、SR蛋白质之间形成多重作用关系.内含子增强因子主要通过结合某些反式作用的蛋白质来增强剪接位点的信号.剪接信号的抑制通常由hnRNP蛋白质家族(如SXL、PTB和hnRNPA1等)的作用来实现.最简单的一种机制是:结合在抑制因子上的蛋白质会直接阻止剪接体的结合.然而,剪接的抑制经常需要通过结合到多个同类型的抑制因子的蛋白质之间的协调作用来完成.已发现的有两种协调抑制的形式[11,12],这两种调控形式或通过结合在高结合强度的抑制因子上的蛋白质的增殖,或通过在RNA外将蛋白质形成环形来产生一个“抑制区域”.在这两种情况下,外显子、剪接位点和增强因子都无法接触剪接因子.在许多情况下,可变剪接事件可能由更为复杂的机制造成,比如多个增强和抑制因子同时作用.哺乳动物src N1外显子的神经系统特有的可变剪接是一个典型的多因子调控剪接例子[13].在非神经系统的细胞中,N1外显子的剪接取决于4个侧翼的CUCUCU元件,它们和PTB协调地进行结合.U2-snRNP结合在与PTB结合位置相反的上游内含子中.相反,U1snRNP的结合则不受PTB的抑制影响.在神经系统的细胞中,N1的包含则有赖于下游的ISE.该ISE和其中的一个CUCUCU元件重叠,并与hnRNPF,hnRNPH和KH类型的剪接调控蛋白质作用.该ISE复合体被nPTB蛋白质所吸引,该nPTB结合在CUCUCU元件,但没有PTB的抑制能力强. nPTB有双重作用,一方面会对抗抑制因子,另一方面却促进ISE复合体.nPTB的表达量有限,因此不足以激活N1的剪接.N1外显子中的ESE 结合SF2/ASF、hnRNPF和hnRNPH,而hnRNPA1的结合则起到抑制的调控作用.该剪接机制极为复杂,尚未完全明确.3可变剪接与遗传性疾病可变剪接是一个各种影响因素高度协调的机制,其中任何一个关键因素产生突变,都会改变正常的剪接模式,得到变异的转录体,编码出异常的蛋白质,从而导致疾病甚至癌变.已有大量与可变剪接相关的疾病记载,但是,因为有一些疾病中的突变不是致病的关键因素,所以记载的数目远远低于实际发生的数量(表2给出了现有典型与可变剪接相关疾病的信息).对可变剪接机制与疾病相关性的深入研究,可以为疾病与癌症提供合理的治疗方案.下面讨论几种与疾病有密切联系的典型剪接变异.3.1点突变早在1992年,Krawczak M等就在对101个造成人类遗传疾病的点突变研究中发现,多达15%的点突变会破坏mRNA的剪接[14].该比例在2005年提高到60%[15].2009年1月最新公布的人类基因突变数据库(Human Gene Mutation Database,HGMD[16])中有多达8532个人类基因的点突变与遗传病相关,占数据库总数的10%.需要注意的是,这个数据是来自于具体的文献记载的实验数据.实际的破坏剪接的致病点突变所占比例远远高于10%.对由于剪接位点的选择变化所导致的疾病研究较为充分的代表是地中海贫血[17]和家族性自律神经失调.家族性自律神88第1期经失调是一种由i-kappa-B蛋白激酶及其相关的复杂蛋白质功能丧失引起的隐性疾病,在德系犹太人中,发病率达1/3600[18].患儿的和脱髓鞘相关的神经系统发育异常,临床表现为呕吐、病危、步态不稳、对疼痛感减弱或消失.99.5%以上的家族性自律神经失调患者的20号外显子的5′剪接位点在20号内含子的位置6处由T突变为C.这个点突变打断了与U1-snRNA的碱基配对,U1-snRNA与上游外显子的最后3个核苷酸以及下游内含子的前6个核苷酸相配对.大多数5′剪接位点处形成7对与U1-snRNA互补的碱基对.这意味着,将导致5′剪接位点和U1-snRNA 有3个是错配的.生物信息学分析表明[19],这些错配不是随机分布的.他们或者削弱5′剪接位点的外显子部分,然后通过增加结合到内含子的部分做补偿,或者削弱5′剪接位点的内含子部分,然后通过增加结合到外显子的部分做补偿.在IKBKAP基因的20号外显子中,剪接位点的外显子部分是被削弱的,由于在位置-1处是A,与其配对的T突变为C削弱了5′剪接位点的内含子部分,导致外显子跳过[19].家族性自律神经失调的例子说明了剪接位点突变的复杂性,同时也要联系其他调控元件仔细分析,它进一步表明,关键调控基因的错误剪接会严重影响其它基因.表2互联网上关于遗传疾病的信息Table2Information about genetic diseases on the webGeneral information about alternative splicing http:///Familial dysautonomiaSubstances that influence alternative splicingTauopathiesHutchinson-Gilford progeria syndromeSpinal muscular atrophyPrader-Willi syndromeMyotonic dystrophyMedium-chain acyl-CoA dehydrogenase(MCAD)deficiency Myotonic dystrophy Frontotemporal lobar dementias/-amyotrophic lateral sclerosis / /cpds.htm http://www.molgen.ua.ac.be/ADMutations/ /////mcad_fam.htm /3.2与疾病相关的短重复元件突变在很多外显子中检测出短重复序列,这些重复序列有助于某些剪接因子的识别[20].它们长度的变化还会改变基因的剪接模式,例如:内皮细胞一氧化氮合成酶基因包含一个内含子多态化的CA重复区,该重复区与冠状动脉疾病、高同型半胱氨酸血症,在性别特异性剪接模式上的患病几率有着密切的联系[21];SELEX实验和功能研究表明[22]:CA重复元件与hnRNP L结合,并且hnRNP L活性的激活依赖于CA重复元件的长度.基因芯片的研究表明[23]:内含子序列中丰富的CA重复序列可以影响可变剪接,并且其中某些CA重复元件的多态性会引起人类疾病.另一个与疾病相关的短重复元件是UG,它会引起CFTR基因的9号外显子剪接异常,导致囊性纤维化[23].Alu重复元件是人类基因组中最大的重复群体,他们约占基因组序列总数的10%[24],Alu重复元件包含潜在的剪接位点,可以进化成外显子[25],大约5%以上的人类可变外显子都来源于Alu重复序列[26].毫无疑问,Alu重复元件中的突变会产生异常的mRNA,从而导致人类疾病,例如Alport综合症[27]、先天性白内障[28]、异形面神经综合症[28]、VII型黏多糖症[29].这些例子解释了短重复序列是如何改变可变剪接调控平衡的,尽管他们有时位于内含子中或者看似与mRNA无关.外显子化的Alu重复元件表明了如何利用新的重复元件通过进化获得新的功能,不当外显子化的Alu重复元件所引起的疾病可以被看作是失败的进化尝试.3.3可变剪接产生蛋白质亚型的比例改变神经退化性疾病是一组描述几种中枢神经系统的疾病,它们的一个共同的病理特征是:细胞内存在异常堆积的tau蛋白.该tau蛋白是由位于17号染色体上的单个基因编码的,这个基王科俊等:可变剪接与疾病的生物信息学研究概况89生命科学研究2011年因存在广泛的可变剪接,16个外显子中有8个经历可变剪接[30].人类基因的可变剪接受时间和空间的限制,例如,2号外显子、3号外显号子和10号外显子具有成人细胞组织特异性,在脑组织的不同区域中剪接是有显著差异的[30].Tau 蛋白通过微管重复区域与微管结合.这些微管蛋白结合区中有一个是由可变10号外显子编码的,10号外显子包含会产生有4个微管重复区域的蛋白质(4R),而10号外显子跳过则会产生有3个微管重复区域的蛋白质(3R).在成人中这个剪接事件具有物种特异性.在人类基因中,10号外显子在成年人细胞中是可变剪接的,而在小鼠中,这个外显子是组成性的.在这两个物种中,该外显子的作用都是在发育过程中被调节的.Andreadis对Tau基因的研究发现[30]:Tau基因中罕见的显性突变会导致额颞叶痴呆症、帕金森病以及17号染色体疾病.大多数的突变会影响10号外显子编码微管结合点的部分.Tau的10号外显子的突变导致调节元件分解.该外显子表现为由4个增强子和3个沉默子组成的可变外显子.增强子调控区的突变会减弱外显子的作用,反之,沉默子调控区的突变则会增加外显子的作用.研究发现10号外显子的突变改变其正常包含的前体mRNA编码3R和4R重复Tau 亚型的数量,这和17号染色体疾病相关[31,32].这些数据清楚地表明,剪接突变通过改变4R和3R 亚型的比例导致了神经系统的疾病.这个例子表明,由可变剪接产生的蛋白质亚型比例变化可引起人类疾病.进一步说明如何分析基因的变异体有助于理解剪接调控机制.剪接存在复杂的物种特异性,但可以通过建立动物模型来研究人类病理.3.4单核苷酸多态性高胆固醇是导致动脉粥样硬化的主要因素.低密度脂蛋白受体(LDLR)将血液中的低密度脂蛋白去除.低密度脂蛋白受体基因突变是导致高胆固醇血症的主要原因,同时高血脂是引起LDLR突变的主要因素[33].研究发现[34]:在LDLR 的12号外显子中发现一个单核苷酸多态性(SNP)可以促使这一外显子跳过.该SNP可以促使更年期前的妇女肝脏中12号外显子跳过,但是,对更年期后的妇女或者男子并没有该作用.在更年期前的妇女肝脏组织中该SNP和剪接模式都与胆固醇水平相关,在男子中却不存在这种情况.12号外显子跳过产生一个截短的LDLR,该LDLR缺乏膜结合和内化必要的跨膜区.这可能是因为由12号外显子跳过产生的异常蛋白严重阻止吸收低密度脂蛋白.这个实例阐述了由SNP引起的12号外显子跳过与胆固醇水平有关这一现象.该SNP依赖于性别的原因尚不清楚,但可能是高雌激素水平影响基因的转录水平或者可变剪接[33].载脂蛋白E(ApoE基因)是低密度脂蛋白受体的配体,载脂蛋白E的等位状态是导致阿尔茨海默氏病的一个重大因素.因此,需要研究LDLR的12号外显子中SNP是否与阿尔茨海默氏症有关.研究发现,在男性中该SNP和阿尔茨海默氏病相关,在女性中却不存在这种情况[34].这个例子很好地说明了单核苷酸多态性能够影响可变剪接,从而导致人类疾病.也反映出可变外显子调控机制是由各种因素综合控制的,一个突变依赖于其他因素,在上述实例中依赖于性别和年龄.3.5剪接因子的缺失反式作用因子如果受到剪接的影响,则可能会导致其所调控或参与调控的所有基因的表达发生异常而导致疾病.剪接体由5种snRNP和200多种蛋白质组成,这些蛋白质包括蛋白激酶、磷酸酶和解旋酶等剪接体所需要的酶,以及相关的mRNA输出因子、转录因子和剪接反式作用因子等等[35].因此,生成这些蛋白质和snRNP的基因如果由于可变剪接被破坏,将会使它们在剪接过程中的调控功能丧失,最终可能导致某种疾病.Mordes等对脊髓性肌萎缩(spinal muscular atrophy,SMA)[36]的研究,以及Winkler等对色素性视网膜炎(retinitis pigmentosa)[37]的分析表明:这两种遗传疾病都是由于生成snRNP的基因发生突变所导致的.SMA是一种影响运动神经的常染色体隐性紊乱,由于SMN1基因产物的遗失(即:突变造成该基因所生成的蛋白质异常)而导致.该基因产物是细胞质中生成核心snRNP复合物所需要的,而失去snRNP已被证明和疾病有直接联系[38].色素性视网膜炎是导致失明的一种最常见的原因,4000个人里便有一人患有此疾病[37].生成U4U5U6三聚snRNP的基因中包含色素性视网膜炎的3个主要基因———PRPF31、PRPF8和HPRP3.而U4U5U6是剪接体的主要组成部分.90第1期上述两个实例是典型的由剪接因子缺失导致剪接异常而产生的疾病,说明剪接因子在剪接调控过程中的重要性,也说明了剪接调控机制的复杂性.4可变剪接与癌症除了上述的人类遗传疾病外,剪接异常也是众多癌症的一个常见特征.和癌症相关的细胞迁移、细胞生长调控、荷尔蒙响应性、细胞死亡和化疗反应中基因表达变化都可能和可变剪接相关[39~41].有证据表明影响致癌基因(oncogene)、抑癌基因(tumour suppressor)和其它癌症相关的基因剪接的突变在癌症的起始和过程中都有因果关系[41].目前,对导致癌症中剪接缺陷的机制理解尚不清楚.在一些个案研究中发现,顺式作用元件中的遗传和体细胞突变,反式调节因子的成分、浓度、定位以及活性的变异,都会影响剪接位点的识别和作用,从而导致癌变[39,40].表3给出了典型的由可变剪接异常导致的癌症实例.我们通过已经得到很好研究的具体实例来阐述癌症中剪接机制的典型改变、致病机理,分析可变剪接对抑癌基因与致癌基因的作用原理,为今后癌症的治疗提供理论上的参考.表3可变剪接异常导致的癌症Table3Cancer caused by alternative splicingGene Splice variant Cancer typeSurvivin[42,43]FHIT[44,45]AIB1[46]VEGF[47]Actinin4[48]Cathepsin B[49]RON[50]Survivin2B with pro-apoptotic propertiesAberrant transcriptsIsoform lacking exon3Isoforms lacking exon6Variant VaCertain isoformsRonΔ165RonΔ160RonΔ155Breast carcinoma and late stage or metastatic gastric cancerGastric,cervical,thyroid and testicular germ-cell tumoursBreast cancerNon-small cell lung cancerSmall cell lung cancerColon cancerColorectal carcinoma4.1致癌信号CD44是一种多功能细胞表面糖蛋白,参与细胞增殖、分化、黏附和迁移等过程[51].通过其内部外显子的10种变体的组合与包含可以产生多种CD44亚型,某些特定的CD44剪接变体,特别是那些包含外显子v5、v6以及v7变体的亚型,在多种肿瘤中都过分表达,已经有研究证实这些变体在肿瘤细胞侵袭和转移过程中起着重要的作用[51,52].Konig和Matter等的研究表明[53,54]:外显子v5包含是由外显子的剪接调控元件———剪接增强子和剪接抑制子共同调节的.致癌的RAS信号转导途径的激活刺激外显子v5包含.由于诱导型剪接不需要蛋白的重新合成,其剪接调控可能是由后转译调节或通过控制剪接因子的细胞内定位实现的.近来对STAR(信号转导和RNA激活)蛋白质家族的一员Sam68的研究表明[55]:对ERK MAP酶磷酸化使得其被激活,进而证明是RAS诱导突变引起的外显子v5包含,从而导致的癌变.4.2顺式作用元件的破坏与癌症与疾病相关的点突变至少有15%会导致剪接缺陷,这表明顺式调控元件的破坏会导致大量的错误剪接.已经在许多易发生癌变的基因中发现导致剪接缺陷的胚系突变,例如BRCA1、BRCA2、CDKN2A和APC基因[56~61],而由于体细胞性突变导致的剪接缺陷则很少发生.胚系序列中的点突变和调节元件突变都会增加癌症的易感性,例如,BRCA1基因的18号外显子中的一个遗传性无义突变破坏一个外显子剪接增强子(ESE)及SR蛋白质SF2/ASF的结合位点,从而结构性18号外显子的不当跳过[62].抗原递呈细胞(APC)的胚系突变会导致家族性多发性腺癌(FAP).突变发生在基因的各个位置,特定位置决定疾病的严重程度[60].最近的研究发现两个破坏剪接调控元件的突变.在4号内含子的供体位点保守模体GT处插入一个T引起4号外显子跳过,从而导致轻度的家族性多发性腺癌[60];7号内含子受体位点处一个G由A替代会产生一个隐秘的剪接位点,导致8号外显子的起始处有一个单核苷酸缺失;一个单碱基移码导致APC缩短,进而引致典型息肉症[57].经常在神经纤维瘤的NF1基因中发现胚系突变和体细胞突变的杂合性缺失.Serra等对NF1体细胞突变做了系统的研究[62],结果表明大多数点突变会导致剪接缺陷,包括外显子跳跃、可变5′剪接位点和可变3′剪接位点的使用.据我们的了解,这是唯一的体王科俊等:可变剪接与疾病的生物信息学研究概况91生命科学研究2011年细胞突变导致剪接位点识别改变的研究.4.3反式调节因子的破坏与癌症许多研究表明在肿瘤中,剪接因子的表达会发生特异性的改变.已在人类卵巢癌和小鼠的乳腺癌模型发育过程中发现Tra26、YB-1、SR蛋白质SC35和ASF/SF2的高度磷酸化,mRNA过高表达.此外,这些改变还与CD44剪接模式增加的复杂性有关[63].虽然在癌症中很少发现体细胞剪接突变,但是排除了高突变率是剪接缺陷的主要原因这一假设.一般来说,剪接增强子和沉默子,特别是那些在内含子深处的,保守性不强的,因此,它们的识别以及评价单核苷酸替代对剪接效率的影响,主要视情况应用实验的方法.目前,很多突变被归类为中性、错义或无义的,进而可能影响剪接的过程.这使得研究人员致力于研究肿瘤是否有错配修复缺陷及较高的剪接缺陷率.如果一个剪接因子的表达式或活性在一个癌细胞中发生改变,它很可能会影响其他基因的剪接.因此,应该根据剪接缺陷为癌症分类.到目前为止,如何评价剪接因子的表达式或活性改变?这些改变在人类癌症中发生的频率?以及什么基因受到影响?有多少基因受到影响?等等研究还没有开展.5研究策略上面讨论的实例清晰的表明:异常的可变剪接调节是导致人类遗传疾病与癌症的主要来源.要深入了解疾病的致病机理,研究开发遗传疾病与癌症的治疗方案,以及相应的基因靶向疗法、生物药物设计等,可以在可变剪接层面上展开研究,即对可变剪接进行深入细致的研究,从而找到与疾病相关的异常剪接因素.对于这方面的研究,主要从顺式调节元件与反式作用因子两方面着手.由于受计算技术与生物技术的限制,在对顺式作用元件的早期研究上,主要基于剪接位点附近的外显子与内含子中某些特定调节元件的研究上[21,26],仅仅对单个基因或者某个组织进行研究[11,21],缺乏在基因组范围的分析,随着生物信息技术的发展,使得在基因组范围内研究可变剪接成为可能.近期的研究热点转向对各组织的可变剪接调节元件进行综合分析,我们在对11对人类组织的可变剪接进行研究中发现[64]:某些剪接在各个组织中都发生,而有些剪接只发生在特定的组织中,即在很多组织中都存在自己特异的剪接模式,或者某些剪接模式在特定的组织中过分的表达,这些具有组织特异性的剪接模式发生突变将导致相应的组织疾病,甚至癌变.为进一步研究顺式作用元件与疾病的相关性,对顺式作用元件的研究热点将集中在疾病的组织特异性剪接、癌症特异性剪接、物种特异性剪接等方向.与疾病相关的另一重要机制是反式作用因子,即调节可变剪接的各蛋白质、酶、小核RNA、hnRNP等,研究这些调节因子的异常作用与疾病的相关性,首先需要对这些因子的调节机制的进行深入分析,这些调节因子通过RNA-RNA、RNA-蛋白质、蛋白质-蛋白质等的相互作用来调节可变剪接.例如:剪接调节因子结合在基因序列的不同位置上,将对剪接产生不同的影响,精确识别出剪接因子结合到基因序列上的位置,对于可变剪接与疾病的治疗均具有重大的意义,以往对这一课题的研究主要集中在对基因序列的分析上,仅考虑序列信息,忽视了结构因素对结合位置的影响,我们将结构因素考虑进来,结合序列信息与结构信息对结合位点进行研究发现,结合了结构因素后可以显著提高结合位点的识别率[65],这说明,结构因素同样影响可变剪接,结构的改变也会导致异常的剪接,从而导致疾病.我们考虑的结构信息仅是应用Vienner软件中的Mfold软件包对最稳定的二级结构进行预测,这是基于最小自由能开发的二级结构预测程序,预测的仅是最稳定的折叠,与生物实际的二级结构存在差异,要进一步研究结构对剪接作用因子与基因序列结合位置的影响,还需要对二级结构进行进一步的研究,这也将是未来的研究热点.6结论可变剪接机制是基因在后转录时期的一项复杂而精密的调控机制,与人类遗传疾病有着密切的关系,更是癌症表达的天然来源.对可变剪接调控机制与疾病相关性的研究,有助于对致病机理的理解与深入分析;也可以为重大遗传病诊断与治疗提供理论上的指导;为肿瘤的靶向基因疗法提供准确的定位,为开发癌症的治疗方法提供新的思路;更有助于相关疾病的生物制药方案的制定.目前已有学者提出了在RNA剪接层次上治疗人类遗传疾病和癌症的思路[66~68],如:92。
Numb基因及其可变剪接在胰腺癌
!M"!Numb基因及其可变剪接在胰腺癌中的研究进展李鹏昊,郑楷炼,许熊飞,金 钢海军军医大学长海医院肝胆胰脾外科,上海200433摘要:胰腺癌是一种常见的消化道肿瘤,恶性程度高,预后极差。
目前针对胰腺癌有多种治疗方案,但效果均不太理想。
阐明胰腺癌发病机制仍是临床亟需解决的重要难题。
可变剪接是真核生物基因表达调控的重要手段,同一基因的剪接异构体介导产生不同生物学表型,其异常可导致诸多疾病的产生。
Numb,一种重要的细胞命运决定蛋白,其可变剪接近年来被发现与癌症的发生密切相关。
在胰腺癌中Numb的选择性剪接可产生多种不同亚型的Numb蛋白,对癌症相关通路的活化以及肿瘤细胞生物学行为具有不同的调节作用,探索Numb的剪接异构体在胰腺癌中不同功能有利于解释胰腺癌发病机理和新疗法的开发。
本文就Numb蛋白在胰腺癌中研究进展进行综述,着重探讨其剪接异构体功能特点以及不同亚型对胰腺癌各方面的调节作用。
关键词:胰腺肿瘤;Numb;剪接体基金项目:上海市2020年度“科技创新行动计划”自然科学基金项目(20ZR1457300)NumbanditsalternativesplicinginpancreaticcancerLIPenghao,ZHENGKailian,XUXiongfei,JINGang.(DepartmentofHepatobiliaryPancreaticandSplenicSurgery,ChanghaiHospital,NavalMedicalUniversity,Shanghai200433,China)Correspondingauthor:ZHENGKailian,zhengkl828@126.com(ORCID:0000-0002-7341-0639)Abstract:Pancreaticcancer,acommondigestivesystemtumorwithhighmalignancyandapoorprognosis,hasseveraltreatmentoptions.However,noneofthemareparticularlyeffectivebecauseunderstandingthepathogenesisofpancreaticcancerremainsasignificantclinicalchallenge.Splicingisoformsmediatevariousbiologicalphenotypesasanimportantmeansofregulatinggeneexpressionineukaryotes,andtheirabnormalitiescanleadtoavarietyofdiseases.Numbisanimportantcellfatedeterminingproteinwhosealternativesplicinghasbeenlinkedtothedevelopmentofvariouscancers.Inpancreaticcancer,selectivesplicingofNumbcanresultinavarietyofNumbproteinsub types,eachwithadifferentregulatoryeffectontheactivationofvariouscancer-relatedsignalpathwaysandtumorcellbiology.ThispaperreviewstherecentprogressofNumbproteinresearchinpancreaticcancer,withafocusontheregulatoryroleofitsdifferentisoformsinpath ogenesis.Keywords:PancreaticNeoplasms;Numb;SpliceosomesResearchfunding:NaturalScienceFundprojectofShanghai2020“ScienceandTechnologyInnovationActionPlan”(20ZR1457300)DOI:10.3969/j.issn.1001-5256.2022.12.042收稿日期:2022-06-01;录用日期:2022-07-22通信作者:郑楷炼,zhengkl828@126.com 胰腺癌是预后极差的消化系统恶性肿瘤。
基于可变剪接紊乱的乳腺癌亚型预测分析
第42卷第6期电子与信息学报Vol. 42No. 6 2020年6月Journal of Electronics & Information Technology Jun. 2020基于可变剪接紊乱的乳腺癌亚型预测分析许鹏①③王兵②方刚①石晓龙①刘文斌*①②①(广州大学计算科技研究院广州 510006)②(温州大学计算机与人工智能学院温州 325035)③(黔南民族师范学院计算机与信息学院都匀 558000)摘要:可变剪接与多种复杂疾病的发生、发展存在密切的联系,包括肿瘤在内的多种疾病的产生往往伴随着可变剪接的紊乱发生。
现有的乳腺癌亚型分析主要是基于单个剪接异构体出发,缺少考虑亚型之间由于可变剪接紊乱造成剪接异构体在整体分布上的差异。
因此该文提出了基于可变剪接紊乱的乳腺癌亚型预测方法,主要使用Jensen-Shannon(JS)散度来找寻亚型之间的可变剪接紊乱差异较大的基因,并构建反向传播(BP)神经网络模型对乳腺癌亚型进行分类。
结果表明,该方法不仅能有效发现肿瘤异质性分子,在乳腺癌亚型分类方面也有较好的识别结果,其平均F1值达到0.89,且能为患者提供个性化乳腺癌亚型药物推荐。
该文的研究将有效促进基于可变剪接紊乱的乳腺癌亚型研究的发展。
关键词:乳腺癌亚型预测;可变剪接;Jensen-Shannon散度;反向传播神经网络;药物推荐中图分类号:TP391文献标识码:A文章编号:1009-5896(2020)06-1348-08 DOI: 10.11999/JEIT190871Analysis of Breast Cancer Subtypes Prediction Based onAlternative Splicing DisordersXU Peng①③ WANG Bing② FANG Gang① SHI Xiaolong① LIU Wenbin①②①(Institute of Computing Science and Technology, Guangzhou University, Guangzhou 510006, China)②(College of Computer Science and Artificial Intelligence, Wenzhou University, Wenzhou 325035, China)③(School of Computer Science and Information Technology, Qiannan Normal Universityfor Nationalities, Duyun 558000, China)Abstract: Alternative splicing is closely related to the occurrence and development of a variety of complex diseases, the emergence of various diseases including tumors is often accompanied by the occurrence of alternative splicing disorders. The existing analysis of breast cancer subtypes is mainly based on single splicing isoform, and the difference in the overall distribution of splicing isoforms caused by alternative splicing disorders among subtypes is not considered. Therefore, a prediction method of breast cancer subtypes based on alternative splicing disorders is proposed, which mainly uses Jensen-Shannon(JS) divergence to find genes with large differences in alternative splicing disorders between subtypes, then constructes Back Propagation(BP) neural network model to classify breast cancer subtypes. The results show that this method could not only effectively detect tumor heterogeneous molecules, but also had good identification results in the classification of breast cancer subtypes, with an average F1-score of 0.89, and could provide personalized drug recommendations for patients with breast cancer subtypes. This study will effectively promote the development of breast cancer subtypes based on alternative splicing disorders.Key words: Breast cancer subtypes predicion; Alternative splicing; Jensen-Shannon(JS) divergence; Back Propagation(BP) neural network; Drug recommendation收稿日期:2019-11-01;改回日期:2020-05-10;网络出版:2020-05-23*通信作者:刘文斌 *****************基金项目:国家重点研发计划(2019YFA0706402),国家自然科学基金(61572367, 61573017, 61972107, 61972109)Foundation Items: The National Key R&D Program of China (2019YFA0706402), The National Natural Science Foundation of China (61572367, 61573017, 61972107, 61972109)1 引言可变剪接(Alternative Splicing, AS)是指有些基因的一个前体mRNA通过不同的剪接方式产生不同mRNA剪接异构体(isoform)的过程[1]。
可变剪接的鉴定
可变剪接的鉴定:揭示基因表达的奥秘在生命科学领域,基因的表达调控是一个复杂而有趣的话题。
其中,可变剪接作为一种重要的基因表达调控方式,引起了科学家们的广泛关注。
本文将探讨可变剪接的鉴定方法,以期为深入了解基因表达的奥秘提供思路。
一、可变剪接概述可变剪接是指在基因转录过程中,由于外显子选择、跳跃、重叠或组合的差异,导致同一基因产生多种不同的转录本。
这些转录本在细胞、组织或个体发育过程中表达,从而影响生物体的表型和功能。
可变剪接的异常与多种疾病的发生发展密切相关,因此对可变剪接的鉴定具有重要的生物学意义。
二、可变剪接的鉴定方法1.基因组学方法基因组学方法是通过比较不同物种或同一物种不同发育阶段的基因组序列,寻找可变剪接位点。
随着新一代测序技术的发展,全基因组测序和转录组测序已成为鉴定可变剪接的主要手段。
通过对测序数据进行深入分析,可以发现不同转录本的表达模式,进而揭示可变剪接的规律。
2.生物信息学方法生物信息学方法是通过分析基因表达谱、转录组数据等大规模生物数据,挖掘可变剪接事件。
常用的生物信息学工具有:ASprofile、ASPIRE、DEXSeq等。
这些工具可以帮助研究人员快速准确地鉴定可变剪接事件,并对其功能进行预测和分析。
3.实验验证方法实验验证是鉴定可变剪接的可靠手段。
通过实时荧光定量PCR、Northern blot、Western blot等技术,可以检测不同转录本在特定组织或发育阶段的表达情况。
此外,利用细胞和分子生物学技术,可以进一步研究可变剪接对蛋白质功能的影响。
例如,通过蛋白质相互作用实验、亚细胞定位等手段,可以揭示可变剪接对蛋白质功能的影响。
三、可变剪接的生物学意义1.促进物种多样性可变剪接作为一种重要的基因表达调控方式,在物种进化过程中发挥了重要作用。
通过可变剪接,同一基因可以产生多种不同的转录本,从而增加物种的多样性。
研究表明,可变剪接在不同物种间具有保守性,但也存在一定程度的变异。
外显子可变剪接的控制和功能分析
外显子可变剪接的控制和功能分析外显子可变剪接是一种重要的生物学过程,它决定了基因表达的多样性和可变性。
在这种过程中,原本精准的RNA翻译变得更加复杂,因为同一基因可以通过剪接产生多个不同的转录本。
这些转录本具有不同的外显子组成,从而导致不同的蛋白质编码序列。
因此,外显子可变剪接对细胞功能和生理过程具有重要的影响。
控制外显子可变剪接的机制有许多,包括转录因子的结合、RNA切割复合物的招募和RNA结构阻碍。
其中,核糖核酸处理酶(hnRNP)是一种重要的RNA结构阻碍因子,它被认为是外显子可变剪接的主要调节器之一。
hnRNPs可以通过与RNA的不同部位结合来影响RNA的结构和可变剪接,因此具有重要的生物学功能。
hnRNPs具有相互竞争的关系,其中一些可以促进外显子含量的缩减,而其他一些则可以促进外显子含量的增加。
因此,不同组分的竞争,以及它们与其他RNA和蛋白质相互作用所形成的网络结构,是外显子可变剪接的主要调节机制之一。
在外显子可变剪接中,不同外显子的含量和组合对生物学过程具有不同的影响。
例如,一些转录本的细胞内稳定性可能较低,因而难以在细胞内累积。
其他转录本可能具有特定的功能域或修饰位点,因此对蛋白质功能具有重要的影响。
外显子可变剪接对以下生理过程具有重要的影响:免疫反应、细胞周期、细胞分化和发育、神经元功能和癌症等。
在免疫反应中,外显子可变剪接可以产生多种不同类型的T细胞和B细胞,每种类型都具有特定的功能和抗原识别特性。
在细胞周期中,外显子可变剪接可以影响几个关键的增殖和凋亡信号通路。
在细胞分化和发育中,外显子可变剪接可以促进细胞类型分化和组织发育。
在神经元功能中,外显子可变剪接可以调节神经元的活动和突触可塑性。
在癌症中,外显子可变剪接可以导致癌症细胞的增殖、转移和治疗抵抗。
总之,外显子可变剪接是一个复杂的生物学过程,它由多个调节因子和优选反应机制所控制。
深入了解这一过程的机理和功能,有助于识别新的调节因子和产生新的治疗方法,从而对广泛的生物学过程产生重要影响。
可变剪接在遗传学研究中的应用
可变剪接在遗传学研究中的应用可变剪接是一种广泛存在于真核生物中的基因表达调控机制。
自上世纪70年代发现以来,人们逐渐认识到可变剪接在生命科学中的重要性和应用潜力。
在遗传学研究中,可变剪接已经成为一个热门的领域,被广泛用于研究各种生命现象,如生长发育、疾病发生、表观遗传变异等。
本文将介绍可变剪接在遗传学研究中的应用,重点探讨可变剪接在疾病诊断和药物开发中的意义。
一、基因可变剪接的定义及其重要性基因剪接是真核生物在mRNA转录过程中,将大量非编码序列(内含子)从初级转cript中剪除,剩余部分经过拼接形成成熟mRNA的过程。
在这个过程中,可变剪接是指同一基因可产生多种亚型mRNA的现象,这些亚型诱导的蛋白质具有不同的结构和功能特征。
可变剪接可以大幅度增强生物体对基因信息的表达和运用,也可以通过调控表达多种形态的蛋白质来影响机体形态和功能。
在许多细胞特异性和组织特异性表达的动物基因中,可变剪接现象尤为常见。
随着技术的进步和对可变剪接的深入研究,越来越多的证据表明可变剪接在常见疾病、遗传疾病的发生中发挥了重要作用。
二、可变剪接在常见疾病的诊断中的应用1、癌症研究癌症是世界范围内最常见的疾病之一,具有异质性和复杂性。
许多肿瘤标志物也来自可变剪接产物和可变剪接因子。
可变剪接缺陷和异常播放被认为是许多肿瘤的发生和发展的一个关键因素。
研究已表明,癌症细胞中存在大量的可变剪接事件,这些事件产生的蛋白质可能会影响癌症的病理进程并诱导癌症征象。
因此,可变剪接在癌症的早期诊断和治疗中具有巨大的应用潜力。
2、糖尿病研究糖尿病是一种常见的慢性代谢性疾病,主要由胰岛素异常分泌和胰岛素抵抗所引起。
与正常人相比,2型糖尿病患者的可变剪接活动水平更高。
一项研究表明,2型糖尿病患者中可变剪接的不同,可能导致过度表达不良的胰岛素亚型,在胰岛素分泌和胰岛素抵抗上产生了负面影响。
此外,糖尿病相关SNP的剪接性质与糖尿病的发病率密切相关。
可变剪接可以影响胰岛素的功能和胰腺的分泌,因此在糖尿病的诊断和治疗中具有潜力。
可变剪切的生物学意义
可变剪切的生物学意义摘要:一、引言二、可变剪切的定义与类型1.剪切位点选择2.外显子跳跃3.替代性剪切4.RNA编辑三、可变剪切在生物学中的作用1.基因表达调控2.蛋白质多样性3.细胞功能调控四、可变剪切与疾病关联1.遗传病2.肿瘤3.神经退行性疾病五、研究可变剪切的实验方法与技术1.高通量测序技术2.生物信息学分析3.基因敲除/敲入实验六、未来展望与挑战1.个性化治疗2.药物研发3.伦理与法律问题七、结论正文:可变剪切的生物学意义一、引言可变剪切(Alternative Splicing,AS)作为一种基因表达调控机制,广泛存在于真核生物的转录过程中。
近年来,随着高通量测序技术的发展,对可变剪切的研究越来越受到广泛关注。
本文将探讨可变剪切的定义、类型及其在生物学中的作用,进一步讨论与疾病关联以及研究方法,最后对未来的挑战和机遇进行展望。
二、可变剪切的定义与类型1.剪切位点选择:在转录过程中,RNA聚合酶会在特定的剪切位点将前体RNA剪切成成熟RNA。
剪切位点选择是指转录本在剪切过程中,可以选择不同的剪切位点产生不同的成熟RNA。
2.外显子跳跃:外显子跳跃是指在剪切过程中,部分外显子被跳过,从而产生不同长度和功能的RNA。
这种现象使得同一个基因可以编码具有不同功能的蛋白质。
3.替代性剪切:替代性剪切是指在转录本剪切过程中,可以选择不同的剪切模式产生具有不同氨基酸序列的成熟RNA。
这种现象使得同一个基因可以编码多种蛋白质。
4.RNA编辑:RNA编辑是指在剪切过程中,部分核苷酸被替换、添加或删除,从而改变RNA序列和编码的蛋白质。
这种现象可以在基因表达调控中发挥重要作用。
三、可变剪切在生物学中的作用1.基因表达调控:可变剪切作为一种重要的基因表达调控机制,可以影响基因的表达水平和活性。
通过可变剪切,同一个基因可以产生不同转录本,从而在不同的时间和空间调控基因表达。
2.蛋白质多样性:可变剪切导致前体RNA经过不同的剪切和RNA编辑过程,产生具有不同氨基酸序列的成熟RNA。
真核生物基因剪接的调控机制
真核生物基因剪接的调控机制随着基因组学和转录组学的快速发展,越来越多的证据表明,真核生物的基因表达受到基因剪接的广泛影响。
基因剪接是一种对于RNA前体分子在转录后进行剪切和拼接的调节机制,从而形成各种不同的转录本和蛋白质亚型[1]。
基因剪接的失调与多种人类疾病的发生密切相关,如血友病、肌萎缩性脊髓侧索硬化症和癌症等[2]。
因此,深入了解和探究基因剪接的调控机制,将有助于我们更好地理解真核生物的基因表达和调节。
一、基因剪接的类型基因剪接的类型包括基本剪接(canonical splicing)、非基本剪接(non-canonical splicing)和选择性剪接(alternative splicing)等[3]。
1. 基本剪接基本剪接是指在供体位点(donor site)和受体位点(acceptor site)之间,通过被称为spliceosome的大分子复合物介导的剪接,剪去内含子(intron),将外显子(exon)拼接起来,形成成熟的mRNA[1][3]。
在人类基因组中,大约90%的内含子通过基本剪接形成了确切的外显子序列[2]。
2. 非基本剪接非基本剪接是指与基本剪接不同的剪接方式。
这些剪接方式可能涉及在供体位点或受体位点之外的局部位点进行剪接,或形成部分或不能够形成完整的外显子[3]。
常见的非基本剪接包括替代供体位点、替代受体位点、整合性外显子剪接、内含子保留和外显子跳跃等[1]。
3. 选择性剪接选择性剪接是指在同一基因内,通过对内含子进行不同的剪接选择,从而形成不同的mRNA转录本和蛋白质亚型。
这种剪接方式是真核生物基因表达的主要调节机制之一,可以使得同一基因在不同的组织和环境下表达出不同的转录本,从而发挥不同的功能[1][3]。
二、基因剪接的调控机制1. 前体mRNA的生物合成先在复制DNA模板时,RNA聚合酶依据DNA模板信息,合成出mRNA的前体分子即RNA前体(pre-mRNA)。
可变剪接的生物信息数据分析综述
可变剪接的生物信息数据分析综述章天骄【摘要】前体mRNA的可变剪接是扩大真核生物蛋白质组多样性的重要基因调控机制.可变剪接的错误调节可以引起多种人类疾病.由于高通量技术的发展,生物信息学成为可变剪接研究的主要手段.本文总结了可变剪接在生物信息学领域的研究方法,同时也分析并预测了可变剪接的发展方向.%Alternative pre - mRNA splicing is an important gene regulation mechanism for expanding proteomic diversity in higher eukaryotes. The misregulation of alternative splicing underlies many human diseases. With the development of high - throughput technology, bioinformatics becomes to the main method in study of alternative splicing. This article summarizes the bioinformatics methods in alternative splicing research, as well as analyzes and predicts the direction of alternative splicing.【期刊名称】《生物信息学》【年(卷),期】2012(010)001【总页数】4页(P61-64)【关键词】可变剪接;高通量技术;生物信息学【作者】章天骄【作者单位】哈尔滨工业大学计算机科学与技术学院,哈尔滨150001【正文语种】中文【中图分类】Q811可变剪接是指一个前体mRNA通过不同的剪接方式(选择不同的剪接位点组合)产生不同mRNA剪接异构体的过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
维普资讯
11 0 6
生
物
技
术
通
讯
L I ET ' ERS I BI ECHNOL N OT OGY Vo .8 No6 No . 0 7 11 . v ,2 0
文 章 编 号 :0 9 0 0 (0 70 — 0 6 0 10 -0 2 0 )6 1 1- 3 2
[ bta t Atrai pin l sa mpr n o n po esssc sdvlp n. d ee tt n a d cne. I A src] l nt e sl igpa n i ot trl i rcse u h a ee met i rni i n ac r n e v c y a e o f ao
[ 图 分 类 号 ] Q 5 中 34
[ 献标识码 ] A 文
Ca c r a t r a i e Sp i i g n e nd Ale n tv lc n
GA 0 Ya -me ,HAN Yi in i -q a g
C l g fLf Sine ad T cn l y e ogi gA g s FrtLn el t n U i ri , a i 6 39 hn o eeo i cec n eh o g,H i nj n uut i a d R c mao nvs t D qn 13 ,C ia l e o l a s a i e y g 1
[ y w rs cne;a e ai pin ;gn Ke o d ] a cr l r t e sl ig ee tn v c
真核 生 物 中 , 大 多 数 基 因 的初 始 转 录 产 物 前 m N pe 绝 R A(r— mR A) 须 经过 剪接 等加 工 过 程 , 能 形 成 成 熟 的 m N 可 变 N 必 才 R A。 剪 接 是 指 同一 种 pe m N 具 有 多 种 剪 接 程 序 , 形 成 不 同 的 r— R A mR A。p — R A 的可 变 剪 接 是控 制基 因表 达 和 产 生 蛋 白质 多 N e r m N 样性 的 重要 机 制 在 产 生 受体 多样 性 、调 节 控 制 生 长 发 育 等 方 面 起 着 决定 性 作 用 l。 多 疾 病 的 发 生都 与可 变 剪 接 有 关 口 如 生 长 1许 , 2 1 1 , 素 缺 乏 、rs r 合 征 、 金 森 病 、 囊 纤 维 化 、 素 性 视 网 膜 Fai 综 e 帕 胆 色 炎 、 肌 萎 缩 症 、 强 直 性 营 养 不 良等 。在 人 类 癌 症 进 程 中 , 背 肌 广 泛 存 在 着 各 种 形 式 的 可 变 剪 接 ,许 多 癌 症 相 关 基 因 受 可 变 剪 接 调 控 。异 常 剪 接 、 接 过程 改变 , 至某 一 特 定 可 变 剪 接 的 转 换 , 剪 甚 都 可 能 在 肿 瘤 发 生 、 展 的任 一 阶段 起 到 主 要 作 用 。癌 症特 异 性 发 的剪 接 变 体 具 有 显 著 的诊 断 价 值 , 是极 有 价 值 的 癌 症 标 记 , 可 也 能 是 潜 在 的 药 物靶 标 。
综
述
癌 症 与可 变 剪接
高亚梅 , 韩毅 强
黑龙 江 八 一 农 垦 大 学 生 命科 学技 术 学 院 , 黑龙 江 大 庆 13 1 639
[ 要 ] 可 变剪 接 在 发 育 、 化和 癌 症 等过 程 中发 挥 着 非 常 重 要 的 作 用 。 近 年 来 , 来 越 多 的 研 究 表 明可 变剪 接 与癌 症 有 摘 分 越 着 密切 的关 系 , 多癌 症 相 关 基 因 受 可 变 剪接 调 控 。 由 于癌 症 特 异 性 的 剪 接 变 体 具 有 明 显 的诊 断价 值 , 得 对 癌 症 与 可 变 许 使 剪接 的研 究成 为 热 点 。简 要 概 述 了癌 症 相 关 基 因 的 可 变 剪接 、 变 剪接 变体 的鉴 定 方 法 、 变 剪接 与癌 症 治疗 等 研 究进 展 。 可 可 [ 键 词 ] 癌 症 ; 变 剪接 ; 因 关 可 基