多发性骨髓瘤病人预后相关lncRNA研究讲述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多发性骨髓瘤病人预后相关IncRNA研究Abstract
Backgournd: IncRNA在肿瘤的发生发展的过程往往扮演着十分重要的作用, 表明很多的IncRNA可能作为诊断或者判定肿瘤的潜在的标志物。然而,利用IncRNA表达评价多发性骨髓瘤病人的预后悄况的研究并不多见。
Materials and methods:我们从GEO数据库中获取了大规模的基因表达谱芯片的数据(包括GSE24080和GSE57317),我们从GSE24080数据集中注释得到相关IncRNA,然后找出于病人生存情况相关的IncRNA,利用这些IncRNA 的表达量预测病人的预后,并且独立的数据集(GSE57317)中进行验证。并且我们进行了GSEA 分析,找出IncRNA可能通过哪种生物学通路影响病人的预后。
Results:对基因芯片进行IncRNA注释后,我们共得到2096个IncRNA, 对这些IncRNA进行Univariable Cox regression分析后,我们发现共有176个IncRNA的表达与病人生存显著相关(pv0.05)。通过这仃6个IncRNA的表达量对病人进行聚类分析后,我们发现聚类得到的两组病人生存率存在显著的差异, 独立的数据集(GSE57317)中进行验证也得到了同样的结果。Stratified analysis 表示该预测模型是独立于其他临床表型的,如serum beta 2-microglobulin (Sp2M), serum albumin (ALB)和lactate dehydrogenase (LDH)浓度的。
GSEA分析表明细胞周期、细胞周期过程中检验点的改变、细胞与细胞间的粘附都发生了显著性的改变,IncRNA可能是通过促进细胞增殖,抑制细胞粘附等表型促进了多发性骨髓瘤的进展。
Conclusions:我们结果证明很多IncRNA可以作为评判多发性骨髓瘤病人预后的生物标志物。这样标志物可能对多发性骨髓瘤的发生发展具有重要的作用, 其分子机制还需要更多的实验数据的证实。
Keywords: IncRNA,基因芯片,多发性骨髓瘤,生存率,GSEA
1 Introduction
多发性骨髓瘤是山骨髓中单克隆血浆细胞异常积累引起的一种难以治愈的癌症[1]。多发性骨髓瘤是一种常见的肿瘤,其具有抑制性高、病理特征多等特点, 发性骨髄瘤常常导致很差的预后。多发性骨髄瘤患者的存活时间为儿周到10年不等,五年生存率仅为40%作用[2]。鉴定高风险的多发性骨髓瘤病人可以针对性的进行个性化治疗,这有利于改善病人的预后,提高病人的存活时间。
长链非编码RNA (long non-coding RNA,lnc RNA)是一类长度超过200nt 的RNA分子,不编码蛋白或者只编码很短的多肽,起初被认为是垃圾序列,不具有生物学功能。但随着研究的不断深入,科学家发现,占基因组98%的这些非编码RNA 分子,通过与DNA、RNA、蛋白质的相互作用,参与细胞的增殖、代谢、运动、自噬及凋亡等诸多生理过程,在基因表达调控网络中扮演着十分重要的角色,IncRNA 参与基因组印记以及染色质修饰,转录激活,转录后调控,蛋口功能调节等多种重要的信号转导调控过程[3]。IncRNA的表达失调会引起基因表达异常,从而导致疾病的发生[4]。
IncRNA可以为判断多种类型肿瘤的预后提供很多有用的信息[5-6]o利用表达谱数据判断病人的预后已经被应用于多种类型的肿瘤,例如:乳腺癌[7]、结直肠癌[8]、前列腺癌[9]以及非霍奇金淋巴瘤等[10]。然而,将表达谱数据用于临床中还碰到了很多问题,包括过度拟合,缺乏验证,患者间组织的异质性,瘤内异质性,忽视现在临床变量等。
在现有的研究中,大规模整合多发性骨髓瘤表达谱数据和临床信息的研究并不多见,我们发现了与多发性骨髓瘤病人生存相关的IncRNA,并且利用这些I 生存相关的IncRNA用于预测病人的生存情况,可能具有一定的指导临床评价的作用。
2 Materials and methods
2.1多发性骨髓瘤病人GEO数据集以及相应临床信息
我们从基因表达综合数据库(GEO)中获取了大量多发性骨髓瘤病人的表达谱芯
片数据,并且根据相应的注释文件,获取其相关的临床资料。包括:GSE24080[11 ](Affymetrix HGU133_Plus_2.0 array) (/geo/query/acc.cgi?acc=GSE24080)数据集中558 例多发性骨髓瘤病人,GSE57317[12](Affymetrix HG-U133_Plus_2.0 array) (/geo/query/acc.cgi?acc=GSE57317)数据集中55 例多发性骨髓瘤病人。详细的多发性骨髓瘤病人的病理资料见Supplement table 1。
2.2芯片数据处理和IncRNA注释
我们使用了RMA[13]算法标准化处理了芯片数据,并对标准化的芯片数据进行Z-score[14]处理。我们使GATExplorer[13]I具对Affymetrix HG- U133_Plus_2.0芯片的探针进行IncRNA注释。GATExplorer提供了一系列系列用于注释芯片的R 包,我们利用Bioconductor提供的affy包,可以获得来源与GATExplorer的注释信息。我们从GATExplorer中下载了芯片中比对到非编码区域的ncRNA 的CDF 文件。通过ncrnamapperhgu 133plus2cdf_3.0 文件, 我们获得了IncRNA的表达谱数据。对于比对到多个IncRNA的探针,我们采取了合并取平均值的方法进行处理。寻找与多发性骨髄瘤病人生存率相关的IncRNA我们使用单因素Cox回归分析评价IncRNA表达量与病人生存时间的相关性。我们保留了pv0.05的IncRNA来预测多发性骨髓瘤病人的生存情况。利用IncRNA表达量进行K-means聚类将多发性骨髓瘤病人区分为2组,进行Kaplan-Meier 分析。
2.3统计分析
我们使用Kaplan-Meier生存曲线来评价K-means聚类将多发性骨髓瘤病人区分为2组时,这两组病人的生存情况的差异。我们采取双尾log-rank检验来评价生存曲线是否具有统讣学差异。所有的分析都是使用R语言(323版本) 以及Bioconductor完成的。
2.4 GSEA 分析
我们使用Broad institute所开发的GSEA的JAVA程序进行(/gsea)基因组富集分析(GSEA),我们使用