【CN109872776A】一种基于加权基因共表达网络分析对胃癌潜在生物标志物的筛选方法及其应用【专

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 (43)申请公布日 (21)申请号 201910114155.0

(22)申请日 2019.02.14

(71)申请人 辽宁省肿瘤医院

地址 110042 辽宁省沈阳市大东区小河沿

路44号

(72)发明人 王哲 解夕黎 

(74)专利代理机构 沈阳亚泰专利商标代理有限

公司 21107

代理人 史力伏

(51)Int.Cl.

G16B 25/10(2019.01)

G16H 50/30(2018.01)

(54)发明名称

一种基于加权基因共表达网络分析对胃癌

潜在生物标志物的筛选方法及其应用

(57)摘要

本发明涉及生物医学领域,具体涉及一种基

于加权基因共表达网络分析对胃癌潜在生物标

志物的筛选方法及其应用。本发明采用加权基因

共表达网络分析(WGCNA)以及KEGG通路、GO富集

分析等分析方法。加权基因共表达网络分析

(WGCNA)

是一种高效、全面的高维数据分析方法,且其分析基因芯片数据的准确性和有效性已经

得到证实。所述的应用本发明方法筛选出的潜在

生物标志物为FERMT2。本发明为胃癌的诊断、治

疗及预后提供了新方向,促进了“个体化治疗”的

发展。权利要求书2页 说明书7页 附图6页CN 109872776 A 2019.06.11

C N 109872776

A

1.一种基于加权基因共表达网络分析对胃癌潜在生物标志物的筛选方法,其特征在于,应用此方法筛选出的潜在生物标志物为FERMT2。

2.一种基于加权基因共表达网络分析对胃癌潜在生物标志物的筛选方法,具体包括以下步骤:

1)GEO数据下载和预处理:从GEO数据库下载包括癌症样本以及对应的临床随访信息的胃癌芯片数据,数据的预处理如下:下载数据集为log10-transformed RMA signal intensity,对每个样本进行分位数标准化,进一步对每个样本进行聚类分析,筛选出表达谱较为一致的样本作为训练集样本;

2)筛选变化较大的基因:筛选变化较大的基因,如A基因符合筛选规则如下:①A基因在所有样本中的表达水平中位数高于所有基因在各个样本中表达水平的中位数的20%;②A基因在各个样本中表达水平的方差高于所有基因在各个样本中表达水平的方差的20%;

3)单因素生存分析:为进一步观察这些在样本中变化较大的基因与预后的关系,使用R 软件包survival对这些基因进行单因素生存分析,筛选出预后显著性p值小于0.01的基因作为种子基因;

4)基因与lncRNA共表达网络构建:WGCNA是使用基因表达数据来构建无尺度网络的系统生物学方法,首先构建基因表达相似性矩阵,即计算两两基因之间皮尔森相关系数的绝对值,使用公式1计算基因i和基因j之间的皮尔森相关系数,其中i和j分别是第i个基因和第j个基因的表达量,公式1:

然后使用公式2将基因表达相似性矩阵转换成邻接矩阵,网络类型为signed,其中β为软阈值,其实就是将每对基因的皮尔森相关系数β次方,这一步能够从指数级别强化强相关性和减弱弱相关性,公式2:

下一步使用公式3将邻接矩阵转换成拓扑矩阵,拓扑重叠(topological overlap measure, TOM)用来描述基因之间的关联程度,公式3:

1-TOM表示基因i和基因j之间的相异程度,使用1-TOM作为距离对基因进行层次聚类,然后使用动态剪切树的方法进行模块的识别,每个模块中最具有代表性的基因称为特征向量基因简称ME,它代表了该模块内基因表达的整体水平,它是每个模块中的第一主成分,使用公式4来计算ME,其中i表示模块q中的基因,l表示模块q中的芯片样本,

公式4:

利用某个基因在所有样本中的表达谱与某个特征向量基因ME表达谱的皮尔森相关性来衡量这个基因在该模块中的身份,即模块身份简称MM,使用公式5计算MM,

其中表示第i个基因的表达谱,表示模块q的特征向量基因,

表示了基因i在模块q中的身份,

当= 0,则说明基因i不在模块q中,越接近+1或−1,则说明基因i与模块q高度相关,正负号表示了基因i与模块q是正相关还是负相关,公式5:

权 利 要 求 书1/2页2CN 109872776 A

相关文档
最新文档