雄激素依赖型与非依赖型前列腺癌基因芯片数据分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
雄激素依赖型与非依赖型前列腺癌基因
芯片数据分析
(作者:___________单位: ___________邮编: ___________)
作者:罗烈伟,马文丽,郑文岭
【摘要】目的根据高通量基因表达谱数据,采用数据挖掘技术识别前列腺癌相关的特征基因与功能,探讨雄激素非依赖型前列腺癌形成的分子机制。方法应用GeneSifter在线分析软件对6个雄激素依赖型前列腺癌(ADPC)和6个雄激素非依赖型前列腺癌(AIPC)基因芯片数据分成两组进行分析。结果筛选得到348个差异表达基因,并发现这些差异表达基因涉及的生物学过程和KEGG通路的一些相关基因。结论雄激素非依赖型前列腺癌的形成可能与GREB1 protein基因表达下调有关,并在细胞通讯和细胞黏附等过程和通路方面与雄激素非依赖型前列腺癌的形成有一定关系。
【关键词】 ADPC;AIPC;基因表达谱;数据分析
Abstract:Objective To investigate the molecular mechanisms of androgen-independent prostate cancer using microarray data.Methods Microarray data from the Gene Expression Omnibus (GEO) was used to examine the molecular changes between androgen-dependent and independent primary prostate tumors. This dataset was analyzed with GeneSifter microarray analysis software (VizX Labs,Seattle,WA).Results After filtering the data,348 differentially expressed genes were identified. Gene Ontology and KEGG analysis showed that the genes are correlated with RNA metabolism,cell
cycle,macromolecule biosynthesis,and cell adhesion.Conclusions The GREB1 protein gene possibly plays an important role in androgen-independent prostate cancer. Gene’s changes of cell adhesion and cell communication also contribute to the understanding of androgen-independent prostate cancer.
Key words:ADPC;AIPC;gene expression profile; data analysis
前列腺癌(prostate cancer,PC)为全世界男性最常见的癌症之一,在美国男性所有诊断出来的肿瘤当中PC占了1/3,病死率排第二,仅次于肺癌。近年来PC在中国的发病率也呈不断上升趋势[1,2]。前列腺癌细胞的生长有依赖雄激素的生物学特性,多数前列腺癌患者在首次接受雄激素剥夺疗法后都有显著疗效,但最后超过一半的患者会复发并由雄激素依赖型前列腺癌(androgen-dependent prostate cancer,ADPC)发展成高度恶化且广泛转移的雄激素非依赖型前列腺癌(androgen-independent prostate cancer,AIPC)[3]。AIPC的形成机制还不清楚,基因芯片技术对PC在雄激素剥夺治疗前后的基因表达改变分析也许对了解AIPC的形成过程可以提供一些线索。本研究利用基因芯片数据分析软件GeneSifter对来自基因芯片公共数据库Gene Expression Omnibus(GEO)的12个ADPC和AIPC基因表达谱芯片数据作进一步生物信息学分析,以了解PC在雄激素剥夺治疗后的基因表达变化,并进一步探讨AIPC形成的分子机理,并
为其他研究提供参考。
1 材料与方法
基因表达谱芯片数据来自GEO公共数据库,由BEST CJ等提交的GSE2443系列20个样品芯片数据中选取12个,分别是6个AIPC 患者和6个ADPC患者原位肿瘤活检组织用激光捕获显微切割(LCM)方法取得的样品经RNA提取、扩增、逆转录和荧光标记等步骤,最后与Affymetrix Human Genome U133A芯片杂交,经Affymetrix GeneChip Scanner 3000扫描得到原始图像数据,再经标准化等处理后输出的芯片数据[4]。
GeneSifter属于基因芯片数据网络在线分析工具,经登陆GeneSifter网站以个人名义注册可以得到一定期限功能完整的免费试用。
从GEO下载下来的压缩数据经解压缩得到的是CEL文件格式,再将需要上传的12个GEL文件压缩成一个ZIP格式文件上传至GeneSifter网站进行分析,启动pair-wise analysis,以ADPC样品为第一组,AIPC样品为第二组。设置分析参数为:标准化:None;统计学方法:t-test;阀值:1.5;校正方法:Benjamini and Hochberg;数据转换:Data Aleady Log Transformed。原数据已经过GC-RMA对数转换和标准化处理[5],由于是两组样本的比较,所以采用t检验,
筛选阀值至少为1.5,P0.05,用Benjamini and Hochberg校正方法减少假阳性[6]。经过上述设置筛选得到的差异表达基因,进一步用GeneSifter软件自带的Gene Ontology(GO)工具和Kyoto Encyclopedia of Genes and Genomes (KEGG)通路分析其生物学意义。
2 结果
2.1 基因表达差异筛选结果
表达差异基因筛选得到348个基因,其中108个基因表达上调,占31.0%;240个基因表达下调,占69.0%。以ADPC样品的荧光信号强度值为X轴,AIPC样品的荧光信号强度值为Y轴,作基因表达谱散点图(图1),可以直观地表示两组样品间基因表达差异情况。每一个点代表芯片上一个基因点的杂交信号值,没有差异表达的基因分布在斜线周围,而远离斜线则为差异表达的基因。
图1 AIPC和ADPC基因表达谱散点图(略)
Fig.1 The scatter spot of the gene expression profile of ADPC and AIPC
2.2 生物学意义分析结果
2.2.1 GO分析结果 GO分析结果发现差异基因涉及的生物过程按Z分值从大到小排序上调的有细胞黏附、细胞发育过程、细胞表面受体有关信号转换过程等,下调的有翻译、大分子生物合成、细胞生物合成等,见表1。Z分值表示在GO和KEGG通路分析报告中的统计学差异,Z分值2则认为GO术语(或通路)具有显著丰度