临床医学数据分析报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
案例二
最近小编阅读的文献中很多都是与医学研究挂钩,比如肿瘤病人的数据分析、肿瘤亚型分类、肿瘤药物治疗与寿命关联研究等等。发现有趣的现象是,这些文章的分析思路用到很多专业的生物信息学的方法。小编本人是学生物信息学的,对医学专业不甚了解,但是看了这些医学研究文章,顿时豁然明了,原来还可以从生物信息学角度分析疾病。那么,作为专业医生,小编认为也没必要努力学习专业的生物信息学,能够看懂和阐述分析结果就可以。至于如何分析,可以自学使用免费生物学软件,没时间也可花钱请专业公司分析下。医生若能有效将医学和生物信息结合利用起来,那么发表一篇文章完全不是问题。必须提的是,云生信平台多个生物信息分析模块就可以帮你完成专业医学相关数据分析。虽然,打广告不可少,但这是货真价实的数据分析平台,现在还是可以免费使用。
现在向大家介绍一篇研究肾细胞癌亚型分类的文章,该文章2010年发表在Genes & cancer上,截止目前引用率达到106次,该文章是很有研究和学习价值的。
文献引用:
Brannon A R, Reddy A, Seiler M, et al. Molecular stratification of clear cell renal cell carcinoma by consensus clustering reveals distinct subtypes and survival patterns[J]. Genes & cancer, 2010, 1(2):
152-163.
该文章使用的数据是基因癌症样本中表达值,但是癌症样本未区分开。研究目的是将癌症样本分为2个亚型,即ccA和ccB,以及比较ccA和ccB样本中基因的不同。文献提供的流程图如下。该流程分为两个模块:首先将癌症样本分类、然后比较不同类别的基因表达水平差异。这个流程思路很有参考价值,有样本数据的可以尝试下哦。此外,这个思路可以利用云生信模块做一下,现在来看看云生信是如何实现的,将其分为4步。
第一步癌症样本亚型分类
ConsensusCluster方法是啥玩意啊?!不用管它,只需要知道它可鉴别癌症亚型就行。这个方法已被整合到云生信模块,见图1.1。利用云生信模块提供的示例数据运行,得到结果,见示例图1.2。你可以比较下云生信分析结果(图1.2左)和文献的原图(图1.2右),云生信可以做到类似文献的输出结果,当然还会输出更加详细的样本分类信息文件,比如A样本判断为ccA类型,这个输出文件简单易懂,非常便于医生等用户使用。
图1.1 云生信模块-ConsensusCluster聚类工具模块
图1.2云生信模块-ConsensusCluster聚类工具模块分析结果示例图(左),文献分析结果(右)
第二步癌症样本亚型分类确定
文献中流程图中有“LAD”字样,这是验证样本分类的方法,这好难理解,有木有!其实,用ConsensusCluster鉴别样本后,鉴别结果是不是正确的,需要验证下,但是2010年的ConsensusCluster方法无法提供分类后的验证,所以用了LAD。如今的话,ConsensusCluster 方法经过改进,提供这样分类后续验证。这一成果可是发表在2014年的Nature上啊,那就是图1.1中的PAC聚类优化模块。如果你实用该模块鉴别样本,就不需要LAD去验证,而且使用最新的Nature方法,可是提高文章含金量的妙招~。好了,图2是PAC聚类优化模块得到结果示例。左边给出3个亚型分类结果,而右边PAC最小值是0,此时最佳结果是为2个亚型分类。那么这个数据中最合适的是2个亚型分类。该结果展示容易理解。
图2 云生信模块-PAC聚类优化模块结果示例:样本分为3类是的热度图(左),最佳聚类结果(右)
第三步不同癌症亚型的比较分析
这一步就很简单了,计算亚型之间基因表达水平的差异,提取显著异常表达基因,并对这些
基因进行富集分析。这两步是常见的生信分析,技术很成熟。可以使用生信模块“差异分析”和“富集分析”,见图3.1和3.2。
图3.1云生信-差异分析模块示例结果:差异分析模块(左),差异分析模块-小工具“SAMR差异表达分析”
输出结果示例。
图3.2云生信-富集分析模块示例结果:富集分析模块(左),富集分析模块-小工具“基因(mRNA)功能富
集分析”输出结果示例。
第四步生存曲线分析
最后,文献分别分析了ccA、ccB亚型病人生存曲线分析。生存曲线是医学和生物信息类文章常见的临床分析研究结果展示方式之一。云生信模块也早早添加了“生存曲线分析模块”,见图4.1。根据平台示例数据分析示例图和文献分析结果见4.2。用户只需要按要求准备好输入数据,就可以得到生存曲线图,使用简单方便。
图4.1 云生信作图工具-生存曲线分析
图5.2云生信作图工具-生存曲线分析示例图:生存曲线分析模块结果示例(左),文献生存曲线分析结果
示例(右)
看了肾细胞癌样本亚型分类的流程,不能不体会目前医学数据和生物信息分析方法联系太紧密了。虽然对大多数医生来说,生信分析还是个陌生的领域,但是国内外早已将二者结合起来,相关文献发表的数不胜数。看了云生信平台的四步走过程,即使对方法不理解,但是云生信将这些模块的作用说的很清楚,并且输出结果简单易懂,相信多实践几次,就会明白此类文章的窍门。如果你手头上有类似的数据,赶紧试试吧,说不定就可以做成一篇文章呢~~