生物信息学分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学分析
相信这应该不是你想要的结果吧?
你想知道的是应该是究竟是哪一个或者哪一群基因在某个生物学过程中起到了重要的作用,而要得到这样一个可信的结论,是需要进行重重的生物信息学分析的。
生物信息学分析大致可以分为三个境界:
1、只会机械的套用已有的方法,对算法和原理一无所知,无法运用结果解释分析生物学问题;
2、了解生信检验的基本原理(作者在发明它时,最初的构想、原型、启发),可以根据实际情况选择不同的分析算法,采用最优解,能够解释生物学问题;
3、能够自由的组合、拼接已有的算法,必要时创造想要的算法。
回到芯片测序结果分析这个问题,去除芯片数据质量控制(这部分其实相当复杂),接下来就是差异基因筛选和基因功能注释分析了。基因功能注释属于芯片分析流程中最末端的生物学解读部分,相当于是临门一脚吧。这部分也是整个分析流程中最为灵活的部分,虽然它也有自身的一些套路。
吐槽一下现在文章中非常套路的热图
实验设计非常简单,2组,3vs3,差异表达基因的定义很明了,不是上调就是下调,通过阈值筛选以后,图形展示结果是早可以预见的,毫无意外。既然这样,为什么不直接列个表?回到热图的初衷,这是一个聚类分析,目的是找出表达轮廓相近基因,以此来推断它们在功能上存在关联。如果说一张热图仅仅是为了说明差异基因分的很开,筛选标准是OK的,我的实验分组是OK的,那么称它为一张“田”字红绿色盲测试图并不为过。
基因功能分析用GO和KEGG这一套,简单地罗列数据就OK了。