lncrna芯片分析-自己总结(1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
lncRNA芯片分析
lncRNA芯片分析修改时间2010/6/16 13:57:12 点击3210次
1. 归一化
lncRNA芯片采用的归一化的方法为quantile normalization。
2. 差异LncRNA的筛选
lncRNA芯片中既有lncRNA的探针又有mRNA的探针,分别做差异基因的筛选,筛选方法同表达谱的筛选方法是一致的,参见表达谱的差异基因筛选。
3. 差异lncRNA的重注释
lncRNA芯片注释不完善,因此需要将筛选出来的lncRNA进行重注释。将差异lncRNA在基因组上位置上下游延伸,以寻找lncRNA 附近的有功能的基因。
差异lncRNA重注释示例
4. 差异lncRNA靶基因的预测
lncRNA可能通过调控相应的mRNA发挥功能,因此有必要预测lncRNA的靶基因。我们提取差异lncRNA和mRNA的序列,首先用blast 进行初筛,之后用RNAplex进行进一步筛选,以预测lncRNA可能调控的mRNA。
差异lncRNA靶基因预测结果示例
5. 差异lncRNA与靶基因共表达网络
预测出lncRNA的靶基因后,并可进一步在mRNA的数据中探寻该mRNA是否发生表达量的变化。由此构建差异lncRNA与靶基因相互作用网络图。
差异lncRNA与靶基因相互作用网络图。方框代表lncRNA,圆形代表mRNA。连线表示可能的调控关系。节点面积越大,表示调控的mRNA越多,
预示该lncRNA在调控网络中所起的作用可能越大。
6. 差异lncRNA与差异mRNA的共表达分析
SBC Human lncRNA芯片能同时检测出差异表达的lncRNA和mRNA。我们将差异lncRNA和差异mRNA在一组样品中进行共表达分析,可以发现与某个lncRNA具有相同表达模式的mRNA。
要求:每组数据3个或3个以上生物学重复
实验组:
对照组:
lncRNA与mRNA共表达分析作用图,圆形带圈代表lncRNA,圆形代表mRNA。红色为上调基因,绿色为下调基因。
7. 差异lncRNA靶基因的GO analysis
对lncRNA的靶基因进行GO Ontology的生物学的分类,根据Fisher's Exact Test,得到p-value,得到lncRNA靶基因对应的显著性功能,从而了解lncRNA的功能。
8. 差异lncRNA靶基因的pathway analysis
对lncRNA靶基因按照Pathway的主要公共数据库KEGG和Biocarta来进行分类,对Pathway中的基因进行基于离散分布的显著性分析,得到与实验目的有显著联系的Pathway 分类,由这些pathway对应相应的靶基因,从而获得该分类即导致lncRNA差异的最重要Pathway。
9. 差异lncRNA的转录因子的预测
提取lncRNA TSS的上游2000bp,下游500bp,利用HMM的算法根据数据库预测其转录因子。
1) 芯片数据预处理:对实验数据质量评估,预处理及均一化处理。
2) 差异表达lncRNA及mRNA 的筛选:根据客户提供样本量的大小与分布或实验目的,应用倍数法、多重假设检验等手段,对两条件或多条件下的表达差异的lncRNA和mRNA分别进行计算和筛选。
※表达模式聚类分析:针对芯片结果进行样本及差异表达lncRNA和mRNA的聚类,寻找属于同一表达趋势的基因或样本。
※ GO和pathway显著性富集分析:差异基因,应用数据库进行功能富集分析,挖掘具有统计学意义的差异表达基因的功能类别。显著性P值越小,则它随机聚集差异表达基因的概率越小,其功能相关性的非随机性就越小,该功能模块有较大的可能与疾病(或药物作用)相关。
※蛋白互作网络分析:研究与指定蛋白质相互作用的其他蛋白质的信息,以使研究人员能够更加深入地认清相关蛋白质的功能,更清楚地理解其调控机制。
3) lncRNA-mRNA共表达分析:对于每一个差异表达的lncRNAs,计算得到与之共表达的编码基因。
4) lncRNA表达模式分析:考察差异表达LncRNAs 的表达模式,将LncRNAs 以及与该LncRNAs 显著共表达的编码基因的表达模式绘制heatmap。
5) lncRNA功能预测:筛选出表达显著相关的lncRNA-mRNA 关系对,利用成熟的mRNA 的功能来推导lncRNA 的功能,对异常表达lncRNA 显著相关的mRNA 进行功能富集分析。
6) lncRNA cis作用机制研究:对于感兴趣的差异表达lncRNAs,搜索其上下游100K范围内的所有编码基因,并与该lncRNAs 有显著共表达的基因取交集。这些在基因组上临近、且表达模式上共表达的基因很可能被该lncRNAs 所调控。
7) lncRNA trans作用机制研究:计算LncRNAs 共表达的编码基因,集合与转录因子/染色质调控复合物的靶基因集合的交集,利用超几何分布计算该交集的富集程度,得到与lncRNAs 显著相关的转录因子,从而识别可能与lncRNAs 联合发挥调控作用的转录因子/染色质调控因子。
※ lncRNA--转录因子二元关系及网络分析
※ lncRNA--转录因子--靶基因三元关系及网络分析
[综述]长链非编码RNA(lncRNA)
来源: 新药筛选中心 /点击: 1464
lncRNA
长链非编码RNA(long noncoding RNA,lncRNA)是一类不编码蛋白的RNA 分子,长度在200bp 以上,起初被认为是RNA 聚合酶II 转录的副产物,不具有生物学功能;近期的研究表明lncRNA 具有保守的二级结构,可以与蛋白、DNA 和RNA 相互作用,参与多种生物学过程的调控,尤其在肿瘤当中发挥了重要的调控角色,如染色质修饰、转录激活和抑制、转录后调解以及作为miRNA 的诱导分子干扰基因的表