全基因组表达谱分析方法(DGE)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

全基因组表达谱分析方法(DGE)----基于新一代测序技术的

技术路线

该方法首先从每个mRNA的3’端酶切得到一段21bp的TAG片段(特异性标记该基因);然后通过高通量测序,得到大量的TAG序列,不同的TAG序列的数量就代表了相应基因的表达量;通过生物信息学分析得到TAG代表的基因、基因表达水平、以及样品间基因表达差异等信息。技术路线如下:

1、样品准备:

a) 提供浓度≥300ng/ul、总量≥6ug、OD260/280为1.8~2.2的总RNA样品;

2、样品制备(见图1-1):

a) 类似SAGE技术,通过特异性酶切的方法从每个mRNA的3’末端得到一段21bp 的特异性片段,用来标记该基因,称为TAG;

b) 在TAG片段两端连接上用于测序的接头引物;

3、上机测序:

a) 通过高通量测序每个样品可以得到至少250万条TAG序列;

4、基本信息分析:

a) 对原始数据进行基本处理,得到高质量的TAG序列;

b) 通过统计每个TAG序列的数量,得到该TAG标记的基因的表达量;

c) 对TAG进行注释,建立TAG和基因的对应关系;

d) 基因在正义链和反义链上表达量间的关系;

e) 其它统计分析;

5、高级信息分析:

a) 基因在样品间差异表达分析;

b) 库容量饱和度分析;

c) 其它分析;

测序优势

利用高通量测序进行表达谱研究的优势很明显,具体如下:

1.数字化信号:直接测定每个基因的特异性表达标签序列,通过计数表达标签序列的数目来确定该基因的表达量,大大提高了定量分析的准确度。整体表达差异分布符合正态分布,不会因为不同批次实验引起不必要的误差。

2.可重复性高:不同批次的表达谱度量准确,能够更准确的进行表达差异分析。

3.高灵敏度:对于表达差异不大的基因能够灵敏的检测其表达差异;能够检测出低丰度的表达基因。

4.全基因组分析,高性价比:由于该技术不用事先设计探针,而是直接测序的方式,因此无需了解物种基因信息,可以直接对任何物种进行包括未知基因在内的全基因组表达谱分析,因此性价比很高。

5.高通量测序:已有数据表明,当测序通量达到200万个表达标签时,即可得到样本中接近全部表达基因的表达量数据,而目前每个样本分析可以得到300

万~600万个表达标签。

6.无需重复实验。

7.可同时发现新的转录本、基因组表达调控区域等。

8.完整深入的生物信息学分析支持,更有助于进行重要的科学发现,发高质量的文章。

表达谱案例分析

肺癌组织的表达谱分析:选取2个肺癌病人(5T和10T)的组织提取总RNA,进行分析。

实验目的:为了检测两个病人中表达差异较大的基因,以便找出两个病人症状差异的原因,并进行下一步相关的研究。

1、数据质量的概述

通过严格的质量标准筛选后,通过率达到80%,最终得到500万左右的Tag标签。

2、标签的初步分析统计

两个样品中有95%的Tag重复频度超过1,73%以上的Tag重复频度超过50。

3、表达谱测序饱和度分析

通过对表达谱测序饱和度的分析,通常在表达谱Tag数目达到200万时,测序Tag接近饱和。因此,通过Solexa测序,仅需要1次试验,就可以得到足够后续进行表达分析的数据。

4、样品重复性。

5、 Tag标签的注释(含cDNA,预测基因,EST,线粒体基因组,基因组等)

本案例中,人的2万7千个基因中有50~60%都被Tag所覆盖。即一般的基因的表达量差异被检测出来。为了提高Tag同基因关联的可信度,我们仅仅选取了在基因序列中唯一定位的Tag。这部分唯一定位的Tag占全部Tag数目的50%左右。

另外,除去上述用于基因表达量统计的唯一定位Tag,有大约20%的Tag被定位到了基因组的未注释区域,其中大约有10万个Tag在基因组上的位置是唯一的。利用这些数据我们找到了许多新的转录本和调控区域。同时发现了若干潜在的两个样品间显著差异的区域。为后续的实验提供了可靠的研究目标。

6、参考Tag标签的统计分析

下表显示的人的参考Tag的统计信息,我们可以看到96.53%的基因都拥有Tag。说明Tag-based 新一代测序技术的方法进行表达谱分析的可行性

7、基因表达量的分布统计

8、样本间表达差异基因的相关分析

通过对表达差异基因的统计和分析,我们可以选取样品间表达存在差异的基因,反馈给用户;此外一些已经报道可能相关的基因,是这一部分研究的重点,通过表达差异,我们可以推测出相关基因可能发生的变化。针对此例,图3-3中2

个基因是已经报道的在10T样品中高表达的基因。

9、样本间表达差异基因的信号通路相关分析

对差异表达基因进行功能分析和信号通路分析。结合样本性状差异,鉴定与性状关联的候选基因,以便通过进一步实验验证。

10、根据Tag距离3’端的位置对tag和基因数目进行的统计分析

相关文档
最新文档