大规模表达序列标签测定及分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
● Digital Gene Expression Displayer (DGED)
● cDNA xProfiler
◆ 基因表达系列分析(Serial Analysis of Gene Expression, SAGE)
基因表达系列分析是一种用于定量,高通量基因表达分析的实验方法(Velculescu et al., 1995)。 SAGE的原理就是分离每个转录本的特定位置的较短的单一的序列标签(约9-14个碱基对),这些短 的序列被连接、克隆和测序,特定的序列标签的出现次数就反应了对应的基因的表达丰度。
应注意区别真正的SNPs和由于测序错误( ESTs为单向测序得来,错误率 可达2%)而引起的本身不存在的SNPs。解决这一问题可以通过:
● 提高ESTs分析的准确性。 ● 对所发现的SNPs进行实验验证。
大规模表达序列标签测定及分析
利用ESTs大规模分析基因表达水平
因为EST序列是从某以特定的组织的cDNA文库中随机测序而得到,所以可以用利用未经标准化 和差减杂交的cDNA文库EST分析特定组织的基因表达谱。标准化的cDNA文库和经过差减杂交的 cDNA文库则不能反应基因表达的水平。
大规模表达序列标签测定及分析
ESTs与基因图谱的绘制
EST可以借助于序列标签位点(sequence-tagged sites)用于基因图谱的 构建. STS本身是从人类基因组中随机选择出来的长度在200-300bp左右的 经PCR检测的基因组中唯一的一段序列。来自mRNA的3’非翻译区的ESTs更 适合做为STSs,用于基因图谱的绘制。其优点主要包括:
大规模表达序列标签测定及分析
ESTs与基因预测
由于EST来源于cDNA,因此每一条EST均代表了文库建立时所采样 品特定发育时期和生理状态下的一个基因的部分序列。使用合适的比对 参数,大于90%的已经注释的基因都能在EST库中检测到(Bailey et al., 1998)。ESTs可以做为其它基因预测算法的补充,因为它们对预测基因 的交替剪切和3‘ 非翻译区很有效。
大规模表达序列标签测定及分析
ቤተ መጻሕፍቲ ባይዱ
总EST条目 (million)
dbEST中数据量的增长
20 18 16 14 12 10 8 6 4 2 0
1993 1995 1997 1999 2001
时间(年)
● 93年前ESTs数据收录于GenBank, EBI和DDBJ。
● 1993年NCBI(National Center of Biotechnology Information)建立了 一个专门的EST数据库dbEST来保存和收集所有的EST数据。
◆ DNA微阵列或基因芯片的研究
高密度寡核苷酸cDNA 芯片或cDNA微阵列是一种新的大规模检测基因表达的技术,具有高通量 分析的优点。在许多情况下,cDNA芯片的探针来源于3'EST (Duggan et al., 1999),所以EST序列 的分析有助于芯片探针的设计。 大规模表达序列标签测定及分析
◆ CGAP
为研究癌症的分子机理,美国国家癌症研究所NCI的癌症基因组解析计划(Cancer Genome Anatomy Project , CGAP)构建了很多正常的或是癌症前期的和癌症后期的组织的cDNA文库,并进行 了大规模的EST测序,其中大部分的文库未经标准化或差减杂交处理。
CGAP网站提供了多种工具用以分析不同文库间基因表达的差异, 如:
ESTs已经被广泛的应用于基因识别,因为ESTs的数目比GenBank 中其它的核苷酸序列多,研究人员更容易在EST库中搜寻到新的基因 (Boguski et al., 1994).
● 在同一物种中搜寻基因家族的新成员(paralogs)。 ● 在不同物种间搜寻功能相同的基因(orthologs)。 ● 已知基因的不同剪切模式的搜寻。【注:不过很难确定一个新的 序列是由于交替剪切产生的或是由于cDNA文库中污染了基因组 DNA序列(Wolfsberg et al., 1997)】
大规模表达序列标签测定及分析
什么是 ESTs ?
ESTs(Expressed Sequence tags )是从已建好的cDNA库中随机取出一个 克隆,从5’末端或3’末端对插入的cDNA片段进行一轮单向自动测序,所 获得的约60-500bp的一段cDNA序列。
大规模表达序列标签测定及分析
ESTs与基因识别
大规模表达序列标签(EST)测 定及分析
大规模表达序列标签测定及分析
主要内容
• 什么是EST? • EST的应用 • EST序列测定及分析过程 • 实例:家猪脑组织EST分析
大规模表达序列标签测定及分析
ESTs的来源
上世纪80年代,对cDNA序列进行大规模测序的想法就曾提出,但对此 一直存在争论,有人认为这种方法能发现成千上万的新基因;而反对者则认 为cDNA序列缺少重要的基因调控区域的信息。90年代初Graig Venter 提出 了EST的概念,并测定了609条人脑组织的EST,宣布了cDNA大规模测序的时 代的开始 (Adams et al., 1991)。
● 由于没有内含子的存在,因此在cDNA及基因组模板中其PCR产物的 大小相同;
● 与编码区具有很强的保守性不同,3’UTRs序列的保守性较差,因此 很容易将单个基因与编码序列关系非常紧密的相似基因家族成员分开。 (James Sikela等,1991年)
GeneMap 96‘ 定位了16,000个基于基因的STS(Schuler et al., 1996); GeneMap 98’ 定位了30,000个基于基因的STS(Deloukas et al., 1998),而 且基因图谱随着STS的定位正在不断的更新中。
大规模表达序列标签测定及分析
ESTs与SNPs
来自不同个体的冗余的ESTs可用于发现基因组中转录区域存在的SNPs。 最近的许多研究都证明对ESTs数据的分析可以发现基因相关的SNPs (Buetow et al., 1999;Garg et al., 1999; Marth et al., 1999; Picoult-Newberg et al., 1999) 。
相关文档
最新文档