大规模表达序列标签测定及分析

合集下载

新型分子标记的开发和利用

新型分子标记的开发和利用黄磊;唐光绪;田东;何庆元【摘要】比较遗传分析中常用的随机DNA分子标记、目的基因标记、功能性分子标记.综述了近年开发的几种分子标记,并对新型分子标记(功能性分子标记)进行阐述,如何利用Tilling技术和关联分析的方法开发功能性分子标记,并介绍了功能性分子标记的优点和利用前景.【期刊名称】《安徽农学通报》【年(卷),期】2010(016)023【总页数】4页(P43-45,61)【关键词】功能性分子标记;目的基因标记;Tilling;关联分析【作者】黄磊;唐光绪;田东;何庆元【作者单位】安徽科技学院生命科学学院,安徽凤阳,233100;安徽科技学院生命科学学院,安徽凤阳,233100;安徽科技学院生命科学学院,安徽凤阳,233100;安徽科技学院生命科学学院,安徽凤阳,233100【正文语种】中文【中图分类】Q75长期以来，植物育种选择都是基于植物的表型性状进行的，当性状的遗传基础较为简单或即使较为复杂但表现加性基因遗传效应时，表型选择是有效的。

但许多数量性状难以准确鉴定，根据表型提供的性状遗传潜力的度量是不确切的，因而选择是低效的。

遗传育种家们很早就提出了利用标记进行辅助选择以加速育种改良进程的设想。

但形态标记和常规遗传标记数量少、遗传稳定性差、且常常与不良性状连锁，因而利用受到很大限制。

分子标记是近年迅速发展起来的一种技术手段，它的出现使人们对于基因的准确检测，目标基因的分离，克隆和转移更为方便。

自1974年Grodzicker创立RFLP技术以来，目前已发展起了多种分子标记，按其技术基础主要可分为3类:(1)依赖杂交技术手段的分子标记，如RFLP;(2)依赖于PCR为基础的分子标记，如RAPD，SSR等;(3)一些新型的分子标记，如SNPs等［1］。

按其作用分为随机DNA分子标记(random DNA markers，RDMs)、目的基因分子标记(gene targeted makders，GTMs)和功能性分子标记(functional markers，FMs)［2］。

表达序列标签(est)在基因组学研究中的应用

表达序列标签(est)在基因组学研究中的应用序列标签（Sequence Tag）是指由DNA或RNA片段构成的一系列序列标记，它可以在遗传疾病、基因表达、信号转导等生命科学研究中发挥重要作用。

其中，表达序列标签（EST）是一种简单而有效的标记技术，它的应用在基因组学领域得到了广泛关注。

一、EST技术简介EST技术是一种由测序技术支持的高通量筛选技术，其主要原理是通过随机挑选某些不同的cDNA克隆来获得所需的不同的EST序列。

它的应用可以大大降低生物学研究的难度，也可以在较短的时间内获得大量的基因序列。

二、EST在基因组学研究中的应用（一）基因组注释及功能预测基因组注释是指对基因组序列进行生物信息学分析，以确定其中的基因区域和基因的结构。

EST技术可以通过对基因组序列的全长编码区域进行建库、测序和组装，从而确定基因的结构和位置，从而实现基因组注释。

（二）基因家族的发现和分类EST技术可以应用于表达的基因家族的发现和分类，例如受体基因、酶基因和转录因子基因家族等。

EST序列可以用作启动点，通过比对模式，可将同源序列聚类形成基因家族，并进一步研究其与环境、生长过程或其它生物学过程的关系。

（三）隐形基因的寻找传统的基因克隆方法主要寻找已知的基因进行克隆，而隐形基因（也称未知基因）的寻找则需要更为深入的研究。

EST技术可以通过测序与注释，从全基因组的角度分析，实现隐形基因的发现。

这可以为了解未知疾病的发病机制、发病率等方面提供重要支持和信息。

（四）基因调控机理的研究EST技术不仅可以应用于基因组学研究，还可以应用于表观遗传学——研究基因调控机理。

EST序列常常用于测定细胞特异性基因表达、基因表达的时间和空间分布等方面。

它对于异等基因的表达差异、组织特异性基因表达模式、静态和动态转录调控等具有重要的科研价值。

同时，它还可以用于筛选差异表达基因，并进一步研究其相关的信号传导机制、生长发育机制等。

三、结论在基因组学研究中，EST技术可以为高通量测序提供支持，并更好地揭示基因组结构和基因调控机制。

EST

EST技术流程 EST技术流程
体内：翻译体外研究：反转录
连接，转化
转化效率问题（基因芯片）转化效率问题（基因AGE）测序采样问题（SAGE）的构建。序列主要问题
ESTs数据的不足数据的不足
◆ ◆ ◆ ◆
ESTs很短，没有给出完整的表达序列；低丰度表达基因不易获得。由于只是一轮测序结果，出错率达2%-5%；
有时有载体序列和核外mRNA来源的cDNA污染或是基因组 DNA的污染；
◆ ◆
有时出现镶嵌克隆；序列的冗余，导致所需要处理的数库的构建及其均一化扣除杂交处理
For subtraction of cDNA libraries the procedure is similar to normalization, except that the PCR products arise from a different library (whose genes are to be subtracted from the original library)
● 1993年NCBI(National Center of Biotechnology Information)建立年建立了一个专门的EST数据库数据库dbEST来保存和收集所有的来保存和收集所有的EST数据。数据。了一个专门的数据库来保存和收集所有的数据
什么是 ESTs ？
◆
这个方法后来又得到改进，包括用生物素标记【Nucl. Acids 14, 10027–10044】和 10027–10044】 oligo(dT)30-latex标记cDNA，以增加单双链分子的分离效率。后来，通过PCR选择性 cDNA扩增技术被应用到扣除杂交中，以克服以往扣除杂交中需要大量起始mRNA的缺点，并可以同时提高基因克隆地效率【Nucl. Acids Res. 19, 7097-7104】。 7097-7104】

稻瘟病菌发育cDNA文库构建与表达序列标签分析pdf

农业生物技术学报ＪｏｕｒｎａｌｏｆＡｇｒｉｃｕｌｔｕｒａｌＢｉｏｔｅｃｈｎｏｌｏｇｙ２００６，１４（６）：９６３￣９６９・研究论文・稻瘟病菌发育ｃＤＮＡ文库构建与表达序列标签分析*金庆超１，董海涛１＊＊，彭友良２，陈保善３，邓晔１，戴承恩１，方永启１，邵菁１，娄沂春１，李有志３，李德葆１＊＊（１．浙江大学农业与生物技术学院生物技术研究所，杭州３１００２９；２．中国农业大学农业部分子植物病理学重点实验室，北京１０００９４；３．广西大学亚热带生物资源保护和利用实验室，南宁５３０００４）摘要：利用稻瘟病菌（Ｍａｇｎａｐｏｒｔｈｅｇｒｉｅｓａ）连续６个发育时期的材料构建了一个混合ｃＤＮＡ文库。

文库滴度，重组率和插入片段长度等质量分析表明，构建的文库包含完整的稻瘟病菌基因，可用于病菌基因表达分析。

利用该文库获得了７４５６条５′端表达序列标签（ＥＳＴｓ）（ＧｅｎＢａｎｋ收录号：（ＣＫ９０９９４４￣ＣＫ９１３６６６和ＣＫ９２８５８３￣ＣＫ９３２５８２），生物信息分析表明：ＥＳＴ序列拼接出２９７５个假定独立转录本（ＴＵＴｓ），冗余度为６０．１％；从ｃＤＮＡ文库中筛选出大量的低丰度表达基因，约占ＴＵＴ总数的７９．８％，说明在文库中基因组成类型的复杂性较高；在所有ＴＵＴｓ中，功能未知基因约占８５．５％，编码ＥＣＭ３３蛋白和疏水蛋白等病菌致病相关的注释基因高丰度表达，进一步表明该ｃＤＮＡ文库反映了病菌侵染和发育过程中基因表达的状况。

关键词：稻瘟病菌；ｃＤＮＡ文库；表达序列标签中图分类号：Ｓ１８８文献标识码：Ａ文章编号：１００６－１３０４（２００６）０６－０９６３－０７ＭａｇｎａｐｏｒｔｈｅｇｒｉｓｅｓａＤｅｖｅｌｏｐｍｅｎｔｃＤＮＡＬｉｂｒａｒｙＣｏｎｓｔｒｕｃｔｉｏｎａｎｄＥｘｐｒｅｓｓｅｄＳｅｑｕｅｎｃｅＴａｇｓＡｎａｌｙｓｉｓ＊ＪＩＮＱｉｎｇ－ｃｈａｏ１，ＤＯＮＧＨａｉ－ｔａｏ１＊＊，ＰＥＮＧＹｏｕ－ｌｉａｎｇ２，ＣＨＥＮＢａｏ－ｓｈａｎ３，ＤＥＮＧＹｅ１，ＤＡＩＣｈｅｎｇ－ｅｎ１，ＦＡＮＧＹｏｎｇ－ｑｉ１，ＳＨＡＯＪｉｎｇ１，ＬＯＵＹｉ－ｃｈｕｎ１，ＬＩＹｏｕ－ｚｈｉ３，ＬＩＤｅ－ｂａｏ１＊＊（１．ＩｎｓｔｉｔｕｔｅｏｆＢｉｏｔｅｃｈｎｏｌｏｇｙ，ＣｏｌｌｅｇｅｏｆＡｇｒｉｃｕｌｔｕｒｅａｎｄＢｉｏｔｅｃｈｎｏｌｏｇｙ，ＺｈｅｊｉａｎｇＵｎｉｖｅｒｓｉｔｙ，Ｈａｎｇｚｈｏｕ３１００２９，Ｃｈｉｎａ；２．ＴｈｅＫｅｙＬａｂｏｒａｔｏｒｙｏｆＭｏｌｅｃｕｌａｒＰｌａｎｔＰａｔｈｏｌｏｇｙ，ＭｉｎｉｓｔｒｙｏｆＡｇｒｉｃｕｌｔｕｒｅ，ＣｈｉｎａＡｇｒｉｃｕｌｔｕｒａｌＵｎｉｖｅｒｓｉｔｙ，Ｂｅｉｊｉｎｇ１０００９４，Ｃｈｉｎａ；３．ＬａｂｏｒａｔｏｒｙｏｆＳｕｂｔｒｏｐｉｃａｌＢｉｏｒｅｓｏｕｒｃｅＣｏｎｓｅｒｖａｔｉｏｎａｎｄＵｔｉｌｉｚａｔｉｏｎ，ＧｕａｎｇｘｉＵｎｉｖｅｒｓｉｔｙ，Ｎａｎｎｉｎｇ５３０００４，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：ＴｈｅｉｎｆｅｃｔｉｏｎｍｏｄｅｌｏｆｍｅｃｈａｎｉｃａｌｐｅｎｅｔｒａｔｉｏｎｏｆｐｌａｎｔｓｕｒｆａｃｅｓｂｙＭａｇｎａｐｏｒｔｈｅｇｒｉｓｅａｈａｓｂｅｃｏｍｅａｆｏｃｕｓｏｆｍｏｌｅｃｕ－ｌａｒｍｅｃｈａｎｉｓｍｏｆｔｈｅｆｕｎｇａｌｐａｔｈｏｇｅｎｅｓｉｓ．Ｉｎｏｒｄｅｒｔｏｏｖｅｒａｌｌａｎａｌｙｚｅｇｅｎｅｅｘｐｒｅｓｓｉｏｎｄｕｒｉｎｇｉｎｆｅｃｔｉｏｎａｎｄｄｅｖｅｌｏｐｍｅｎｔ，ａｍｉｘｅｄｃＤ－ＮＡｌｉｂｒａｒｙｗａｓｃｏｎｓｔｒｕｃｔｅｄｗｉｔｈｍａｔｅｒｉａｌｓｆｒｏｍｃｏｎｔｉｇｕｏｕｓｓｉｘｄｅｖｅｌｏｐｍｅｎｔｓｔａｇｅｓｏｆＭ．ｇｒｉｓｅａ．Ｓｏｍｅｑｕａｌｉｔｙａｎａｌｙｓｉｓ，ｓｕｃｈａｓｔｈｅｔｉｔｅｒ，ｔｈｅｒｅｃｏｍｂｉｎａｎｔｒａｔｅａｎｄｉｎｓｅｒｔｃＤＮＡｌｅｎｇｔｈｏｆｔｈｅｃＤＮＡｌｉｂｒａｒｙ，ｉｎｄｉｃａｔｅｄｔｈａｔｔｈｅｌｉｂｒａｒｙｃｏｎｔａｉｎｅｄｉｎｔａｃｔｇｅｎｅｓａｎｄｃｏｕｌｄｂｅｕｓｅｄｆｏｒｇｅｎｅｅｘｐｒｅｓｓｉｏｎａｎａｌｙｓｉｓｏｆＭ．ｇｒｉｓｅａ．Ｔｏｔａｌ７４５６ｅｘｐｒｅｓｓｅｄｓｅｑｕｅｎｃｅｔａｇｓ（ＥＳＴｓ）（ＧｅｎＢａｎｋ（ＣＫ９０９９４４￣ＣＫ９１３６６６ａｎｄＣＫ９２８５８３￣ＣＫ９３２５８２）ｏｆ５′ｅｎｄｓｗｅｒｅｏｂｔａｉｎｅｄｆｒｏｍｔｈｅｃＤＮＡｌｉｂｒａｒｙ．ＲｅｓｕｌｔｓｏｆｂｉｏｉｎｆｏｒｍａｔｉｃｓａｎａｌｙｓｉｓｆｏｒａｌｌＥＳＴｓｄａｔａｓｈｏｗｅｄｔｈａｔＥＳＴｓｅｑｕｅｎｃｅｓａｓｓｅｍｂｌｅｄｏｕｔ２９７５ｔｅｎｔａｔｉｖｅｕｎｉｑｕｅｔｒａｎｓｃｒｉｐｔｓ（ＴＵＴｓ）ａｎｄｅｎｄｕｅｄ６０．１％ｒｅｄｕｎｄａｎｃｙ；ｍｏｓｔｇｅｎｅｓｅｘ－ｐｒｅｓｓｅｄｗｉｔｈｌｏｗａｂｕｎｄａｎｃｅｇｅｎｅｒａｔｅｄｆｒｏｍｔｈｅｃＤＮＡｌｉｂｒａｒｙａｎｄｏｃｃｕｐｉｅｄ７９．８％ｏｆａｌｌＴＵＴｓ，ｉｎｄｉｃａｔｉｎｇｔｈｅｌｉｂｒａｒｙｈａｄａｇｏｏｄｃｏｍｐｌｅｘｉｔｙｏｆｇｅｎｅｃｏｍｐｏｓｉｔｉｏｎ；ａｂｏｕｔ８５．５％ＴＵＴｓｃｏｕｌｄｎｏｔｂｅａｓｓｉｇｎｅｄｆｕｎｃｔｉｏｎａｌｄｅｓｃｒｉｐｔｉｏｎａｎｄｉｎｆｅｃｔｉｏｎｒｅｌａｔｅｄｇｅｎｅｓ，ｓｕｃｈａｓＥＣＭ３３ｐｒｏｔｅｉｎａｎｄｈｙｄｒｏｐｈｏｂｉｎｅｘｐｒｅｓｓｅｄａｔｈｉｇｈａｂｕｎｄａｎｃｅｌｅｖｅｌａｍｏｎｇｔｈｅｒｅｍａｉｎｅｄａｎｎｏｔａｔｅｄｇｅｎｅｓ，ｆｕｒｔｈｅｒｌｙｉｎｄｉｃａｔｅｄｔｈａｔｔｈｅｃＤＮＡｌｉｂｒａｒｙｒｅｆｌｅｃｔｅｄｃｏｒｒｅｃｔｌｙｇｅｎｅｅｘｐｒｅｓｓｉｏｎｄｕｒｉｎｇＭ．ｇｒｉｓｅａｄｅｖｅｌｏｐｍｅｎｔ．ＳｏｔｈｅｍｉｘｅｄｃＤＮＡｌｉｂｒａｒｙｐｒｏｖｉｄｅｓａｎｅｆｆｅｃｔｉｖｅｒｅ－ｓｏｕｒｃｅｆｏｒｆｕｎｃｔｉｏｎａｌｓｔｕｄｙｏｆｔｈｅｆｕｎｇｕｓａｎｄｉｓｓｕｉｔａｂｌｅｆｏｒｆｕｒｔｈｅｒｓｔｕｄｙｆｏｒｍｏｌｅｃｕｌａｒｍｅｃｈａｎｉｓｍｏｆｉｎｆｅｃｔｉｏｎａｎｄｄｅｖｅｌｏｐｍｅｎｔｏｆＭ．ｇｒｉｓｅａ．Ｋｅｙｗｏｒｄｓ：Ｍａｇｎａｐｏｒｔｈｅｇｒｉｓｅａ；ｃＤＮＡｌｉｂｒａｒｙ；ｅｘｐｒｅｓｓｅｄｓｅｑｕｅｎｃｅｔａｇｓ＊基金项目：国家高技术研究与发展计划（８６３）项目（Ｎｏ．２００２ＢＡ７１１Ａ１５）资助。

冬虫夏草菌表达序列标签的分析

冬虫夏草菌表达序列标签的分析冯辉;金永三;刘燕楠;刘震;韩宇宁;孙海波;张绍鹏【期刊名称】《世界科学技术-中医药现代化》【年(卷),期】2010(012)004【摘要】为研究野生冬虫夏草的基因表达谱和挖掘其功能基因,在前期构建的冬虫夏草高质量cDNA文库基础上,挑选21845个克隆测序,筛选出了20136条EST序列,最终获得6434条非重复序列,包括2462条重叠群,3972条单一序列,代表本物种的转录序列.与GenBank中已知序列BLAST比对(E值10-5),获得部分同源基因的功能注释.基因功能分属7个不同的类别.本文重点讨论了营养物质消化吸收相关基因与抗性基因,旨在说明冬虫夏草菌适应寄生环境的机制,为进一步从分子水平研究活性成分及开发利用这一基因资源提供了条件.【总页数】6页(P604-609)【作者】冯辉;金永三;刘燕楠;刘震;韩宇宁;孙海波;张绍鹏【作者单位】北京中医药大学,北京,100029;北京中医药大学,北京,100029;北京中医药大学,北京,100029;北京华大基因研究中心,北京,101300;北京华大基因研究中心,北京,101300;北京华大基因研究中心,北京,101300;北京华大基因研究中心,北京,101300【正文语种】中文【中图分类】R2【相关文献】1.表达序列标签大规模序列分析策略及方法 [J], 刘稳升;吴忠道2.肝细胞癌中差异表达的表达序列标签的生物信息学分析 [J], 陈香宇;段芳龄;李建生;朱武凌;韩泽广;薛乐勋3.大片吸虫成虫cDNA表达文库的构建及其表达序列标签初步分析 [J], 罗洪林;张为宇;郑小龙;黄维义4.梅山猪、大白猪和梅大杂交猪背最长肌中差异表达的14个表达序列标签的分离、鉴定及组织表达分析 [J], 刘永刚;熊远著;左波;蒋思文;邓昌彦;李家连;李凤娥;郑嵘5.大片吸虫成虫FG0018表达序列标签序列的电子克隆分析及实验验证 [J], 罗洪林;郑小龙;张为宇;覃华;黄维义因版权原因，仅展示原文概要，查看原文内容请购买。

基因组学试题

基因组学试题1、什么是基因组（5分）？什么是转录组（5份）？说明基因组合的关系和异同（10分）基因组是生物体（细胞或病毒）中所有的DNA的总和, 包括所有的基因和基因间区域，包括染色体之外的遗传物质，如线粒体、叶绿体、质粒等。

基因组：物种内恒定(♀/♂)，生物体或细胞内恒定，没有时空变化(?)。

事实上有特例，1、盲鳗(Hugfish) ,性细胞和体细胞DNA量差异; 2、部分昆虫，性细胞和体细胞染色体数目差异; 3、动物雌雄个体差异转录组：•生物体、组织、细胞不同生长发育阶段的转录产物不同。

•生物体不同组织、同一组织不同细胞的转录产物不同。

•生物体、组织、细胞不同环境、不同生理状态下的转录产物不同。

•转录产物中包含大量不翻译蛋白的RNA,如rRNA; sRNA2、简述原核生物基因组和真核生物基因组的特点和差异（10分）原核生物基因组•一条环状DNA；•只有一个复制起始点；•有操纵子（Operon）结构1.结构基因为多顺反子，若干个功能相关的功能基因串联在一起，手统一调控区调控。

2.数个操纵子还可以受同一个调节基因（regulaterygene)，即调节子（regulon)调控。

•结构基因无重叠现象，基因组中任何一段DNA不会用于编码2种蛋白质•基因是连续的，无内含子，转录后不剪接；•重复序列少，蛋白质基因一般为单拷贝基因，但编码rRNA的基因一般为多拷贝，有利于核糖体快速组装。

真核生物基因组•复杂的染色体结构，一般有多条染色体•每条染色体上有多个复制起始点；•基因组中有大量的重复序列（轻度、中度、高度重复）；•基因是不连续的，有内含子，转录后经过剪接加工成成熟RNA；•有许多来源相同、结构相似、功能相关的基因组成的单一基因簇，或基因家族•有细胞器基因，真核生物除具有核基因外，还有存在于线粒体和叶绿体中基因，编码同功酶等。

3、什么是遗传图谱（5分）？遗传图谱在基因组研究中的意义何在（15分）？采用遗传学分析方法将基因或其它DNA标记按一定的顺序排列在染色体上，这一方法包括杂交实验，家系分析。

禾谷镰刀菌基因组学研究进展

禾谷镰刀菌基因组学研究进展张大军,邱德文,蒋伶活*(中国农业科学院植物保护研究所植物病虫害生物学国家重点实验室,北京100081)摘要禾谷镰刀菌是小麦和大麦生产上一类重大的病原真菌。

禾谷镰刀菌全基因组测序的完成,为禾谷镰刀菌功能基因的发掘提供了十分有利的信息。

简述了禾谷镰刀菌在基因组学,包括比较基因组学和功能基因组学等领域的研究进展。

关键词禾谷镰刀菌;比较基因组学;功能基因组学中图分类号 S188 文献标识码 A 文章编号 0517-6611(2009)17-07892-03R e se a rch Pro g re s s on th e G e n om ic s o f Fusariu m g r a m inear u m ZHANG D a -ju n e t a l (S ta te K ey L abo ra to ryfo r B io logy o f P lan t D isea se an d In sect P es ts ,In s titu te o f P lan t P ro tection,C h in ese A cade m y o f A gr icu ltu r-a l S cien ces ,B e ijin g 100081)A b s tra c t Fu sarium g r am in earu m is a m a jo r fu n ga l pa th og en on w h ea t an d bar le y produ ction.T h e com p le tion o f F .g ra m inear um gen om ic sequ en cin g prov i de s va lu ab le in form a tion fo r s tu dy in g th e f u n ction a l gen e s o f Fu sariu m g r am i n ear um.T h e recen t re se arch p rog ress on th e g en o m ics o f Fusarium gra m inearu m w e re rev iew ed ,su ch as co m pa ra tive gen om ics an d fu n ction a l gen om ics .K e y w o rd s Fusariu m gra m inear um;C om pa ra tive gen om ics ;F un ction a l g en o m ics基金项目国家“973”项目(2006CB 101907)。

cDNA测序和表达谱研究

法。如要获得药物处理后上调的基因，采用前向(forward)减式方法，即用药物处理前mRNA杂交或吸附药物处理后的mRNA；反之，要获得药物处理后下调的基因，则采用后向(backward)减式方法。缺点：该方法尚不完善和不稳定，所获得的结果需Northern印迹法证实，并且插入子的片段较短，缺少5’或3’端，对低丰度mRNA效果不佳。目前，多主张将减式方法和均一化方法合起来，对相关的低丰度表达基因可能效果更好。
②电脑克隆全长cDNA
与UniGene的构成非常类似，也是应用序列相似性进行排列组合。不同之处：除充分利用EST数据外，还要利用基因组DNA序列基因预测结果。电脑克隆时，需要与上述核苷酸及蛋白质数据库进行同源性比较分析以确定是否可能含有全长的ORF。若同源性较高，则易判断；若同源性较低或没有同源性，则较难确定。此时，在保证顺序正确的同时，对翻译的顺序进行结构功能域和比较基因组分析，可帮助确定是否含有ORF。
目前，美国NIH启动了全长cDNA计划—哺乳动物基因采集计划(Mammalian Gene Collection Project) ，加之其他国家的加入，大大加快了全长cDNA的识别和克隆工作。中国的人类基因组计划起步较晚，但坚持“有所为，有所不为”的原则，充分利用自己的资源优势和研究基础，提出对特殊组织如造血细胞、神经内分泌细胞、树突状细胞、胚胎器官等,或疾病如白血病、肝癌等进行大规模EST测序,进行基因表达谱分析，同时完成1％人类全长cDNA的识别和克隆任务。
UniGene：
为了弄清EST间的关系，美国国立生物技术信息中心(NCBl)根据EST相似性比较进行聚类分析，形成数据库UniGene (／UniGene) 当前cDNA测序的趋势: 由对EST的随机测序，转向全长cDNA的克隆和测序。

大规模平行测序技术_MPSS_研究进展

新技术新方法大规模平行测序技术(MPSS)研究进展陈杰*(第三军医大学新桥医院肿瘤科,重庆400037)摘要大规模平行测序技术(massively par allel signatur e sequencing,MPSS)是以DNA测序为基础的大规模高通量基因分析新技术,通过标签库的建立、微珠与标签的连接、酶切连接反应和生物信息分析等步骤,获得基因表达序列.MP SS具有能测定表达水平较低、差异较小的基因,不必预先知道基因的序列,自动化和高通量等特点,是值得推广的技术.关键词基因,表达分析,大规模平行测序学科分类号Q34311,Q78大规模平行测序技术(massively parallel signature sequencing,MPSS)是Brenner等[1]于2000年建立,由美国Lynex公司(www.lynex. com)将其商品化的一种基因克隆新技术.在发明之初就与TAKARA公司联手向全球推广.其核心技术分别由MegaClone、MPSS和生物信息分析三部分组成.是基于序列分析技术的高通量、高特异性和高敏感性的基因分析技术.本文就最新建立的大规模平行测序技术做简要介绍,并比较该技术与其他几种常用技术的优缺点.1MPSS概况基因药物及相关诊断试剂开发的首要条件是要找出导致疾病或与疾病相关的基因.人类基因组共有1万至5万个基因,而在人体的任一器官、任一时刻,大约有1万至115万个基因在同时起作用.找出与疾病直接相关的基因是一个复杂的过程,涉及到基因表达水平的测定、蛋白质表达、抗体产生和测试,以及复杂的实验设计和数理统计.而其中最重要的一个环节是准确有效地检测基因在不同样品中表达水平的差异.MPSS是以基因测序为基础的新技术,其方法学基础是一个标签序列(10~20bp)含有能够特异识别转录子的信息,标签序列与长的连续分子连接在一起,便于克隆和序列分析.通过定量测定可以提供相应转录子的表达水平,也就是将mRNA 的一端测出一个包含10至20个碱基的标签序列,每一标签序列在样品中的频率(拷贝数)就代表了与该标签序列相应的基因表达水平,所测定的基因表达水平是以计算mRNA拷贝数为基础,是一个数字表达系统,只要将病理和对照样品分别进行测定,即可进行严格的统计检验,能测定表达水平较低、差异较小的基因,而且不必预先知道基因的序列,该技术的特点是基因表达水平分析的自动化和高通量.大规模平行测序技术,其基本方法是从生物样品中提取mRNA,将mRNA分子转换成cDNA,通过固相克隆将该cDNA均匀地加载到特制的小分子载体表面,然后在小分子载体上进行大量的PCR扩增.将所有cDNA游离的一端进行精确测序产生16至20个碱基.每一特定序列在整个生物样品中所占的比例,就代表了含有该cDNA基因在样品中的相对表达水平.该技术能将一个生物样品中几乎所有表达了的基因全部分别克隆到特制的小分子载体上,然后把几十或上百万个小分子载体放进一个特殊的反应系统内,使所有小分子载体都排列在一个平面上,然后将带特殊荧光标记的G、A、T、C单核苷酸按顺序分别加入反应体系中,分别与小分子载体上的cDNA进行分子杂交,每次分子杂交后将所有小分子载体进行激光扫描照相.当加入G时,有特殊荧光的小分子载体上所载的*通讯联系人.Tel:023*********,E2mail:jazz0331@收稿日期:2004202210,接受日期:2004203228cDNA在这个碱基位置上就是G,当加入A时有荧光,则这个位置就是A,以此类推,只需经过4次反应4次激光扫个碱描照相就可将上百万个cDNA 同时将这一位置的序列测出[2].该技术的特点是:a1不必事先知道基因的序列,适用于任何生物体及任何性状;b1基因组覆盖面高,能测量出样品中几乎所有表达了的基因; c1基因表达水平的测量是通过直接计算样品中cDNA的拷贝数目,属于非连续变量,所以只要有病理和正常个体(或组织)两个样品即可以进行严格的统计检验,能有效地检测差异性中等或较小的基因;d1实验效率高,只要两个星期即可获得几十万个克隆的16至20个碱基序列.该技术的关键是验证数据问题,即如何确定转录子和基因表达水平与标签序列产生的数据之间的关系.对不同的基因使用正确的标签序列,如果基因与标签序列之间是非特异性和不明确的都将会产生分析错误.2MPSS基本步骤首先用生物素标记的寡核苷酸引物(biotin2 labelled oligo2dT primer)将来自细胞或组织的mRNA合成为cDNA双链(图1)[3].Dp nÒ限制性内切酶(酶切位点为GATC)消化cDNA片段,利用标记的生物素纯化消化的cDNA片段.将纯化的cDNA片段克隆入包含有32bp序列的标签(tag)载体中,并通过标签上的PCR引物扩增插入片段.酶切消化线性化PCR产物,生成含cDNA片段与32bp标签相连接的产物.将cDNA模板连接到直径为5L m的微球体上./克隆0的方法是利用人工设计长度不同的两类互补寡核苷酸(tag和anti2tag),分别将cDNA与tag连接,anti2tag和微球体连接之后,再将cDNA模板通过tag和anti2tag杂交连接与微球体连接起来.为了能装载下细胞内所有的cDNA模板(若以310 ~410个基因计算),寡核苷酸的数量至少应该要比模板的量多100倍以上,为此Brenner等设计了1167@107个长32bp的寡核苷酸片段,这样可以保证生物体所有不同的cDNA模板都能与不同的寡核苷酸相连接,而且每一个微球体上也可承载104 ~105个相同的cDNA拷贝[3].与32bp标签序列互补的序列(anti2tag)杂交连接,而anti2tag预先已经通过共价键与直径为5L m的微球体连接,这样含cDNA片段与32bp 标签相连接的序列就与微球体相结合.cDNA序列测定,通过连接接头和ÒS型限制性酶BbvÑ,进一步消化结合在微球体上cDNA模板,BbvÑ能在距识别位点9个碱基和13个碱基的位置切割cDNA双链,并在cDNA模板上产生4个碱基末端.Fig11Atta chment of tags to cDNAs[3]图1cDNA片段与标签及微球体的结合[3]洗脱除去寡核苷酸接头,经过BbvÑ酶切后的cDNA模板,进入下一轮分析.分析所得到的17张荧光显微照片,就可以读出微球体阵列中每一个微球体上长度为17bp的cDNA模板序列(图2)[3].Fig12Deter mine the17mer2signatur e of ea ch cDNA2bead[3]图2每个cD NA2bead序列中17bp标签的产生[3]3MPSS应用根据MPSS技术的原理可以知道,MPSS一方面可提供某一cDNA在体内特定发育阶段的拷贝数,另一方面还可测定出相应cDNA17bp的序列,所以这就为在转录水平上进行基因表达分析提供了强有力的定性和定量手段,很明显,这一技术首先可以应用于不同丰度基因的差异表达分析,制作基因转录图谱,这无疑将加速新基因克隆和基因功能的分析.MPSS所获得的基因序列可提供PCR 引物,可通过比较GenBank EST数据库等进行基因定位,也可转化为分子标记构建遗传图谱等等,因此该技术可广泛用于动植物体分类学和遗传学,功能基因组学,蛋白质组学等研究.Hoth等[4]用MPSS克隆出细胞分裂素上调基因823和下调基因917.Christensen等[5]用MPSS 分析了单叶ROB基因家族的保守亚群和发育调节基因.Jongeneel等[2]用MPSS分析了HB4a(正常乳腺上皮细胞)和H CT2116(结肠腺癌细胞)两株细胞的转录子特征.每株细胞获得了107个序列标签,建立了一个基因表达短标签的分析平台.每个细胞株单拷贝表达基因数量为10000~15000之间.两株细胞中绝大多数转录子都可以在已知基因和多聚A变异体上找到对应的位置,从表达序列标签上克隆的基因,大约8000个两株细胞能公共表达,而6000个分别特异表达.Potschka等[6]以大鼠颞叶癫痫模型为研究对象,采用MPSS技术克隆大鼠癫痫特异表达基因,结果提示,在海马回中有263个特异表达基因,其中,最有意义的是知觉早期基因Homer1A,其功能与谷氨酸受体修饰有关,在癫痫大鼠海马回中过表达.Hoth等[7]在研究基因组ABA(phytohormone abscisic acid,ABA)反应基因在拟南芥(Ara bidopsis thalia na)和abi121突变株中的表达差异时,应用了MPSS技术,结果提示,在ABA处理的野生株中发现的1 354个上调和下调基因,在这些ABA反应基因中大多数编码信号传导组分.在abi121突变的对ABA无反应的对照组中,8415%的克隆基因表达减弱,619%基因表达消失,而816%的基因仍然有一定的调节作用.因此作者认为与其他几种基因表达分析方法相比较,MPSS具有高度特异性和敏感性,是在拟南芥野生株中克隆到大量ABA反应基因的主要手段.4MPSS技术的特点目前,应用于基因克隆的技术有DNA芯片(DNA microarrays)、基因表达系列分析(serial analysis of gene expression,SAGE)、定量PCR (quantitative RT2PCR)、差异显示RT2PCR (differential2display RT2PCR)、抑制消减杂交(subtractive suppress hybridization,SSH)和大规模平行测序(massively parallel signature sequencing, MPSS)等方法.每一种方法,都有自身的优点和不足.考察每一种方法的优劣,应该从该技术的特异性、敏感性、可信性、技术难度和运作成本等方面考虑.尤其是建立的基因表达数据库是否有利于下一步生物信息学的分析.基于序列分析的技术有基因表达系列分析、大规模平行测序(MPSS)和表达标签序列分析等方法.相对而言,基于杂交技术的DDRT2PCR、SSH 和RNA点杂交等技术具有可靠、前期操作简单、通量低、后期生物信息学处理较容易、实验成本低等特点.而基于序列分析的SAGE、EST和MPSS 等具有自动化程度高、通量大、生物信息学处理困难和运作成本高等特点.所以在整体基因和基因组分析中很难说那一种技术占有绝对的优势,研究者可以根据各自的实验目标选择一种适当的方法.MPSS分析系统对基因表达分析过程,诸如微球体阵列的制作,反应液的供排、各种反应条件的控制,图像的处理和数据的分析已经完全自动化,能够在很小的一块微球体阵列上,通过常规的分子生物学手段:连接、酶切、萤光成像等简单几个步骤就可以同时分析数以万计的基因数目,这大大超过了基因的EST、RNAse保护分析、DDRT RT2 PCR分析(这几种方法一次只能检测很少的基因表达情况),甚至超过了SAGE的一次性分析能力,同时不需要耗费时间做大量的PCR实验,不需要对cDNA模板做特殊的处理,也不用对探针序列进行提前选择,因此MPSS技术分析样品基因表达的操作简便,速度快,时间短.更为重要的是MPSS可根据荧光信号对基因表达水平做定量的分析,能提供基因末端序列信息,这是MPSS与RT2 PCR、SAGE等常规方法不同之处.另外,MPSS 对基因末端序列与常规测序不同的是,它不需要进行基因片段的分离、克隆再逐一测序,而是具备了cDNA芯片、cDNA微阵列荧光分析法直接读出序列的优点,可同时获得大量cDNA末端序列,从而简化了测序过程,这符合后基因组时代基因功能分析的高通量、自动化、微型化的要求[8,9].MPSS与基因芯片技术相比较,有下列优点: a1可以避免在cDNA芯片技术中出现的高度同源序列的交叉杂交.因此可以保证基因的高度特异性.9712%的标签中,17bp长度的标签已经足够鉴别基因组中相关的基因.如此高的鉴别率, cDNA芯片技术很难达到;b1MPSS的高分辨率可以检测很低表达水平的基因;c1MPSS技术检测基因不需要预先知道该基因的相关信息,可以应用于任何生物体的基因表达检测,而cDNA芯片技术需要将已知基因片段作为探针固定在片基上[10].当然该技术同DNA芯片技术一样,需要较为昂贵的硬件和相配套的软件协同运做.目前国内外的相关应用报道较少,因此目前还亟需降低仪器检测的成本,加强推广和普及工作.总之,MPSS技术是基因表达定性和定量研究的一种有效工具,它能在短时间内检测细胞或组织内全部基因的表达情况,并能通过与已知基因数据库进行比对,定量显示出基因在细胞或组织内的表达状况,是功能基因组研究和基因发现的有力工具,对于致病基因的识别、药物在组织中的药效分析、揭示基因与疾病之间的传导通路.揭示基因在疾病中的作用都是非常有价值的,而这些与疾病相关的基因将是非常有价值的药靶.随着MPSS技术的不断发展,相信该技术必将在各种生物基因组功能方面及其相关领域研究中发挥巨大的作用.参考文献1Brenner S,Johnson M,Bridgham J,et al.Gene expression analysis by massively parallel signature sequencing(MPSS)on microbead arrays.Nat B iotechnol,2000,18(6):630~6342Jongeneel C V,Iseli C,Stevenson B J,et prehensive sampling of gen e expression in human cell li nes with massivelyparallel signature sequencing.Proc Natl Acad Sci USA,2003,100(8):4702~47053J eannette R,Eddy B,Jingzhong L,et al.Massively parallel signature sequencing(MPSS)as a tool for in2depth quanti tative gene ex pres sion profiling in al l organisms.Briefings i n Functional Genomics and Protemics,2002,1(1):95~1044Hoth S,Ikeda Y,Morgante M,et al.Moni toring genome2wide changes in gen e expression in response to endogenous cytokinin reveals targets i n Arabidop s is thaliana.FEBS Lett,2003,554(3):373~3805Christensen T M,Vej lupkova Z,Sharma Y K,et al.Conserved subgroups and developmental regulation in the monocot rop gene family.Plant Physiol,2003,133(4):1791~18086Potschka H,Krupp E,Ebert U,et al.Kindling2inducedoverexpressi on of hom er1A and i ts functional i mplications for epileptogenesi s.Eur J Neurosci,2002,16(11):2157~21657Hoth S,Morgante M,Sanchez J P,et al.Genom e2wide gene expression profiling in Arabidop s is thaliana reveals new targets of abscisic acid and largely impaired gene regulation in the abi121 mutant.J Cell Sci,2002,115(24):4891~49008Pollock J D.Gene expression profili ng:methodological challenges, results,and prospects for addiction research.Chem Phys Lipids, 2002,121(1~2):241~569Brenner S,Williams S R,Vermaas E H,et al.In vitro cloni ng of complex mixtures of DNA on microbeads:physical separation of differentially ex pres sed cDNAs.Proc Natl Acad Sci USA,2000, 97(4):1665~167010Blohm D H,Guiseppi2Elie A.New developments in microarray technology.Curr Opin B iotechnol,2001,12(1):41~47A Novel Gene Identification Approach:Massively ParallelSignature SequencingCHEN Jie*(C a ncer T reatmen t Center,Xin qiao Hos p ital,The Third Military Medical University,Chongqing400037,China)Abstr act Massively parallel signature sequencing,MPSS,is an open platform that reveals the expression level of virtually all genes expressed in a sample by counting the number of individual mRNA molecules produced from each gene.The MPSS process involves cloning each mRNA molecule onto the surface of a5L m bead.T he DNA combitag sequence is attached to a fragment of cDNA.The cDNA library is hybridized to beads.After hybridization,each of the beads displays amplified copies of one and only one starting mRNA molecule.MPSS has a routine sensitivity of a few molecules of mRNA per cell and the results are in a digital format that simplifies data management and analysis.MPSS results will be particularly useful for generating the type of complete data sets that will help to identify the functionally important genes in the sample of interest.Key words gene,expression analysis,massively parallel signature sequencing(MPSS)*Corresponding author.T el:86223268755646,E2mail:jazz0331@Received:February10,2004Accepted:March28,2004。

西洋参cDNA文库构建及表达序列标签(EST)分析

２郑州大学纳米药物研究中心，郑＃１００；３郑州大学基础医学．４０１．５院，郑＇４００）／Ｎ５０１／中国药学杂志．２０，４（０．７６７一０８３１）－６￣７０制备分枝型聚乙烯亚胺（—Ｅ）反义寡核苷酸（Ｏ）分子组ＢＰＩ／ＡＳＮ超
院，石河子８２０）／国药学杂志．２０，４（）一８～９３０３／中～ｏ８３２．８４应用细胞膜色谱法（ｌｍｅｂａｅｃｒｍｔｒｐｙＭＣ对实验ｃｌｍｒｎｏａｇａｈ，Ｃ）ｅｈｏ室合成的ｌ种取代噻唑烷酸酯类化合物进行活性筛选．细胞膜色０谱筛选条件：心肌细胞膜色谱柱（ｍ２ｍＸ５ｍ）；流动相为２０ｍ５ｍｏ・磷酸盐缓冲液，Ｈ７：柱温３ｍｌＬｐ．４７℃；流速０３Ｌ・ｉ一，．ｍｒｎａ不同波长下检测，以容量因子、保留时间等为指标，卡托普利（ｐｐｌ为阳性对照，据化合物在细胞膜色谱柱上的保留特性ｃｔｆ）ａｏｉ根
（．河子大学化学化工学院，石河子８２０：２石河子大学医学１石３０３．
分枝型聚乙烯亚胺／核苷酸组装体的制备及细胞摄取研究＝寡
Ｓｕｙｏｒｐｒｔｎｏｒｎｈｄｐｌｅｈｌｎｍｉｅｏｉｏｕｌｏｉｅｔｄｎｐｅａａｉｆｂａｃｅｏｙｔｙｅｉｎ／ｌｎｃｅｔｏｇｄ
ｔｉｚｉｉｅ－・ａｂｘｆｃｃｄｅｈｌｅｔｒｂｙｃｌｍｅｂａｅｃｒｍａｈａｏｌｎｃｒｏｙａｉｔｙｓｅｅｌｄ４・ｉｍｒｎｈｏ－

三七根差异基因表达序列标签生物信息学分析

析。结果表明：１个克隆组装分析后有４个重叠群和８９３个单拷贝ＥＴ，表了８Ｓ代７个基因。已知功能的基因序
列共５８个，６％，占６按基因功能分类为ｌ，中大多基因与代谢途径和分泌途径有关。未知功能基因序列０类其
３３％．ｈｒｙ — ｔｅｌｎｅｔｅｄｎｇｔｒｕｇｍｉｏａｉｅｕｎｅｒｎｌｚｄｂｉｉｆｒｔｃｌｍｅｈｄ．ｉｔｈｒｅｃｏｓｗｉｒａｉｈｏｈａｎｃｄｓｑｅｃｓｗｅｅａａｙｅｙｂｏｎｏｍａｉａｔｏｓｈＳｇａｅｔｄｎｍｂａｅ — ｓｎｉｇｒｇｏｓｐｅｉｔｎｒｖａｅｈｔ９ｃｏｅａｅｓｇａｐｉｅＡｍｏｇｉｎｌｐｐｉｅａｄｍｅｒｎｐａｎｎｅｉｎｒｄｃｉｅｅｌｄｔａｌｎｓｈｖｉｎｌｐｅｔｄ．ｏｎ
ｍｅａｏｉａｄｓｃｅｏｙｐｔｗａ．Ｍｅｎｈｌ，ｔｅｅａｅ２ｅｅｔｎｎｗｎ — ｆｎｔｎａｄａｃｕｔｄｆｒｔｂｌｍｎｅｒｔｒａｈｙｓａｗｉｅｈｒｒ９ｇｎｓｗｉｕｋｏｈｕｃｉｎｃｏｎｅｏｏ
２Ｙｎａｇｃｌｒｌｎｖｒｔ，Ｙｎａ５２１ｈｎ）．ｕｎｎＡｒｕｔａＵｉｓｙｕｎｎ６００，Ｃｉａｉｕｅｉ
ＡｂｔａｔＡｏａｆｃｏｅｒｍｗｏｓｐｐｅｓｖｕｒｃｉｅｈｂｄｉａｉｎｃｓｒｃ：ｔｔｌｏ１ｌｎｓｆｏｔｕｒｓｉｅｓｂｔａｔｖｙｒｚｔＤＮＡｉｒｒｅｆＰａａｏｏｉｓｎ９ｉｏｌａｓｏｎｘｎｔｇｎｅｇｂｉ

系统生物学-第三讲-转录组学PPT课件

.
18
• 第一个被确认的miRNA——在线虫中首次发现的lin-4 和 let-7 ，可以通过部分互补结合到目的mRNA靶的3’非编码区(3’UTRs)，以一种未知方式诱发蛋白质翻译抑制，进而抑制蛋白质合成，通过调控一组关键mRNAs的翻译从而调控线虫发育进程。
继线虫之后，随后多个研究小组在包括人类、果蝇、植物等多种生物物种中鉴别出数百拼接和注释表达与分类功能分析作用机理分析qpcr验证est软件平台est序列库序列的质量检查测序量监控聚类和拼接检查借助于基因组信息全长orf寻找发现全长基因研究表达基因概况的主要实验手段dnachipproteomics的先驱功能分类表达量分析交替剪接检测est特有信息microarray和genechip大规模表达谱或全景式表达谱globalexpressionprofile
.
40
表达序列标签(EST)测定及分析
1、什么是EST? 2、EST的应用 3、EST序列测定及分析过程
.
41
1、表达序列与表达序列标签概念
(1) 什么是表达序列?
基因组表达为RNA的序列: mRNA和功能RNA
(2) 什么是表达序列标签?
（expressed sequence tag, EST）
• 转录组研究是基因功能及结构研究的基础和出发点，是解读基因组功能原件和揭示细胞及组织分子组成所必需的。
.
34
• 转录组的特点：受到内外多种因素的调节，因而是动态可变的。能够揭示不同物种、不同个体、不同细胞、不同发育阶段及不同生理病理状态下的基因差异表达信息。
.
35
• 转录组学（Transcriptomics）：研究细胞在某一功能状态下所含mRNA的类型与拷贝数；比较不

基因功能研究方法

反义技术的两种技术路线:
将表达与体内基因或mRNA互补序列的基因转入体内，使细胞表达与目标基因互补的mRNA失活，从而阻断目标基因的表达；
体外合成mRNA互补的核苷酸类似物，通过静脉注射等途径进入细胞，特异性的与目标mRNA作用。
反义寡聚核苷酸与mRNA特异性结合，阻断翻译过程。
的部位，如球形或纤维状结构，他们介于二级结构和三级结构之间。
激活结构域:指转录因子中与转录起始复合体接触与互作的结构部
位。
优势：
它可应基因序列，它检测的相互作用在体内发生，无需额外的纯化步骤。
删除、置换、修饰等手段重建DNA序列,使之成为靶载体； (2)将靶载体导入小鼠的胚胎干细胞中,使外源DNA与胚胎干
细胞基因组相应部分发生同源重组,将靶载体的DNA 序列整合到内源基因组中；
(3)将胚胎干细胞受体细胞注入小鼠的囊胚，将这些囊胚导入假孕母鼠子宫中，产生的雄性嵌合鼠子代与正常的雌鼠交配即可获得生殖系统携带该基因的纯合鼠，进而分析被剔除基因的功能。
优点：可使导入基因的水平与内源基因相当,并且具有类似于天然的剪接机理,适用于复杂的基因功能分析。
YAC要具备的主要功能成份
1）着丝粒：mitosis姊妹染色单体和减I同源染色体分离之必需。 2）端粒：保护染色体末端免受核酸酶的侵袭。 3）自主复制序列（ARS）元件：是染色体自主复制的复制起点。构建YAC需要4个短序列：2个端粒，着丝粒，ARS元件
4.2 基因敲入基因敲除技术已经成为研究基因功能的强有力手段，但对
于许多基因来说，简单的失活常导致令人费解的无改变的表型。最常见的解释是某些其它基因取代了靶基因的功能，但要在普通基因敲除小鼠中证明这一点十分困难。基因敲入即通过基因打靶用一种基因替换另一种基因以确定它们是否具有相同功能。

表达序列标签研究进展及其在甲壳动物中的应用概况

表达序列标签研究进展及其在甲壳动物中的应用概况摘要：随着生物信息学的发展，表达序列标签（ＥＳＴ）在分子标记开发、新基因分离鉴定、基因表达谱分析、基因组功能注释、基因电子克隆等方面具有重要作用。

简要介绍了ＥＳＴ分析的原理及其在基因识别、基因预测、物理图谱的构建、ＤＮＡ芯片制备等方面的应用概况。

综述了甲壳动物ＥＳＴ的研究现状，并对ＥＳＴ的应用前景进行了展望。

关键词：表达序列标签（ＥＳＴ）；甲壳动物；生物信息学Ａｂｓｔｒａｃｔ：Ｗｉｔｈｔｈｅｄｅｖｅｌｏｐｍｅｎｔｏｆｂｉｏｉｎｆｏｒｍａｔｉｃｓ，ｅｘｐｒｅｓｓｅｄｓｅｑｕｅｎｃｅｔａｇ（ＥＳＴ）played ａｎｉｍｐｏｒｔａｎｔｒｏｌｅiｎｍｏｌｅｃｕｌａｒｍａｒｋｅｒｓｄｅｖｅｌｏｐｍｅｎｔ，ｎｅｗｇｅｎｅｓｉｓｏｌａｔｉｏｎａｎｄｉｄｅｎｔｉｆｉｃａｔｉｏｎ，ｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｆｉｌｅａｎａｌｙｓｉｓ，ｇｅｎｏｍｅｆｕｎｃｔｉｏｎａｌａｎｎｏｔａｔｉｏｎａｎｄｓｉｌｉｃｏｇｅｎｅｃｌｏｎｉｎｇ．TｈｅｐｒｉｎｃｉｐｌｅｏｆＥＳＴａｎａｌｙｓｉｓａｎｄｉｔｓａｐｐｌｉｃａｔｉｏｎｓiｎｇｅｎｅｉｄｅｎｔｉｆｉｃａｔｉｏｎ，ｇｅｎｅｐｒｅｄｉｃｔｉｏｎ，ｐｈｙｓｉｃａｌｍａｐｃｏｎｓｔｒｕｃｔｉｏｎａｎｄＤＮＡｃｈｉｐｐｒｅｐａｒａｔｉｏｎwas briefly introduced．Ｉｎａｄｄｉｔｉｏｎ，ｔｈｅｒｅｓｅａｒｃｈｓｔａｔｕｓｏｆｃｒｕｓｔａｃｅａｎＥＳＴａｎｄthe ｐｒｏｓｐｅｃｔｏｆＥＳＴａｐｐｌｉｃａｔｉｏｎｗｅｒｅａｌｓｏｓｕｍｍａｒｉｚｅｄ．Ｋｅｙｗｏｒｄｓ：ｅｘｐｒｅｓｓｅｄｓｅｑｕｅｎｃｅｔａｇ（ＥＳＴ）；ｃｒｕｓｔａｃｅａｎ；ｂｉｏｉｎｆｏｒｍａｔｉｃｓ表达序列标签（Ｅｘｐｒｅｓｓｅｄｓｅｑｕｅｎｃｅｔａｇ，ＥＳＴ）是从一个随机选择的ｃＤＮＡ克隆进行５’端和３’端单一次测序获得的短的ｃＤＮＡ部分序列。

10第十一章DNA序列测定和分析

第18页，共81页。
A > C 的反应
还有一种反应（A＞C），必要时可用来参考。在 90℃下，用1.2mol/L NaOH处理，可使A位点发生剧烈的断裂反应，而C位点的断裂反应较微弱。
第19页，共81页。
四、测序策略
鸟枪法
鸟枪法又称随机法，它是先将大片段DNA经酶切或超声处理，切割成适合测序大小的片段（如 500 ～ 800bp），然后亚克隆到M13载体上，得到单链DNA后测序，再根据重叠的部分推测出整个大片段的序列。
速、大规模测序提供了新的思路和方法。
第24页，共81页。
1. Roche（454）GS FLX sequencer
Roche公司收购454公司的测序仪并经改造升级，该测序仪最早的商业化产品于2004年推出。454测P载样。
（4）测序。
第12页，共81页。
自动化测序的输出信号
第13页，共81页。
三、Maxam-Gilbert 化学直读法
这是一种基于DNA降解的方法。此法的原理是首先将待测序的 DNA 片段一端用放射性标记，然后使 DNA链在特定碱基处断裂。控制条件使每个DNA分子只发生一处断裂，就可以得到一系列只差一个核苷酸的DNA片段，跑电泳后可得出序列。
第十一章 DNA序列测定和分析
一、加减法
二、 Sanger 双脱氧链终止法三、 Maxam－Gilbert 化学直读法
四、测序策略
五、第二代测序技术
六、杂交测序与DNA芯片技术
七、表达序列标签
八、 DNA 序列分析
第1页，共81页。
一、加减法测序
以待测 DNA 为模板，加一同位素标记的短链引物，在 4×dNTP存在下，用DNA聚合酶Ⅰ催化合成各种随机长度的产物。将模板及合成的产物分为“加法组”和“减法组”，加法组和减法组又各分为4组。“加法组”中的每一小组只加一种dNTP，4组各加不同的dNTP。以加dATP组为例，当前面合成的随机长度的DNA下一个核苷酸该加A时，可以将A加上；如果正好以A结尾，而下一个不该加A时，则链保持不变；如果不以A结尾，下一个又不该加A时，则利用DNA聚合酶Ⅰ 的3’→5’外切活性逐个切除已合成的核苷酸，直到遇到A为止。最终加dATP组的每一条新合成的链都是以A结尾，整个组中各个A处结尾的链都有。

一种利用序列标签定量测定核酸的方法[发明专利]

专利名称：一种利用序列标签定量测定核酸的方法专利类型：发明专利
发明人：周国华
申请号：CN200910126690.4
申请日：20090309
公开号：CN101519698A
公开日：
20090902
专利内容由知识产权出版社提供
摘要：本发明属于分子遗传学领域，公开了一种利用序列标签定量测定核酸的方法，包括下列步骤：连接反应标记待测核酸、扩增反应增加连接反应产物量、测序反应识别和定量连接反应产物上的序列标签，其特征在于单管中含有一对或多对连接探针，每对连接探针与一种待测核酸存在特异性互补序列，该对连接探针中的至少一条探针含有特异性的序列标签。

本发明不经过荧光染料的标记而直接采用碱基序列标记法就可以实现多个核酸的定量测定，方法简单、方便、通量高、成本较低、既能用于测定基因序列差异又能用于测定基因相对表达量，有利于临床广泛推广使用。

申请人：周国华
地址：210002 江苏省南京市中山东路293号
国籍：CN
代理机构：南京天华专利代理有限责任公司
更多信息请下载全文后查看。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

大规模表达序列标签测定及分析
ESTs与SNPs
来自不同个体的冗余的ESTs可用于发现基因组中转录区域存在的SNPs。最近的许多研究都证明对ESTs数据的分析可以发现基因相关的SNPs (Buetow et al., 1999;Garg et al., 1999; Marth et al., 1999; Picoult-Newberg et al., 1999) 。
大规模表达序列标签测定及分析
总EST条目（million）
dbEST中数据量的增长
20 18 16 14 12 10 8 6 4 2 0
1993 1995 1997 1999 2001
时间（年）
● 93年前ESTs数据收录于GenBank， EBI和DDBJ。
● 1993年NCBI(National Center of Biotechnology Information)建立了一个专门的EST数据库dbEST来保存和收集所有的EST数据。
大规模表达序列标签测定及分析
ESTs与基因预测
由于EST的一个基因的部分序列。使用合适的比对参数，大于90％的已经注释的基因都能在EST库中检测到(Bailey et al., 1998)。ESTs可以做为其它基因预测算法的补充，因为它们对预测基因的交替剪切和3‘ 非翻译区很有效。
● 由于没有内含子的存在，因此在cDNA及基因组模板中其PCR产物的大小相同；
● 与编码区具有很强的保守性不同，3’UTRs序列的保守性较差，因此很容易将单个基因与编码序列关系非常紧密的相似基因家族成员分开。（James Sikela等，1991年）
GeneMap 96‘ 定位了16,000个基于基因的STS(Schuler et al., 1996)； GeneMap 98’ 定位了30,000个基于基因的STS(Deloukas et al., 1998)，而且基因图谱随着STS的定位正在不断的更新中。
◆ CGAP
为研究癌症的分子机理，美国国家癌症研究所NCI的癌症基因组解析计划(Cancer Genome Anatomy Project , CGAP)构建了很多正常的达序列标签(EST)测定及分析
大规模表达序列标签测定及分析
主要内容
• 什么是EST? • EST的应用 • EST序列测定及分析过程 • 实例：家猪脑组织EST分析
大规模表达序列标签测定及分析
ESTs的来源
上世纪80年代，对cDNA序列进行大规模测序的想法就曾提出，但对此一直存在争论，有人认为这种方法能发现成千上万的新基因；而反对者则认为cDNA序列缺少重要的基因调控区域的信息。90年代初Graig Venter 提出了EST的概念，并测定了609条人脑组织的EST，宣布了cDNA大规模测序的时代的开始 (Adams et al., 1991)。
大规模表达序列标签测定及分析
ESTs与基因图谱的绘制
EST可以借助于序列标签位点(sequence-tagged sites)用于基因图谱的构建. STS本身是从人类基因组中随机选择出来的长度在200-300bp左右的经PCR检测的基因组中唯一的一段序列。来自mRNA的3’非翻译区的ESTs更适合做为STSs，用于基因图谱的绘制。其优点主要包括：
大规模表达序列标签测定及分析
什么是 ESTs ？
ESTs（Expressed Sequence tags ）是从已建好的cDNA库中随机取出一个克隆，从5’末端或3’末端对插入的cDNA片段进行一轮单向自动测序，所获得的约60-500bp的一段cDNA序列。
大规模表达序列标签测定及分析
ESTs与基因识别
应注意区别真正的SNPs和由于测序错误( ESTs为单向测序得来，错误率可达2％)而引起的本身不存在的SNPs。解决这一问题可以通过：
● 提高ESTs分析的准确性。 ● 对所发现的SNPs进行实验验证。
大规模表达序列标签测定及分析
ቤተ መጻሕፍቲ ባይዱ
利用ESTs大规模分析基因表达水平
因igital Gene Expression Displayer (DGED)
● cDNA xProfiler
◆ 基因表达系列分析(Serial Analysis of Gene Expression, SAGE)
基因表达系列分析是一种用于定量，高通量基因表达分析的实验方法(Velculescu et al., 1995)。 SAGE的原理就是分离每个转录本的特定位置的较短的单一的序列标签（约9-14个碱基对），这些短的序列被连接、克隆和测序，特定的序列标签的出现次数就反应了对应的基因的表达丰度。
ESTs已经被广泛的应用于基因识别，因为ESTs的数目比GenBank 中其它的核苷酸序列多，研究人员更容易在EST库中搜寻到新的基因 (Boguski et al., 1994).
● 在同一物种中搜寻基因家族的新成员(paralogs)。 ● 在不同物种间搜寻功能相同的基因(orthologs)。 ● 已知基因的不同剪切模式的搜寻。【注：不过很难确定一个新的 erg et al., 1997)】
◆ DNA微阵列或基因芯片的研究
高密度寡核苷酸cDNA 芯片或cDNA微阵列是一种新的大规模检测基因表达的技术，具有高通量分析的优点。在许多情况下，cDNA芯片的探针来源于3'EST (Duggan et al., 1999)，所以EST序列的分析有助于芯片探针的设计。大规模表达序列标签测定及分析