新基因功能研究的整体策略_张岚

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

新基因功能研究的整体策略

张岚,李庆章

(东北农业大学,乳品科学教育部重点实验室,黑龙江哈尔滨 150030)

摘要:随着生命科学的发展及研究领域的不断开拓,越来越多的未知新基因和基因的新功能被发现,这些基因功能的研究成为了后基因组时代的首要任务。作者对新基因的研究策略作了一个较为系统全面的综述。

关键词:新基因功能研究;功能预测;基因转导;蛋白质相互作用

中图分类号:Q78 文献标识码:A 文章编号:1671 7236(2011)05 0109 05

随着人类基因组计划(H GP)和其它模式生物基因组计划的相继完成,生命科学已经进入了后基因组学时代(post geno mics)。在对基因组结构进一步了解的同时,功能基因组学逐渐成为核心内容(徐子勤,2007)。基因组序列测定的完成仅仅是基因组计划的第一步,更大的挑战在于如何确定基因的功能和阐述其调控的机制与表达规律。因而,基因功能研究已成为生命科学领域中的重大课题,它将是21世纪生命科学研究的重要领域(李新枝等, 2007)。那么,对于一个未知的新基因,如何对它制定基因功能的研究方案从而进行全面、系统的研究是每个基因功能研究者面临的首要问题。目前基因功能的基本策略包括:通过生物信息学的方法对新基因进行结构和功能的预测;通过试验方法进行基因功能的验证,包括功能获得策略和功能失活策略;基因编码产物相互作用蛋白的研究。作者结合国内外基因功能研究方法的新进展,对基因功能研究的策略进行了一个系统的综述。

1 新基因全长cDNA的克隆策略

在研究新基因的功能之前,首先要通过基因克隆试验得到新基因全长cDNA序列。所有的基因克隆都包括4个步骤,依次为产生DNA片段、连接至载体、转化到受体细胞中扩增和目的序列的筛选鉴别。如果一个基因的完整序列已经被报道,可以

收稿日期:2010 10 18

作者简介:张岚(1980-),女,黑龙江人,硕士,研究方向:乳腺发育功能基因功能。

通信作者:李庆章(1953-),男,河北人,教授,博士生导师,研究方向:泌乳生物学与乳腺功能调控。E mail:qing

zhangLi@h ;T el:0451 ********基金项目:国家重点基础研究发展(973)计划(2011CB100800);

东北农业大学创新团队项目(CXT005 1 1/CXT005

1 2)。根据已知序列设计特异引物,通过PCR技术获得目标DNA片段。如果一个或多个物种的某种基因已经被分离,可以根据同源性比对找到的保守性序列合成探针或简并引物,通过文库筛选或PCR反应从另一个新物种中分离功能相似的基因。如果只知道某个基因的一段碱基序列,可以采用RA CE(cDNA 末端快速扩增)或反向PCR和锚定PCR方法克隆该基因的cDNA全长序列;也可以将已知序列制备成探针对cDNA文库进行筛选,获得cDNA克隆后利用载体上的引物进行序列分析。此外,转座子示踪技术可用于酵母和植物的克隆;基于图谱的基因克隆方法(m ap based clo ning)依赖于遗传图谱和物理图谱,可用来分离与已知分子标记紧密连锁的基因,包括染色体跳查和染色体歩查;硅片克隆(silico cloning),即不经过实验室工作,将网络中的数据资料进行整理分析和拼接,得到新基因的全长序列(樊红等,2002)。基因的克隆有多种不同策略,研究者应根据自己的实际情况,采取适合的方法。

2 通过生物信息学预测新基因的功能

目前,生物信息学分析已成为新基因功能研究的首选和必用方法,具有方便、快捷、经济等优点。研究者往往可以从中得到与新基因功能有关的重要信息,初步推测基因的可能功能,进而制定出进一步的实验室研究方案(Kim,2004;Mo unt,2004)。

2.1 编码产物预测分析 研究者往往最开始得到有价值的EST序列,进而通过电子延伸或和相关试验方法获取其全长cDNA。在这种情况下,首先要进行全长cDNA序列的开放阅读框查找,推导其编码蛋白质的氨基酸序列。然后,进行信号肽序列预测分析(http://genome.cbs.dtu.dk/services/ Sing nalP/),初步判定其亚细胞定位(Bendtsen等, 2004)。再进行蛋白质的基本理化性质分析,包括氨基酸组成、分子质量、等电点、亲/疏水性等。最后,

以已知的氨基酸序列基础,分析预测其高级结构(http://w w w.embl heidelberg.de/predictprotein/ predict Pr otein.htm l)(H am no等,2004)。

2.2 序列同源性分析 序列同源性分析包括核苷酸序列同源性分析和氨基酸序列同源性分析,这也是目前生物信息学技术中应用最为广泛的基本技术之一。序列同源性分析主要采用BLAST和FLAS RT程序进行,即从已知的各种核酸和蛋白质序列数据库搜索与新基因对应的功能已知的高度同源基因和蛋白质,从这些已知基因和蛋白质的功能信息中来初步推测和判断新基因的功能。同时,因为人类全基因组测序已经完成,所以以新基因cDNA的序列来对基因组数据库进行同源性比对,则可很方便地获得与其完全同源的基因组DNA序列及其染色体定位信息,而无需进行荧光原位杂交等基因染色体定位技术,进而还可通过分析其内含子、外显子序列及其调节位点,推测其可能的基因表达调控方式。如H amano等(2004)即通过此法确定了富含亮氨酸重复序列蛋白新基因的基因组DNA序列及其染色体定位。此外,如果从同源性分析中可以初步确定新基因属于某一基因家族或超家族的一个新成员,则可进一步分别运用Clustal W(http:// ww /clustalw/index.html)和T ree V iew(http://taxonom y.zo olozy.g /ro d/ tr eeview.htm l)软件来进行多重序列比对和分子进化分析,以获取更多提示信息(M ount,2004)。

2.3 蛋白质功能域分析 蛋白质的功能域分析,主要是通过联网到SMART(http://smart.embl heidelber g.de/)或PROSITE(http://w ww.ex /pr osite)数据库来进行。蛋白质是基因功能的体现者和施行者,而蛋白质的结构则是蛋白质执行生物学功能的基础,因此对新基因所编码蛋白质的功能域分析将对推测新基因功能提供极其有价值的信息。目前,已经有大量被发现的蕴藏于蛋白质结构中的与特定生物学活性相关的所谓保守模体(co nsensus mo tif)(M ount,2004)。

3 新基因的表达谱分析

基因的表达在个体发育的不同阶段及在个体的不同组织和细胞类型中均不相同,即基因表达的时空性。因此,在研究一个基因的功能时,首先要对基因的时空表达谱进行分析,包括m RNA和蛋白质两个水平上的基因表达谱分析。

3.1 mRNA水平的表达谱分析 研究mRNA水平的基因表达谱分析常用的方法有Northern blot ting、原位杂交、RT PCR等。No rthern blotting可对基因进行特异性和定量检测,但测定效率不高,灵敏度也低,不能检出微小的基因表达量,同时试验中使用的放射性物质对人和环境也有危害。作为一种经典的基因表达量分析方法,Northern blo tting依然被广泛地应用。原位杂交技术由美国耶鲁大学Gall和Pardue于1969年首先创立,广泛用于检测一个特异的mRN A在某一种生物体或组织、细胞里的具体表达位置,对待测核酸分子进行定性、定量及定位分析。RT PCR主要有半定量RT PCR、实时定量RT PCR及竞争性定量RT PCR:半定量RT PCR操作简便、快捷,但精确度不高,多用于快速初步分析;实时定量RT PCR是近年来新发展起来的,特异性强、自动化程度高;竞争性RT PCR则是将特异性目的序列同已知浓度的内标RNA一起扩增,通过比较由内标获得的信号和目的模板所获得的信号,确定目的模板的相对含量。

近年来,发展了一些新方法,如表达序列标签串联排列连接(tandem ar rayed ligation of ex pr es sedsequenee tag s,T ALEST)和GeneCalling。T ALEST是应用含有H S型限制酶位点的寡核苷酸引物,产生在m RNA上固定的短(16bp)EST s。这些EST s与热变性有关的GC 锁状标点序列相邻,因此可串联成长阵列,然后通过高通量DNA测序识别、分析(Spinella等,1999)。Genecalling法研究的对象是用两种不同限制酶消化的cDNA样品。用荧光标记的引物扩增、毛细管电泳分离这些标记的片段,然后同时测定每个片段的精确长度。通过电泳比较两个样品中每个点的强度,自动识别不同表达基因的cDNA片段。用大小精确的片段和片段旁侧序列查询特定物种的数据库,得出片段信息,而旁侧序列由限制酶消化而来。查询数据库包括转录子的 in silico 消化片段及所有预测的基因片段。这种预测称为 GeneCalling ,可瞬时显示基因表达差异的临时列表(Shim kets等,1999)。

3.2 蛋白质水平的表达谱分析 确定新基因在哪些组织细胞被转录后,进一步的工作则是制备相应的抗体来检测其蛋白质终产物的表达情况,如该蛋白质表达的亚细胞定位、分子质量大小、聚体形式等。这种在蛋白质水平上的表达分析涉及到的常用技术主要是Western blo tting、免疫组化等。其中, Western blotting与Northern blotting类似,不仅可以进行定量分析,且还能够检测蛋白质的分子质量大小及其聚体形式。而免疫组化技术的优势则在于其能够确定蛋白质是在特定组织中的哪些细胞及在特定细胞的哪个部位中表达(Sambrook等, 2001)。另外,对于病态组织细胞而言,在mRN A和

相关文档
最新文档