生物信息学在基因组学中的应用_沈春修
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作者简介沈春修(1979-),男,湖南溆浦人,硕士,助教,从事水稻遗传
育种与抗病分子机制方面的研究。
收稿日期
2007!04!01
基因的研究是指在许多基因同时存在的基础上对多个基因同时进行研究,分析各自与它们之间的结构与功能的相互关系。因而它至少涉及3个相关领域:结构基因组———主要关心DNA碱基序列水平上的基因结构;比较基因组———寻找种内、种属间产生基因结构差异的分子基础,以期获取与目的性状相关的基因;功能基因组———着重研究基因与其表达产物及功能活性的调控关系。结构基因组是其他领域的基础,比较基因组为功能基因组研究提供等位基因,蛋白质组则是在蛋白质水平上分析基因表达的功能基因组研究的派生分枝。生物信息学是在前面三者研究的基础上,获取、整理、综合分析提取大量已有复杂生物数据的新学科,对相关学科的研究有很大的推动作用。
1生物信息学在结构基因组中的应用
随着化学分析方法的改进,DNA测序水平的提高,科
研成本的降低,已开始对多种模式生物进行基因组全序列的测序。如拟南芥和水稻的全基因组测序,将来会有越来越多的重要作物基因组被全测序。因而,今后的工作重点将是基因组中信息的分析与鉴定,对植物抗性基因来说,是分析鉴定其组织结构及其相关调控序列的鉴定。结构基因组的研究对抗性基因的研究有许多指导意义。
在现在已知的许多种已克隆的抗性基因(不含Hm1和
Hm2)中,分析其序列结构,都含有或部分含有核苷酸结合
位点(NBS),富含亮氨酸重复(LRR),跨膜结构域(TM)以及丝氨酸-苏氨酸激酶(STK)保守序列。根据已知抗性基因都含有NBS序列的特征,从测序结果中可预测某一生物中含有与抗性基因有关的基因数目有多少[1]。在拟南芥与水稻测序的过程中,发现许多与抗性有关的NBS序列。在已测序的拟南芥67Mb中(相当于大于50%的拟南芥基因组序列),有120个可预见的基因产物与植物抗性基因的NBS结构相似[2]。假设剩余的另外50%未知基因也按这样的比例分布,那么拟南芥中将有200个左右的基因与抗性有关。在这些与抗性有关的200个基因中,它们要么是编码信号传导的组分,要么是编码抗微生物的蛋白,这些基因序列的总长度大约占拟南芥总基因数的1%。而在水稻中,通过对重叠的BAC克隆末端序列分析(占全部水稻基因的5%)来看,大约有750 ̄1500个基因具有编码NBS的能力[3-5]。
从已知抗性基因的定位结果来看,NBS序列在拟南芥基因组中倾向于成簇排列。测序结果也表明,植物中的抗性基因一般与抗性基因的多种同源共生序列在一起,共同组成
高度重复区域,这种区域统称为基因簇。Rpp5基因簇包含
8 ̄10个同源序列,散布在90kb的区域上,并且被蛋白激酶
的假基因与反向转座子等隔开。Cf!4/9基因簇由5个抗性基因同源序列组成,散布在36kb的区域内,Cf!4/9的同源序列被Lox基因隔开,成为高度重复区域。Pto基因簇包含5个同源序列,分布在60kb的区域内,这其中的Prf基因编码NBS!LRR,对Pto基因的功能是必需的。Dm3基因是目前已知的最大的抗性基因,至少由24个抗性基因同源序列组成,横跨3.5Mb。因而,随着更多模式植物的全基因组测序的完成,人们可以从基因组测序信息中直接读出有用数据,分析寻找抗性基因的组织结构特征与分布规律。
2生物信息学在比较基因组学中的应用
随着多种生物的全基因组测序完成,有越来越多的数
据可以直接利用。首先,通过比较多种属植物抗性基因的定位特点,发现抗性基因大多定位在较不稳定的区域,其区域的结构不很保守,如拟南芥的抗性基因RPM1的同源序列在感病表型的植株上丢失[6]。进一步研究发现,抗性基因的位置要么是端粒区域,要么是接近着丝粒区域。例如,通过原位荧光杂交分析得知:莴苣的两抗性基因分别定位在端粒区域与接近着丝粒区域,高粱Rpg1基因位于端粒区域,番茄的Mi基因位于异染色质的着丝粒边缘[7]。第2,通过测序分析,可以确定基因成簇的模式与范围,通过比较种属间亲缘关系,来预测某一功能相似的基因在其他物种中的位置。进而根据已克隆的抗性基因间的相似性,可以采用适当的引物进行PCR扩增获得抗性基因的候选序列,而且这些候选序列的片段均可定位到已知的抗性基因的位置上[8]。从现在公开的数据中,比较多种NBS基因的相似性,用PCR获得了130个候选抗性基因,此数据将继续增长。第3,比较基因组的另一作用在于可以区分同源区域与同源共生区域。这对本身就位于同源共生区域的抗性基因家族可能困难,但是抗性基因相关序列的种间比较结果显示:同源区域比同源共生区域更加相似。这提示:物种为了赶上病原菌的变化步伐而采取快速进化来抵抗随时间而变化的病原群体。通过分析拟南芥的RPm1基因侧翼序列也得到这样的结论。第4,比较基因组学也可对某特定等位基因的变化的分子基础进行研究[9]。至今,只有极少数通过同源重组,实现蛋白质结构域的域置换试验成功。这些结果显示NBS!LRR编码基因的LRR区域是非常重要的,但它不是专一性的唯一决定簇。随着测序效率的提高,将建立抗性基因相关序列的数据库,这些序列信息可作为基因步行试验的模板,为克隆新的抗性基因提供极大的帮助。第5,比较基因组作图表明,染色体上的DNA标记排列具有共线性[10]。如小麦的基
生物信息学在基因组学中的应用
沈春修
(宜春学院,江西宜春336000)
摘要随着计算机科学、物理学、数学等与生命科学的相互渗透和交叉,生物信息学愈来愈显示出其重要性,尤其是在抗病基因的研究中。笔者从结构基因组、比较基因组、功能基因组与生物信息学等方面论述了生物信息学在基因组学中的应用。关键词抗性基因;结构基因组;比较基因组;功能基因组;生物信息学
中图分类号Q78文献标识码A文章编号0517-6611(2007)20-06054-02
安徽农业科学,JournalofAnhuiAgri.Sci.2007,35(20):6054-6055,6057责任编辑王淼责任校对王淼