比较基因组学与分子进化复习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
比较基因组学与分子进化复习题
1.比较基因组学及分子进化的产生背景及其应用,请举例说明如何理解其意义?
产生背景:随着1990年人类基因组计划(Human Genome Project,HGP)的实施并取得巨大成就,同时模式生物(model organisms)基因组计划也在进行,并先后完成了几个物种的序列分析,研究重心从开始揭示生命的所有遗传信息转移到从分子整体水平对功能的研究上。
在HGP进行中完成一系列模式生物全基因组测定,如大肠杆菌、酵母、线虫、果蝇、小鼠。这些模式生物全基因组测定的完成有重大理论与现实意义。至此基因组的研究进入了后基因组时代(post genome era)。它的研究内容可以概括为:比较基因组学、功能基因组学、蛋白质组学、转录物组学、代谢物组学等,是在全基因组水平上研究基因功能和基因之间互相作用及其调控机制的学科。
随着公共资源数据体系的大规模建立,面对海量数据,如何从这些数据中获得自己想要的知识,搜集、管理、处理、分析、释读能力的要求迅速提升,比较基因组学和分子进化已经成为生命科学研究的核心和不可分割的学科。
应用:比较基因组学能根据对一种生物相关基因的认识来理解、诠释甚至克隆分离另一种生物的基因。
远缘基因组间的比较为认识生物学机制的普遍性,寻找研究复杂生理和病理过程所需的实验模型提供了理论依据,而近缘基因组间的比较则为认识基因结构与功能等细节提供了参数。
比较基因组学与分子进化拓展了模式生物从测序的意义,不仅可以模式生物基因组研究模式生物本身,更重要的是利用模式生物研究进化上相近的其他物种;推动了物种起源和生物进化研究的发展;同时带来了研究方法的思路的突破,促进了反向遗传学等学科的发展。
举例:两种血吸虫完整基因组序列被确定
两个国际联合课题组报告了曼氏血吸虫和日本血吸虫的完整基因组序列。它们是引起血吸虫病(也称“裂体血吸虫病”)的三种主要病原体中的两种。血吸虫病是一种“被忽视的”热带疾病,影响76个国家的超过2亿人。对基因组序列的解析不仅能够在遗传学水平上揭示虫体的活动规律,而且还将有利于发现新的药物作用靶位和疫苗抗原,通过对曼氏血吸虫和日本血吸虫的基因转录谱和蛋白质表达谱的研究,已发现了一些血吸虫与宿主相互作用的重要分子。对新的基因组序列所作的分析,为了解这些病原体的分子结构和宿主互动方式以及未来开发该疾病定向干涉疗法的途径提供了线索。这两种血吸虫的基因组是首次被测序的两种扁形虫基因组,所以它们为了解动物演化中的早期事件、尤其是身体模式的确定及组织发育成器官的过程提供了新视角。
2.目前国际上主要生物信息数据库资源包括那些?其作用是什么?在NCBI数据库中BLAST的含义是什么,如何评价其结果的可靠性?Blastp 、Blastn 、blastx 、Tblastn 和Tblastx 分别能够完成那些研究工作,请举例说明?
(1)主要生物信息数据库及其作用:
①核算序列数据库:
NCBI:国家生物技术信息中心(National Center for Biotechnology Information, 简称NCBI) 是美国国家医学图书馆(NLM)的一部分(该图书馆是美国国家卫生研究所的一部分)。涵盖了几乎目前研究得到的所有蛋白质、核酸序列、基因和蛋白质结构与功能的信息,并提供多种软件工具和检索系统。
EMBL:EMBL - European Bioinformatics Institute欧洲生物信息研究所。为科学界提供免费生物信息资源、促进基础研究、提供培训和传播行业尖端技术。管理和维护着多个大型生物信息公共数据库,跨基因组学,蛋白质组学,化学信息学,转录组学,系统生物学等,同时创建了多种工具供让研究人员分析和分享信息。
DDBJ:DDBJ(DNA Data Bank of Japan) 日本DNA数据库。DDBJ主要向研究者收集DNA序列信息并赋予其数据存取号,信息来源主要是日本的研究机构,亦接受其他国家呈递的序列。与NCBI的GenBank,EBI的EMBL数据库共同组成国际DNA数据库,每日都交换更新数据和信息,并主持两个国际年会-国际DNA数据库咨询会议和国际DNA数据库协作会议,互相交换信息,因此三个库的数据实际上是相同的。
②蛋白质序列数据库:
UniProt:Universal Protein是信息最丰富、资源最广的蛋白质数据库。它由整合Swiss-Prot、TrEMBL 和PIR-PSD 三大数据库的数据而成。他的数据主要来自于基因组测序项目完成后,后续获得的蛋白质序列。它包含了大量来自文献的蛋白质的生物功能的信息。
PIR:PIR数据库按照数据的性质和注释层次分四个不同部分,分别为PIR1、PIR2、PIR3和PIR4。PIR1中的序列已经验证,注释最为详尽;PIR2中包含尚未确定的冗余序列;PIR3中的序列尚未加以检验,也未加注释; 而PIR4中则包括了其它各种渠道获得的序列,既未验证,也无注释。
SwissProt:该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所(Swiss Institute of Bioinformatics,简称SIB)和欧洲生物信息学研究所EBI共同维护和管理。瑞士生物信息研究所下属的蛋白质分析专家系统(Expert Protein Analysis System,,简称ExPASy)的Web服务器除了开发和维护SwissProt 数据库外,也是国际上蛋白质组和蛋白质分子模型研究的中心,为用户提供大量蛋白质信息资源。
TrEMBL:蛋白质序列数据库TrEMBL是从EMBL中的cDNA序列翻译得到的。”。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。TrEMBL数据库分两部分,SP-TrEMBL 和REM-TrEMBL。SP-TrEMBL中的条目最终将归并到SwissProt数据库中。而Rem-TrEMBL则包括其它剩余序列,包括免疫球蛋白、T细胞受体、少于8个氨基酸残基的小肽、合成序列、专利序列等。
(2)BLAST的含义及如何评价其结果的可靠性:
BLAST (Basic Local Alignment Search Tool)是NCBI推出的对蛋白质数据库或DNA数据库进行相似性