计算机在生物学中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学基本方法: 1 数据库信息检索; 2 用序列比对(alignment,对位排列)方法进 行数据库序列检索; 3 网络分析,计算机模拟。
问题:你对生物信息学的认识
第一章 生物信息数据库
生物信息数据库分类保存各种生物信息, 为大家提供计算机分析的基本材料。例文献 数据库、序列数据库。
一 信息中心:维护和提供数据库服务。 主要工作:在分子水平上应用数学和计算 科学的方法研究基础生物、医学问题;为科 学和医学界开发、维护和分享一系列的生物 信息学数据库;开发和促进生物信息学数据 库、数据存储、交换以及生物学命名规则的 标准化。
生物信息学
背景:
1 数据分析技术的发展:1962年Zuckerkandl和 Pauling将序列变异分析与其演化关系联系起 来,开辟了分子演化的研究领域;1964年 Davies开创了蛋白质结构预测研究;1970年 Needoeman和Wunsch发表了两序列比较算 法;1974年Ratner运用理论方法对分子遗传调 控系统进行分析;1975年Pipas和McMahon用 计算机技术预测二级结构。1976年后生物学数 据分析技术大量涌现。 2 人类基因组计划产生了大量基因信息(图0)
计算机在生命科学和生物技术 中的应用
计算机是生物研究的工具。为了了解计算 机工具在生物研究中的应用,首先需要了解 生物研究的现状。 基因决定论 由于DNA双螺旋结构的发现,基因决定论 成为主要观点。人们尝试寻找决定生物功能 的基因,但是受到挫折。
一是由于美国能源部用30多年研究“核辐射 对人类基因突变作用”,未取得实质性突破 进展,受害者已表现 出明显的突变性状,但 检测不出其基因突变与对照组存在显著性差 异。 二是美国于1975年巨额投资启动的“肿瘤十 年计划”基本以失败告终。 R. Dulbecco 于1986在science上发表《癌症 研究的转折点:测序人类基因组》,认为要 彻底阐明癌症的发生、演进、侵袭和转移的 机制,必须对人体细胞的基因组进行全测序。 美国政府与1990年正式启动HGP。
生物学发展的展望—W. Gilbert (80年诺 贝尔化学奖)91年专门在“nature”撰文讨论 生物学研究形式的变化: 正在兴起的新的范式在于,所有的‘基因’ 将被知晓(在可用电子方式从数据库里读取 的意义上),今后生物学研究项目的起点将 是理论的。一位科学家将从理论猜测开始, 然后才转向实验去继续或检验该假设。 新的范式:从机理出发,推论在一定条件 下细胞的表现,再用实验去验证。 现代,生物学已分为两个部分:
基因组学 由于基因组是物种所有遗传信息的储藏 库,从根本上决定着物种个体的发育和生 理,因此,在研究遗传、发育、进化、功能 调控等基本生物学问题方面,基因组学关注 的是基因组整体的作用,而不是个别基因。 功能基因组学(后基因组学)的中心任务是 通过了解基因组表达与环境的关系,以及其 在基本生物学方面和人类健康和疾病相关的 生物医学问题方面的意义。 后基因组学 转录组学:关注mRNA的组成和细胞功能的 关系。
蛋白质组学:其中心任务是通过比较不同时间 或不同细胞的蛋白质组成,以揭示蛋白质变化 的生物学意义。 结构基因组学:了解蛋白质三维结构与蛋白质 功能的关系。 蛋白质相互作用网络:了解蛋白质相互作用。 代谢组学:其中心任务是通过比较不同时间或 不同细胞的小分子组成,揭示生物学意义。 系统生物学:以一个理论模式为基础,与基因 组学和蛋白质组学的表现进行比较,判断生物 在分子水平上复杂的相互作用。
Excel计算和作图;序列数据应用于试验室技术改良(8); 第一章、生物信息数据库(12) 第二章、数据库检索(25) 第三章、序列比对(30) 一 序列比对策略(31);二 算法 (34) ;三 序列双重比对(42) ;四 多序列比对(47)。 第四章 在系统发生分析中的应用(51) 第五章、生物信息学在基因组构建中的应用;一 基因的识别和 鉴定(62)二 蛋白质功能的预测(73) ;三 蛋白质结构预 测(78) ;四 基因组中非编码区的研究(96) ;五 人类基 因组多样性计划(102) 。 第六章、计算机在其他方面的应用(107);药物开发(110)。 第七章、生物信息学在组学中的应用;一 基因组学研究(119); 二 功能基因组研究(128) ;三 蛋白质组研究(137) ;四 蛋白质的功能确定(140);五 代谢组(142);六 网络研究 (145);七 细胞计划(157) 。 第八章、生物医学信息资源(160)
生物信息学(bioinformatics):利用计算机 技术并参照现代信息技术,对生物信息进行储 存、检索和综合分析。及一是对海量数据的收 集、整理与服务。二是使用数据。 生物信息学是把DNA序列分析作为源头,找 到基因组序列中代表蛋白质和mRNA的编码 区;同时,阐明基因组中大量存在的非编码区 的信息实质,破译隐藏在DNA序列中的遗传语 言规律;在此基础上,归纳、整理与基因组遗 传信息释放及其调控相关的转录谱和蛋白质谱 的数据,从而认识代谢、发育、分化、进化的 规律。
试验生物学:传统的、依靠实践发现事物的 性质和活动规律的学科。 研究对象是组成生 物体的元件。研究手段是物质分离和检测技 术。当前主要在于建立高通量检测技术。 理论生物学:根据事物已知性质和活动规律 推导其可能性质和活动规律的学科。 研究对 象是生物体整体。研究手段是逻辑分析和推 导。 计算机作为生物研究的工具,在前期生物学 研究工作中作为计算和存储工具起辅助作用。 在当前生物学研究工作中作为数据处理工具。 数据处理是高通量百度文库测技术和理论生物学 研究的主要方法。产生生物信息学。
计算机辅助工具的运用
一 Excel的功能: 表格处理;图表功能;数据库管理功能。 1 图表制作 建立图表,激活和修改图表项。 2 计算 引用:相对引用(=(a1-b1)/c1*d1) 绝对引用($ a$1-$b$1)/$c$1*$d$1 ) 函数:chitest(检验相关性);slope(斜率); intercept(截距)。 二 化学做图: ISIS DRAW2的应用 下载软件:www.bio-soft.net/