计算机在生命科学中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Galileo wrote that “the book of nature is written in the language of mathematics ”; Nearly 400 years later,the fragmented teaching of science in our universities still leaves biology outside the quantitative and mathematical culture that has come to define the physical sciences and engineering.
生物数学
生物学
遗传学 生态学 生理学 生物动力学 生物分类学 等 计算机 线性代数 信息论 微分方程 概率论 积分变换等
数学
统计学
生物数学的发展过程
1901——Pearson, “ 生物统计学杂志” 1920s——Rashevsky, Lotka, 生物方程、生物数 学模型 1940s——计算机产生,数量分类学、生物控制 论、信息论随之产生 1970s——数学的各项内容应用于生物学,包括 经典数学、应用数学 1990s——生物信息处理 2000s——计算生物学、生物数学复杂模型等
计算机在生命科学中的应用
讲述计算机在生命科学中应用的共性问题 具体内容:生命科学中的数值方法、生物 统计学、生命科学实验数据处理、生命科 学中的数学模型及其求解、生命科学实验 设计、生物信息学、生命科学中的常用软 件等几个部分。 主要应用MATLAB为计算工具。
课程教学安排
总学时:54学时 其中:课堂教学/32学时,上机练习/16学 时(生物楼三楼机房), 大作业/6学时 成绩评定:平时成绩50%,考试成绩50% 教材:《计算机在生命科学中的应用》 参考书籍:计算机数值方法、MATLAB、 生物统计学、回归分析、数学建模、生 物信息学等相关书籍
生物产物形成中的细胞代谢与环境变化过程
带有计算机数据采集与控制的生物反应器系统
双向凝胶电泳图
酵母的完整基因表达图谱
计算机在生命科学中的应用类型
1、计算机在生命科学领域的数据采集。 实验数据的在线检测,如常规的温度、压力、 pH值、溶氧浓度;生物医学中的葡萄糖浓度、 脑电流等生物电信号; 实验数据的离线检测,如蛋白质浓度和DNA、 RNA等核酸浓度的测定,生物特性物质的检 测,生物种群数目的统计等。 由于生物数据的量大面广,依靠传统的人工 采集数据的方法已不能适应需要。
GCG
GCG支持5种数据库供Wisconsin Package使用, 分别是2种核酸数据库和3种蛋白质数据库。 2种核酸数据库是GenBank数据库和EMBL核酸 序列数据库。这两种数据库也可被组合成为一 个库,称为GenEMBLPlus。 3种蛋白质数据库是Protein Information Resource(PIR) 国际蛋白质序列数据库, SWISS-PROT蛋白质序列数据库,SP-TrEMBL 数据库(由欧洲生物信息学研究所等开发)。 GCG可以用于核酸和蛋白质序列的编辑、搜 索、比较、分析等。
生物计算机
DNA计算机把二进制数翻译成遗传密码的 片段,每个片段就是一个链。对问题以新 的DNA编码形式加以解答。 蛋白质计算机利用分子内电子或质算机的优点首先是体积小,存储的 信息量大。其次,这种电脑运算速度极快。 第三是最大限量的减少能耗,DNA电脑的 能耗,仅为普通电脑的十亿分之一。
cDNA microarray expression patterns of small (S) and large (L) neurons
应用现状
3、计算机在生物信息学的应用 、
计算机对生物信息的处理是数据处理中的一个特 殊部分,生物信息学已成为一个单独应用领域。 生物信息学是以计算机为工具对生物信息进行储 存、检索、传输和分析的科学,涉及范围很广。 其研究重点一般为两个方面,即基因组学 (Genomics)和蛋白质组学(Proteomics)。 它们涉及对核酸和蛋白质序列信息的获取、分析 和存储,数据的查询和校对等,包括对大量基因 组数据、蛋白质组数据信息,如GenBank、生物分 子结构数据库MMDB,以及生物类文献,如 MEDLINE和BA(Biological Abstract)数据库的检 索等。
SCIENCE VOL 303:6 303: FEBRUARY 2004
Introductory Science and Mathematics Education for 21st-Century Biologists 21stWilliam Bialek and David Botstein
交大科技消息2 交大科技消息2
上海交大和中科院上海营养科学研究所协 作攻关,在试管中完成了DNA计算机的雏 形研制工作,在实验上把自动运行与表面 DNA计算结合到了一起。这在中国属首次, 相关论文已发表在中国《科学通报》49卷 第1期的英文版上。
主要内容
采用双色荧光标记对输入与输出分子进行 同时检测,用测序仪对自动运行过程进行 实时监测,用磁珠表面反应法固化反应提 高可控性操作技术等,以至最终在一定程 度上完成模拟电子计算机处理0、1信号的 功能
生物数学
生物数学是生物学与数学之间的边缘学科。 它以数学方法研究和解决生物学问题,并对 与生物学有关的数学方法进行理论研究。 生物数学的分支学科较多,从生物学的应用 去划分,有数量分类学、数量遗传学、数量 生态学、数量生理学和生物力学等; 从研究使用的数学方法划分,又可分为生物 统计学、生物信息论、生物系统论、生物控 制论和生物方程等分支。
课程内容——数据处理和实验设计 课程内容——数据处理和实验设计
数据处理和实验设计是一门综合性的学科, 它和生命科学相结合,被具体用于生命科学 实验数据处理、生命科学的建模和生命科学 中的实验设计,对生命科学的发展发挥了积 极作用。 具体内容包括生命科学实验数据的误差及其 分布、实验数据常用的处理方法、生命科学 中数学模型的建立方法以及生命科学中常见 的数学模型。实验数据的回归分析及其检验, 实验数据常用的设计方法、回归正交设计和 序贯实验设计。
GCG软件 GCG软件
生物信息学中使用较广的软件。 GCG(Genetics Computer Group)主要是提供 一种计算机集成环境,它将大量序列分析 和数据库搜索程序集成在一起,可以访问 各种不同来源的序列数据库。 它提供的集成环境SeqLab(图形用户界面) 是Wisconsin Package的一部分。 Wisconsin Package则是一种综合性的序列分 析程序,由120多个独立的程序组成,用户 为适应不同要求,可对其程序进行组合使 用。
应用现状
5、计算机用于生物工程和生命活动的过程控 制和过程监督。 如发酵工程中,控制方式有人工控制和计算 机控制两种,但目前大部分还是人工控制或 半人工控制为主,包括经典的自动控制、顺 序控制、模拟控制等。 计算机全自动控制能直接实现人机对话,利 用系统的数学模型实现过程优化,如医学上 人工血液输送系统(人工心脏等)的控制。
本课程内容
生物信息学 生命科学中的数值方法 生物统计学 生命科学实验数据处理 生命科学中的数学模型及其求解 生命科学实验设计 生命科学中的常用软件 实例涉及到生命科学中的各个领域
课程内容——数值方法 课程内容——数值方法
主要介绍如何掌握各种数值计算技巧,利用 计算机解决实际计算问题,学习的重点放在 各种算法的应用,学以致用。 学习关键不仅在于能从原理上理解各种算法, 而且更重要的是在于合理选择和应用这些算 法去解题。 数值方法的基本内容包括非线性方程求根、 代数方程组求解、插值法、数值积分、常微 分方程及其方程组求解等。
Bialek and Botstein propose incorporating mathematical and quantitative approaches into biological sciences curricula, not merely as prerequisite courses to be suffered as a rite of passage but as full-fledged components of the training of a contemporary scientist.
第一章 绪 论
第一节 计算机在生命科学中的应用 一、应用现状 1、计算机在生命科学领域中的应用普遍,计算机 已广泛应用于微生物学、遗传学、生态学、医学、 人口学、药物动力学、生理学、分子生物学等领 域。 2、生物信息学、数值方法、数据模型化、最优化 实验设计等在生命科学中越来越显示出强有力的 作用。 3、生命科学领域中的计算机应用起步较晚,主要 因为生命过程非常复杂,影响因素众多,内在机 理研究难以深入。
计算机与生命科学的结合
用计算机技术(数学方法)研究和解决 生命科学问题。 生命科学问题的数量化 用生物物质制造计算机,解决计算机发 展存在的问题(存储和计算速度)。 DNA计算机 蛋白质计算机
2004年交大科技消息 2004年交大科技消息1 年交大科技消息1
2004/1/30-“Science”发表了署名“中国 SARS分子流行病学协作课题组”的论文 “中国SARS流行期间SARS冠状病毒的分 子进化” 论文将2002/2003期间的SARS流行划分为 早、中、晚三期进行分析,揭开沙斯分子 流行病学之谜,破解了沙斯冠状病毒变异 和进化的规律。
基因序列同源性比较
应用现状
4、计算机数值方法在生命科学中的应用 、
事实上实验数据的处理,包括生物信息学的数据处 理都是以数值方法和统计学的知识为基础的。 现代生命科学提出了相当多的数学问题及复杂的数 学模型,涉及到许多非线性的代数或微分方程,这 些方程常常是大量耦合的。对于这类复杂的数学模 型的研究,经典的数学解析法是无能为力的,必须 借助数值方法应用计算机求解。 计算机数值法在生命科学领域内占有极其重要的地 位,是现代生命科学技术发展的促进因素。
应用现状
2、计算机对生命科学实验数据的处理 、
包括生命科学中各种实验数据的处理,生命科 学数学模型的建立和求解,利用数学模型对实 验的控制和实验监测,实验跟踪生物量、生物 参数,以及生命科学和生物工程的实验设计包 括最优化实验设计。 如将所测定的DNA序列对应的光谱数据进行整 理和处理后确定核苷酸的位置; 放射性示踪物在生物分子中的研究应用; 利用计算机按分子量大小或其它特性自动分离 生物物质; 利用计算机对生物工厂进行工艺优化设计,对 实验测量值的误差自动分析处理等。
主要内容
课题组完成了来自广东和香港的SARS发展各阶段的 24个病人的18株SARS冠状病毒及11份含病毒生物样 品的病毒基因组全序列测定,结合已经公开的其他 32条人类SARS冠状病毒及2条果子狸的SARS样冠状 病毒的基因组全序列进行生物信息学分析 生物信息学分析,研究 生物信息学分析 SARS冠状病毒在流行过程中的分子变异规律。 SARS 通过进化模型的计算 进化模型的计算获得了一系列关键的基础数据, 进化模型的计算 发现SARS冠状病毒基因组的中性突变率是稳定的, 认识到了SARS冠状病毒基因组各主要片段对于环境 选择压力的不同的响应及其与SARS流行过程的相关 性。
课程内容——数学模型 课程内容——数学模型
数学模型的优点:定量、简便、计算机应用 在生命科学中,传统的研究方法如经验归纳 法等已不能满足学科发展的需要,在工程上 数学模型已成为一种重要的研究方法。 现代生命科学的发展越来越多地要求用数学 的方法对生命过程进行定量研究,建立数学 模型,以揭示生命现象的本质。
本课程的学习目的
探索生命科学中实验数据变化的规律, 提高分析数据和处理数据的能力。 了解和掌握计算机在生命科学数据处理 与分析、实验数据模型化中应用的基本 思想和方法。 了解生命科学的一些相关软件。
第二节 生命科学中常用的计算机 软件概述
生命科学中的各个领域以及和生命科学相交 叉的各学科,均开发了多种应用软件; 如用于数值计算的MATLAB软件、药物设计 MATLAB 的分子构型软件、微生物发酵工程中的控制 软件、生物医学的仿真软件、计算机辅助设 计AUTOCAD等。 从网络资源来看,提供相关新闻、数据库服 务、应用软件和软件在线服务、算法等。