15_系统生物学和生物分子网络基础

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

什么是系统生物学
• 2nd International Conference on Systems Biology ( ICSB, 2001): Systems Biology is the quantitative study of biological processes as whole systems instead of isolate parts. The goal of Systems Biology is the construction and experimental validation of models that explain and predict the behavior of biological systems.
The E.Coli Regulatory Network
Node= operons (413) Edge= Regulatory interaction (517)
Operons in different modules are shown in different colors.
Ma HW, Buer J, Zeng AP. BMC Bioinformatics 2004, 5:199
网络中的路径与距离
网络中节点G到节点 C的路径有: l1={G, A, B, C} l2={G, A, D, C} l3={G, F, A, B, C} l4={G, F, A, D, C}
从节点G到节点C的路径中,l1和l2的长度为3,l3和l4的长度 为4。 长度最短的路径称为最短路径,最短路径的长度称为从起 点到终点的距离,上图中从节点G到节点C的距离为3 。
生物分子网络的模块性
生物分子行使功能的机制中往往会包含有模块化特性。网络中由许多分子相互 结合形成的,有着稳定结构和功能的复合体,称为网络“模块”(module)。 网络的模块性指网络间的节点存在着内部彼 此高度连接的子节点集合。由此,模块化的 网络连通更为紧密。与同样规模的随机网络 相比,虽然拥有相同的节点数与边数,模块 化网络的连接却更为密集,这一现象可以由 聚类系数CC的提高表现出来。
系统生物学研究的几个步骤
1. 数据收集、分析;
2. 生物网络模型建立; 3. 生物网络拓扑与动力学性质;
4. 生物网络行为预测与控制;
5. 新网络的设计。
相关的理论问题
robust systems/ feedback control/ structural stability/ redundancy/ modular design
介数定义为: Bv
i j vV

σ ivj σ ij
衡量节点出现在其他节点间最短路径的 比例,表明在其他节点彼此连接中所起 的作用。
ij 表示节点i 到节点j 的最短路径的条数。
有{B,A,D},{C,A,D},{D,A, C,E}以及它们的逆序路径共6条最短 路径通过节点A,节点A的介数为6。
网络模序
子网模式是指一组节点按照特定的顺序连接而成的结构。针对不同网络 的研究显示,在真实的网络中不同的子网模式出现的频率并不一致,有 些模式在网络中频繁出现,远远超过随机网络中期望出现的次数。
网络模序(motif)是指网络中出现次数远超过随机期望的子 网模式。
有向网络模序 无向网络模序
A为正向子调控环;B为负向子调控环; C为前馈环;D为单输入模序
真正连通的路径只有{C,B},{D,A,B}, {D,A,C},{D,A,C,B},{E,C},{E ,C,B}。其中经过节点A的路径有2条,则 节点A的介数为2。
紧密度(closeness)
1 Cv d vj n 1 j vV
n 表示节点数
描述节点到网络中其他所有节点的平 均距离。
无标度网络,是指网络中连通度的分布符合幂率分布,即P(k)~k 的网络
A为随机网络,其连通度 分布符合泊松分布 ,在 大尺度情况下近似服从 正态分布。 B为无标度网络,其连通 度分布符合幂率分布 , 平均聚类系数函数曲线 水平。 C为层次网络,其连通度 分布符合幂率分布 ,平 均聚类系数与连通度的 倒数成正比。
• 生物网络具有层次结构 • 生物网络具有度的负关联性 (disassortative)
– 连接度大的节点更倾向于和连接度小的节点相连接。
• 生物网络具有一定的鲁棒性和适应性。
– 鲁棒性关系到生物体的生存,是响应外界扰动和内部组织变化的一种 能力。 – 适应性是指生物体与环境变化表现出适应的现象。
网络的数据结构
动力学模型(微分方程组)一些基础知识
化反应动力学
质量作定律
动力学方程
酶动力学
平衡态近似
生物分子网络的特点
• 生物网络具有稀疏性 (O(N))
• 生物网络具有无标度(scale-free)性质,即度分布呈幂律 分布 (P(k)~k-r )
• 生物网络具有超小世界(small world)性质
– 短的平均最短路径 l 和大的平均聚集系数CC。

系统生物学还是典型的多学科交叉研究,它需要生命科学、信息科学、数学、 计算机科学等各种学科的共同参与。
/ P4 Medicine: Personalized, Predictive, Preventive, Participatory
国内外有关计算与系统生物学建设情况
系统生物学的主要思想—整合
• 系统生物学与基因组学、蛋白质组学等各种“组学”的不同之处在于:它是一 种整合型大科学。
– 首先,它要把系统内不同性质的构成要素(基因、mRNA、蛋白质、生物小分子等) 整合在一起进行研究。 – 对于多细胞生物,系统生物学要实现从基因到细胞、到组织、到个体的各个层次的 整合。对组成部分或低层次的分析并不能真正地预测高层次的行为。如何通过研究 和整合去发现和理解涌现的系统性质,是系统生物学面临的一个根本性的挑战。 – 系统生物学整合性的第三层含义:研究思路和方法的整合。经典的分子生物学研 究—垂直型的研究(即采用多种手段研究个别的基因和蛋白质。首先在DNA水平上 寻找特定的基因,然后通过基因突变、基因剔除等手段研究基因的功能;在基因研 究的基础上,研究蛋白质的空间结构,蛋白质的修饰以及蛋白质间的相互作用等 等);基因组学、蛋白质组学和其他各种“组学”—水平型研究(即以单一的手段 同时研究成千上万个基因或蛋白质);系统生物学的特点—把水平型研究和垂直型 研究整合起来,成为一种“三维”的研究。
连通度是描述单一节点的最基本的简单而十分重要的拓扑属性。在研究中, 连通度较大的节点称为中心节点(hub), 自然成为目前研究的重点。
聚类系数(clustering coefficient )
无向网络中
n 2n CC v 2 C k k (k 1)
n 表示在节点 v 的所有 k 个邻居间 的边数。
节点A到B、C、D、E的距离分别为1、1、1、 2。节点A的紧密度为1.25。
直径(diameter)
直径(diameter)是描述网络总体性质的一个属性。网络的直径是指网 络中任意两个连通节点间距离的distance)
网络的平均距离(average distance)也是描述网络总体性质的一个属 性,是指网络中任意两个连通节点距离的平均值。
网络的拓扑属性
网络的拓扑属性是描述网络本身及其内部节点或边结构特征的测度。 这些测度对进一步分析网络结构和探索关键节点有重要意义。
连通度(degree)
节点v的连通度是指网络中直接与v相连的边的数目k。对于有向网络往往还要 区分边的方向,由节点v发出的边的数目称为节点v的出度kout,指向节点v的边 数则称为节点v的入度kin 。整个网络的连通性可以用各个节点的连通度的平均 值来表示。
系统生物学和生物分子网络 System biology and biomolecular network
2015 年春季学期
Life’s Complexity Pyramid
A.-L Barabasi & Z. Oltvai, Science, 2002
Butcher EC, Berg EL & Kunkel EJ. Nature Biotechnology (2004) 22:1253 - 1259
连通度的分布函数和聚类系数函数
通过统计不同连通度的节点占全部节点的比例,能够得到一种重要的描述网络 连通性的属性:连通度的分布函数P(k), k=1,2,...。 聚类系数函数CC(k) 当函数自变量等于k时, CC(k)即为所有连通度为k节点的聚 类系数的平均值。
无标度(scale free)网络
-r
无标度网络-复杂系统网络模型
复杂系统网络: “大世界”景象 ~ “小世界”特征
在无标度网络中大部分节点的连通度较低,但存在少数连通度非常高的节点使 网络连接在一起。无标度网络的直径相对较小,一般来说无标度网络直径的大 小正比于网络中节点数目的对数值的对数值即 l~log(log(N))。由此可以发现无 标度网络比一般小世界网络直径更小,联系更紧密。
节点A的连通度为3
CC A 2 1 1 3 (3 1) 3
有向网络中
n n CC v 2 Pk kout (kout 1)
节点A的入度为1,出度为2 体现了部分节点间存在的密 集连接性质。
CC A 1 1 2 (2 1) 2
介数(betweenness)
• 系统生物学是系统性地研究一个生物系统中所有组成成分(基 因、mRNA、蛋白质等)的构成以及在特定条件下这些组分间 的相互关系,并分析生物系统在一定时间内的动力学过程。 • 系统生物学综合利用实验及计算模拟的手段来研究生物体系的 基本结构及动力学特性。 • 系统生物学研究的特点是多学科交叉性、定量性、综合性、可 预测性、精确性,特别是科学假说驱动下的生物学研究。
全连接集
网络模序搜索算法
从一个包含N个节点的网络搜索模序的过程包括:
• 定义包含k个节点子网模式; • 在网络中搜索全部Cn 包含k个节点的节点子集,并检查其中结构与 所搜寻的模式相符的个数; • 将各个模式在真实网络中出现的频率和在大量随机网络背景中所出 现的频数进行比较,从而发现网络模序。
k
R. Milo et al. Science 298, 824 (2002)
1.连接矩阵表示法
2.连接边表示法
生物分子网络类型
• 基因调控网络
• 蛋白质互作网络
• 代谢网络 • 信号转导网络
基因调控网络
• 基因调控实验检测技术
– ChIP-chip芯片技术
• 基因转录调控数据库
– TRANSFAC数据库, TRRD数据库, RegulonDB数据库
• 基因转录调控网络
– 基因转录调控网络是以转录因子和受调控基因作为节点,以调控 关系作为边的有向网络。
生物分子网络的动态性
生命是个动态过程,生物分子网络也不可避免地具有动态 性的特征,生物分子网络的时空特异性是一项普遍存在的 性质。
在基因转录调控,信号传导和代谢等生物过程中,信息 的传递和生物反应是一系列在时间和空间上连续的过程, 这个过程也就可以被设定为网络节点状态和拓扑结构的一 系列变化。 通过结合基因表达等动态信息,利用线性模型、微分模 型、随机过程等算法,可以构建出随时间、空间和环境条 件关系等变化的动态生物分子网络,从而更为准确地描述、 解释和预测生物过程。
如果网络中的每条边都 赋予相应的数字,这个网络就 称为加权网络,所赋予的数字 称为边的权重。如果网络中各 边之间没有区别,可以认为各 边的权重相等,称为等权网络 或无权网络。
二分网络
如果网络中的节点可分为 两个互不相交的集合,而 所有的边都建立在来自不 同集合的节点之间,则称 这样的网络为二分网络。
生物分子网络
网络是复杂系统存在的普遍形式
公路交通网
互联网
社交网络
生物分子网络的基本概念
网络的定义
以图 G= (V, E)表示网络,其中:
V 是网络的节点集合,每个节点代表一个生物分子,或者一个环境刺激; E 是边的集合,每条边代表节点之间的相互关系。
有向网络与无向网络
无向网络 有向网络
加权网络与等权网络
相关文档
最新文档