结构生物信息学基础知识(ppt)
生物信息学 第六章 蛋白质结构预测及分子设计ppt课件
更多有用的链接
▪ PDB的外部链接中Compute pI Mw点击Chain B (可计算各链分子 量)
▪ 在打开的Compute pI/Mw页面中点击EX5B_ECOLI (ExPASy,大 量信息,链接)
▪ 在打开的UniProtKB/Swiss-Prot页面中点击EcoCyc:EG10824MONOMER (biocyc,参与的反应/路径图)
3、输入要找的蛋白名称或ID号等(如RecBCD, E. coli DNA repair)
4、点击”Go” 5、点击感兴趣的结果(1W36,进入MMDB) 结果列表中包含相关蛋白(powered by BLAST)、文献、结构域 (domain)、配体(ligand)、3D缩略图、三维查看器
在MMDB看搜到蛋白的结构(NCBI)
实验数据
数据库搜索
结构域匹配
已知结构的 同源蛋白?
有
同源 建模
无 二级
结构预测 有
串线法
三维结构模型
可用的折 叠模型?
无
从头 预测
蛋白质的基本性质
蛋白质的基本性质:
相对分子质量 氨基酸组成 等电点(pI) 消光系数
半衰期
不稳定系数 总平均亲水性 …….
工具 AACompldent
Compute pI/Mw
蛋白质跨膜区特性 ▪ 典型的跨膜螺旋区主要是由20~30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、
Ala等)组成; ▪ 亲水残基往往出现在疏水残基之间,对功能有重要的作用; ▪ 基于亲/疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性。 跨膜蛋白序列“边界”原则 ▪ 胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸) ▪ 胞外-内分界区:Trp(色氨酸) ▪ 跨膜区:Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸
结构生物信息学4-多序列比对
④ 在所得到的比对中,对于α1、α2和 α中原来有插入或删除操作的位 置, 恢复其原有的实际字符或空位 字符”-”.
多序列比对
a1 a2a3a4
b1 b2b3b4b5
生物信息学培训班
算法原理 – 树形比对
多序列比对
对于n个序列的树形比对的基本算法过程如下:
(1)初始化,对于每个序列,生成一个叶节点
(2)利用AA算法合并两个节点,形成一个新节点,
合并的结果放在新节点中,原来的两个节点作
为
新节点的子节点
(3)反复执行(2),直到形成n个叶节点的树根为止,
根节点中的序列即为最终的多重比对结果。
α
α1
α2
s1 s2 s3 s4
生物信息学培训班
算法原理 – CLUSTAL算法
算法原理 –动态规划算法
多序列比对的动态规划算法
多序列比对
生物信息学培训班
算法原理 –动态规划算法
多序列比对的动态规划算法
Sequence 2
多序列比对
Sequence 1
生物信息学培训班
算法原理 – SP方法
多序列比对
为了找到最佳比对,并解决解决动态规则算法的 计算复杂问题,Carrillo & Lipman (1988)建立了 SP(Sum of Pairs)方法
SP
scoreAGP
26
S
G
打分函数:
P(a,a)=0 P(a,b)= -1 (a≠b) P(a,-)=P(-,b)= -1 P(-,-)=0
逐对计算p(1,2),p (1,3),...,p(1,8),p (2,3),p(2,4),...p(2,8) ...,p(7,8) 的 所有得分:(-7-6-5-4-3-2-1)+2 = -26 然后将一个多重比对所有列的得分全部加起来,其和即为该多重比对的得分。
生物信息学分析方法介绍PPT课件
目录
• 生物信息学概述 • 基因组学分析方法 • 转录组学分析方法 • 表观遗传学分析方法 • 蛋白质组学分析方法 • 生物信息学分析流程和方法比较
01
生物信息学概述
生物信息学的定义和重要性
定义
生物信息学是一门跨学科的学科,它利用计算机科学、数学和工程学的原理和 技术,对生物学数据进行分析、建模和解读,以揭示生命现象的本质和规律。
研究蛋白质的序列、结构 和功能,以及蛋白质相互 作用和蛋白质组表达调控 机制。
研究基因转录本的序列、 结构和表达水平,以及转 录调控机制。
研究基因表达的表观遗传 调控机制,如DNA甲基化 、组蛋白修饰等。
通过对患者基因组、蛋白 质组和转录组等数据的分 析,为个性化医疗和精准 医学提供支持。
02
基因组学分析方法
基因组注释
基因组注释是指对基因组序列中的各 个区域进行标记和描述的过程,包括 基因、转录单元、重复序列、调控元 件等。
注释信息可以通过数据库(如RefSeq、 GeneBank等)或注释软件(如GATK、 ANNOVAR等)获取。注释信息对于 理解基因组的生物学功能和进化关系 具有重要意义。
基因组变异检测
基因组变异检测是指检测基因组序列 中的变异位点,包括单核苷酸变异、 插入和缺失等。
VS
变异检测对于遗传疾病研究、进化生 物学和生物进化研究等领域具有重要 意义。常用的变异检测方法有SNP检 测、CNV检测等,它们基于不同的原 理和技术,具有不同的适用范围和精 度。
03
转录组学分析方法
RNA测序技术
利用生物信息学方法和算法,对 RNA测序数据进行基因融合检测, 寻找融合基因及其融合方式。
基因融合检测结果可以为研究肿 瘤等疾病提供重要线索,有助于 深入了解疾病发生发展机制。
结构生物信息学(Structural Bioinformatics)
Examples of recent advances: 6 Docking and inhibitor design
• Discovery of a potent and selective protein kinase CK2 inhibitor by highthroughput docking. Vangrevelinghe et al., J Med Chem. 2003, 46:265662. • Structural modes of stabilization of permissive phosphorylation sites in protein kinases: distinct strategies in Ser/Thr and Tyr kinases. Krupa et al., J Mol Biol. 2004, 339:102539.
Example of recent advances: 1 Genomewide survey
• Mechanisms of thermal adaptation revealed from the genome of the antarctic Archaea Methanogenium frigidum and Methanococcoides burtonii. Saunders et al., Genome Res 2003 (7):15808
Prediction with inputs from Structural Bioinformatics Genomewide analysis of protein families Evolutionary relationships amongst proteins Design of novel protein folds Design of new function to an existing scaffold
生物信息学第一章绪论PPT幻灯片
❖ 掌握生物信息学领域内计算机信息处理的方法; ❖ 了解生物信息学方面的一些重要资源,掌握运
用生物信息学工具解决生命科学相关问题的基 本方法与途径。
研究对象
• 基因:具有遗传效应的DNA片段
• 蛋白质:调控和实现几乎所有生物功能 的分子机器
研究对象
参考书
❖ 孙啸,陆祖红,谢建明,生物信息学基础, 清华大学出版社, 2004. ❖ 张成岗, 贺福初, 生物信息学方法与实践, 科学出版社, 2002.
课程特点
➢ 具有学科交叉的鲜明特色 ➢ 概念多, 算法多
成绩评定
平时考核成绩×30% + 闭卷考试成绩×70%
生物信息学课件
基因组组装与注释
基因组组装
01
基因组组装是将测序得到的碎片组装成一个完整的基因组序列
。
基因组注释
02
基因组注释是对基因组序列进行分析,识别出基因和其他功能
元件。
基因组组装与注释的重要性
03
基因组组装与注释是理解基因组结构和功能的基础,对于研究
生物进化、疾病发生和治疗具有重要意义。
03
生物信息学应用
• 详细描述:单基因遗传病通常是由单个基因的突变引起的,这些突变可能是显性或隐性。在研究中,生物信息 学家可以通过对患者的基因组进行测序和分析,识别与疾病相关的基因变异。他们还可以通过比较健康个体的 基因组与患病个体的基因组,发现差异并确定导致疾病的特定突变。此外,生物信息学家还可以使用计算机模 型和算法来模拟基因组变异的影响,并预测其对蛋白质功能和细胞过程的影响。这些信息有助于医生和研究人 员更好地理解疾病的病因、病理生理机制以及潜在的治疗方法。
THANK YOU
数据库建设
研究如何建立和维护生物信息学数据库, 包括数据库设计、数据存储和管理、数据 查询和可视化等技术。
02
生物信息学基础
遗传密码子
遗传密码子的定义
遗传密码子是DNA和RNA中携带遗传信息的序列 。
遗传密码子的特点
遗传密码子具有方向性、连续性、通用性和简并 性。
遗传密码子的破译
科学家们通过研究基因组序列,逐渐破译了遗传 密码子的秘密。
以单分子DNA测序为主要技术,具有读取长度长、准确率高、速度快等优点,但设备昂贵且维护成本 高。
生物信息学数据库
1 2 3
NCBI
美国国立生物技术信息中心,提供生物医学相关 信息和数据,包括基因组测序数据、基因表达谱 数据等。
结构生物信息学3-序列比对
生物信息学培训班
蛋白质的打分矩阵 -- PAM
PAMn矩阵的构建
1. 2. 3. 4. 5. 6. 7.
序列比对算法
选取多个家族的相似性>85%的保守序列; 根据匹配计分进行多重比对(不含空位); 以比对结果构建进化树,反映氨基酸替换关系; 计算每种氨基酸转换成其它氨基酸的次数; 计算每种氨基酸突变率; 计算每对氨基酸突变率,得到突变概率矩阵,将此矩阵 自乘n次; 将突变概率矩阵转化为PAMn矩阵。
等价矩阵 (unitary matrix) BLAST矩阵 转移矩阵(transition,transversion)
等价矩阵表 A T 0 1 C 0 0 G 0 0 A T BLAST矩阵 A 5 -4 -4 T -4 5 -4 C G A T A 1 -5 -1 -4 -4 -4 -4 转移矩阵 T -5 1 -5 C G -5 -1 -1 -5
Sequence 1 Sequence 2
actaccagttcatttgatacttctcaaa
taccattaccgtgttaactgaaaggacttaaagact
A A 1
G 0
C 0
T 0
匹配: 1 错配: 0 分值:5
G 0
C 0 T 0
1
0 0
0
1 0
0
0 1
生物信息学培训班
DNA转换和颠换
生物信息学培训班
基因的进化
生物学意义
生物信息学培训班
基因的进化
生物学意义
生物信息学培训班
基因进化过程中的变异
变异:主要有三种类型:
生物学意义
替代(substitution) 插入或删除(insertion or deletion),通称indel 重排(rearrangement) 进化距离,一个序列变 Sequence A 成另一个序列所需的步 骤数 x steps 如A变为B的进化距离为 :x+y
2024生物医学信息学PPT课件
生物医学信息学PPT课件•生物医学信息学概述•生物信息学基础知识•医学图像处理技术•生物信号处理与分析目录•生物医学数据挖掘与应用•生物医学信息学伦理与法规01生物医学信息学概述定义与发展历程定义生物医学信息学是生物医学与计算机科学、信息科学等学科的交叉领域,旨在研究生物医学信息的获取、处理、存储、分析和应用等方面的理论和技术。
发展历程生物医学信息学经历了从早期的医学图像处理、生物信号处理到现代的生物信息学、临床信息学等阶段,随着大数据、人工智能等技术的发展,生物医学信息学的研究和应用领域不断拓展。
研究内容及方法研究内容生物医学信息学的研究内容包括生物医学数据的采集、处理、分析和挖掘,生物医学知识的表示、推理和应用,以及生物医学信息系统的设计、开发和应用等。
研究方法生物医学信息学采用多种研究方法,包括数学建模、统计分析、机器学习、自然语言处理等,以实现对生物医学数据的深入挖掘和有效利用。
应用领域及前景展望应用领域生物医学信息学在医疗、科研、教学等领域具有广泛的应用,如医学影像诊断、基因测序数据分析、临床决策支持、生物医学知识库构建等。
前景展望随着生物医学数据的不断积累和技术的不断进步,生物医学信息学将在精准医疗、智能诊疗、健康管理等方面发挥越来越重要的作用,为人类的健康和医疗保健事业做出更大的贡献。
02生物信息学基础知识基因组学与蛋白质组学基因组学01研究生物体基因组的组成、结构、功能及演变的科学领域,涉及基因测序、基因注释、比较基因组学等方面。
蛋白质组学02研究生物体内所有蛋白质的表达、功能、相互作用及调控的科学领域,与基因组学相辅相成,共同揭示生物体的生命活动规律。
基因组学与蛋白质组学的关系03基因组学提供生物体的遗传信息,蛋白质组学则研究这些遗传信息的表达产物,二者相互关联,共同揭示生物体的生理和病理过程。
基因表达调控与表观遗传学基因表达调控生物体内通过一系列机制调节基因的表达水平,包括转录调控、转录后调控、翻译调控等多个层面,以确保生物体在不同环境和发育阶段下能够正常生长发育。
生物信息学(东南大学版)精选ppt
09.04.2020
41
遗传连锁图:通
过计算连锁的遗
传标志之间的重
组频率,确定它
配子
们的相对距离,
一般用厘摩(cM,
即每次减数分裂
的重组
频率为1%)
表示。
末 期 II
晚 期 II
中 期 II
间期 前期 I
同源染色体 形成配对
中期 I
前 期 II
晚期 I 发生交换
09.04.2020
42
物理图谱
5、《生物信息学手册》 郝柏林 中科院物理所 上海科学技术出版社
6、《简明生物信息学》 钟扬 复旦大学 高等教育出版社
09.04.2020
2
http://
编号
第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章
第九章
第十章
09.04.2020
网上资源
名称
书稿(word)
生物信息学引论 分子生物学基础
破译遗传语言、识别基因 预测蛋白质结构和功能 认识生物界信息存贮和传递的本质 研究药物作用机制和开发新药
09.04.2020
31
第二节 生物信息学的发展历史
生物科学和 技术的 发展
人类基因组 计划的 推动
生物信息学 基本思想的产生
二十世纪 50年代
09.04.2020
生物信息学 的迅速发展
09.04.2020
生物体生长发育的本质就是遗 传信息的传递和表达
17
DNA通过自我复制,在生物体的繁衍过 程中传递遗传信息
基因通过转录和翻译,使遗传信息在生物 个体中得以表达,并使后代表现出与亲代 相似的生物性状。
基因控制着蛋白质的合成
《生物信息学概述》课件
04
生物信息学的挑战与未来发展
数据整合与标准化
数据整合
在生物信息学中,数据整合是一个重要的挑战。由于不同实验室、研究机构的数据格式、标准和质量 各不相同,如何将这些数据有效地整合在一起成为一个亟待解决的问题。
标准化
为了提高数据的可比性和可重复性,生物信息学需要制定统一的标准和规范,以确保数据的准确性和 可靠性。
03
生物信息学在医学研究中的应用
疾病诊断
基因检测
利用生物信息学技术对基因序列进行分析,检测与疾病相关的基因 变异,有助于早期发现遗传性疾病和个性化诊断。
疾病分型
通过对生物样本的基因组、转录组和蛋白质组等数据进行比较分析 ,有助于对疾病进行精确分型,为制定个性化治疗方案提供依据。
预测疾病风险
基于生物信息学的大数据分析,可以预测个体患某种疾病的风险,为 预防性干预提供科学依据。
05
实例分析
基因组学研究实例
总结词
基因组学研究实例展示了生物信息学在基因组序列分析中的应用。
详细描述
基因组学研究实例中,生物信息学发挥了重要作用。通过对基因组序列进行分析,可以 发现与人类健康、疾病相关的基因变异和功能。生物信息学方法包括基因组测序、基因
表达分析、基因变异检测等,这些方法为个性化医疗和精准医学提供了有力支持。
02
生物信息学的主要技术
基因组学
基因组测序
通过对生物体基因组的测序,分析基因序列、基因突变和基 因功能。
基因表达分析
研究基因在不同条件下的表达水平,揭示基因与生物表型之 间的关系。
蛋白质组学
蛋白质分离与鉴定
分离和鉴定生物体内的蛋白质,了解蛋白质的组成和功能。
蛋白质相互作用研究
生物信息学基础知识
生物信息学基础知识生物信息学是一门交叉学科,将计算机科学与生物学相结合,致力于利用计算机技术和统计学方法分析、理解和解释生物学数据。
本文将介绍生物信息学的基础知识,包括DNA、RNA、蛋白质序列、基因组、生物数据库和生物信息学工具等内容。
一、DNA和RNADNA和RNA是生物体内两种关键的生物分子。
DNA(脱氧核糖核酸)是遗传信息的载体,它由四种碱基(腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶)组成。
RNA(核糖核酸)则在基因表达中发挥重要作用,它的碱基组成与DNA类似,但是胸腺嘧啶被尿嘧啶取代。
二、蛋白质序列蛋白质是生物体内重要的功能分子,其序列决定了其结构和功能。
蛋白质序列由氨基酸组成,氨基酸的种类决定了蛋白质的性质。
生物信息学通过分析蛋白质序列,可以预测其结构和功能,为生物学研究提供重要参考。
三、基因组基因组是生物体内所有基因的集合。
生物信息学通过基因组测序技术,可以获取生物体的全部基因序列。
基因组的解析和比较有助于研究基因的进化、功能和调控,以及人类遗传病的研究。
四、生物数据库生物数据库是存储生物学数据的重要工具。
其中包括基因序列、蛋白质序列、基因组序列、蛋白质结构等数据。
常用的生物数据库有GenBank、UniProt、ENSEMBL等。
生物信息学家通过访问这些数据库,可以获取所需的生物学数据,并进行进一步的分析和研究。
五、生物信息学工具生物信息学工具是进行生物学数据分析的软件和算法。
常用的生物信息学工具有BLAST、ClustalW、EMBOSS等。
这些工具可以用于基因序列比对、蛋白质结构预测、基因表达分析等。
生物信息学家通过运用这些工具,可以从大量的生物学数据中提取有用信息,并进行生物学研究。
结语生物信息学的基础知识对于理解和解释生物学数据具有重要意义。
通过对DNA、RNA、蛋白质序列、基因组、生物数据库和生物信息学工具的学习,我们能够更好地利用计算机技术和统计学方法来研究生物学问题。
希望本文对你了解生物信息学提供一些帮助,并激发你进一步学习和探索的兴趣。
生物信息学基础第三章
对字母表中的任意字符a、b,定义
w (a, a) = 0
w (a, b) = 1
a b
w (a, -) = w ( -, b) = 1
也可以使用得分(score)函数来评价编辑操作
p (a, a) = 1 p (a, b) = 0 a b p (a, -) = w ( -, b) = -1
(1)两条长度相近的序列相似 找出序列的差别
(2)判断一条序列的前缀与另一条序列的后缀相似 (3)判断一条序列是否是另一条序列的子序列 (4)判断两条序列中是否有非常相似的子序列
2、编辑距离(Edit Distance)
GCATGACGAATCAG
TATGACAAACAGC
GCATGACGAATCAG
?
反向互补序列
RNA发夹式二级结构
3、通过点矩阵进行序列比较
“矩阵作图法” 或 “对角线作图”
实例
序 列
→ 2→
→ 序列1 →
自我比较
→ 序列1 →
→ 1→
序 列
滑动窗口技术
两条序列中有很多匹配的字符对,因而在点矩阵中 会形成很多点标记。
滑动窗口技术
• 使用滑动窗口代替一次一个位点的比较是解决这 个问题的有效方法。
Match(C, C)
Match(A, A)
Match(A, A)
Match(C, C)
Match(C, C)
Replace(A, T)
Insert( -, T)
Delete(C, -)
Match(A, A)
Match(A, A)
图3.6 序列AGCACACA和ACACACTA的两种比对结果
结构生物信息学5-二级结构预测
生物信息学培训班
二级结构预测方法 - 经验参数法
预测算法
生物信息学培训班
二级结构预测方法 - 经验参数法
经验参数法:
预测算法
基本思想是在序列中寻找规则二级结构的成核位点和终止位 点 扫描输入的氨基酸序列,利用一组规则发现可能成为特定二 级结构成核区域的短序列,然后对于成核区域进行扩展,不 断扩大成核区域,直到倾向性因子小于1.0为止 规则:
由蛋白质二级结构统计分析得到的规则可用于全新蛋白质设 计或蛋白质突变体的设计; 当序列同源性较低时,二级结构的指认有助于确定蛋白质间 结构与功能的关系; 同源蛋白质模建中,二级结构预测有助于建立正确的序列比 对关系; 基于二级结构片段堆积的三级结构预测中正确的二级结构预 测是第一步;
I(S; R)在二级结构预测中的含义 R代表中心氨基酸及其所处环境 S代表二级结构类型 I(S; R)代表中心氨基酸处于S的信息值
生物信息学培训班
二级结构预测方法 - GOR算法
例子:
预测算法
假定数据库中有1830个残基, 780个处于螺旋态,1050个处于 非螺旋态; 库中共有390个丙氨酸(A),有240个A处于螺旋态,其余 150个 A 处于非螺旋态。
生物信息学培训班
二级结构预测方法 - 经验参数法
经验参数法:
(生物信息学).ppt
生物信息学简介生物信息学是一门综合性学科,将计算机科学、统计学和生物学相结合,利用计算机技术和软件工具对生物学数据进行解析、处理和研究。
生物信息学在基因组学、蛋白质组学、转录组学等领域具有重要的应用价值,可以帮助我们更好地理解生物体内的分子机制和生物过程。
生物信息学的应用领域基因组学基因组学是研究整个基因组的结构、功能、进化和调控的学科。
生物信息学在基因组学中起到重要作用,可以通过生物信息学工具对基因组进行注释、比对、重构等分析。
基因组学的研究可以帮助我们理解基因的组织、表达和调控,以及基因与疾病之间的关系。
蛋白质组学蛋白质组学是研究细胞或生物体内所有蛋白质的表达、结构和功能的学科。
生物信息学在蛋白质组学中有广泛的应用,可以通过生物信息学方法预测蛋白质的结构和功能,对蛋白质相互作用网络进行建模和分析,以及对蛋白质组的表达、修饰等进行系统性的研究。
转录组学转录组学是研究细胞或组织中所有基因的转录活动的学科。
生物信息学在转录组学中发挥重要作用,可以通过分析转录组数据,如RNA测序数据,来研究基因的表达模式、调控网络和信号通路等。
转录组学的研究对于理解基因调控和细胞分化等生物过程具有重要意义。
比较基因组学比较基因组学是研究不同物种间基因组的结构、功能和进化的学科。
生物信息学在比较基因组学中起到关键作用,可以通过比对不同物种的基因组序列,寻找共同的基因、保守的序列和功能,从而揭示物种的进化关系和基因家族的起源演化。
生物信息学的工具和方法生物信息学依赖于各种计算工具和方法来分析和解释生物学数据。
以下是一些常用的生物信息学工具和方法的介绍:序列比对序列比对是生物信息学中常用的分析方法,可以用来比对不同序列之间的相似性和差异性。
比对结果可以用来推断序列的进化关系、功能和结构等。
常用的序列比对工具包括BLAST、ClustalW等。
基因注释基因注释是通过对基因组序列进行分析和解释,确定基因的位置、结构和功能的过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质分子的结构
生物基础
➢ 结构域(domain)
多肽链在超二级结构基础上进一步绕曲折叠而成 的相对独立的三维实体称结构域
蛋白质结构中具有特异结构和独立功能的区域。
蛋白质分子的结构
➢ 结构域(domain)
生物基础
➢ 多个脱氧核苷酸通过5’和3’形成磷酸二 酯键连接而成的长DNA单链。
➢ 通过碱基互补配对形成互补链,两条相 互平行的DNA单链形成双螺旋结构。
生物基础
➢ RNA通常是单链形式。 ➢ RNA只有尿嘧啶(U)而没有胸腺嘧啶(T) ➢ DNA主要存在于细胞核内,RAN在细胞核外也存在。 ➢ 配对原则:
简写 G A V I L F P M W C
氨基酸名称 丝氨酸 苏氨酸
天冬酰胺 谷酰胺 酪氨酸 组氨酸
天冬氨酸 谷氨酸 赖氨酸 精氨酸
英文缩写 Ser Thr Asn Gln Tyr His Asp Glu Lys Arg
简写 S T N Q Y H D E K R
蛋白质分子 – 生命活动的执行者 生物基础
碱基
糖基
磷酸
碱基+糖基
核苷 + 磷酸
核苷酸
核酸
聚合
DNA(脱氧核糖核酸) RNA(核糖核酸)
核酸分子 – DNA和RNA
生物基础
➢ DNA的磷酸基团和糖基团都相同,碱基分为4种类型:
腺嘌呤 -- A
鸟嘌呤 -- G
胞嘧啶 -- C
胸腺嘧啶 -- T
A
C
G
T
A只能与T配对 C只能与G配对
核酸分子 – DNA和RNA
两段以上的β -折叠结 构平行排列 ,两链间 可顺向平行,也可反 向平行
生物基础
两链间的肽键之间形成氢键,以稳固β -折叠结 构。氢键与螺旋长轴垂直。
蛋白质分子的结构
生物基础
➢ -转角
含4个氨基酸残基,第一个残基的 CO 基团和第 四个残基的 NH基团之间形成氢键,使多肽链的 方向发生“U”形改变。
蛋白质分子的结构
生物基础
➢ 超二级结构
在蛋白质分子中,特别是球状蛋白质中,由若干 相邻的二级结构单元(即α-螺旋、β-折叠和β-转 角等)彼此相互作用组合在一起,,形成有规则、 在空间上能辨认的二级结构组合体,充当三级结 构的构件单元,称超二级结构。
蛋白质分子的结构
生物基础
➢ 蛋白质三级结构 在二级结构基础上的肽链再折叠形成的构象。
蛋白质分子的结构
➢ 肌红蛋白的三级结构
分子中多肽主链由长短 不等的8段直的α螺旋组 成 最大的螺旋含23个残基 最短的7个残基,分子中 几乎80%的氨基酸残基 都处于α螺旋区中。 拐弯是由1—8个残基组 成的无规则卷曲。
生物基础
蛋白质分子的结构
生物基础
➢ 蛋白质四级结构 每条完整三级结构的多肽链,称为亚基 (subunit)
A -- U
C -- G
G -- U
蛋白质分子 – 生命活动的执行者 生物基础
➢ 蛋白质是由氨基酸通过肽键相链接形成的聚合物。
➢ 氨基酸-蛋白质的基本组成单位,存在自然界中的氨基酸有 300余种,但组成人体蛋白质的氨基酸仅有20种。
➢ 氨基酸有一个位于中心的碳原子(Cα)以及用共价键相连的 四个基团组成。
主要化学键:氢键
肽单元
➢ 肽单元
(peptide unit)
H
O
N
C
Cα
ψ
H
R
R
H
Cα
Nφ
C
H O
蛋白质分子的结构
➢ 肽平面及二面角
生物基础
蛋白质分子的结构
➢ 二级结构主要有以下几种形式:
螺旋 ( -helix) 折叠 ( -sheet) 转角 ( -turn) 无规卷曲 (coil) 多肽链中有60%的区 段为螺旋和折叠
结构生物信息学基 础知识(ppt)
(优选)结构生物信息学基础 知识
生物学两种主要信息载体
➢ 核酸分子 与 蛋白质分子
生物基础
核酸分子
➢ 核酸的基本单元式核苷酸。核苷酸 有一个磷酸基团、一个糖基团和一 个含有氮原子的碱基基团构成。
➢ 根据糖基不同,核苷酸可分为: 脱氧核糖核苷酸 核糖核苷酸
生物基础
生物基础
蛋白质分子的结构
➢ -螺旋
多肽链主链围绕中心轴形成 右手螺旋状结构,侧链伸向 螺旋外侧
每个氨基酸残基(第n个) 的羰基与多肽链 C 端方向的 第4个残基(第4+n个)的酰 胺氮形成氢键
生物基础
蛋白质分子的结构
➢ -折叠
多肽链充分伸展,相 邻肽单元之间折叠成 锯齿状结构,侧链位 于锯齿结构的上下方
➢ 蛋白质的一级结构
定义:蛋白质的一级结构指多肽链中氨基酸的排列顺序。 主要化学键:肽键
➢ 一级结构是蛋白质空间构象和特异生物功能的基础。
胰岛素的一级结构
蛋白:蛋白质分子中某一段肽链的局部空间结构,即该段肽 链主链骨架原子的相对空间位置,并不涉及氨基酸残基侧链 的构象。
生物信息学数据库
➢应满足5个方面的主要需求:
(1)时间性 (2)注释 (3)支撑数据 (4)数据质量 (5)集成性
Background
生物信息学数据库
Background
➢生物信息数据库具备的几个明显特征:
• 数据库的更新速度不断加快 • 数据库使用频率增长更快 • 数据库的复杂程度不断增加 • 数据库网络化 • 面向应用 • 先进的软硬件配置
➢ 氨基酸之间的差异主要体现在侧链部分 ➢ 氨基酸的侧链决定了不同氨基酸的物理化学性质
C O O - 羧基
R
氨基
C
+N H 3
侧链
Cα
H
蛋白质分子 – 生命活动的执行者
氨基酸的分类
碱
性
氨
极性中性氨基酸
基
酸
生物基础
酸 性 氨 基 酸
非极性疏水氨基酸
蛋白质分子的结构
生物基础
蛋白质分子的结构
生物基础
C O O - 羧基
CHHR3
侧链
氨基酸之间的差异主 H
要体现在侧链部分
氨基
C
+N H 3
Cα 甘丙氨酸
氨基酸的通式
蛋白质分子 – 生命活动的执行者 生物基础
20种标准氨基酸
氨基酸名称 甘氨酸 丙氨酸 缬氨酸
异亮氨酸 亮氨酸
苯丙氨酸 脯氨酸
甲硫氨酸 色氨酸
半胱氨酸
英文缩写 Gly Ala Val Ile Leu Phe Pro Met Trp Cys
蛋白质分子中各亚基的空间排布及亚基接触部位 的布局和相互作用,称为蛋白质的四级结构。
Outline
➢生物学基本知识 ➢常用的生物数据及数据库处理 ➢生物数据的基本处理方法
生物信息学数据库
Background
生物分子数据 高速增长
分子生物学 及相关领域研究人员 迅速获得最新实验数据
建立生物分子数据库