生物信息学基础1a
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
电信工程学院
2007-1-6
10
第四章 蛋白质数据库(书上第三章)
¾ 生物信息数据库来源 ¾ 生物信息数据库及其种类 ¾ 生物信息学序列数据库 ¾ 复合序列数据库 ¾ 序列模式数据库 ¾ 蛋白质结构分类数据库
PDB Growth
电信工程学院
2007-1-6
11
电信工程学院
2007-1-6
12
3
第四章 蛋白质数据库
电信工程学院
2007-1-6
27
电信工程学院
2007-1-6
28
7
第九章数据库搜索实例
¾ 一次数据库搜索实例 ¾ 二次数据库搜索实例
Hidden Markov Models (cont.)
•HMMs used to model protein families are profile HMMs with three different types of hidden states: Match (M), delete (D) and insertion (I) states (Krogh et al. JMB 1996) •The observations (visible symbols) are the amino acids
Full domain alignment methods
Profiles (PROFILE LIBRARY) HMMs (Pfam)
Multiple motif methods
电信工程学院
2007-1-6 13
Identity matrices (PRINTS) Weight matrices (Blocks) 电信工程学院
Use dynamic programming ‘in a band’ for all regions with initn scores better than some threshold: opt score.
电信工程学院
2007-1-6
25
电信工程学院
2007-1-6
26
Homoplasy: The formation of tails
¾ 生物信息数据库来源 ¾ 生物信息数据库及其种类 ¾ 生物信息学序列数据库 ¾ 复合序列数据库 ¾ 序列模式数据库 ¾ 蛋白质结构分类数据库
Methods for family analysis
Single motif methods
Fuzzy regex (eMOTIF) Exact regex (PROSITE)
电信工程学院
2007-1-6 23
第六章 双序列比对(书上第六章)
¾ PAM & BlUSUM 方法 ¾ 整体相似性和局部相似性 ¾ Blast & Fast 方法
电信工程学院
2007-1-6
24
6
The algorithms, in brief —
BLAST:
Two word hits on the same diagonal above some similarity threshold triggers ungapped extension until the score isn’t improved enough above another threshold: the HSP. Initiate gapped extensions using dynamic programming for those HSP’s above a third threshold up to the point where the score starts to drop below a fourth threshold: yields alignment.
电信工程学院
2007-1-6
3
电信工程学院
2007-1-6
4
1
第一章概述 Final grade
¾ Final exam (60%):
Multiple choice questions Open questions
¾ 生物信息学定义、研究方向。 ¾ 生物信息学的主要基本概念
¾ Home assignment (40%)
电信工程学院
2007-1-6
5
电信工程学院
2007-1-6
6
第二章 信息网络
¾ Internet and WWW.(World、Wide、Web) ¾ TCP/IP 传输控制协议和网际协议简介
相关机构网址及信息查询
¾ 欧洲分子生物学网络组织(European Molecular Biology Network , EMBnet), 至98年, 共26个国家节点,8个专业节 点. ¾ 欧洲分子生物信息学研究所(European Molecular Bioinformatics Institute, EBI) 维护EMBL核酸数据库. ¾ 国际遗传工程和生物技术中心(International Centre for genetic Engineering and Biotechnology, ICGEB)维护蛋 白质结构域数据库SBASE,等等. ¾ 美国国家生物技术信息中心(National Centre for Biotechnology Information, NCBI) Entrenz 数据库查询 系统 http://www.ncbi.nlm.nih.gov/
电信工程学院
2007-1-6
17
电信工程学院
2007-1-6
18
第五章 基因组
¾ DNA序列数据库及其种类 ¾ 特定基因组资源 ¾ DNA序列分析(书上第五章) ¾ 基因结构与DNA序列(书上第五章) ¾ DNA序列分析方法(书上第五章) ¾ EST数据库分析(书上第五章)
The action of a restriction enzyme, EcoRI Note: EcoRI gives a ‘sticky’ end
¾ BLOSUM 90 - prepared from BLOCKS sequences with >90% sequence ID best for short alignments with high similarity ¾ BLOSUM 62 - prepared from BLOCKS sequences with >62% sequence ID best for general alignment (default) ¾ BLOSUM 30 - prepared from BLOCKS sequences with >30% sequence ID best for detecting weak local alignments
电信工程学院
2007-1-6
15
电信工程学院
2007-1-6
16
4
第五章 基因组(书上第四章)
¾ DNA序列数据库及其种类 ¾ 特定基因组资源 ¾ DNA序列分析(书上第五章) ¾ 基因结构与DNA序列(书上第五章) ¾ DNA序列分析方法(书上第五章) ¾ EST数据库分析(书上第五章)
Central Dogma of Molecular Biology
TIGR
¾ TIGR ( The Institute for Genomic Reseach) ¾ HGI ( Human Gene Index) >40 basics >95% determinate basics
电信工程学院
2007-1-6
21
电信工程学院
2007-1-6
22
BLOSUM Matricies
¾ Tails evolved independently in the ancestors of frogs and humans ¾ Presence of a tail Æ no useful conclusions
第八章 二次数据库搜索(书上第八章)
¾ 二次数据库搜索 ¾ 二次数据库内容 ¾ 正则表达式 ¾ 蛋白质序列指纹图谱(PRINTS) ¾ 蛋白质序列模块(BLOCKS) ¾ 序列谱(Profiles) ¾ 隐马尔可夫模型(HMM)
电信工程学院
2007-1-6
29
电信工程学院
2007-1-6
30
第十章 基因芯片及技术
¾ 基因芯片 ¾ 晶片技术 ¾ 主要厂家 ¾ 应用
PCR Machine
PCR( Polymerase Chain Reaction)
电信工程学院
2007-1-6
31
电信工程学院
2007-1-6
32
8
Wireless Body Area Network Wireless Body Area Networks
第七章 多序列比对(书上第七章)
¾ 多序列比对 ¾ 多序列比对数据库
Find all ungapped exact word hits; maximize the ten best continuous regions’ scores: init1.
FastA:
Combine nonoverlapping init regions on different diagonals: initn.
2007-1-6
14
第四章 蛋白质数据库
¾ 生物信息数据库来源 ¾ 生物信息数据库及其种类 ¾ 生物信息学序列数据库 ¾ 复合序列数据库 ¾ 序列模式数据库 ¾ 蛋白质结构分类数据库
Protein Secondary Structure
¾ CATH (Class, Architecture,Topology, Homology) http://www.biochem.ucl.ac.uk/dbbrowser/cath/ ¾ SCOP (structural classification of proteins) hierarchical database of protein folds http://scop.mrc-lmb.cam.ac.uk/scop ¾ FSSP Fold classification using structure-structure alignment of proteins http://www2.ebi.ac.uk/fssp/fssp.html ¾ TOPS Cartoon representation of topology showing helices and strands http://tops.ebi.ac.uk/tops/
EEG POTS Vision positioning
WBAN
Hearing ECG Blood Pressure Toxins
Network
glucose Cellular DNA protein
Implants
WLAN
电信工程学院
2007-1-6 33
电信工程学院
2007-1-6
34
Ants Colony in nature
电信工程学院
2007-1-6 19
电信工程学院
2007-1-6
20
5源自文库
第五章 基因组
¾ DNA序列数据库及其种类 ¾ 特定基因组资源 ¾ DNA序列分析(书上第五章) ¾ 基因结构与DNA序列(书上第五章) ¾ DNA序列分析方法(书上第五章) ¾ EST数据库分析(书上第五章) ¾ 第六章 双序列比对(书上第六章)
电信工程学院
2007-1-6
7
电信工程学院
2007-1-6
8
2
第三章 生物学基础知识
¾ 细胞的概念 ¾ 蛋白质的结构和功能 ¾ 遗传信息载体-DNA ¾ 分子生物学法则 ¾ 基因组结构 ¾ 基因表达调控 ¾ 生物大分子结构的测定 ¾ 分子生物学工具
电信工程学院
2007-1-6 9
细胞、染色体、DNA、Gene、Protein
2
FTP站点
¾ biol.3322.org ¾ 端口: 22 ¾ 用户名:biol ¾ 密码:6666
Course Layout
¾ Sixteen lessons – Sixteen weeks. ¾ Lecture, exercise, discussion. ¾ Exercises. ¾ Books and additional material. ¾ Missing lessons or exercises. ¾ Consultation hour.
教材
生物信息学基础
《生物信息学概论》 T K Attwood, D J Parry-Smith 著 罗静初 译
参考书
张陆勇
lyzhang@bupt.edu.cn or zh_luyong@126.com
《生物信息学基础》 孙啸 陆祖宏 谢建明 编著
电信工程学院
2007-1-6
1
电信工程学院
2007-1-6