生物信息学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 建立储存这些信息的数据库;
• 开发数据分析工具。
基因组 (genome) 是一个生物 体或细胞中一套染色体的遗 传物质的总和,以全长 DNA 的碱基对 (bp) 数目表示。 基因组 = 基因 + 非编码序列
Wellcome genome bookcase
人类基因组
3 x 109 bp; ~ 25000 基因
生物信息学
基础医学院生化教研室
马郁芳
生物信息学的定义
生物信息学 (Bioinformatics) 是生物学与计算机和 信息科学相结合的学科。
BIOlogy
INFORmatics
mathMATICS
NIH Biomedical Information Science and Technology (BISTIC) 对生物信息学的定义 (2000年) Bioinformatics - Research, development, or application of computational tools and approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data. 研究、发展和应用计算机工具和方法,以扩大对生物 学、医学、行为和健康数据的利用,包括获得、储存、 组织、管理、分析以及可视化这些数据。
Introduction to Bioinformatics Arthur Lesk Oxford, June 2008 ISBN-10: 0199208042;ISBN-13: 978-0199208043
Bioinformatics: A ConceptBased Introduction
Venkatarajan S. Mathura and Pandjassarame Kangueane ISBN: 978-0-387-84869-3
Arabidopsis thaliana
人类微生物组计划 ( Human Microbiome Project, HMP ) 旨在对人体不同部位 (包括鼻 腔,口腔,皮肤,胃肠道和 泌尿生殖道) 的微生物群落进 行定性,并分析这些微生物 在人类健康和疾病中的作用。
生物信息学 (第1版) (供8年制 及7年制临床医学等专业用) 李霞 主编
功能预测 实验验证
Escherichia coli
Saccharomyces cerevisiae
一些模式生物体
Mycobacterium tuberculosis
Drosophila melanogaster
Caenorhabditis elegans
Danio rerio
Mus musculus
Springer Science+Business Media, LLC 2009
http://bioinformatics.oxfordjournals.org/
基因 蛋白质
基因表达
基因
Replication (基因组)
基因表达 (gene expression) 是极其复杂的 过程,多种因素控制 mRNA 和蛋白质的 生成以及蛋白质的平衡。
核酸的书写:从 5’ 端向 3’ 端;5’ 端在左侧,3’ 端在右侧。
ATGACGTTTC CGTTCGGACA CTGCATGCGA CAGCGCATCG GCCCTGCAGG CCCGATGACT GACACGCTGG ACCACGACGC GTCATGGCGA AACGCCGGCG TCCAACAACG GGCCAGACCG CGCGTCCAGC CTGGCCGGCG GGCCGCGACA CGCTGTGTCG GTGGTGCGCA ACCTACCTGC GTCAAGAACT GCCGACATCG ACGTCCAAAC GTGGCCCCAG GATGTCCCGC GTGCAGCGCA GCCTGCCAAC CTGGTGACAC CCCCCAAGGT TCGCCAAGCT CGCCGCTAGT ATCGACCGCT ACGCCGGCAA CCGACTTGAT TGGATGATCC TCGTGGAGCA TCTACGCCTT CCCAACAGGA TACATGCCAG TGGCCGAGCT TCACCGTCGT CCGTCATTCA TCGGTCCCGA CCCACGGTTC GGCCCGGAAC CCACCATCGG GCGAGTACAG GGCGCACCAC TAACCATCGG CGGGGGCGCT AACGCCCCGG AGCCCACACA CGCGGTCCTG GCTGCACACA GGCGCCGCAG CGGTGAACTC AGGGACCGGG CGTCGTGGTC CGCCACCCAC CTTCGGCTAC AACCGACGCG CGACATCGCC GCTCTACCTC CCACGTCGAC GGCCTCCGAA CGACCCGGCT CCCGGGTACC CACCACCCTG GTCGTCGTCG CGCGTTGGGC CACCGGCACC CAACATCGGC CGTCGGTTCG CGACGGCGCG GGCAGTGTCG CAGCCCAGCG ACCACCCGAC GTCCTAGCGG CTCGCCGGTC CGTCTAATCG GCCGACACCC CATGCGGTAC ACCTCGGGAG CGCGCGGTGT GGCCGCATCC ACACCATCGC GCGCTGCGGT ACCGACGTCA GACAGCGCGT CTCAACCGGC ACCACCTGGA CAGTTGCTGG ACCGACGTCG ATTGGGGATG GCCGACGGCA AAGGTGCCGC GCCTCCAGCG CACGTACGGA TATACCGGGG GCGGGTCCGC GCTCAGGCCT GCTGATCAGA CCGGGCCCGG GCAGCATGCT TGGTGCTGGG TAGGCCGAAC TCTGCGGGCT ATACCCCGCT CGGCTGCGGT TGCGCACCCA AGCGGGAAAT CCGCACTGAG TCGCCATCTT TGGTGGCCGG GGGTGGTGGC TCGACGTCGA GCCGCACCCA CCGTCGGCGA GCGCCGCGGT AGCTGGGCGC ACCTGACCTA TGTTCGTCAA CCGGGTCCGA CCGGCACAGT AACGCAACAT CAAAAAGAGC CACCGTGA GACCCGGATG GTCGCATGTA ACACGATCAC GATCGACGTC GTCCGCGCTG GCTGGACGCC GACGGTGCTG GGATCACGAA CCGCGAAGTC CCGGCTGAGC GCGCTCCGAC CGTCAACAAT CGCTCACCAG CGTCACCATC GATCGGCGGT CGGTGCCTCG CGGGCCCTTC GTTCGTCGAG CGTCGGCGAC CTACGACGGT CACCATGTTC GGTGCGGGAG CGAGAACTGG CTCAGAAATG 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1420 1488
Array Scanner
正常细胞
mRNA cDNA
(红色荧光染料标记的 cDNA)
异常细胞
mRNA cDNA
(绿色荧光染料标记的 cDNA)
与芯片杂交
只在正常细胞中表达的基因 只在异常细胞中表达的基因 在正常细胞在异常细胞中等 量表达的基因 在正常细胞中高表达的基因 在异常细胞中高表达的基因 在正常细胞在异常细胞中都 不表达的基因
结构、识别、调节、 催化、转运、运动、 免疫等
核酸及蛋白质信息的获得
• 基因、DNA 片段及 cDNA 测序
• 基因组测序
• 蛋白质的肽质谱分析、晶体结构测定及相 互作用分析等
利用基因组学、转录组学、蛋白质组学和代谢组学等 多组学技术研究临床疾病,促进转化医学的发展。
基因组 (Genome) 生物体或细胞中遗传物质的总和,包括基因和非编码序列。
第二章生物学基础
2.1 生命起源和分子进化 2.2 生物的分类
2.3 核酸
2.4 蛋白质
第三章 生物信息数据库及其信息检索 第四章 序列比对与算法 第五章 核酸序列分析 第六章 蛋白质结构预测和分子设计 第七章 基因组信息学 第八章 蛋白质组信息学 第九章 生物信息学前沿 附录一 生物信息学相关数据库 附录二 生物信息学重要软件简介 附录三 生物信息学名词解释 附录四 习题
http://www.genome.gov/10005107/
The ENCODE Project 旨在解析人类基因组中的所有功能性 元件。
http://fantom.gsc.riken.jp/
Functional Annotation of the Mammalian Genome
DNA 测序技术
• 双脱氧链终止法 (Sanger 法) • 焦磷酸测序 (Pyrosequencing) • Single-molecule sequencing • Array-based DNA capture with NimbleGenTM sequence capture technology • Ion semiconductor sequenci源自文库g
http://www.genomics.cn/navigation/show_navigation?nid=220
https://www.lifetechnologies.com/cn/zh/home/life-science/sequencing.html
用 Sanger 法测定目的 DNA 或 cDNA 的核苷酸序列
• DNA 芯片技术是一种大规模集成的固相杂交。 • 在固相支持物上原位合成寡核苷酸或者直接将大量预 先制备的 DNA 探针有序地固化于支持物表面,然后与 标记的 DNA 或 RNA 样品杂交。
• 通过检测杂交信号来分析样品的基因序列或表达信息。
Arrayer
Hybridization Oven
20 世纪三大科学计划
曼哈顿原子弹计划 (1942-1946)
阿波罗登月计划 (1961-1969)
人类基因组计划 (1990-2003)
人类基因组计划 (Human genome project, HGP)
• 测定人类基因组的 DNA 序 列: 3×109 bp;
• 识别基因:约 3 万个基因;
转录组 (Transcriptome)
特定细胞、组织在某一生理状态下所有 RNA 的总和,包括 mRNA 和 非编码 (tRNAs,rRNAs,miRNAs,lncRNAs 等)。
蛋白质组 (Proteome)
特定细胞、组织在某一生理状态下所有蛋白质的总和。
代谢组 (Metabolome) 生物体内源性代谢物质的动态整体。代谢组目前只涉及相对分子质量 约小于1000 Da 的小分子代谢物质。
人民卫出版社 (2010年)
生物信息学 (第2版)
张阳德 科学出版社 (2009)
第一章概论
1.1 生物信息学产生的背景 1.2 人类基因组计划
1.3 什么事生物信息学
1.4 生物信息学的研究目标和内容 1.5 生物信息学的发展 1.6 生物信息学研究方法的新进展 1.7 国内外生物信息学研究现状 1.8 生物信息学的主要意义和展望 1.9 生物信息学与生物实验的关系
基因组测序
Garraway LA and Lander ES.
Lessons from the cancer genome. Cell, 2013, 153: 17-37.
新的癌症基因:影响 细胞信号转导、染色 质、表观遗传调控、 RNA 剪接、蛋白质的 动态平衡和代谢等。
DNA 芯片 (DNA Chip) 技术