生物信息学复习资料.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学复习资料
第一讲生物信息学绪论
1、生物信息学诞生于计算机初创时期,1956年在美国田纳西州的Gatlinburg召开了首次“生物学中的信息理论讨论会”
2、20世纪80年代末“林华安”博士创造了”bioinformatics”一词
3、数据库的构建:1979年美国Genbank数据库;1982年欧洲分子生物实验室EMBL核酸序列数据库;1984年日本国家级核酸序列数据库DDBJ
4、专业机构:1988年美国成立了“生物技术信息中心”(NCBI);欧洲生物信息学研究所(EBI)于1993年构建.
5、生物信息学产生的背景
(1)、传统生物学和现代生物学都是一门实验学科,生物学的发展需要数学模型的介入(2)、海量生物学数据信息的产生(2002年8月,Genbank中的序列量已达18197000,而碱基对数达22617000000,且以每秒220对的速度增加),数据的分析处理成为生物学发展的“瓶颈”
(3)、新的生物学研究模式的出发点应是理论:从理论出发,再回到实验中追踪或验证这些理论假设
6、生物信息学定义
(广义):应用信息科学的方法和技术,研究生物体系和生命过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。
狭义:应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。一般提到的“生物信息学”是就指这个狭义的概念,更准确地说,应该是分子生物信息学(Molecular Bioinformatics)
7、生物信息学研究的主要对象——两种信息载体:DNA分子和蛋白质分子
(1)遗传信息的载体——DNA
遗传信息的载体主要是DNA,控制生物体性状的基因是一系列DNA片段,生物体生长发育的本质就是遗传信息的传递和表达
(2)蛋白质的结构决定其功能
蛋白质功能取决于蛋白质的空间结构,蛋白质结构决定于蛋白质的序列(这是目前基本共认的假设),蛋白质结构的信息隐含在蛋白质序列之中。
8、生物分子数据类型:DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功能数据、
9、第一步遗传密码和第二部遗传密码
第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少,对于第二部密码,目前则只能用统计学的方法进行分析。无论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量的生物分子数据之中。
10、分子生物学的三大核心数据库
(1)GenBank核酸序列数据库
(2)SWISS-PROT蛋白质序列数据库
(3)PDB生物大分子结构数据库
11、生物信息学的目标和任务:揭示生物分子数据的内涵是生物信息学的长远目标
(1)收集和管理生物分子数据
(2)数据分析和挖掘
(3)开发分析工具和实用软件
12、生物信息学主要研究内容
1)破译遗传语言、识别基因
2)预测蛋白质结构和功能
3)认识生物界信息存贮和传递的本质
4)研究药物作用机制和开发新药
13、目前生物信息学主要研究内容
1)生物分子数据的收集与管理
2)数据库搜索及序列比较
3)基因组序列分析
4)基因表达数据的分析与处理
5)蛋白质结构预测
14、在二级结构预测方面主要方法有:
立体化学方法、图论方法、统计方法、最邻近决策方法、基于规则的专家系统方法、分子动力学方法、人工神经网络方法
15、生物信息学研究意义
1)认识生物本质
了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。
2)改变生物学的研究方式
改变传统研究方式,引进现代信息学方法
3)在医学上的重要意义
为疾病的诊断和治疗提供依据,为设计新药提供依据
16、生物信息学的应用
•生物信息的经济价值与生物信息学市场
•基因组分析
•基因芯片
•药物开发
•其他领域
17、生物信息学基本研究方法
•建立数据库
•数据库检索
•序列分析
•统计模型
•算法
第二讲 生物学知识简介(Part 1)
1、现代生物学的里程碑——DNA 双螺旋结构的发现 DNA :遗传物质
Mendel 的经典遗传学实验及其经典遗传学规律(1865年) Morgan 学派的基因学说(1915年)
Griffith 的肺炎双球菌转化实验(1928年) Avery 的实验以及Hershey 、Chase 的噬菌体标记实验:DNA 是遗传信息的载体(1944~1951年)
2、DNA 双螺旋结构模型的意义
1) 为合理解释遗传物质的各种功能、解释生物的遗传和变异、揭示自然界色彩纷纭的
生命现象奠定了理论基础;
2) 揭示了生命世界多样性和生命本质的一致性的辨正统一; 3) 现代生命科学的里程碑。 3、生物分类体系
界(kingdom ) 动物界(Animalia )
门(phylum ) 脊索动物门(Chordata ) 脊椎动物亚门(Vertebtata )
纲(class ) 哺乳动物纲(Mammalia ) 真兽亚纲(Eutheria ) 目(order ) 灵长目(Primates ) 类人猿亚目(Anthropoidea ) 科(family ) 人科(Hominidae ) 属(genus ) 人属(Homo ) 种(species ) 人种(sapiens ) 超-(super-);亚-(sub-)
4、三主干六界说:三主干是真细菌、古细菌和真核生物,六界是真细菌、古细菌、原生生物、 真菌、植物、动物
5、四大“模式生物”:酵母、线虫、果蝇、小鼠
6、
氨基酸标准符号
符号符号酪氨酸Y(Tyr)赖氨酸K(Lys)谷氨酸/谷氨酰胺
Z
亮氨酸L(Leu)甲硫氨酸
M(Met)
色氨酸W(Trp)异亮氨酸I(Ile)缬氨酸V(Val)组氨酸H(His)硒代半胱氨酸
U 甘氨酸G(Gly)苏氨酸T(Thr)本丙氨酸F(Phe)丝氨酸S(Ser)谷氨酸E(Glu)精氨酸R(Arg)天冬氨酸D(Asp)谷氨酰胺Q(Gln)半胱氨酸C(Cys)脯氨酸P(Pro)天冬氨酸/天冬酰胺
B 天冬酰胺N(Asn)丙氨酸
A(Ala)意义
意义