11922 生物信息学资源

合集下载

很好—生物信息相关数据库资源介绍

很好—生物信息相关数据库资源介绍

3).核酸三维结构数据库

NDB - Nucleic Acid Databank (3D structures) BNASDB - Nucleic acid structure db from University of Pune
4).其他
AsDb - Aberrant Splicing db (异常拼接) ACUTS - Ancient conserved untranslated DNA sequences db Codon Usage Db - The frequency of codon use in each organism is made searchable through this World Wide Web site. EPD - Eukaryotic Promoter db(真核启动子) HOVERGEN - Homologous Vertebrate Genes db (同源 脊椎动物) IMGT - ImMunoGeneTics db [Mirror at EBI] (免疫遗传学) ISIS - Intron Sequence and Information System RDP - Ribosomal db Project gRNAs db - Guide RNA db PLACE - Plant cis-acting regulatory DNA elements db

5)Transgenics(转基因)

Cre Transgenic Database - Cre transgenic mouse lines Transgenic/Targeted Mutation Database Information on transgenic animals and targeted mutations

生物信息学概述(共59张PPT)精选全文完整版

生物信息学概述(共59张PPT)精选全文完整版

蛋白质 结构
蛋白质 功能
最基本的 生物信息
2024/11/11
生命体系千姿百 态的变化
维持生命活 动的机器
9
第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多
数DNA非编码区域的功能还知之甚少
对于第二部密码,目前则只能用统计学的方法进行分析。破译“第
二遗传密码”:即折叠密码(folding code),从蛋白质的一级结构
Rickettsia prowazekii
Helicobacter pylori
Buchnerasp. APS
Escherichia coli大南芥
Thermotoga maritima
Thermoplasma acidophilum
mouse
Caenorhabitis elegans
以基因组计划的实施为标志的基因组时代(1990年至2001年)是生
物信息学成为一个较完整的新兴学科并得到高速发展的时期。这一 时期生物信息学确立了自身的研究领域和学科特征,成为生命科学 的热点学科和重要前沿领域之一。
这一阶段的主要成就包括大分子序列以及表达序列标签 ( expressed sequence tag,EST)数据库的高速发展、BLAST( basic local alignment search tool)和FASTA(fast alignment)等工具软件的研制和相应新算法的提出、基因的寻 找与识别、电子克隆(in silico cloning)技术等,大大提高
细胞质(线粒体、叶绿体) 基因组DNA
人类基因组:3.2×109 bp 18
人类自然科学史上的 3 大计划
曼哈顿原子 弹计划
阿波罗登月 计划
人类基因组计划

生物信息学介绍(PPT20页)

生物信息学介绍(PPT20页)
– 蛋白质的结构和功能预测
• 蛋白质怎样实现细胞和有机体的动力学:
– 生命为什么是蛋白质的运动方式
• 个体发育和系统发育的法则和机理:
– 肌体如何长成、运作、衰老和进化
• 征服疾病:
– 主要循环系统疾病、癌症、病毒源性疾病、遗传病和衰老
• 保护和利用生物资源,开发和发展生物产业:
– 生物学怎样造福人类

1、
功的路 。2020/10/262020/10/26Monda y, October 26, 2020
成功源于不懈的努力,人生最大的敌人是自己怯懦

2、
。2 020/10/ 262020 /10/26 2020/10 /2610/ 26/202 0 12:03:09 AM
每天只看目标,别老想障碍
–蛋白质的三维结构
– 蛋白质的物理性质预测
– 其他特殊局部信息:其它特殊局部结构包括 膜蛋白的跨膜螺旋、信号肽、卷曲螺旋 (Coiled Coils)等,具有明显的序列特征和结 构特征,也可以用计算方法加以预测
• cDNA 芯片相关的数据管理和分析
实验室信息管理系统 基因表达公共数据库
• 分子进化
基因芯片流程(二)
6. 图象处理(采用专门软件,对图象进行分析, 提取每个点上的数字信号),得到原始数据表。
7. 数据校正和筛选(对cy5或cy3信号进行校正, 消除实验或扫描等各环节因素对数据的影响, 同时利用筛选规则对数据中的“坏点”,“小 点”,“低信号点”进行筛选,并作标记。)
8. 差异表达基因的确定(采用ratio值对差异基因 进行判断,或采用统计方法如线性回归、主成 分分析、调整P值算法等对差异基因进行统计 推断)
远期任务
• 读懂人类基因组,发现人类遗传语言的 根本规律,从而阐明若干生 物学中的重 大自然哲学问题,像生命的起源与进化 等。这一研究的关键和核心是了解非编 码区

生物信息学课件PPT

生物信息学课件PPT

12
递归(Recursion)
• 在计算机程序设计中如何理解F(x)=ax+b • 编程计算N! f(n) = n*f(n-1) n>1 • 编程计算斐波那契数列
1, 1, 2, 3, 5, 8 ...... n
f(n) = f(n-1)+f(n-2) n>2
2021/3/10
13
动态规划
• 问:斐波那契数列当n=5时,结果是多少? x=50呢?x=100呢?
• 数据是信息的载体,信息是数据的目的
“我有一个好想法,不过只可意会不可言传”
• 数据本身没有价值
• 用户不同,数据和信息的划分也不同
• 数据和信息可以相互转化
2021/3/10
4
What is Data?
10535185574 雨认会不天我为明下
0100100101001100 0110111101110110 0110010101011001 0110111101110101
简介
• 生物信息学(Bioinformatics)是20世纪80 年代末随着人类基因组计划的启动而兴起 的一门新型交叉学科,它体现了生物学、 计算机科学、数学、物理学等学科间的渗 透与融合。
• 生物信息学通过对生物学实验数据的获取、 加工、存储、检索与分析,达到揭示数据 所蕴含的生物学意义从而解读生命活动规 律的目的。
残基序列所占比例的大小
• 序列比对定义
序列比对(Sequence Alignment)就是运用某种特定的算法,找出两个或多个 序列之间的最大匹配碱基数
2021/3/10
11
动态规划与序列比对
• 基因组数据库保存了海量的原始数据(Raw Data), 人类基因有接近30亿个碱基对。为了查遍所有数 据并找到其中有意义的关系,我们便需要依赖于 高效的计算机科学字符串算法。

【2019年整理】很好—生物信息相关数据库资源介绍

【2019年整理】很好—生物信息相关数据库资源介绍


2.蛋白质序列和相关数据库
蛋白质序列数据库

PIR-international -The Protein Information Resource (protein sequence) (国际蛋白质信息中心,
NBRF+JIPID+MIPs,PIR1\PIR2\PIR3\PIR4))
TelDB - Multimedia Telomere(端粒) Resource

TRADAT - TRAnscription Databases and Analysis Tools
Subviral RNA db - Small circular RNAs db (viroid and viroid-like) (类病毒)
tmRDB - tmRNA dB
tRNA - tRNA compilation(编辑) from the University of Bayreuth

uRNADB - uRNA db
5)其他核酸数据库

RNA editing - RNA editing site


RNAmod db - RNA modification db

3).核酸三维结构数据库

NDB - Nucleic Acid Databank (3D structures) BNASDB - Nucleic acid structure db from University of Pune
4).其他
AsDb - Aberrant Splicing db (异常拼接) ACUTS - Ancient conserved untranslated DNA sequences db Codon Usage Db - The frequency of codon use in each organism is made searchable through this World Wide Web site. EPD - Eukaryotic Promoter db(真核启动子) HOVERGEN - Homologous Vertebrate Genes db (同源 脊椎动物) IMGT - ImMunoGeneTics db [Mirror at EBI] (免疫遗传学) ISIS - Intron Sequence and Information System RDP - Ribosomal db Project gRNAs db - Guide RNA db PLACE - Plant cis-acting regulatory DNA elements db

生物信息学基础讲座课件

生物信息学基础讲座课件

转录组学
研究基因的表达情况和调控。
生物信息学未来的发展趋势
人工智能
应用人工智能算法加速数据分析 和模型预测。
精准医学
结合个体基因组数据,实现个体 化的医学诊断和治疗。
宏基因组学
研究微生物群落的基因组组成和 功能。
生物信息学基础讲座课件
欢迎参加生物信息学基础讲座!在这个课件中,我们将探索生物信息学的定 义、应用、数据来源、主要任务、发展历程、分支学科以及未来的发展趋势。
什么是生物信息学?
生物信息学是研究如何利用计算机科学和统计学方法来解读生物学数据的学 科。它将生物学、计算机科学和统计学相结合,以揭示生物系统的复杂性。
生物信息学的发展历程
1
1950s-1970s
生物学和计算机科学开始合作。
2
1980s-1990s
基因测序技术的突破,启发生物信息学的发展。
3
2000s- 至今
大规模生物学数据的出现,推动了生物信息学的快速发展。和功能。
蛋白质组学
研究蛋白质的结构和功能。
使用实验和计算方法研究蛋白质 的三维结构。
基因表达分析
通过RNA测序技术研究基因在不 同组织和条件下的表达水平。
生物信息学的主要任务
1 数据处理与管理
开发算法和工具,处理和 管理大规模生物学数据。
2 数据分析与挖掘
通过统计分析和机器学习 算法,揭示生物学数据的 模式和特征。
3 模型构建与预测
建立数学模型,预测生物 现象和生物分子之间的相 互作用。
生物信息学的应用
基因组学
通过分析基因组数据,了解生命过程中的基因功能和重要遗传变异。
蛋白质组学
研究蛋白质的结构、功能和相互作用,揭示生物体内蛋白质的组成和调控机制。

生物信息学 资料

生物信息学 资料

生物信息学资料一.什么是生物信息学?答:它是利用计算机对生命科学工作者研究的生物作息进行存储、检索和分析的科学。

现代生物信息学的定义:是现代生命科学与信息科学、计算机科学、数学、统计学、物理学、化学等学科相互渗透而形成的交叉学科,是应用计算机技术和信息论方法采集、存储、传递、检索、分析和解读蛋白质及核酸序列等各种生物信息,以帮助了解生物信息学和遗传学信息的科学。

二.真核生物基因组的结构特点:1多基因家族:指由一共同祖先基因经过重组和变异所产生的一组基因,并成簇分布,其成员成簇集中在一条染色体上,也可以散布在不同的染色体上。

2多重复序列:1)高度重复序列:反向重复序列、卫星DNA、a-卫星DNA、端粒DNA2)中度重复序列3转座因子:在DNA分子内部或两个DAN分子之间移动的DNA片段4单拷贝序列:多为结构基因,两侧为间隔序列和散在分布的重复序列。

5DNA多态性:1)DNA多态性:限制性片段长度的多态性、高度可变区的DNA、单个核苷酸多态性2)DNA指纹图谱:一种特殊的RFLP使用小卫星DNA作为探针,与某种限制性酶酶切后,并经电泳分离的基因组DNA进行分子杂交,在放射自显影的X光片上,每个个体都可呈现不同长度片段的杂交显影带。

三.真核生物的基因结构:1.5’UTR区:1)启动子:基因DNA中一段特定的核苷酸序列,是RNA聚合酶在起始时对模板DNA的识别部位,也是转录起始时RNA聚合酶对模板DNA的结合部位,因此,是转录过程是否起始的决定部位。

2)增强子:约200bp,为远距离作用,距离靶基因可几十个kb,可位上、下游或基因内部,无基因特异性,对各种基因的启动子都可以发挥作用,常和多种转录调节蛋白结合后发挥作用。

2转录起始点:是模板DNA转录区中的第一个核苷酸,常标以+1,往后类推。

3起始密码子:如ATG(编码甲硫氨酸)4编码区:基因通过信使RNA来进行蛋白质的合成,信使RNA包含对应蛋白质氨基酸序列的一段核苷酸序列。

《生物信息学概述》课件

《生物信息学概述》课件

04
生物信息学的挑战与未来发展
数据整合与标准化
数据整合
在生物信息学中,数据整合是一个重要的挑战。由于不同实验室、研究机构的数据格式、标准和质量 各不相同,如何将这些数据有效地整合在一起成为一个亟待解决的问题。
标准化
为了提高数据的可比性和可重复性,生物信息学需要制定统一的标准和规范,以确保数据的准确性和 可靠性。
03
生物信息学在医学研究中的应用
疾病诊断
基因检测
利用生物信息学技术对基因序列进行分析,检测与疾病相关的基因 变异,有助于早期发现遗传性疾病和个性化诊断。
疾病分型
通过对生物样本的基因组、转录组和蛋白质组等数据进行比较分析 ,有助于对疾病进行精确分型,为制定个性化治疗方案提供依据。
预测疾病风险
基于生物信息学的大数据分析,可以预测个体患某种疾病的风险,为 预防性干预提供科学依据。
05
实例分析
基因组学研究实例
总结词
基因组学研究实例展示了生物信息学在基因组序列分析中的应用。
详细描述
基因组学研究实例中,生物信息学发挥了重要作用。通过对基因组序列进行分析,可以 发现与人类健康、疾病相关的基因变异和功能。生物信息学方法包括基因组测序、基因
表达分析、基因变异检测等,这些方法为个性化医疗和精准医学提供了有力支持。
02
生物信息学的主要技术
基因组学
基因组测序
通过对生物体基因组的测序,分析基因序列、基因突变和基 因功能。
基因表达分析
研究基因在不同条件下的表达水平,揭示基因与生物表型之 间的关系。
蛋白质组学
蛋白质分离与鉴定
分离和鉴定生物体内的蛋白质,了解蛋白质的组成和功能。
蛋白质相互作用研究

生物信息学资料整理(原创)

生物信息学资料整理(原创)

生物信息学大规模测序基本策略:逐个克隆法,全基因组鸟枪法,Contig(重叠群,基因组测序中将许多序列片段经过比对找到重叠区,从而连接成的长片段。

)3.生物信息学的主要研究内容(1)生物分子数据的收集与管理EMBL欧洲分子生物学实验室,于1974年由欧洲14个国家加上亚洲的以色列共同发起建立,包括一个位于德国Heidelberg的核心实验室,三个位于德国Hamburg,法国Grenoble及英国Hinxton的研究分部。

GenBank是美国国家生物技术信息中心建立的DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或来源于大规模基因组测序计划。

DDBJ日本DNA数据库,于1984年建立,是世界三大DNA 数据库之一,与NCBI的GenBank,EBI的EMBL数据库共同组成国际DNA数据库。

SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。

PIR全称The Protein Information Resource,是一个集成了关于蛋白质功能预测数据的公共资源的数据库,其目的是支持基因组/蛋白质组研究。

PIR与MIPS(the Munich Information Center for Protein Sequences)、JIPID(the Japan International Protein Information Database)合作,共同构成了PIR-国际蛋白质序列数据库(PSD):一个主要的已预测的蛋白质数据库,包括250000个蛋白。

蛋白质数据库PDB是由美国国家科学基金会、能源部的生物和环境研究所、国家健康组织中的两个单位:药品科学研究所和医药图书馆共同资助的。

它们设立这个机构的共同目标是通过PDB尽量广泛地传播其收集的信息。

(2)数据库搜索及序列比较通过数据库搜索可以找到目的基因的相关信息通过序列比较寻找同源基因(3)基因组序列分析基因组结构分析、基因识别、基因功能注释基因调控信息分析、基因组比较(4)基因表达数据的分析与处理基因表达数据分析是目前生物信息学研究的热点和重点。

生物信息学讲义

生物信息学讲义

生物信息学讲义第一章:生物信息学概述什么是生物信息学:又称计算生物学(computational biology),是生物学与信息学、计算机科学相互交叉形成的新兴学科,它应用数学、计算机科学的方法研究生物学问题,它所研究的主要对象是生物学的数据。

生物信息学是为了适应人类基因组计划(Human Genome Project,HGP)的需要产生的,最主要的应用是对人类基因组计划所得到的大量生物学数据进行存储、检索和分析。

目前生物信息学已被广泛的应用于医学、人类学、结构生物学和蛋白质组学(Proteomics)等研究领域。

生物信息学的研究内容:广义地说,生物信息学从事对基因组研究相关生物信息的获取、加工、储存、分配、分析和解释。

这一定义包括了两层含义,一是对海量数据的收集、整理与服务,也就是管好这些数据;另一个是从中发现新的规律,也就是用好这些数据。

具体地说,生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA基因的编码区;同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律;在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律。

生物信息学还利用基因组中编码区的信息进行蛋白质空间结构的模拟和蛋白质功能的预测,并将此类信息与生物体和生命过程的生理生化信息相结合,阐明其分子机理,最终进行蛋白质、核酸的分子设计、药物设计和个体化的医疗保健设计。

基因组信息学、蛋白质的结构计算与模拟以及药物设计,这三者紧密地围绕着遗传信息传递的中心法则,因而必然有机地连接在一起。

1、基因组序列数据的拼接和组装基因组研究的首要目标是获得人的整套遗传密码。

人的遗传密码有32亿个碱基,而目前DNA测序多采用鸟枪法(shotgun),每个反应只能读取几百到上千个碱基。

在进行测序前,首先应用物理方法将人的基因组打碎,得到基因组片段进行测序,然后再把这些片段重新拼接起来。

(生物信息学)CH3生物信息数据库及主要网上资源

(生物信息学)CH3生物信息数据库及主要网上资源
发展趋势
未来生物信息数据库的发展将更加注重数据的整合、标准化和共享,同时也会更加注重数据的隐私和 安全问题。此外,随着人工智能和机器学习技术的发展,生物信息数据库将更加智能化和自动化。
02
常用生物信息数据库
GenBank数据库
总结词
全球最大的开放存取生物序列数据库
详细描述
GenBank数据库由美国国家生物技术信息中心(NCBI)维 护,包含了全球范围内的基因组序列、质粒序列、EST序列、 RNA序列等,是生物信息学领域最常用的数据库之一。
04
生物信息数据库分析工具
BLAST软件
强大的序列比对工具
BLAST(Basic Local Alignment Search Tool)是一种用于在数据库中搜索与给定序列相似的序列的工具。它被广泛应用于生物 信息学领域,用于序列比对、基因组注释和功能基因组学研究。BLAST通过局部序列比对算法,能够快速地搜索和比对基因组、 蛋白质和EST等数据库中的序列。
MEGA软件
进化遗传学分析工具
MEGA(Molecular Evolutionary Genetics Analysis)是一个用于进化遗传学分析的工具,
它支持多种数据格式,包括DNA、蛋白质和 氨基酸序列。MEGA提供了多种进化遗传学 分析方法,如分子进化遗传学分析、系统发 育重建和物种进化研究等。它还支持多种算 法和统计方法,帮助研究人员深入了解物种
功能检索
总结词
通过输入蛋白质的功能或活性,查找具有相似功能的蛋白质。
详细描述
功能检索是利用蛋白质的功能信息进行查找的一种方式,用户可以根据已知的蛋白质功能信息,在数据库中找到 具有相似功能的其他蛋白质。
结构检索
总结词

生物信息学简介省名师优质课赛课获奖课件市赛课一等奖课件

生物信息学简介省名师优质课赛课获奖课件市赛课一等奖课件

陈宝林,最优化理论与算法(第二版),清华 大学出版社,2023年10月.
课件存储邮箱
2024/9/26
passwd: bioinfo
3
考核方式
期末成绩 40%
➢ 大作业 or 考试
平时成绩 40%
➢ 小作业 ➢ 开放项目,鼓励自由参加
日常考勤 20%
2024/9/26
4
课程定位
Introduction to Life Science and Artificial Life
✓ 遗传图谱
✓ 物理图谱
✓ 序列图谱
✓ 基因图谱
已完毕测序旳基因组
(/genomes)
种类
古细菌(Archaea) 真细菌(Bacteria) 真核生物(Eukaryo)
数目
备注
16
120 其中有旳测定了2个以上旳菌株
15 涉及酵母、线虫、果蝇、蚊子、拟南芥、人等
分子 生物学
信息技术
2024/9/26
遗传学
7
历史回忆(1)
1866年,神父Gregor Mendel经 过对豌豆旳杂交和遗传学研究, 提出了传递遗传特征旳基本单位--遗传因子(基因)旳概念
1944年, Avery & McCarty第一 次发觉了遗传信息旳载体是染色 体上旳DNA(而不是先前以为旳 蛋白质).
28,791
49,179,285
39,533
71,947,426
55,627
101,008,486
78,608
157,152,442
ห้องสมุดไป่ตู้
143,492
217,102,462
215,273
384,939,485

11-9-22生物信息学资源

11-9-22生物信息学资源
38
美国的核酸数据库GenBank〖Banson,D.A. et al. (2019) Nucleic Acids Res. 26, 1-7〗从 1979年开始建设,1982年正式运行;
39
40
欧洲分子生物学实验室的EMBL数据 库也于1982年开始服务
41
/embl//
身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育 过程的良好对象。
28
模式生物(Model Organism) 小鼠(Mus musculus)
基因组大小与人类相近,约30亿个核苷酸对;
29
30
31
提纲:
模式生物测序 3大核酸数据库 蛋白质数据库
32
主要的数据库资源
核酸序列数据库主要有GenBank, EMBL, DDBJ等.
EMBL核酸序列数据库 由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查 询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。 数据库网址是:/embl/。
DDBJ数据库 日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库, 与Genbank和EMBL核酸库合作交换数据。使用其主页上提供 的SRS工具进行数据检索和序列分析。 DDBJ的网址是:ddbj.nig.ac.jp/。
生物信息学 Bioinformatics
1
重要通知:
下次课在机房上课,请自己准备好 上网帐号:
内容: 数据库资源检索 时间:下周一(9月26日)
晚上19:00-21:00 地点:生科楼B2019
2
复习:
第二章
生物信息学的生物学基础
细胞 蛋白质 核酸
3
Questions:

生物信息学网址(全)电子教案

生物信息学网址(全)电子教案

生物信息学网址(全)电子教案生物信息学网站网址(全)生物信息学网站分子生物学数据库综合目录1. SRS序列查询系统(分子生物学数据库网络浏览器) http://www.embl-heidelberg.ed/srs5/2. 分子生物学数据库及服务器概览/doc/644745278.html,/people/pkarp/mimb d/rsmith.html3. BioMedNet图书馆 /doc/644745278.html,4. DBGET数据库链接http://www.genome.ad.jp/dbget/dbget.links.html5. 哈佛基因组研究数据库与精选服务器/doc/644745278.html,6. 约翰. 霍普金斯大学(Johns Hopkins University) OWL网络服器/doc/644745278.html,/Dan/proteins/owl.ht ml7. 生物网络服务器索引,USCS/doc/644745278.html,/network/science/bio logy/index.html8. 分子生物学数据库列表(LiMB) gopher:///doc/644745278.html,/11/molbio/oth er9. 病毒学的WWW服务器,UW-Madison/doc/644745278.html,/Welcome.html10. UK MRC 人类基组图谱计划研究中心/doc/644745278.html,/11. 生物学家和生物化学家的WWW资源http://www.yk.rim.pr.jp/~aisoai/index.html12. 其他生物网络服务器的链接/doc/644745278.html,/biolinks.html13. 分子模型服务器与数据库/doc/644745278.html,/lap/rsccom/dab/ind 006links.html14. EMBO实际结构数据库http://xray.bmc.uu.se/embo/structdb/links.html15. 蛋白质科学家的网络资源/doc/644745278.html,/protein/ProSciDocs/ WWWResources.html16. ExPASy分子生物学服务器http://expasy.hcuge.ch/cgi-bin/listdoc17. 抗体研究网页 /doc/644745278.html,18. 生物信息网址http://biochem.kaist.ac.kr/bioinformatics.html19. 乔治.梅森大学(George Mason University)的生物信息学与计算分子生物学专业/doc/644745278.html,/~michaels/Bioinformatic s/20. INFOBIOGEN数据库目录/doc/644745278.html,biogen.fr/services/dbcat/21. 国家生物技术信息研究室/doc/644745278.html,/data/data.html22. 人类基因组计划情报/doc/644745278.html,/TechResources/Human_ Genome23. 生物学软件及数据库档案/doc/644745278.html,/Dan/software/biol-links.html24. 蛋白质组研究:功能基因组学的新前沿(著作目录)http://expasy.hcuge.ch/ch2d/LivreTOC.html序列与结构数据库一.主要的公共序列数据库1. EMBL WWW服务器http://www.EMBL-heidelberg.ed/Services/index.html2. Genbank 数据库查询形式(得到Genbank的一个记录)/doc/644745278.html,/genbank/query_for m.html3. 蛋白质结构数据库WWW服务器(得到一PDB结构) /doc/644745278.html,4. 欧洲生物信息学研究中心(EBI) /doc/644745278.html,/5. EBI产业支持 /doc/644745278.html,/6. SWISS-PROT(蛋白质序列库) http://www.expasy.ch/sprot/sprot-top.html7. 大分子结构数据库/doc/644745278.html,/cgi-bin/membersl/shwtoc.pl?J:mms8. Molecules R Us(搜索及观察一蛋白质分子)/doc/644745278.html,/modeling/net_servic es.html9. PIR国际蛋白质序列数据库/doc/644745278.html,/Dan/proteins/pir.html10. SCOP(蛋白质的结构分类),MRC http://scop.mrc-/doc/644745278.html,/scop/data/scop.l.ht ml11. 洛斯阿拉莫斯的HIV分子免疫数据库 http://hiv-/doc/644745278.html,/immuno/index.html12. TIGR数据库/doc/644745278.html,/tdb/tdb.html13. NCBI WWW Entrez浏览器/doc/644745278.html,/Entrez/index.html14. 剑桥结构数据库(小分子有机的及有机金属的结晶结构)/doc/644745278.html,15. 基因本体论坛/doc/644745278.html,/GO/二. 专业数据库1. ANU生物信息学超媒体服务(病毒数据库、分类及病毒的命名法)/doc/644745278.html,.au/2. O-GLYCBASE(O联糖基化蛋白质的修订数据库)http://www.cbs.dtu.dk/OGLYCBASE/cbsoglycbase.html3. 基因组序列数据序(GSDB)(已注释的DNA序列的关系数据序)/doc/644745278.html,4. EBI蛋白质拓扑图/doc/644745278.html,/tops/Serverintermed.ht ml5. 酶及新陈代谢途径数据库(EMP) /doc/644745278.html,/6. 大肠杆菌数据库收集(ECDC)(大肠杆菌K12的DNA序列汇编)http://susi.bio.uni-giessen.de/ecdc.html7. EcoCyc(大肠杆菌基因及其新陈代谢的百科全书)/doc/644745278.html,/ecocyc/ecocyc.html8. Eddy实验室的snoRNA数据库/doc/644745278.html,/snoRNAdb/9. GenproEc(大肠杆菌基因及蛋白质) /doc/644745278.html,/html/ecoli.html10. NRSub(枯草芽胞杆菌的非冗余数据库) http://pbil.univ-lyonl.fr/nrsub/nrsub.html11. YPD(酿酒酵母蛋白质) /doc/644745278.html,/YPDhome.html12. 酵母基因组数据库/doc/644745278.html,/Saccharomyces/13. LISTA、LISTA-HOP及LISTA-HON(酵母同源数据库汇编)/doc/644745278.html,/14. MPDB(分子探针数据库)http://www.biotech.est.unige.it/interlab/mpdb.html15. tRNA序列及tRNA基因序列汇编 http://www.uni-bayreuth.de/departments/biochemie/trna/index/html16. 贝勒医学院(Baylor College of Medicine)的小RNA数据库/doc/644745278.html,/dbs/SRPDB/SRPDB. html17. SRPDB(信号识别粒子数据库)/doc/644745278.html,/dbs/SRPDB/SRPDB. html18. RDP(核糖体数据库计划) /doc/644745278.html,/19. 小核糖体亚蛋白RNA结构http://rrna.uia.ac.be/ssu/index.html20. 大核糖体亚蛋白RNA结构http://rrna.uia.ac.be/lsu/index.html21. RNA修饰数据库/doc/644745278.html,/RNAmods/22. 16SMDB及23SMDB(16S和23S核糖体RNA突变数据库)/doc/644745278.html,/Departments/Biolog y/Databases/RNA.html23. SWISS-2DPAGE(二维凝胶电泳数据库) http://expasy.hcuge.ch/ch2d/ch2d-top.html24. PRINTS/doc/644745278.html,/bsm/dbbrowser/PRI NTS/PRINTS.html25. KabatMan(抗体结构及序列信息数据库) /doc/644745278.html,/abs26. ALIGN(蛋白质序列比对一览)/doc/644745278.html,/bsm/dbbrowser/ALI GN/ALIGN.html27. CATH(蛋白质结构分类系统) /doc/644745278.html,/bsm/cath28. ProDom(蛋白质域数据库) http://protein.toulouse.inra.fr/29. Blocks数据库(蛋白质分类系统) /doc/644745278.html,/30. HSSP(按同源性导出的蛋白质二级结构数据库) http://www.sander.embl-heidelberg.de/hssp/31. FSSP(基于结构比对的蛋白质折叠分类)/doc/644745278.html,/dali/fssp/fssp.html32. SBASE蛋白质域(已注释的蛋白质序列片断)http://www.icgeb.trieste.it/~sbasessrv/33. TransTerm(翻译控制信号数据库) /doc/644745278.html,/Transterm.html34. GRBase(参与基因调控的蛋白质的相关信息数据库)/doc/644745278.html,/~regulate/trevgrb.h tml35. REBASE(限制性内切酶和甲基化酶数据库) /doc/644745278.html,/rebase/36. RNaseP数据库/doc/644745278.html,/RNaseP/home.html37. REGULONDB(大肠杆菌转录调控数据库)http://www.cifn.unam.mx/Computational_Biology/regulondb/38. TRANSFAC(转录因子及其DNA结合位点数据库) http://transfac.gbf.de/39. MHCPEP(MHC结合肽数据库) /doc/644745278.html,.au/mhcpep/40. ATCC(美国菌种保藏中心) /doc/644745278.html,/41. 高度保守的核蛋白序列的组蛋白序列数据库/doc/644745278.html,/Baxevani/HISTONES42. 3Dee(蛋白质结构域定义数据库) /doc/644745278.html,/servers/3Dee.html43. InterPro(蛋白质域以及功能位点的完整资源)/doc/644745278.html,/interpro/序列相似性搜索1. EBI序列相似性研究网页/doc/644745278.html,/searches/searches.html2. NCBI: BLAST注释/doc/644745278.html,/BLAST3. EMBL的BLITZ ULTRA快速搜索/doc/644745278.html,/searches/blitz_input. html。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
104 105 106 107 108 109 1010 1011
模式生物(Model Organism) 病毒(Virus)
不具有细胞形态结构,仅由核酸和蛋白质构成; 如:人艾滋病毒HIV、SARS冠状病毒
体积小,10~300nm;
严格的专性细胞内寄生; 对抗生素不敏感。
电子显微镜下的SARS冠状病毒
内含子?
4
请画出示意图:
1. 中心法则 2. 真核生物基因的一般结构
5
核酸
中心法则
复制
转录
DNA 逆转录
调控
RNA
蛋白质
复制
翻译
6
真核生物基因的结构:
加帽位点 5'm7GpppNp
翻译起始
植物C/GAANNATGG 动物A/GNNATGG
ቤተ መጻሕፍቲ ባይዱ
加poly(A)信号 植物 G/AATAA1-3 动物 AATAAA
25
模式生物(Model Organism)
Oryza sativa
水稻
单子叶植物模式植物,390-430MB
26
模式生物(Model Organism)
非洲爪蟾(Xenopus lavias)
1个受精卵在24小时内分裂到各种器官初具雏形的程度;
27
模式生物(Model Organism)
斑马鱼(Danio rerio)
TSS
各个外显子 各内含子
5'端
3'端
AGGA或 CAAT盒
TATA盒
起始密码子
终止密码子
Promotor 2000bp
UTR
UTR
7
Promotor 2000bp
转录
UTR翻译
UTR
8
编号 第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章
名称 生物信息学引论 生物信息学的生物学基础 生物信息学数据库资源 DNA和蛋白质序列分析
Bacillus subtilis
Drosophila melanogaster
Rickettsia prowazekii
Helicobacter pylori
Buchnerasp. APS
Escherichia coli
human
Arabidopsis
Thermotoga maritima
Thermoplasma acidophilum
生物信息学 Bioinformatics
1
重要通知:
下次课在机房上课,请自己准备好 上网帐号:
内容: 数据库资源检索 时间:下周一(9月26日)
晚上19:00-21:00 地点:生科楼B2017
2
复习:
第二章
生物信息学的生物学基础
细胞 蛋白质 核酸
3
Questions:
1. 蛋白质二级结构有哪些? 2. TSS,外显子和内含子的概念。 3. 如何判断起始密码子和终止密码子?
蛋白质序列数据库主要有SWISS-PROT, PIR, TrEMBL等,
蛋白结构数据库有PDB, MMDB等,
33
3大核酸数据库
基因组数据库的相关背景。 主要的基因组数据库资源。 重点介绍GenBank
水稻 (2002) 家鸡 (2004) 家蚕 (2007) 家猪 (2009) 大熊猫 (2010)
18
Genome sizes in nucleotide pairs (base-pairs)
plasmids viruses bacteria fungi plants algae insects mollusks bony fish amphibians reptiles birds mammals
有6条染色体,全基因组于1998年测定,长9.7Mb
23
模式生物(Model Organism)
Drosophila melanogaster
果蝇
繁殖很快、容易诱发变异的小昆虫。 总长达1.8亿核苷酸。
24
模式生物(Model Organism)
Arabidopsis thaliana
拟南芥
个体生活周期只有6周的十字花科 小草,是一种理想的模式植物。
21
模式生物(Model Organism) Saccharomyces cerevisiae
酿酒酵母
真菌界的单细胞真核生物,它的全基因组 已在1996年测定。
22
模式生物(Model Organism)
秀丽线虫Caenorhabditis elegans
一种透明的、生活在海滩泥沙中的小虫。
细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元;
mouse
Caenorhabitis
rat
elegans
Borrelia burgorferi
Plasmodium falciparum
Borrelia burgorferi
Aquifex aeolicus
Neisseria meningitidis Z2491
Mycobacteriu 14 m tuberculosis
身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育 过程的良好对象。
28
模式生物(Model Organism) 小鼠(Mus musculus)
基因组大小与人类相近,约30亿个核苷酸对;
29
30
31
提纲:
模式生物测序 3大核酸数据库 蛋白质数据库
32
主要的数据库资源
核酸序列数据库主要有GenBank, EMBL, DDBJ等.
系统发生分析 基因表达数据分析 其他常用生物信息学工具 电子克隆的原理和应用 基本生物信息学工具的开发与应用
9
第三章 生物信息学数据库资源
10
提纲:
模式生物测序 3大核酸数据库 蛋白质数据库
11
提纲:
模式生物测序 3大核酸数据库 蛋白质数据库
12
13
一、模式生物
Ureaplasma urealyticum
模式生物基因组计划
模式生物基因组计划 酵母、线虫、果蝇、细菌、拟南芥、人类、水
稻等共约50多种已完成,70余种正在进行。目前总量已 达60亿碱基对!
15
2001年2月15日《Nature》封面 2001年2月16日《Science》封面
16

又一次成功!

——水稻基因研究
17
我国自主产权的全基因组测序计划
100nm
20
模式生物(Model Organism)
Escherichia coli 大肠杆菌
Escherichia coli K12
Escherichia coli O157:H7
大肠杆菌是研究得最为详尽的一个模式生物。这种 只有1.6微米长的、可以迅速繁殖的单细胞原核生物, 已经成为实验室和基因工程的重要工具。
相关文档
最新文档