第三讲-生物催化剂的基因数据挖掘66页PPT文档
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• Curation!!! – Error rate in the information is greatly reduced in comparison to most other databases.
• Extensive cross-linking to other data sources • SwissProt is the ‘gold-standard’ by which other
• DDBJ (DNA Data Bank of Japan) – ddbj.nig.ac.jp
• SwissProt/ExPASy (Swiss Bioinformatics Resource) – expasy.cbr.nrc.ca/sprot/
• PDB (The Protein Databank) – rcsb.org/PDB/
(Model) Organism specific information: Yeast: genomestanford.edu/Saccharomyces/ Arabidopis: tair.org/ Mouse: jax.org/ Fruitfly: fruitfly.org/ Nematode: wormbase.org/
• 基本局部比对搜索工具(Basic Local Alignment Search Tool)
• NCBI上BLAST服务的网址: ncbi.nlm.nih.gov/blast/
• NCBI的BLAST程序及数据库下载网址: ftp://ftp.ncbi.nlm.nih.gov/blast
SwissProt (expasy.cbr.nrc.ca/sprot/)
基因组计划项目的迅猛增加
截止至2019年8月20日,已完成全基因组测序的细胞生物有1909种,
正在进行的基因组计划还有11456种。 ——genomesonline.org
As of 15 April 2019), GenBank release 183.0 has 135,440,924 loci, 126,551,501,141 bases, from 135,440,924 reported sequences
量少:许多酶在野生状态下表达量较低; 娇嫩:酶容易失活 底物的溶解性和耐受性:天然的酶并非为工业生产而 生! 整细胞实际上是多酶体系 如何升级改进?
• 有了基因,可以?
– 从基因本质上改善酶的性质 – 大量重组表达 – 还可以研究:结构与功能的关系、进化……
2019-07-14
1.1基因数据库资源
• 1 基因数据挖掘 2 宏基因组技术
• 1 基因数据挖掘 • 1.1 基因组数据库 • 1.2 基因组数据的挖掘方法 • 1.3 酶基因数据挖掘案例
生物催化工程的发展前沿与现状
Natural enzymes Structure-guided protein engineering
Directed evolution methodologies
databases can be measured, and is the best place to start if you have a specific protein to investigate
A few more resources to be
aware of
• Human Genome Working Draft(人类基因组) – genome.ucsc.edu/
Nucleic Acids Research Database Issue nar.oupjournals.org/ (First issue every year)
2019-07-14
1.1 基因组数据挖wk.baidu.com方法
What is bioinformatics?
什么是生物信息学?
生物信息学利用应用数学、信息学、统计学和计算机科学的 方法研究生物学的问题。目前的生物信息学基本上只是分子 生物学与信息技术(尤其是因特网技术)的结合体。生物信 息学的研究材料和结果就是各种各样的生物学数据,其研究 工具是计算机,研究方法包括对生物学数据的搜索(收集和 筛选)、处理(编辑、整理、管理和显示)及利用(计算、 模拟)。目前主要的研究方向有:序列比对,基因识别,基 因重组,蛋白质结构预测,基因表达,蛋白质反应的预测, 以及建立进化论的模型。
Bioinformatics
Pre 1970s
1970s
1980s
1990s
Now
生物催化工程的发展前沿与现状
Natural enzymes Structure-guided protein engineering
Directed evolution methodologies
Pre 1970s
1970s
• TIGR (The Institute for Genomics Research)(基因研究院) – tigr.org/
• Celera – celera/
克雷格·文特尔生于1946年10月 14日,美国颇具传奇色彩的生 物学家和创业家。文特尔在测 量人类基因组工程中发挥了关 键作用并创建了基因研究院( The Institute for Genomic Research)。2019年他被评为 时代杂志最有影响力的100人之 一5。
EBI (ebi.ac.uk/)
• SRS database interface
– EMBL, SwissProt, and many more
• Many server-based tools
– ClustalW, DALI, …
NCBI (The National Center for Biotechnology Information; ncbi.nlm.nih.gov/
Five websites that all biologists should know
• NCBI (The National Center for Biotechnology Information; – ncbi.nlm.nih.gov/
• EBI (The European Bioinformatics Institute) – ebi.ac.uk/
1980s
1990s
Bioinformatics
Now
生物催化剂的发现:从挖土到挖基因!
Gene
传统生物催化剂的开发周期太长 生物催化剂在细胞中的含量太低
后基因组时代网上公开的基因组 序列中包含海量的新酶基因信息
快速获得大量可用于工业生产的生物催化剂成为可能!
为什么要做酶的基因克隆?
• 酶在工业应用上的局限:
• Extensive cross-linking to other data sources • SwissProt is the ‘gold-standard’ by which other
• DDBJ (DNA Data Bank of Japan) – ddbj.nig.ac.jp
• SwissProt/ExPASy (Swiss Bioinformatics Resource) – expasy.cbr.nrc.ca/sprot/
• PDB (The Protein Databank) – rcsb.org/PDB/
(Model) Organism specific information: Yeast: genomestanford.edu/Saccharomyces/ Arabidopis: tair.org/ Mouse: jax.org/ Fruitfly: fruitfly.org/ Nematode: wormbase.org/
• 基本局部比对搜索工具(Basic Local Alignment Search Tool)
• NCBI上BLAST服务的网址: ncbi.nlm.nih.gov/blast/
• NCBI的BLAST程序及数据库下载网址: ftp://ftp.ncbi.nlm.nih.gov/blast
SwissProt (expasy.cbr.nrc.ca/sprot/)
基因组计划项目的迅猛增加
截止至2019年8月20日,已完成全基因组测序的细胞生物有1909种,
正在进行的基因组计划还有11456种。 ——genomesonline.org
As of 15 April 2019), GenBank release 183.0 has 135,440,924 loci, 126,551,501,141 bases, from 135,440,924 reported sequences
量少:许多酶在野生状态下表达量较低; 娇嫩:酶容易失活 底物的溶解性和耐受性:天然的酶并非为工业生产而 生! 整细胞实际上是多酶体系 如何升级改进?
• 有了基因,可以?
– 从基因本质上改善酶的性质 – 大量重组表达 – 还可以研究:结构与功能的关系、进化……
2019-07-14
1.1基因数据库资源
• 1 基因数据挖掘 2 宏基因组技术
• 1 基因数据挖掘 • 1.1 基因组数据库 • 1.2 基因组数据的挖掘方法 • 1.3 酶基因数据挖掘案例
生物催化工程的发展前沿与现状
Natural enzymes Structure-guided protein engineering
Directed evolution methodologies
databases can be measured, and is the best place to start if you have a specific protein to investigate
A few more resources to be
aware of
• Human Genome Working Draft(人类基因组) – genome.ucsc.edu/
Nucleic Acids Research Database Issue nar.oupjournals.org/ (First issue every year)
2019-07-14
1.1 基因组数据挖wk.baidu.com方法
What is bioinformatics?
什么是生物信息学?
生物信息学利用应用数学、信息学、统计学和计算机科学的 方法研究生物学的问题。目前的生物信息学基本上只是分子 生物学与信息技术(尤其是因特网技术)的结合体。生物信 息学的研究材料和结果就是各种各样的生物学数据,其研究 工具是计算机,研究方法包括对生物学数据的搜索(收集和 筛选)、处理(编辑、整理、管理和显示)及利用(计算、 模拟)。目前主要的研究方向有:序列比对,基因识别,基 因重组,蛋白质结构预测,基因表达,蛋白质反应的预测, 以及建立进化论的模型。
Bioinformatics
Pre 1970s
1970s
1980s
1990s
Now
生物催化工程的发展前沿与现状
Natural enzymes Structure-guided protein engineering
Directed evolution methodologies
Pre 1970s
1970s
• TIGR (The Institute for Genomics Research)(基因研究院) – tigr.org/
• Celera – celera/
克雷格·文特尔生于1946年10月 14日,美国颇具传奇色彩的生 物学家和创业家。文特尔在测 量人类基因组工程中发挥了关 键作用并创建了基因研究院( The Institute for Genomic Research)。2019年他被评为 时代杂志最有影响力的100人之 一5。
EBI (ebi.ac.uk/)
• SRS database interface
– EMBL, SwissProt, and many more
• Many server-based tools
– ClustalW, DALI, …
NCBI (The National Center for Biotechnology Information; ncbi.nlm.nih.gov/
Five websites that all biologists should know
• NCBI (The National Center for Biotechnology Information; – ncbi.nlm.nih.gov/
• EBI (The European Bioinformatics Institute) – ebi.ac.uk/
1980s
1990s
Bioinformatics
Now
生物催化剂的发现:从挖土到挖基因!
Gene
传统生物催化剂的开发周期太长 生物催化剂在细胞中的含量太低
后基因组时代网上公开的基因组 序列中包含海量的新酶基因信息
快速获得大量可用于工业生产的生物催化剂成为可能!
为什么要做酶的基因克隆?
• 酶在工业应用上的局限: