基因组学技术概要

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基因组学复习纪要

第一讲绪论

1基因组学(Genomics):以生物信息学分析为手段研究基因组的组成、结构、表达调控机制和进化规律的一门学科。

生物信息学是应用计算模型、算法和数据库等手段来研究蛋白、基因和基因组的学科。

2人类基因组计划(HGP)

于20世纪80年代提出的,由国际合作组织包括有美、英、日、中、德、法等国参加进行了人体基因作图,测定人体23对染色体由3×109核苷酸组成的全部DNA序列,于2000年完成了人类基因组“工作框架图”。2001年公布了人类基因组图谱及初步分析结果。

HGP的目标:(1)人类DNA测序(2)发展测序技术(3)鉴定人类基因组变异(4)发展有效的基因组学技术(5)比较基因组学

(6)ELSI: ethical, legal, and social issues(7)生物信息学和计算生物学(8)Training and manpower

在人类基因组计划中,还包括对五种生物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。

模式生物(model organism):作为实验模型以研究特定生物学现象的动物、植物和微生物。从研究模式生物得到的结论,通常可适用于其他生物。比如,在揭示生物界遗传规律时,孟德尔选用豌豆作为模式生物,而摩根选用果蝇作为模式生物。

选择用于测序的基因组的标准:

基因组大小;花费;与人类疾病的关系;与生物学基本问题的关系;与农业的关系等

基因组的大小

病毒: 1 kb to 360 kb Note: Mimivirus: 1.2 Mb

细菌: 0.5 Mb to 13 Mb;

真核生物: 8 Mb to 670 Gb;

3基因组学的类型:

环境基因组学;药物基因组学;进化基因组学;结构基因组学;法医基因组学;营养基因组学等

4研究基因组学的五种途径:

Approach I: cataloguing genomic information

Approach II: cataloguing comparative genomic information

Approach III: function; biological principles; evolution

Approach IV: Human disease relevance

Approach V: Bioinformatics aspects

5基因组学一些特点:

(1)基因组学依赖于测序;

(2)基因组学是数据引导的学科,而不是假说驱动的;

(3)Genome sciences is asystematic approach

第二章基因组研究主要网站介绍

1.基因组学数据类型

• DNA序列(全基因组,染色体,基因)

•转录组(蛋白编码转录组;非编码转录组;全长或部分序列(表达序列标签ESTs))•蛋白质序列(已知的和预测的)

•重复序列

•变异

2.三大核酸数据库

GenBank;EMBL ;DDBJ

3.基因组学中一些常用的网络资源

• UCSC Genome Browser and Table Browser

• Ensembl and EnsMart/BioMart

• NCBI for Blast server, PubMed, Gene Expression Omnibus, dbSNP, etc.

• HapMap for haplotype and variation

• TIGR Comprehensive Microbial Resource

4.数据库类型

Primary Databases

– Original submissions by experimentalists

– Content controlled by the submitter

• Examples: GenBank, SNP, GEO

Derivative Databases

– Built from primary data

– Content controlled by third party (NCBI)

5 .Access to sequences: Entrez Gene at NCBI

Entrez Gene 收集主要数据库中基因/蛋白的关键信息.

6.RefSeq去冗余数据库,为每一种DNA/蛋白提供一个AccessNumber

7 HomologoGene:NCBI 整理真核生物同源序列的资源

8 表达序列数据库UniGene,GEO

9 Blat

快速找到与长度大于40个碱基的序列的相似性大于等于95%的序列,是BLAST-Like Alignment Tool, 但不是BLAST,可用于找到序列在基因组中的位置,可处理少于1 GB 的数据

10. Table Browser

To get the data associated with a track in text format, to calculate intersections between tracks, and to retrieve DNA sequence covered by a track.

11. Gene Sorter

• Displays a sorted table of genes that are related to one another

• Correlation is color-coded

– a highly expressed gene is colored red

– a less expressed gene is shown in green

12 .Ensembl 数据库

第三章测序原理与进展

1双脱氧链末端终止法原理

分别设计四个反应体系,每一反应体系中存在相同的DNA模板、引物、四种dNTP 和一种ddNTP(如ddATP),则新合成的DNA链在可能掺入正常dNTP的位置都有可能掺入ddNTP,从而导致新合成链在不同的位置终止。由于存在ddNTP与dNTP的竞争,生成的反应产物是一系列长度不同的多核苷酸片段。

2多色荧光标记法-- 荧光标记引物法

定义:将荧光染料预先标记在测序反应所用引物的5’端

一组(4种)荧光标记引物,其序列相同,但标记的荧光染料颜色不同。

相关文档
最新文档