基因组学技术概要
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基因组学复习纪要
第一讲绪论
1基因组学(Genomics):以生物信息学分析为手段研究基因组的组成、结构、表达调控机制和进化规律的一门学科。
生物信息学是应用计算模型、算法和数据库等手段来研究蛋白、基因和基因组的学科。
2人类基因组计划(HGP)
于20世纪80年代提出的,由国际合作组织包括有美、英、日、中、德、法等国参加进行了人体基因作图,测定人体23对染色体由3×109核苷酸组成的全部DNA序列,于2000年完成了人类基因组“工作框架图”。2001年公布了人类基因组图谱及初步分析结果。
HGP的目标:(1)人类DNA测序(2)发展测序技术(3)鉴定人类基因组变异(4)发展有效的基因组学技术(5)比较基因组学
(6)ELSI: ethical, legal, and social issues(7)生物信息学和计算生物学(8)Training and manpower
在人类基因组计划中,还包括对五种生物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。
模式生物(model organism):作为实验模型以研究特定生物学现象的动物、植物和微生物。从研究模式生物得到的结论,通常可适用于其他生物。比如,在揭示生物界遗传规律时,孟德尔选用豌豆作为模式生物,而摩根选用果蝇作为模式生物。
选择用于测序的基因组的标准:
基因组大小;花费;与人类疾病的关系;与生物学基本问题的关系;与农业的关系等
基因组的大小
病毒: 1 kb to 360 kb Note: Mimivirus: 1.2 Mb
细菌: 0.5 Mb to 13 Mb;
真核生物: 8 Mb to 670 Gb;
3基因组学的类型:
环境基因组学;药物基因组学;进化基因组学;结构基因组学;法医基因组学;营养基因组学等
4研究基因组学的五种途径:
Approach I: cataloguing genomic information
Approach II: cataloguing comparative genomic information
Approach III: function; biological principles; evolution
Approach IV: Human disease relevance
Approach V: Bioinformatics aspects
5基因组学一些特点:
(1)基因组学依赖于测序;
(2)基因组学是数据引导的学科,而不是假说驱动的;
(3)Genome sciences is asystematic approach
第二章基因组研究主要网站介绍
1.基因组学数据类型
• DNA序列(全基因组,染色体,基因)
•转录组(蛋白编码转录组;非编码转录组;全长或部分序列(表达序列标签ESTs))•蛋白质序列(已知的和预测的)
•重复序列
•变异
2.三大核酸数据库
GenBank;EMBL ;DDBJ
3.基因组学中一些常用的网络资源
• UCSC Genome Browser and Table Browser
• Ensembl and EnsMart/BioMart
• NCBI for Blast server, PubMed, Gene Expression Omnibus, dbSNP, etc.
• HapMap for haplotype and variation
• TIGR Comprehensive Microbial Resource
4.数据库类型
Primary Databases
– Original submissions by experimentalists
– Content controlled by the submitter
• Examples: GenBank, SNP, GEO
Derivative Databases
– Built from primary data
– Content controlled by third party (NCBI)
5 .Access to sequences: Entrez Gene at NCBI
Entrez Gene 收集主要数据库中基因/蛋白的关键信息.
6.RefSeq去冗余数据库,为每一种DNA/蛋白提供一个AccessNumber
7 HomologoGene:NCBI 整理真核生物同源序列的资源
8 表达序列数据库UniGene,GEO
9 Blat
快速找到与长度大于40个碱基的序列的相似性大于等于95%的序列,是BLAST-Like Alignment Tool, 但不是BLAST,可用于找到序列在基因组中的位置,可处理少于1 GB 的数据
10. Table Browser
To get the data associated with a track in text format, to calculate intersections between tracks, and to retrieve DNA sequence covered by a track.
11. Gene Sorter
• Displays a sorted table of genes that are related to one another
• Correlation is color-coded
– a highly expressed gene is colored red
– a less expressed gene is shown in green
12 .Ensembl 数据库
第三章测序原理与进展
1双脱氧链末端终止法原理
分别设计四个反应体系,每一反应体系中存在相同的DNA模板、引物、四种dNTP 和一种ddNTP(如ddATP),则新合成的DNA链在可能掺入正常dNTP的位置都有可能掺入ddNTP,从而导致新合成链在不同的位置终止。由于存在ddNTP与dNTP的竞争,生成的反应产物是一系列长度不同的多核苷酸片段。
2多色荧光标记法-- 荧光标记引物法
定义:将荧光染料预先标记在测序反应所用引物的5’端
一组(4种)荧光标记引物,其序列相同,但标记的荧光染料颜色不同。