基因结构分析的基本策略

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Crayfish: GGKDSCQGDSGGPLAASDTGSTYLAGIVSWGYGCARPGYPGVYTEVSYHVDWIKANAV--
保守序列
2019年6月18
插入? •当两个序列非常相似时,是否一定
感说谢你明的观它看 们具有相似的功能?
5
目录
•NCBI数据库
NCBI首先创建GenBank数据库
•可 以 通 过 下 拉 菜 单 选 择 记 录 的 显 示 格 式 , 通 常 选 择 GenBank Report格式或FASTA Report格式。
•当选择GenBank Report格式后,屏幕显示较完整的基因记录,包 括 : 基 因 位 点 (Locus ) 、 基 因 定 义 (Definition ) 、 基 因 存 取 号 (Accession)、 核酸编号(NID )、关键词(Keywords)、 来源 (Source)、组织分类(Organism)、参考文献(Reference)、 著者 (Author ) 、 题 目 (Title ) 、 期 刊 (Journal ) 、 Medline 存 取 号 (Medline)、序列特征(Features)、基因(Gene)、CDS(cDNA)、 等位基因(Allele) 对等的肽(Mat-Peptide )、计算碱基数(Base Count)、原序列(Origin)。
(5) PopSet
•包含研究一个人群、一个种系发生或描述人群 变化的一组组联合序列 •PopSet既包含了核酸序列数据又包含了蛋白质 序列数据
2019年6月18
感谢你的观看
10
目录
(7) 文献数据库
•PubMed:生物医药科学的检索系统 •OMIM:孟德尔遗传学数据库是人类基因和基 因疾病的目录数据库
•于 1991 年 开 发 了 Entrez 数 据 库 检 索 系 统 , 该 系 统 整 合 了 GenBank、EMBL、PIR和SWISS-PROT等数据库的序列信息 以及MEDLINE有关序列的文献信息,并通过相关链接,将他 们有机地结合在一起
•NCBI 还 提 供 了 其 他 数 据 库 , 包 括 在 线 人 类 孟 德 尔 遗 传 (OMIM)、三维蛋白结构的分子模型数据库(MMDB)、人 类 基 因 序 列 集 成 ( UniGene ) 、 人 类 基 因 组 基 因 图 谱 (GMHG)、生物门类(Toxonomy) 等数据库
•该数据库包括原文信息、图片和参考信息, 同 时 还 可 以 链 接 到 Entrez 系 统 MEDLINE 数 据库中相关文献和序列信息
•其他:书目,杂志,文章引用匹配等
2019年6月18
感谢你的观看
11
目录
2. NCBI数据库检索
•在检索框中输入检索词,检索词间默认逻辑关 系为AND,检索规则基本同PubMed
-40
-30
2019年6月18
-20
-10
Start site
+10
-3 +1 +5 ATG Initiator 感谢你的观看 Py2CAPy5
+20
30
目录
二、基因转录起始点的序列分析
思考: •转录起始点 (TSS)位于基因编码序列的5端 •基因编码区是指能体现在多肽链中的核苷酸 序列 •多肽链是以mRNA为模板经翻译合成的
2. 多序列比对
否具有足够的相似性 从而判断二者之间是否具
有同源性
2019年6月18 进化上曾具有共同祖先感谢你的观看
4
目录
序列比对的结果:
•取代 •插入 •缺失
保守序列: •可能是共同进化的标志 缺失? •可能并不代表功能的重要性
Mouse: GGKDSCQGDSGGPVVCNG----QLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIKNTIAAN
AAAAAn TTTTT15-18
反转录酶的末端转移酶活性 Oligo (dG)15-18
TTTTT15-18
与线性载体相连接 要求:
克隆扩增,感5谢端你测的观序看分析
cDNA的5端完整无缺
32
目录
2. cDNA末端快速扩增技术(RACE)
•传统的RACE:
3-
nGGGGG
nGGGGG
nCCCCC
2019年6月18
感谢你的观看
26
目录
第二节 基因转录起始点的鉴定
2019年6月18
感谢你的观看
27
目录
主要内容: 一、基因转录起始点的序列特征 二、基因转录起始点的序列分析
2019年6月18
感谢你的观看
28
目录
一、基因转录起始点的序列特征
1. 真核基因及其调控元件
顺式作用元件
-GCGC---CAAT---TATA
•在识别位点下游18~20碱基处切开双链DNA
2019年6月18
感谢你的观看
37
目录
Gppp
p
XhoI MmeI
•主要有两种方法:
•5 ′端连续分析基因表达(5 ′ -end serial analysis of gene expression, 5 ′ SAGE)
•帽分析基因表达(cap analysis gene expression, CAGE)
2019年6月18
感谢你的观看
36
目录
(1) 5 ′ SAGE
反转录酶 10nt 随机引物
感谢你的观看
34
目录
5-RACE adaptor 5-RACE adaptor 5-RACE adaptor
5-RACE adaptor
长短不同的cDNA
随机引物
用10nt随机引物与5-RACE引物 进行PCR扩增
5-RACE adaptor
5-RACE adaptor 5-RACE adaptor 5-RACE adaptor
因此, 分析鉴定TSS的方法都是以cDNA为切入点
2019年6月18
感谢你的观看
31
目录
1. cDNA克隆测序
mRNA
CCCCC
cDNA第一链 cDNA第二链
nGGGG
nCCCC cDNA第一链
2019年6月18
mRNA
AAAAAn AAAAAn AAAAAn
反转录酶 Oligo (dT)15-18
锚定引物 2019年6月18
mRNA cDNA
PCR产物
mRNA
AAAAAn
反转录酶
Oligo (dT)15-18
末端转移酶 dGTP
AAAAAn
TTTTT15-18 -5
TTTTT15-18
锚定PCR扩增
TTTTT15-18
特异引物 感谢你的观看
33
目录
•Deep-RACE:
用寡核苷酸替代mRNA的5′端帽结构以及
21
目录
点击核酸序列blast,在框内输入序列:
2019年6月18
感谢你的观看
22
目录
选择搜索条件:
2019年6月18
感谢你的观看
23
目录
选择特殊程序:
2019年6月18
感谢你的观看
24
目录
比较两个序列之间的相似性:
2019年6月18
感谢你的观看
25
目录
以上仅简介了NCBI相关数据库及工具软 件关于其他数据库及软件工具等信息见书中 第二十五章表1-5。
蛋白质
核苷酸 (翻译)
蛋白质
核苷酸 (翻译)
核苷酸 (翻译)
内容 使用取代矩阵寻找较远的关系: 可以进行SEG过滤 寻找较高分值的匹配,对较远关系 不太适用 对于新的DNA序列和ESTs的分析极 为有用 对于寻找数据库中没有标注的编码 区极为有用 对于分析EST极为有用
2019年6月18
感谢你的观看
2019年6月18
感谢你的观看
6
目录
2019年6月18
感谢你的观看
7
目录
1. 各种数据库的介绍
(1) Nucleotide
•该数据库由国际核苷酸序列数据库成员美国 国立卫生研究院GenBank、日本DNA数据库 (DDBJ)和英国Hinxton Hall的欧洲分子生物学 实验室数据库(EMBL)三部分数据组成
15
目录
•向下拉寻找关注的内容
2019年6月18
感谢你的观看
16
目录
•可以直接拷贝保存相关内容
•凡是连接的地方都可以点击查看
2019年6月18
感谢你的观看
17
目录
3. NCBI数据库搜索工具
•Entrez:
是一个用以整合NCBI数据库中信息的
搜寻和检索工具 •Entrez的一个强大和独特的特点
结构基因
转录起始点
增强子
TATA box
2019年6月18 GC box
CAAT box
感谢你的观看
29
目录
2. 转录起始点(TSS)
II 型启动子的TSS: •没有明确的保守序列 •有一种趋势,即mRNA 的第一个碱基是A, 其侧翼碱基倾向于是嘧啶 •与mRNA第一个碱基对应的位置标记为-1区 •-3 ~ +5区域被称作起始子 (initiator)
•NCBI 已 经 将 结 构 数 据 交 叉 链 接 到 书 目 信 息 、 序 列 数 据 库 和 NCBI的Taxonomy中运用NCBI的3D结构浏览器和Cn3D,可 以很容易地从Entrez获得分子的分子结构间相互作用的图像
2019年6月18
感谢你的观看
9
目录
(4) Taxonomy
•即生物学门类数据库,可以按生物学门类进行检 索或浏览其核苷酸序列、蛋白质序列、结构等
•BLAST:
是检索相关的序列,结构,和参考
文献的能力

是一个NCBI开发的序列相似搜索程序,还可作
为鉴别基因和遗传特点的手段
•NCBI 提 供 的 附 加 软 件 工 具 有 : 开 放 阅 读 框 寻 觅 器 (ORF Finder),电子PCR,和序列提交工具, Sequin和BankIt
•三个组织每天交换各自数据库中的新增序列 实现数据共享
2019年6月18
感谢你的观看
8
目录
(2) Genome
•即基因组数据库,提供了多种基因组、完全染 色体、重叠序列图谱以及一体化基因物理图谱
(3) Structures
•即结构数据库或称分子模型数据库(MMDB), 包含来自X线晶体学和三维结构的实验数据
2019年6月18
感谢你的观看
18
目录
•Entrez:

2019年6月18
感谢你的观看
19
目录
•BLAST:
2019年6月18
感谢你的观看
20
目录
•BLAST程序
程序 Blastp Blastn Blastx Tblastn Tblastx
数据库 蛋白质
查询 蛋白质
核苷酸 核苷酸
核苷酸 (翻译)
•而FASTA Report格式仅包括检出序列的简要特征描述。
2019年6月18
感谢你的观看
12
目录
例如:人EPO基因序列检索
•输入关键词,选择合适的程序
2019年6月18
感谢你的观看
13
目录
•向下拉寻找符合目标的条目
2019年6月18
感谢你的观看
14
目录
•点击此条打开连接
2019年6月18
感谢你的观看
•5′SAGE是在PCR过程中将MmeI酶切位点引物cDNA的5′ 端,通过酶切和连接获得不同短片段重复序列,并对重 复序列进行测序获得大量片段序列信息
•不同序列的短片段代表不同基因的转录起始点 (TSS)
MmeI:
•是一种特殊的II型限制性核酸内切酶
•识别的序列不是回文结构,而是不对称的DNA 序列5′-TCCRAC-3′(R代表G或A)
发光标记巢氏PCR引物实现高通量鉴定转录
起始点
5-p 帽
mRNA
AAAAAn
牛小肠磷酸酶 (CIP)
5-帽
AAAAAn
烟草酸焦磷酸酶 (TAP)
5-
5-RACE adaptor (寡核苷酸)
2019年6月18
AAAAAn
将5-RACE adaptor (寡核苷 酸)加到脱帽RNA分子上
AAAAAn
PCR产物
随机引物
以5’-RACE引物和5’端甩尾的基因 特异性反向引物进行巢氏PCR
5-RACE adaptor
以5’-RACE发光标记引物对PCR混 合物直接进行一次性测序
2019年6月18
分析基感因谢你转的录观起看始点
35
目录
3.连续分析基因转录起始点
•在RACE的基础上,通过在转录本5 ′端引入一 个特殊的II型限制性核酸内切酶识别位点,实 现了基因5 ′端短片段串联连接产物一次测序分 析多个基因转录起始点的目的
2019年6月18
感谢你的观看
2
ቤተ መጻሕፍቲ ባይዱ目录
第一节
基因序列结构的生物信息学 检索和比对分析
2019年6月18
感谢你的观看
3
目录
•基因或DNA序列比对
•就是在数据库中对基因序列或DNA序列进行
比对分析,以其能够推测出其结构、功能及在
进化上的联系.
直接的数量关系
•比对方法:
序列比对目的:
1. 双重比对
•判断两个或多个序列间是
第二十五章
基因结构分析的基本 策略
Basic strategy for analyzing gene structure
2019年6月18
感谢你的观看
1
目录
主要内容: 第一节 基因序列结构的生物信息学检索和比对
分析 第二节 基因转录起始点的鉴定 第三节 启动子的结构及功能分析 第四节 编码序列结构分析
相关文档
最新文档