第四章 核酸序列分析-1.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
以JaMBW 的Oligo Calculator为例演示
18
19
计算结果:
Baidu Nhomakorabea
20
二、序列转换 序列转换是分子生物学和生物信息学研究中最常遇到的工 作之一,因此,掌握序列转换的常用方法是分子生物学家
21
和生物信息学家的基本要求。
序列转换主要包括两方面的工作: 1)序列格式转换
2)互补与反向序列格式转换
31
1)对于已知蛋白,可进行数据库搜索判断序列的可靠性。 2)对于未知新基因,则需要参考序列的其他特定信息。
32
33
许多程序对DNA序列一次进行全部6个阅读框的翻译。
程序之一:EBI著名软件包EMBOSS中的Transeq
http://www.ebi.ac.uk/emboss/transeq/
特点: 1)输入序列可以是原始序列,也可以是GCG,Fasta, EMBL,GenBank,PIR等格式。 2)可一次翻译成1条,同向3条,双向6条蛋白质序列。 3)翻译时可选择标准密码子或其他类型的密码子
13
NCBI网站:http://www.ncbi.nlm.nih.gov/guide/all/#tools 14
EBI网站:http://www.ebi.ac.uk/
15
一、序列统计
16
序列统计包括核酸序列基本指标的计算:分子质量、GC百 分含量、融合温度(Tm值,又称退火温度)、摩尔消光系 数等。可通过一些常用软件如JaMBW软件包中的一个小工 具Oligo Calculator、BioEdit、DNAMAN等进行综合计算。
第四章 DNA序列分析
回顾
1 如何查询下列文献:Wan, Y. and Lemaux, P.G.. Generation of large numbers of independently transformed fertile barley plants. Plant Physiol. 1994 ,104: 37–48. 2上次上机操作内容简要说明。
2. DNA序列携带的遗传信息具有极高的复杂性
3. DNA序列分析是揭示遗传语言复杂性的基本过程
二、基因结构与功能简介 原核生物基因结构
7
特点:
1 长开放阅读框 2 高基因密度 3 简单的基因结构 4 基因组中GC含量变化非常大
真核生物基因结构
8
1 基因组规模大
特点: 2 非编码区序列占绝大部分(人类,97%) 3 基因结构复杂
国外主要网站 http://mobyle.pasteur.fr/cgi-bin/portal.py/ http://www.ncbi.nlm.nih.gov/Tools/index.html http://www.ebi.ac.uk/
12
各种生 物信息 学软件
法国巴斯德研究所:http://mobyle.pasteur.fr/cgibin/portal.py#forms::revseq
22
1 序列格式转换
ReadSeq是目前最流行的格式处理软件之一。是美国印 第安那大学的Don Gilbert开发编制的。 支持23种序列格式的转换,几乎囊括了目前所有的一 级序列格式。
http://www-bimas.cit.nih.gov/molbio/readseq/
23
选择输出 格式
24 EMBL格式
Oligo Calculator , http://www.bioinformatics.org/JaMBW/
17 JaMBW是一个分子生物学软件包,功能包括:序列格式 转换、求序列的补体序列与逆序列、将DNA序列翻译成 蛋白序列、序列分析、 多序列比较、特征位点查找、3维 分子结构查看、PCR引物设计、缓冲液设计等功能,包 含了分子生物学研究常用的一些操作。JaMBW是一个非 常出色的工具软件。
2
3
序列分析其实就是从已知蛋白质、RNA、
DNA序列作出生物学推论的过程。
4
主要内容 §4.1 引言 §4.2 序列的一般分析 §4.3 基因预测与鉴定 §4.4 非编码区分析与调控元件识别
§4.1 引 言
一、DNA序列分析的意义
6
DNA序列分析是生物信息学中的重要内容之一
1. DNA是生物遗传信息的最终决定者
序列格式说明: 1)序列标准格式 >XX(不能少)
2)序列长度少于18bp时一 定要用标准格式
3)序列长度大于18bp时, “>XX”可省去。
YYYYYYYYYYYYYYY
2 互补与反向序列格式转换 RevSeq程序是一款专门将序列进行反向和互 补转换的小工具。 个头虽小,但很实用。它是著名的生物信息 学软件包EMBOSS的一个成员。
4 具有复杂的基因转录调控方式
5 具有丰富的可变剪接 6 有明显的CpG岛、密码子使用具有偏好性
四、DNA序列分析基本内容
9
序列一般性分析 基因识别与鉴定
非编码区分析及调控元件识别
§4.2 DNA序列的一般分析
11
重要分析工具网站
华北制药集团的谈杰创建的一个非常有用的生 物信息学资源网站。 http://www.bio-soft.net/index.html
25
http://mobyle.pasteur.fr/cgi-bin/portal.py?form=revseq
26
粘贴序列
上传序列文件
1)反向链 2)互补链 3)反向互补链
改变文件名
27
要求填写E-mail地址
28
填写验证码
输出转换结果
29
互补反向链
30
同时转换多条序列
三、序列翻译 所谓序列翻译,是指用计算机程序把核酸序列按三 联体密码规则翻译成蛋白质序列。 6框架翻译,即从正向1,2,3位碱基开始按三联体密 码规则翻译成3条蛋白质序列以及从反向1,2,3位碱 基开始翻译得到3条蛋白质序列,共6条蛋白质序列。 问题: 究竞蛋白质序列是不是真正表达的蛋白产物? 方法:
34
Transeq主页
翻译结果(6框架)
35
36
程序之二: ExPASy的Translate Tool http://us.expasy.org/tools/dna.html 特点: 1)程序简单,没有太多的可选项,运行速度快。
2)一次翻译双向6条蛋白质序列。
3)输出结果较Transeq清楚,不仅将终止密码子用 Stop英文单词表示,还将起始密码子以MET标记出来