序列的比对分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
输入“more db”-〉回车察看db文件内容
输入“formatdb -i db -p T”-〉回车 对db数据库进行格式化
输入“dir”-〉回车 察看bin文件夹下内容
格式化以后产生的文件
输入“blastall -p blastx -i in -d db -o out -e 2e-5 -m 9” -〉回车 运行blastx程序
产生的结果文件“out”
用”more out” 察看结果文件
不使用–m参数时 比对结果显示序列两两比对
用”more out” 察看结果文件
多序列比对的 目的
• 从物种的一些分子特性出发,从而 了解物种之间的生物系统发生的关 系。
• 通过序列同源性的比较进而了解基 因的进化以及生物系统发生的内在 规律。
➢MEGA5
ClustalW/X的运行
• 本地运行
– 命令行操作的Clustal W(linux & windows) – 窗口化操作的ClustalX(windows)
下载页面: ftp://ftp.ebi.ac.uk/pub/software/clห้องสมุดไป่ตู้stalw2/2.1/
• 欧洲生物学中心(EBI)还提供了Clustal W的网上 运行服务(http://www.ebi.ac.uk/clustalw)
• 下载 (ftp://ftp.ncbi.nlm.nih.gov/blast/executa bles/blast+/LATEST/)
• 安装(安装到C:\) • 数据库的格式化(formatdb) • 程序运行(blastall)
•bin含可执行程序(将数据库及需要比 对操作的数据放入该文件); •data文件夹含打分矩阵及演示例子的 序列数据信息;
点击File下拉菜单中 Load sequences选项, 打开序列文件17-RNASE1.fasta.txt
打开后的界面
点击进行多序列比对
可在Alignment下拉菜单中的Alignment Parameters中设定各个参数
明
例:blastall -p blastx -d db -i in -o out -e 2e-5 -m 9 (表格显示比对结果)
采用blastx程序,将in中的序列到数据库bd中进行比对, 结果以表格形式输入到out文件
上机实习2:本地运行blastx
• 进入DOS命令行提示符状态(“运行”cmd) • 进入C盘“cd\” • 进入包含序列数据的bin目录下“cd Blast\bin” • 察看目录下内容“dir”
•doc文件夹含关于各子程序的说明文 档。
双击安装到C盘 产生三个文件夹
•bin •data •doc
将数据库文件(db)及目标序 列文件(in)保存在Blast/bin 文件夹下
本地数据库的构建
• 查看db文件
由fasta格式的序列组成
数据库的格式化
formatdb命令用于数据库的格式化: formatdb [option1] [option2] [option3]…
输入“cd\”-〉回车 回到安装目录C盘
输入“cd blast\bin”-〉回 车 到达blast程序下bin文件夹
输入“dir”-〉回车 察看bin文件夹下内容
bin文件夹下包含 以.exe为后缀的程序 文件以及需要用到 的数据可文件“bd” 和目标序列文件“in”
•空格键翻页 •输入“q”跳出
·
下载ClustalX
各种参数设定
目标序列
Jalview 结果下载
本地运行ClustalX
17-RNASE1.fasta
• 多序列比对
– (Multiple Alignment)
在C:\Program Files\ClustalX2 文件夹下,找到clustalx.exe 双击打开
Clustalx窗口
formatdb常用参数 -i database_name 需要格式化的数据库名称 -p T\F 待格式化数据库的序列类型 (核苷酸选F;蛋白质选T;默认值为T)
例:formatdb -i db -p T
对蛋白质数据库“db”进行格式化
程序运行
blastall命令用于运行五个blast子程序: blastall [option1] [option2] [option3] *可在dos下输入blastall查看各个参数的意义及使用
• blastall常用参数
➢ 四个必需参数 -p program_name,程序名,根据数据库及搜索文件序列性质进行选择; -d database_name,数据库名称,比对完成格式化的数据库; -i input_file,搜索文件名称; -o output_file,BLAST结果文件名称;
➢ 两个常用参数 -e expectation,期待值,默认值为10.0,可采用科学计数法来表示,如2e-5; -m alignment view options:比对显示选项,其具体的说明可以用以下的比对实例说
• 序列比对的目的:
– 从核酸以及氨基酸的层次去分析序列的相同点 和不同点,以推测他们的结构、功能以及进化 上的联系
– 通过判断两个序列之间的相似性来判定两者是 否具有同源性
• 相似性:直接的数量关系,如:序列之间相似部分 的百分比
• 同源性:质的判断,两个基因在进化上是否曾有共 同祖先的推断
本地运行BLAST
• 格式化数据库db“formatdb -i db -p T”
• 运行blastx
输入 数据库类型:F/T
– “blastall -p blastx -i in -d db -o out -e 2e-5 -m 9 ”
Blast程序 序列输入 数据库 结果输出
• 察看结果“more out ”或在 windows下双击打
多序列比对的应用:
•系统发育分析(phylogenetic analysis) •结构预测(structure prediction) •序列基序鉴定(sequence motif identification) •功能预测(function prediction)
➢ClustalW/ClustalX:一种全局的多序列 比对程序,可以用来绘制亲缘树,分析进化 关系。
输入“formatdb -i db -p T”-〉回车 对db数据库进行格式化
输入“dir”-〉回车 察看bin文件夹下内容
格式化以后产生的文件
输入“blastall -p blastx -i in -d db -o out -e 2e-5 -m 9” -〉回车 运行blastx程序
产生的结果文件“out”
用”more out” 察看结果文件
不使用–m参数时 比对结果显示序列两两比对
用”more out” 察看结果文件
多序列比对的 目的
• 从物种的一些分子特性出发,从而 了解物种之间的生物系统发生的关 系。
• 通过序列同源性的比较进而了解基 因的进化以及生物系统发生的内在 规律。
➢MEGA5
ClustalW/X的运行
• 本地运行
– 命令行操作的Clustal W(linux & windows) – 窗口化操作的ClustalX(windows)
下载页面: ftp://ftp.ebi.ac.uk/pub/software/clห้องสมุดไป่ตู้stalw2/2.1/
• 欧洲生物学中心(EBI)还提供了Clustal W的网上 运行服务(http://www.ebi.ac.uk/clustalw)
• 下载 (ftp://ftp.ncbi.nlm.nih.gov/blast/executa bles/blast+/LATEST/)
• 安装(安装到C:\) • 数据库的格式化(formatdb) • 程序运行(blastall)
•bin含可执行程序(将数据库及需要比 对操作的数据放入该文件); •data文件夹含打分矩阵及演示例子的 序列数据信息;
点击File下拉菜单中 Load sequences选项, 打开序列文件17-RNASE1.fasta.txt
打开后的界面
点击进行多序列比对
可在Alignment下拉菜单中的Alignment Parameters中设定各个参数
明
例:blastall -p blastx -d db -i in -o out -e 2e-5 -m 9 (表格显示比对结果)
采用blastx程序,将in中的序列到数据库bd中进行比对, 结果以表格形式输入到out文件
上机实习2:本地运行blastx
• 进入DOS命令行提示符状态(“运行”cmd) • 进入C盘“cd\” • 进入包含序列数据的bin目录下“cd Blast\bin” • 察看目录下内容“dir”
•doc文件夹含关于各子程序的说明文 档。
双击安装到C盘 产生三个文件夹
•bin •data •doc
将数据库文件(db)及目标序 列文件(in)保存在Blast/bin 文件夹下
本地数据库的构建
• 查看db文件
由fasta格式的序列组成
数据库的格式化
formatdb命令用于数据库的格式化: formatdb [option1] [option2] [option3]…
输入“cd\”-〉回车 回到安装目录C盘
输入“cd blast\bin”-〉回 车 到达blast程序下bin文件夹
输入“dir”-〉回车 察看bin文件夹下内容
bin文件夹下包含 以.exe为后缀的程序 文件以及需要用到 的数据可文件“bd” 和目标序列文件“in”
•空格键翻页 •输入“q”跳出
·
下载ClustalX
各种参数设定
目标序列
Jalview 结果下载
本地运行ClustalX
17-RNASE1.fasta
• 多序列比对
– (Multiple Alignment)
在C:\Program Files\ClustalX2 文件夹下,找到clustalx.exe 双击打开
Clustalx窗口
formatdb常用参数 -i database_name 需要格式化的数据库名称 -p T\F 待格式化数据库的序列类型 (核苷酸选F;蛋白质选T;默认值为T)
例:formatdb -i db -p T
对蛋白质数据库“db”进行格式化
程序运行
blastall命令用于运行五个blast子程序: blastall [option1] [option2] [option3] *可在dos下输入blastall查看各个参数的意义及使用
• blastall常用参数
➢ 四个必需参数 -p program_name,程序名,根据数据库及搜索文件序列性质进行选择; -d database_name,数据库名称,比对完成格式化的数据库; -i input_file,搜索文件名称; -o output_file,BLAST结果文件名称;
➢ 两个常用参数 -e expectation,期待值,默认值为10.0,可采用科学计数法来表示,如2e-5; -m alignment view options:比对显示选项,其具体的说明可以用以下的比对实例说
• 序列比对的目的:
– 从核酸以及氨基酸的层次去分析序列的相同点 和不同点,以推测他们的结构、功能以及进化 上的联系
– 通过判断两个序列之间的相似性来判定两者是 否具有同源性
• 相似性:直接的数量关系,如:序列之间相似部分 的百分比
• 同源性:质的判断,两个基因在进化上是否曾有共 同祖先的推断
本地运行BLAST
• 格式化数据库db“formatdb -i db -p T”
• 运行blastx
输入 数据库类型:F/T
– “blastall -p blastx -i in -d db -o out -e 2e-5 -m 9 ”
Blast程序 序列输入 数据库 结果输出
• 察看结果“more out ”或在 windows下双击打
多序列比对的应用:
•系统发育分析(phylogenetic analysis) •结构预测(structure prediction) •序列基序鉴定(sequence motif identification) •功能预测(function prediction)
➢ClustalW/ClustalX:一种全局的多序列 比对程序,可以用来绘制亲缘树,分析进化 关系。