上机-第二代测序中的数据分析-基因组
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– $ bwa index
参考基因组索引建立过程
bwa index 指令更多的用法及 options
5. 拼接组装
● 生成 sai 文件
– $ cd ~/proj1/ – $ bwa aln ref/ref1.fa reads/example1.L.fq > aln_example1.L.sai – $ bwa aln ref/ref1.fa reads/example1.R.fq > aln_example1.R.sai
● 执行程序路径
– $ export PATH=$PATH:~/bin/
2. 分析工具的安装
● Fa来自百度文库tQC
– FastQC aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing pipelines
运行过程的显示
$ cd ~/proj1/fastqc/example1.L.fq_fastqc/ 通过 ftp 将 example1.L.fq_fastqc 整个文件夹拷贝回本地电脑
FastQC 的输入结果以 html 格式显示
FastQC 的输出结果
FastQC 的输出结果
FastQC 的输出结果
● 建立合理的文件结构
– $ cd – $ mkdir bin proj1 tools – $ cd proj1 – $ mkdir reads fastqc ref snp-calling
● 拷贝相关的分析工具
– $ cd – $ cp -r /home/training/tools/bwa ./tools/ – $ cp -r /home/training/tools/fastqc ./tools/ – $ cp -r /home/training/tools/samtools ./tools/
● BWA
– Fast, accurate, memory-efficient aligner for short and long sequencing reads
● Samtools
– Various utilities for processing alignments in the SAM format, including variant calling and alignment viewing
够看到以下信息则表示安装成功
3. 测序数据质量评估
● 拷贝原始测序数据
– $ cp /home/training/data/DNA-Seq/example1.* ~/proj1/reads/
● 进入工作目录
– $ cd ~/proj1/fastqc/
● 评估测序数据质量
– $ fastqc -f fastq -o ./ ../reads/example1.*
● 检测安装是否成功
– $ cd – $ fastqc -h
说明:本文档中如没有特殊说明,” $“ 表示在 Shell 环境下的输入提示
FastQC 解压缩过程中显示的文档
在目录 ~/tools/fastqc/FastQC/ 下通过输入 ls -l 命令显示 已被激活的 fastqc 命令
在目录 ~/bin/ 下可以看到建立的命令执行路径
● 检测安装是否成功
– $ cd – $ samtools – $ vcfutils.pl
samtools 解压缩过程中显示的文档
输入 make 命令,进行 samtools 编译显示过程
执行路径建成以后, cd 回到工作目录,输入 samtools 按回车能
够看到以下信息则表示安装成功
执行路径建成以后, cd 回到工作目录,输入 vcfutils.pl 按回车能
上机 - 第二代测序中的数据分析 ( 基因组 )
罗奇斌
练习一 基因组分析
目的
● 通过对 NGS 工具的安装、配置、运行来熟悉 Linux 环境下的生物信息分析软件
● 学会对原始数据的质量评估、拼接组装、 SNP Calling 等分析过程
● 掌握初步的分析 NGS 数据能力
1. 建立项目文件系统
执行路径建成以后, cd 回到工作目录,输入 fastqc -h 按回车能够
看到以下信息则表示安装成功
2.2 安装 BWA
● 解压缩
– $ cd ~/tools/bwa/ – $ tar -jxvf bwa-0.7.3a.tar.bz2
● 编译
– $ cd bwa-0.7.3a/ – $ make
2.1 安装 FastQC
● 解压缩
– $ cd ~/tools/fastqc/ – $ unzip fastqc_v0.10.1.zip
● 激活执行命令
– $ cd FastQC – $ chmod +x fastqc
● 建立执行路径
– $ cd ~/bin/ – $ ln -s ~/tools/fastqc/FastQC/fastqc ./
– $ cd ~/tools/samtools/ – $ tar -jxvf samtools-0.1.19.tar.bz2
● 编译
– $ cd samtools-0.1.19/ – $ make
● 建立执行路径
– $ cp samtools ~/bin/ – $ cp bcftools/vcfutils.pl ~/bin/ – $ cp bcftools/bcftools ~/bin/
● 建立执行路径
– $ cp bwa ~/bin/
● 检测安装是否成功
– $ cd – $ bwa
BWA 解压缩过程中显示的文档
输入 make 命令,进行编译显示过程
执行路径建成以后, cd 回到工作目录,输入 bwa 按回车能够看
到以下信息则表示安装成功
2.3 安装 Samtools
● 解压缩
4. 建立参考基因组索引
● 拷贝参考基因组数据
– $ cp /home/training/data/DNA-Seq/ref1.fa ~/proj1/ref/
● 建立基因组索引
– $ cd ~/proj1/ref/ – $ bwa index -a is ref1.fa
● bwa index 指令更多的用法及 options ,通过以下 命令来查看
参考基因组索引建立过程
bwa index 指令更多的用法及 options
5. 拼接组装
● 生成 sai 文件
– $ cd ~/proj1/ – $ bwa aln ref/ref1.fa reads/example1.L.fq > aln_example1.L.sai – $ bwa aln ref/ref1.fa reads/example1.R.fq > aln_example1.R.sai
● 执行程序路径
– $ export PATH=$PATH:~/bin/
2. 分析工具的安装
● Fa来自百度文库tQC
– FastQC aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing pipelines
运行过程的显示
$ cd ~/proj1/fastqc/example1.L.fq_fastqc/ 通过 ftp 将 example1.L.fq_fastqc 整个文件夹拷贝回本地电脑
FastQC 的输入结果以 html 格式显示
FastQC 的输出结果
FastQC 的输出结果
FastQC 的输出结果
● 建立合理的文件结构
– $ cd – $ mkdir bin proj1 tools – $ cd proj1 – $ mkdir reads fastqc ref snp-calling
● 拷贝相关的分析工具
– $ cd – $ cp -r /home/training/tools/bwa ./tools/ – $ cp -r /home/training/tools/fastqc ./tools/ – $ cp -r /home/training/tools/samtools ./tools/
● BWA
– Fast, accurate, memory-efficient aligner for short and long sequencing reads
● Samtools
– Various utilities for processing alignments in the SAM format, including variant calling and alignment viewing
够看到以下信息则表示安装成功
3. 测序数据质量评估
● 拷贝原始测序数据
– $ cp /home/training/data/DNA-Seq/example1.* ~/proj1/reads/
● 进入工作目录
– $ cd ~/proj1/fastqc/
● 评估测序数据质量
– $ fastqc -f fastq -o ./ ../reads/example1.*
● 检测安装是否成功
– $ cd – $ fastqc -h
说明:本文档中如没有特殊说明,” $“ 表示在 Shell 环境下的输入提示
FastQC 解压缩过程中显示的文档
在目录 ~/tools/fastqc/FastQC/ 下通过输入 ls -l 命令显示 已被激活的 fastqc 命令
在目录 ~/bin/ 下可以看到建立的命令执行路径
● 检测安装是否成功
– $ cd – $ samtools – $ vcfutils.pl
samtools 解压缩过程中显示的文档
输入 make 命令,进行 samtools 编译显示过程
执行路径建成以后, cd 回到工作目录,输入 samtools 按回车能
够看到以下信息则表示安装成功
执行路径建成以后, cd 回到工作目录,输入 vcfutils.pl 按回车能
上机 - 第二代测序中的数据分析 ( 基因组 )
罗奇斌
练习一 基因组分析
目的
● 通过对 NGS 工具的安装、配置、运行来熟悉 Linux 环境下的生物信息分析软件
● 学会对原始数据的质量评估、拼接组装、 SNP Calling 等分析过程
● 掌握初步的分析 NGS 数据能力
1. 建立项目文件系统
执行路径建成以后, cd 回到工作目录,输入 fastqc -h 按回车能够
看到以下信息则表示安装成功
2.2 安装 BWA
● 解压缩
– $ cd ~/tools/bwa/ – $ tar -jxvf bwa-0.7.3a.tar.bz2
● 编译
– $ cd bwa-0.7.3a/ – $ make
2.1 安装 FastQC
● 解压缩
– $ cd ~/tools/fastqc/ – $ unzip fastqc_v0.10.1.zip
● 激活执行命令
– $ cd FastQC – $ chmod +x fastqc
● 建立执行路径
– $ cd ~/bin/ – $ ln -s ~/tools/fastqc/FastQC/fastqc ./
– $ cd ~/tools/samtools/ – $ tar -jxvf samtools-0.1.19.tar.bz2
● 编译
– $ cd samtools-0.1.19/ – $ make
● 建立执行路径
– $ cp samtools ~/bin/ – $ cp bcftools/vcfutils.pl ~/bin/ – $ cp bcftools/bcftools ~/bin/
● 建立执行路径
– $ cp bwa ~/bin/
● 检测安装是否成功
– $ cd – $ bwa
BWA 解压缩过程中显示的文档
输入 make 命令,进行编译显示过程
执行路径建成以后, cd 回到工作目录,输入 bwa 按回车能够看
到以下信息则表示安装成功
2.3 安装 Samtools
● 解压缩
4. 建立参考基因组索引
● 拷贝参考基因组数据
– $ cp /home/training/data/DNA-Seq/ref1.fa ~/proj1/ref/
● 建立基因组索引
– $ cd ~/proj1/ref/ – $ bwa index -a is ref1.fa
● bwa index 指令更多的用法及 options ,通过以下 命令来查看