2_重测序BSA分析项目结题报告

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

重测序BSA项目结题报告

客户单位:____________________________________

报告单位:____________

联系人:____________________________________

联系电话: ___________________________

传真:___________________________

报告日期:____________________________________

项目负责人:__________ 审核人: __________________

目录

目录 (1)

1 项目概况 (1)

1.1 合同关键指标 (1)

1.2 项目基本信息 (1)

1.3 项目执行情况 (2)

1.4项目结果概述 (2)

2 项目流程 (3)

2.1 实验流程 (3)

2.2 信息分析流程 (3)

3 生物信息学分析 (5)

3.1 测序数据质控 (5)

3.1.1 原始数据介绍 (5)

3.1.2 碱基测序质量分布 (7)

3.1.3碱基类型分布 (9)

3.1.4 低质量数据过滤 (10)

3.1.5测序数据统计 (10)

3.2 与参考基因组比对统计 (11)

3.2.1 比对结果统计 (11)

3.2.2 插入片段分布统计 (11)

3.2.3 深度分布统计 (12)

3.3 SNP 检测与注释 (14)

331样品与参考基因组间SNP的检测 (14)

332样品之间SNP的检测 (17)

3.3.3 SNP结果注释 (19)

3.4 Small In Del 检测与注释 (22)

3.4.1 样品与参考基因组间Small InDel 的检测 (22)

3.4.2样品之间Small InDel 检测 (22)

343 Small In Del 的注释 (23)

3.5 关联分析 (26)

3.5.1高质量SNP筛选 (26)

3.5.2 SNP-index方法关联结果 (26)

3.5.3 ED方法关联结果 (28)

3.5.4候选区域筛选 (29)

3.6 候选区域的功能注释 (30)

3.6.1候选区域的SNP注释 (30)

3.6.2 候选区域的基因注释 (30)

3.6.2.1 候选区域内基因的GO 富集分析 (31)

3.6.2.2候选区域内基因的KEGG富集分析 (33)

3.6.2.3候选区域内基因COG分类统计 (36)

3.7结果可视化 (37)

4 数据下载 (38)

4.1 结果文件查看说明 (38)

参考文献 (39)

1项目概况

1.1合同关键指标

(1) 完成X个样品的重测序,共产生XGbp Clean Data,保证Q30达到80%。

(2) 数据评估:测序数据量,测序数据质量和GC含量的统计。

(3) 与基因组比对:比对效率,基因组覆盖度,基因组覆盖深度统计。

⑷变异检测和注释:SNP、In Del的检测和注释。

(5) 关联分析:通过计算两个混池间等位基因的基因型频率确定与目标性状关联的区

域。

(6) 候选SNP注释:对关联区域内的SNP注释,包括位置信息和非同义突变信息。

(7) 候选基因注释:对关联区域内的基因进行GO、KEGG、COG、NR、SwissProt

数据库注释。

1.2项目基本信息

(1)样品信息:

样品编号BMK编号

亲本1 (父本) P

亲本2 (母本) M

混池1B1

混池2B2

注:BMK编号:百迈客对样品的统一编号,实验建库和后续信息分析均使用该编号。

混池规模:30+30;群体类型:F2群体;研究性状:水稻千粒重

(2)参考基因组信息:

根据水稻的基因组大小以及GC含量等信息,最终选取日本晴水稻基因组作为参考基因组。

具体信息如下所示:

1. 测序物种信息:水稻(Oryza sativa),实际基因组大小为419.8 Mb,GC含量为

45.67%;

2. 参考物种信息:日本晴水稻(Oryza sativaindica)⑴基因组,组装出的基因

组大小为374.3 Mb,GC含量为43.56%, ScaffoldN50为500Kb,,该基因组组

装到染色体水平,有基因注释信息,版本号为v7.0,下载地址:http://rapdb.d

na.affrc.go.jp/。

1.3项目执行情况

(1) 样品信息到位时间为2016年XX月XX日。

(2) 样品检测合格时间为2016年XX月XX日。

(3) 项目启动时间为2016年XX月XX日。

⑷项目分析完成时间为2016年XX月XX日。

1.4项目结果概述

(1) 数据质控

测序共获得XXGbp数据量,过滤后得到的Clean Read为XXGbp , Q30达到80%, 平均每个样品测序深度X。样品与参考基因组平均比对效率为XX%,平均覆盖深度为X,基因组覆盖度为XX% (至少一个碱基覆盖)。

(2) 变异检测

SNP检测:样品P、M之间共获得XX个SNP,其中非同义突变的SNP共XX个;样品B1、B2之间共获得XX个SNP,弓I起非同义突变的SNP共XX个。

In Del检测:样品P、M之间共获得XX个Small I nDel;样品B1、B2之间共获得XX 个Small In Del。

(3) 关联分析:SNP-index关联算法,共得到XX个与性状相关的侯选区域,总长度为XXbp ; ED关联算法,共得到XX个与性状相关的侯选区域,总长度为XXbp,两种方法取交集得到XX个与性状相关的侯选区域,总长度为XXbp。关联区域内包含非同义突变SNP位点的基因共XX个,同义突变SNP位点的基因共XX个。

相关文档
最新文档