真核转录组结题报告

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4-2
样品4Байду номын сангаас2 的比对统计结果:
与参考基因组的比对 Total Reads Total BasePairs Total Mapped Reads perfect match <=5bp mismatch unique match multi-position match Total Unmapped Reads
数量 46675362 4200782580 40893514 28234190 12659324 38010097 2883417 5781848
百分比 100.00% 100.00% 87.61% 60.49% 27.12% 81.44% 6.18% 12.39%
与参考基因的比对 Total Reads Total BasePairs Total Mapped Reads perfect match <=5bp mismatch unique match multi-position match Total Unmapped Reads
基因表达注释
14/78
1-1
样品1-1 的基因覆盖度统计 结果文件列表: 1-1
15/78
1-2
样品1-2 的基因覆盖度统计 结果文件列表: 1-2
16/78
4-1
样品4-1 的基因覆盖度统计 结果文件列表: 4-1
17/78
4-2
样品4-2 的基因覆盖度统计 结果文件列表: 4-2
18/78
项目概述
项目编号 物种 差异分析方案 Project_test human 1-2-VS-1-1 4-2-VS-4-1
样品分析统计
Sample Name 1-1 1-2 4-1 4-2
Clean reads 48593470 48654830 46675362 48282566
Gennome map Rate Gene map Rate Expressed Gene Novel Transcripts 48.53% 86.05% 87.61% 89.35% 32.38% 75.60% 55.72% 58.77% 17865 17183 16508 16500 215 413 1215 1072
数量 48593470 4373412300 23581572 16674091 6907481 21507092 2074480 25011898
百分比 100.00% 100.00% 48.53% 34.31% 14.21% 44.26% 4.27% 51.47%
与参考基因的比对 Total Reads Total BasePairs Total Mapped Reads perfect match <=5bp mismatch unique match multi-position match Total Unmapped Reads
1-2
样品1-2 的比对统计结果:
与参考基因组的比对 Total Reads Total BasePairs Total Mapped Reads perfect match <=5bp mismatch unique match multi-position match Total Unmapped Reads
数量 46675362 4200782580 26006315 19781170 6225145 24701692 1304623 20669047
百分比 100.00% 100.00% 55.72% 42.38% 13.34% 52.92% 2.80% 44.28%
样品4-1 的测序随机性评估
12/78
数量 48654830 4378934700 36782038 29136519 7645519 35310643 1471395 11872792
百分比 100.00% 100.00% 75.60% 59.88% 15.71% 72.57% 3.02% 24.40%
样品1-2 的测序随机性评估
11/78
比对统计
9/78
1-1
样品1-1 的比对统计结果:
与参考基因组的比对 Total Reads Total BasePairs Total Mapped Reads perfect match <=5bp mismatch unique match multi-position match Total Unmapped Reads
数量 48282566 4345430940 28373499 22554395 5819104 26980492 1393007 19909067
百分比 100.00% 100.00% 58.77% 46.71% 12.05% 55.88% 2.89% 41.23%
样品4-2 的测序随机性评估
13/78
4-2-VS-4-1 386 83
技术简介
产品说明
转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,该产品目前主要针对mRNA。转录组是连接基因组遗传信息与生物功能的蛋白质组的必然纽带,也 是基因功能及结构研究的基础和出发点,通过新一代高通量测序,能够全面快速地获得某一物种特定组织或器官在特定状态下的几乎所有转录本序列信息,已广泛应用于基础研究、临床 诊断和药物研发等领域。
2/78
信息分析简介
图2. 转录组信息分析流程图 图2 为信息分析流程图:由Illumina HiSeqTM 2000测序所得的数据称为raw reads或raw data,随后要对raw reads进行质控(QC),以确定测序数据是否适用于后续分析。质控后,经过滤得 到clean reads,用SOAPaligner/SOAP2 [ 1]将clean reads比对到参考序列。比对完,通过统计reads在参考序列上的分布情况及覆盖度,判断比对结果是否通过第二次质控(QC of alignment) 。若通过,则进行基因表达、基因结构优化、可变剪接、新转录本预测及注释、SNP检测等一系列后续分析,并从基因表达结果中,筛选出样品间差异表达的基因,基于差异表达基因, 进行GO 功能显著性富集分析和pathway显著性富集分析。
数量 48593470 4373412300 15736910 12189268 3547642 14653922 1082988 32856560
百分比 100.00% 100.00% 32.38% 25.08% 7.30% 30.16% 2.23% 67.62%
样品1-1 的测序随机性评估
10/78
Alternative Splicing 28392 41671 31774 37351
SNP 39341 59200 91175 77552
Gene Fusion 32 24 19 14
差异基因统计
Type/Pairs DiffGene(Up) DiffGene(Down)
1-2-VS-1-1 1892 519
结果文件示例: 结果文件的样式均类似下表(各列含义详见 GeneRPKM.readme.txt), 这里只取其中一个文件的一部分作为示意。 GeneID 378938 1277 60 7431 2495 1915 71 3488 1278 100462981 Uniq_reads_num(14653922) 323296 179552 135491 134319 129621 122047 116825 114230 111292 95509 Length 8708 5927 1852 2151 1245 3528 2123 6333 5411 1036 Coverage 97.86% 99.81% 99.08% 96.09% 97.19% 98.58% 96.8% 99.87% 97.47% 80.31% RPKM 2533.54157506181 2067.29019227428 4992.4714528315 4261.31034029599 7104.80463947114 2360.72096341703 3755.19003673876 1230.88311233107 1403.56502491068 6291.15907947063
3/78
三、信息分析结果
测序质量评估
4/78
1-1
样品1-1 碱基组成情况
样品1-1 碱基质量情况
5/78
1-2
样品1-2 碱基组成情况
样品1-2 碱基质量情况
6/78
4-1
样品4-1 碱基组成情况
样品4-1 碱基质量情况
7/78
4-2
样品4-2 碱基组成情况
样品4-2 碱基质量情况
8/78
22/78
结果文件示例:结果文件的样式均类似下表(各列含义详见GeneDiffExp.readme.txt),这里只取其中一个文件的一部分作为示意。 Up-Down1-2geneID geneLength Expression Expression 1/1-2) 7546 1735 3040 389692 3975 2991 2120 622 2373 3431 0 0 0 0 0 2127 970 235 889 881 0.001 0.001 0.001 0.001 0.001 48.5285372885567 31.2235297697996 25.7824154395766 25.565256075239 17.5227116682191 15.5665457556551 14.9303460204377 14.6540998092482 14.6418968564496 14.0969384311765 Up Up Up Up Up 0 0 3.81844e-126 0 0 0 0 1.75751950716049e-124 0 0 1-11-2-RPKM 1-1-RPKM log2 Ratio(1-1/1-2) Regulation(1P-value FDR
数量 48654830 4378934700 41865363 30314232 11551131 39258904 2606459 6789467
百分比 100.00% 100.00% 86.05% 62.30% 23.74% 80.69% 5.36% 13.95%
与参考基因的比对 Total Reads Total BasePairs Total Mapped Reads perfect match <=5bp mismatch unique match multi-position match Total Unmapped Reads
数量 48282566 4345430940 43139373 30648098 12491275 39985410 3153963 5143193
百分比 100.00% 100.00% 89.35% 63.48% 25.87% 82.82% 6.53% 10.65%
与参考基因的比对 Total Reads Total BasePairs Total Mapped Reads perfect match <=5bp mismatch unique match multi-position match Total Unmapped Reads
4-1
样品4-1 的比对统计结果:
与参考基因组的比对 Total Reads Total BasePairs Total Mapped Reads perfect match <=5bp mismatch unique match multi-position match Total Unmapped Reads
实验简介
1/78
图1. 转录组测序的实验步骤 图1 描述的是转录组测序实验步骤:提取样品总RNA并使用DNase I消化DNA后,用带有Oligo (dT)的磁珠富集真核生物mRNA(若为原核生物,则用试剂盒去除rRNA后进入下一步);加 入打断试剂在Thermomixer中适温将mRNA打断成短片段,以打断后的mRNA为模板合成一链cDNA,然后配制二链合成反应体系合成二链cDNA,并使用试剂盒纯化回收、粘性末端 修复、cDNA的3’末端加上碱基“A”并连接接头,然后进行片段大小选择,最后进行PCR 扩增;构建好的文库用Agilent 2100 Bioanalyzer和ABI StepOnePlus Real-Time PCR System 质检合 格后,使用Illumina HiSeqTM 2000或其他测序仪进行测序。
19/78
基因差异表达分析
差异表达基因图示:
20/78
1-2-VS-1-1
1-2-VS-1-1 差异表达图示
21/78
4-2-VS-4-1
4-2-VS-4-1 差异表达图示 差异表达基因列表(FDR≤0.001 AND |log2Ratio|≥1): 1-2-VS-1-1 4-2-VS-4-1 所有基因表达情况列表: 1-2-VS-1-1 4-2-VS-4-1
相关文档
最新文档