2018 免疫组库测序
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IR-SEQ
目录
一. 免疫组库(IR) 二. 免疫组库测序技术 三. 信息分析
1、免疫组库概念
免疫组库(Immune Repertoire,IR)是指 在任何指定时间,某个个体的循环系统中 所有功能多样性B细胞和T细胞的总和。研 究免疫组库就要测定免疫系统中的BCR和 TCR的基因或RNA分子序列。
4、BCR/TCR多样性产生机制
1. 不同VDJ基因片段组合的多样化; 2. 不同基因片段连接时随机插入删除造成连
接的多样化,V(D)J连接区核苷酸的插入和 删除,体现为互补决定区簇CDR3)序列多 样性; 3. 不同重链和轻链组合的多样化; 4. 以及 B 细胞受体特有的随机高频突变。
5、研究免疫组库的流程
1. 提取样本DNA/RNA:根据所要研究的问题设计试验方案, 提取血液或组织样本,分离B细胞或T细胞,然后提取 和纯化DNA/RNA。
2. 构建测序文库:根据不同实验情况加入不同扩增引物进 行PCR扩增,从而扩增出想要测序的免疫基因,最后 构建测序文库。
3. 测序:利用二代高通量测序仪,如Roche 454、Illumina Hi Seq2500、Illumina Mi Seq等进行测序。
决定B淋巴细胞识别抗原的关键部位是最具 多样性的重链CDR3区,其多样性的产生源 于IGHV(51个功能性基因片段)末端IGHD(23个功能性基因片段)-IGHJ前端(6 个功能性基因片段)基因重排及V-D和D-J连 接时非模板依赖性核苷酸插入或剪切和体 细胞高频突变等。
ຫໍສະໝຸດ Baidu
3、TCR
T细胞受(TCR)是由T细胞分泌的膜蛋白分子,与BCR 不同的是TCR只在细胞表面而不分泌出去。一个T细胞的 TCR可以是α链和β链组成的,或者由γ链和δ链组成的。α 链和γ链由V-J-C基因片段重组而来,β链和δ链由V-D-J-C 基因片段重组而来,这也类似于BCR的重链和轻链。参 与特异性免疫应答的T淋巴细胞主要是α/β T淋巴细胞,占 外周T淋巴细胞的90-95%。TCR β 链CDR3在抗原特异性 识别中起关键作用,是直接与抗原肽的结合位点,其编 码基因位于人类7号染色体(7q34),全长620kb,由50 多个可变区(V区)基因片段、2组上游D基因片段/下游 恒定区(C区) 基因片段、6~7个J区基因片段组成,这些 基因在T淋巴细胞发育早期不连续分布,在胸腺内原始T 细胞阶段,D-J区片段连接为 DJ片段;在成熟T淋巴细胞 阶段,V、D、J、C区基因片段相连成 VDJC片段。
2、两种PCR技术的优缺点
Arm-PCR是最新开创的一种高效扩增子救援多重 PCR,它克服了传统多重PCR的缺限。通过在扩 增的早期使用基因靶点特异性的引物,而在指数 扩增期使用共用的引物,使得所有模板的扩增效 率大大提高,因而具有较高的特异性和灵敏性。
3、模板比较
基因组虽然DNA容易制备,但PCR扩增过程 中易产生非产出性的重组序列,且J-C区之 间存在的大量内含子使其下游引物只能位 于J区,PCR扩增的敏感性一般由细胞的拷 贝量决定;相对而言,RNA需取自新鲜的标 本,其产物多为产出性的CDR3序列,下游 引物可选自C区,具有高度的敏感性。
高效靶向覆盖-运用多重PCR设计实现平均 97%靶向覆盖
读长-可选择200bp或400bp读长
5、信息分析
1、基本数据统计 数据过滤,对原始数据进行去除接头污染序列及低质量 reads的处理 数据搭建,数据拼接,消除测序背景及有效数据构建 数据统计,数据产出统计及测序数据的成分和质量评估
2、数据比对分析 比对分析,与数据库(IMGT)V/D/J基因片段比对 重新比对,寻找最佳V/D/J比对结果
6、IR-SEQ存在的问题
1、构建免疫组库的过程实际上是基于多重引 物PCR来覆盖BCR或TCR序列多样性的过程, 这就会涉及多重引物之间扩增效率导致的 偏好性的问题,一套好的多重引物总会平 衡各对引物之间的扩增效率以及尽量避免 引物间的非特异性扩增和二(多)聚体, 可以说构建的免疫组库质量的好坏直接取 决于其多重引物质量的高低。
4、主流测序技术及优缺点
免疫组库分析的精确性依赖于HTS数据的 可靠性。而HTS数据的可靠性又依赖于测序 的准确性和覆盖的深度。
Thermo测序平台
Ion Torrent:革新性的半导体芯片测序技术 平台
原理是:向 DNA 聚合物中加入 dNTP,会 释放出氢离子。我们采用半导体测定这些 氢离子引起的 pH 变化,通过同时测量数百 万起此类变化,可以测定各个片段的序列。
3、免疫组库的多重引物并不通用,每个物 种甚至每个种系的引物都可能不尽相同。 这意味着每研究一种新的物种的免疫组库, 我们都要重新设计合成该物种的多重引物 以及PCR条件等。另一反面,有的物种胚系 基因序列不全甚至没有,这也给多重引物 的设计带来一定的麻烦。
影响免疫组库组成的因素有很多种。比如 年龄、疾病、免疫记忆、免疫缺陷遗传疾 病、疫苗、器官移植、癌症治疗等。
根据淋巴细胞DNA来源的不同,对于免疫组库 的研究分为以下几大类:健康人士一般采用抽 取外周血的方式;特殊人群比如白血病人或者 白血病细胞微小残留病(MRD)患者,为了深 入研究其免疫组库的变化也将骨髓血作为淋巴 细胞DNA的来源;刚出生的婴儿,其脐带血可 以用于研究人在出生早期与母亲在免疫组库方 面的联系与区别;而对于动物来说尤其是小型 动物,脾脏也是常见淋巴细胞的DNA来源脏器。
以唾液和尿液作为淋巴细胞DNA来源的方式。
2、BCR
B细胞受体(BCR)又称为免疫球蛋白(IG), 它是由B细胞分泌的可以和抗原结合的蛋白质 分子。成熟的B细胞可以将IG分泌到细胞外面 以中和抗原。免疫球蛋白由两条重链(heavy chain, H),两条轻链(light chain, L)中间通 过二硫键连接而成。重链(IGH)由 Variable (V),Diversity(D),Joining(J)和 Constant(C)基因片段重组而来;轻链(IGL) 只由V-J-C重组而来。重链(H链)又分为V区、 C区、跨膜区及胞质区;而轻链(L链)则只有 V区和C区。V区由VH和VL两个结构域组成,各 有3个CDR即CDR1、CDR2和CDR3。
4. 信息分析:对测出来的序列数据进行信息挖掘,来发掘 出生物学意义与结果。数据分析主要包括数据清理、 质量控制、不同样本数据分离、序列比对、序列注释 以及下游的各种分析。
二、免疫组库测序
1、免疫组库测序概念
免疫组库测序(Immune Repertoire sequencing(IR-SEQ))是以 T/B 淋巴细胞为 研究目标,用多重PCR技术或5’RACE扩增决 定B细胞受体(BCR)或T细胞受体(TCR) 多样性的互补决定区(CDR3区),再结合 高通量测序技术(HTS),全面评估免疫系 统的多样性,深入挖掘免疫组库与疾病的 关系。
2、以人体内BCR为例,保守估计BCR的种类多 样性在1011这一数量级级别上,其中骨髓方面 占17%,全身淋巴结占到28%,脾脏和粘膜系 统占23%,外周血方面仅占2%,其他约占 30%。然而我们对人免疫组库的研究往往是以 来源方便的外周血,显然外周血对免疫组库多 样性的贡献率2%远远不足,为了能尽量完全 地反映人群的免疫组库全貌,我们可以通过增 加样本量的方式来弥补单个人外周血免疫组库 不能反映免疫组库全貌的不足,但是巨大的样 本量又让人望而却步。
据推测,胚系VDJC基因片段随机组合、重排以及 TCR α/β链和γ/δ 链V区基因重排产生的TCR克隆数 量高达1015-1018,构成多样性极其丰富的T淋巴细 胞抗原受体库。不同T淋巴细胞克隆有不同序列或 长度的TCR-CDR3基因,翻译出不同的CDR3多肽序 列,从而反映T淋巴细胞功能状态。在发生特异性 免疫应答时,TCR多样性发生变化,出现寡克隆甚 至单克隆扩增,随着胸腺再生,大量原始T淋巴细 胞增殖,TCR免疫组库多样性得以恢复和重建。
3、序列结构分析 分析CDR序列组成及序列碱基成分 分析CDR序列的碱基插入和缺失 编码CDR序列翻译成氨基酸和肽链
4、免疫组库构建 构建免疫组库表达谱,统计多样性抗体库克隆表达情况 免疫组库多样性呈现,绘制V/J基因表达的2D、3D图
5、免疫组库差异分析 样品间多样性差异分析(辛普森系数、香农威纳系数) 样品间克隆表达差异分析(CDR3,V-D-J) 分组样品间的克隆表达差异分析(CDR3,V-D-J)
目录
一. 免疫组库(IR) 二. 免疫组库测序技术 三. 信息分析
1、免疫组库概念
免疫组库(Immune Repertoire,IR)是指 在任何指定时间,某个个体的循环系统中 所有功能多样性B细胞和T细胞的总和。研 究免疫组库就要测定免疫系统中的BCR和 TCR的基因或RNA分子序列。
4、BCR/TCR多样性产生机制
1. 不同VDJ基因片段组合的多样化; 2. 不同基因片段连接时随机插入删除造成连
接的多样化,V(D)J连接区核苷酸的插入和 删除,体现为互补决定区簇CDR3)序列多 样性; 3. 不同重链和轻链组合的多样化; 4. 以及 B 细胞受体特有的随机高频突变。
5、研究免疫组库的流程
1. 提取样本DNA/RNA:根据所要研究的问题设计试验方案, 提取血液或组织样本,分离B细胞或T细胞,然后提取 和纯化DNA/RNA。
2. 构建测序文库:根据不同实验情况加入不同扩增引物进 行PCR扩增,从而扩增出想要测序的免疫基因,最后 构建测序文库。
3. 测序:利用二代高通量测序仪,如Roche 454、Illumina Hi Seq2500、Illumina Mi Seq等进行测序。
决定B淋巴细胞识别抗原的关键部位是最具 多样性的重链CDR3区,其多样性的产生源 于IGHV(51个功能性基因片段)末端IGHD(23个功能性基因片段)-IGHJ前端(6 个功能性基因片段)基因重排及V-D和D-J连 接时非模板依赖性核苷酸插入或剪切和体 细胞高频突变等。
ຫໍສະໝຸດ Baidu
3、TCR
T细胞受(TCR)是由T细胞分泌的膜蛋白分子,与BCR 不同的是TCR只在细胞表面而不分泌出去。一个T细胞的 TCR可以是α链和β链组成的,或者由γ链和δ链组成的。α 链和γ链由V-J-C基因片段重组而来,β链和δ链由V-D-J-C 基因片段重组而来,这也类似于BCR的重链和轻链。参 与特异性免疫应答的T淋巴细胞主要是α/β T淋巴细胞,占 外周T淋巴细胞的90-95%。TCR β 链CDR3在抗原特异性 识别中起关键作用,是直接与抗原肽的结合位点,其编 码基因位于人类7号染色体(7q34),全长620kb,由50 多个可变区(V区)基因片段、2组上游D基因片段/下游 恒定区(C区) 基因片段、6~7个J区基因片段组成,这些 基因在T淋巴细胞发育早期不连续分布,在胸腺内原始T 细胞阶段,D-J区片段连接为 DJ片段;在成熟T淋巴细胞 阶段,V、D、J、C区基因片段相连成 VDJC片段。
2、两种PCR技术的优缺点
Arm-PCR是最新开创的一种高效扩增子救援多重 PCR,它克服了传统多重PCR的缺限。通过在扩 增的早期使用基因靶点特异性的引物,而在指数 扩增期使用共用的引物,使得所有模板的扩增效 率大大提高,因而具有较高的特异性和灵敏性。
3、模板比较
基因组虽然DNA容易制备,但PCR扩增过程 中易产生非产出性的重组序列,且J-C区之 间存在的大量内含子使其下游引物只能位 于J区,PCR扩增的敏感性一般由细胞的拷 贝量决定;相对而言,RNA需取自新鲜的标 本,其产物多为产出性的CDR3序列,下游 引物可选自C区,具有高度的敏感性。
高效靶向覆盖-运用多重PCR设计实现平均 97%靶向覆盖
读长-可选择200bp或400bp读长
5、信息分析
1、基本数据统计 数据过滤,对原始数据进行去除接头污染序列及低质量 reads的处理 数据搭建,数据拼接,消除测序背景及有效数据构建 数据统计,数据产出统计及测序数据的成分和质量评估
2、数据比对分析 比对分析,与数据库(IMGT)V/D/J基因片段比对 重新比对,寻找最佳V/D/J比对结果
6、IR-SEQ存在的问题
1、构建免疫组库的过程实际上是基于多重引 物PCR来覆盖BCR或TCR序列多样性的过程, 这就会涉及多重引物之间扩增效率导致的 偏好性的问题,一套好的多重引物总会平 衡各对引物之间的扩增效率以及尽量避免 引物间的非特异性扩增和二(多)聚体, 可以说构建的免疫组库质量的好坏直接取 决于其多重引物质量的高低。
4、主流测序技术及优缺点
免疫组库分析的精确性依赖于HTS数据的 可靠性。而HTS数据的可靠性又依赖于测序 的准确性和覆盖的深度。
Thermo测序平台
Ion Torrent:革新性的半导体芯片测序技术 平台
原理是:向 DNA 聚合物中加入 dNTP,会 释放出氢离子。我们采用半导体测定这些 氢离子引起的 pH 变化,通过同时测量数百 万起此类变化,可以测定各个片段的序列。
3、免疫组库的多重引物并不通用,每个物 种甚至每个种系的引物都可能不尽相同。 这意味着每研究一种新的物种的免疫组库, 我们都要重新设计合成该物种的多重引物 以及PCR条件等。另一反面,有的物种胚系 基因序列不全甚至没有,这也给多重引物 的设计带来一定的麻烦。
影响免疫组库组成的因素有很多种。比如 年龄、疾病、免疫记忆、免疫缺陷遗传疾 病、疫苗、器官移植、癌症治疗等。
根据淋巴细胞DNA来源的不同,对于免疫组库 的研究分为以下几大类:健康人士一般采用抽 取外周血的方式;特殊人群比如白血病人或者 白血病细胞微小残留病(MRD)患者,为了深 入研究其免疫组库的变化也将骨髓血作为淋巴 细胞DNA的来源;刚出生的婴儿,其脐带血可 以用于研究人在出生早期与母亲在免疫组库方 面的联系与区别;而对于动物来说尤其是小型 动物,脾脏也是常见淋巴细胞的DNA来源脏器。
以唾液和尿液作为淋巴细胞DNA来源的方式。
2、BCR
B细胞受体(BCR)又称为免疫球蛋白(IG), 它是由B细胞分泌的可以和抗原结合的蛋白质 分子。成熟的B细胞可以将IG分泌到细胞外面 以中和抗原。免疫球蛋白由两条重链(heavy chain, H),两条轻链(light chain, L)中间通 过二硫键连接而成。重链(IGH)由 Variable (V),Diversity(D),Joining(J)和 Constant(C)基因片段重组而来;轻链(IGL) 只由V-J-C重组而来。重链(H链)又分为V区、 C区、跨膜区及胞质区;而轻链(L链)则只有 V区和C区。V区由VH和VL两个结构域组成,各 有3个CDR即CDR1、CDR2和CDR3。
4. 信息分析:对测出来的序列数据进行信息挖掘,来发掘 出生物学意义与结果。数据分析主要包括数据清理、 质量控制、不同样本数据分离、序列比对、序列注释 以及下游的各种分析。
二、免疫组库测序
1、免疫组库测序概念
免疫组库测序(Immune Repertoire sequencing(IR-SEQ))是以 T/B 淋巴细胞为 研究目标,用多重PCR技术或5’RACE扩增决 定B细胞受体(BCR)或T细胞受体(TCR) 多样性的互补决定区(CDR3区),再结合 高通量测序技术(HTS),全面评估免疫系 统的多样性,深入挖掘免疫组库与疾病的 关系。
2、以人体内BCR为例,保守估计BCR的种类多 样性在1011这一数量级级别上,其中骨髓方面 占17%,全身淋巴结占到28%,脾脏和粘膜系 统占23%,外周血方面仅占2%,其他约占 30%。然而我们对人免疫组库的研究往往是以 来源方便的外周血,显然外周血对免疫组库多 样性的贡献率2%远远不足,为了能尽量完全 地反映人群的免疫组库全貌,我们可以通过增 加样本量的方式来弥补单个人外周血免疫组库 不能反映免疫组库全貌的不足,但是巨大的样 本量又让人望而却步。
据推测,胚系VDJC基因片段随机组合、重排以及 TCR α/β链和γ/δ 链V区基因重排产生的TCR克隆数 量高达1015-1018,构成多样性极其丰富的T淋巴细 胞抗原受体库。不同T淋巴细胞克隆有不同序列或 长度的TCR-CDR3基因,翻译出不同的CDR3多肽序 列,从而反映T淋巴细胞功能状态。在发生特异性 免疫应答时,TCR多样性发生变化,出现寡克隆甚 至单克隆扩增,随着胸腺再生,大量原始T淋巴细 胞增殖,TCR免疫组库多样性得以恢复和重建。
3、序列结构分析 分析CDR序列组成及序列碱基成分 分析CDR序列的碱基插入和缺失 编码CDR序列翻译成氨基酸和肽链
4、免疫组库构建 构建免疫组库表达谱,统计多样性抗体库克隆表达情况 免疫组库多样性呈现,绘制V/J基因表达的2D、3D图
5、免疫组库差异分析 样品间多样性差异分析(辛普森系数、香农威纳系数) 样品间克隆表达差异分析(CDR3,V-D-J) 分组样品间的克隆表达差异分析(CDR3,V-D-J)