平行单细胞转录组和染色质可及性测序揭示重编程轨迹的多样性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
平行单细胞转录组和染色质可及性测序揭示重编程轨迹的多样性
导读
为了解结构异质性并揭示成功重编程的机制,本研究采用单细胞RNA测序(scRNA-Seq)和单细胞转座酶可及染色质分析(scATAC-Seq)对不同时间点的重编程细胞进行了分析。研究分析表明,重新编程的细胞以异步轨迹进行,并分化成不同的亚群。并鉴定了荧光探针和表面标记,以丰富早期重编程的人类细胞。此外,表面标记的组合使用使得具有不同重编程倾向的早-中期细胞能够很好地分离。scATAC-Seq分析进一步揭示了负责重编程过程调控阶段的基因组分区和转录因子。FOSL1和以TEAD4为中心的调控网络之间的二元选择决定了成功重新编程的结果。
实验设计
本研究使用OSKM经典方法对人源成纤维细胞进行重编程诱导,再通过基于微流控芯片系统的分离技术,对33468个细胞进行两种单细胞测序,建立测序文库,进行参考成分分析和基因表达差异分析,发现细胞在重编程过程中表现出了极其丰富的多样性。进一步使用10X单细胞转录组库对不同时间点数据进行了细胞轨迹的构建。然后对荧光标记分子库进行了筛选,发现荧光染料BDD2-C8能有效的区分出重编程能力更强的细胞。研究对经过CD13分离的D8细胞建立10X单细胞转录组文库,并对在中间状态中「互斥」的转录因子FOSL1和TEAD4进行验证。
结果
1 人类细胞命运重编程的单细胞谱分析
为了研究人类重编程的异质性,共分析了第0天(BJ)、第2天(D2)、第8天(D8)、第12天(D12)和第16天(D16)OSKM诱导的重编程细胞制备的33468个scRNA-Seq和scATAC-Seq 文库(图1A)。D16时,利用多能干细胞特异性表面标记物TRA-1-60分选细胞,区分成功重编程(D16+)和非重编程(D16-)细胞(图1A)。产生的诱导多能干细胞(iPSCs)用免疫染色、DNA甲基化和畸胎瘤实验进行表征(图1)。在这项研究中,使用两种截然不同的方法进行scRNA-Seq文库制备(图1A)。此外,还筛选了荧光探针来区分准备成功重编程的早期中间细胞(图1A),为上游TF制备了染色质免疫沉淀测序(ChIP-Seq)文库,解析其调控网络(图1A)。大多数基于捕获的scRNA-Seq文库表现出较高的外显子定位百分比(≥75%)和基因检出率(≥20%),在基因体上分布均匀(图1B和1C)。此外,与间充质和成纤维细胞基因相反,上皮和多能性基因随着重编程的推进而逐渐表达。同样,大多数10X文库质量良好(图1G,1H)。UMAP聚类发现从亲代BJ到D16+细胞的动态转录组转变(图1D)。预期ZEB1(间充质)和COL1A1(体细胞)在早期时间点和非重编程细胞中大量表达(图1E和1F)。相反,EPCAM(上皮)和NANOG和LIN28A(多能性)在成功重编程的细胞中高表达(图1E,1F)。同样,大部分scATAC-Seq文库通过了之前报道的质量控制指数,并表现出转录起始位点(TSS)区域和核小体分布的富集(图1G-1I)。总的来说,研究结果为数以万计的重编程细胞生成了可靠的单细胞文库,为破译其深层分子机制提供了丰富的资源。
图1. 用于消除人类细胞重新编程中的异质性的单细胞系统。(A)在人类细胞重新编程的不同时间点上准备的单细胞NGS文库概述。利用微流控平台制备了439个scRNA-Seq和891个scATAC-Seq文库。利用10x基因组学平台制备了32138个高质量的scRNA-Seq文库。(B)基于微流控捕获的scRNA-Seq文库的质量控制。Dotlot 显示了每个scRNA-Seq文库的外显子映射百分比(x轴),以及相应的检测到的基因率(y轴)。(C)基于捕获的scRNA-Seq文库相对于遗传体的平均富集。(D)制备的10X scRNA-Seq文库的UMAP图。(E和F)MET 基因(E)和成纤维细胞和多能基因(F)的表达水平重叠。(G)SCATAC-Seq文库的质量控制。Dotlot展示了每个scATAC-Seq库的库大小(x轴),以及它对各个时间点的HAR的贡献(y轴)。(H)D16+scATAC-Seq文库在基因组转录起始点(TS)附近的平均富集轮廓。(I)揭示核小体模式的D16+scATAC-Seq文库的插入大小
度量直方图。
2 识别具有不同重编程电位的异质性亚组
为了确定每个重编程时间点存在的不同群体,使用参考成分分析对scRNA-Seq文库进行了聚类。BJ细胞与平滑肌谱系显著相关(图1A,1B)。D2细胞被4个不同的亚组(G1~G4)标记,其中G1-2细胞与成纤维细胞和间充质干细胞(MSCs)表现出较低的相关性(图2A)。另一方面,D8细胞分布在三个离散的亚组中。D8 G1细胞与成纤维细胞、平滑肌、肌细胞和MSC
谱系相对应,而G3细胞与PSCs表现出实质性的相似性。D8G2细胞代表中间状态。同样,D16+细胞中存在两个亚群,其中G2细胞与PSCs高度相关,而G1细胞与MSCs、脂肪细胞和内皮细胞保持可检测的相关性(图2A)。综上所述,RCA分析表明重编程细胞具有高度多样性,其中一些可能偏离多能性的途径,获得替代谱系细胞命运。
然后,进行了差异基因表达(DGE)分析,以评价亚组特异性基因。在D2亚组中,G3细胞具有最明显的转录组学特征,仅表达大量基因。而大多数D2 G1-2基因在D16+G2中高表达,但在D16-细胞中不表达,表明它们具有更高的重编程倾向(图2B)。在D8亚组中,G1和G1-2特异性基因在BJ和D16-中高表达,但在D16+细胞中不表达,包括与细胞外基质组织和胶原分解代谢过程相关的基因——如JUNB、LUM、COL1A1和COL6A3——被报道为重编程的障碍。而
D8 G2-3和G3特异性基因则观察到相反的趋势。同样,与RCA相关性一致,D16+G1特异性基因在D16-细胞中也大量表达,含有MMP2等参与细胞外基质组织的基因,暗示D16+G1细胞最多部分重编程(图2B)。另一方面,上皮基因和包括CDH1、NANOG和LIN28A在内的多能基因在D16+G2细胞中特异性表达(图2B)。与此相一致,干性分析揭示了D16+G1特异性基因与分化谱系的关联和D16+G2基因与多能性的关联。为了测试D8亚组的不同重编程电位,研究将其与不同时间点的亚组相关联。D8G3与D16+G2高度相关,而D8G1细胞与D16-细胞和早期时间点(BJ和D2)的细胞密切相关。另一方面,D8G2细胞代表中间状态,与早期时间点的两种细胞和D16+/-中度相关。
3 重编程过程的伪时间轨迹
接下来分析了10X文库,构建了细胞重编程的轨迹,它由9个状态和4个分支事件组成(图2C)。伪时间与实际重编程时间点高度相关(图2C,2D)。为了回答RCA亚组如何在伪时间轨迹中分布,以与Fluidigm scRNA-Seq文库相同的方式从10X文库中识别了RCA亚组,并将RCA亚组身份叠加在轨迹图上(图2E)。从两个数据集中确定的RCA亚组不仅与不同谱系具有相同的相关性模式,而且彼此之间显示出统计学相似性。联合RCA分析证明,与其他D2亚组相比,D2G1-2细胞聚集在更接近D8G2细胞的地方,并且与胚胎干细胞(ESC)命运的相关性更强,进一步证实了它们更高的重编程倾向。至于D8亚组,G1细胞富集了状态9以外的状态(成功重编程),而G3细胞多在状态9中发现(图2E,2F)。另一方面,D8G2细胞主要属于状态4和9(图2E,2F)。有趣的是,状态4(627个细胞)几乎完全由D8G2(544个细胞)组成(图2E,2F)。D16+G2细胞是状态9的主要成分,而D16+G1的细胞在状态8(非重编程)和状态9中均富集,证实了它们的部分或非重编程同一性(图2E)。进一步,亚组特异性标记物沿假时间轴差异表达(图2G)。RFC3(D8G2-3)、GDF3(D8G3)以及NANOG和LIN28A(D16+G2)在成功重编程轨迹上的细胞中高表达,而MMP2(D16+G1)则表现出相反的趋势(图2G)。除了RCA,还检测了系统中小鼠重编程细胞的谱系。根据特征基因的表达,用谱系同一性注释重编程细胞。值得注意的是,在小鼠重编程的早期阶段,间质-上皮转化(MET)事件导致早期细胞群分叉为基质和上皮细胞。观察到间充质基因在早期下调,而大多数上皮基因仅在人类重编程的晚期表达。与此观点一致的是,在人类重编程中,上皮谱系仅在包含晚期时间点(D12和D16)的状态8和状态9中富集此外,滋养层和神经系出现在小鼠重编程的中晚期。同样,也观察到在状态8和9(D12和D16-)的细胞中滋养层和神经系的富集。有趣的是,研究人员发现状态8细胞中的一些(D12和D16-)类似于免疫谱系。