从技术的角度看,随着单细胞测序技术的发展,其研究范围不再局限于转录组,而是扩展到了基因组、免疫组、表观组、蛋白组等多组学水平,研究对象涉及染色质、DNA、表观、转录因子、组蛋白、细胞表面蛋白等多种分子信息。基于单细胞多组学数据,细胞聚类既可以通过来自相似细胞群的参考数据集中现有的细胞类型注释对细胞进行聚类,也可以执行无监督聚类来识别相似细胞组,并利用其它分子层面数据来进行的更精细的划分。
例如转录组数据可用于鉴定不同细胞类型或状态之间差异表达的基因,基因组数据能够在单细胞水平检测基因拷贝数变化、单碱基突变、插入缺失及等信息,染色质可及性数据可用于鉴定可及区域和富集的 DNA 基序,表观组数据可用于鉴定不同细胞类型或状态之间的差异甲基化区域,蛋白质组数据可用于了解细胞间相互作用等。此外,近年来新出现的空间转录组测序方法及其数据整合算法,提供了细胞的空间信息,为单细胞测序技术进行了补充。
而从应用角度看,在肿瘤发生等复杂的生物过程中,异质性同时存在于基因组、转录组、表观组、免疫组等多层面,基因相同的肿瘤细胞可能具有不同的 DNA 甲基化、基因表达、克隆扩增模式,因此常常需要多组学技术才能更加准确地将它们分类为不同亚群,揭示更深层的生物学机制。
图 4-5 多组学数据整合下的细胞聚类与注释
(Tim et al. Nature reviews genetics 2018)
图 4-6 单细胞测序技术扩展到多组学和多分子水平
单细胞免疫组测序
免疫组库是指在特定时间段内,机体所有有功能的 T 细胞和 B 细胞的总和。人体的适应性免疫系统主要依靠于 T 淋巴细胞和 B 淋巴细胞表面的 T 细胞受体(TCR) 和 B 细胞受体(BCR),其受体上的互补决定区(CDR) 与 MHC- 抗原肽分子进行识别并特异性结合。BCR/TCR 存在一块区域叫作互补决定区(CDR), 由 CDR1、CDR2、CDR3 组成,CDR1 和 CDR2 都是由 V 基因编码,而 CDR3 是由 V、D、J 三个基因编码形成,所以 CDR3 多样性程度高,是主要参与抗原识别的区域。
免疫组库测序(Immune Repertoire sequencing(IR-SEQ)) 是以 T/B 淋巴细胞为研究目标,通过多重 PCR 或 5’RACE 技术特异性扩增决定 B 淋巴细胞受体(BCR) 或 T 淋巴细胞受体(TCR) 多样性的互补决定区(CDR3 区),再结合高通量测序技术,全面评估免疫系统的多样性,深入挖掘免疫组库与疾病的关系。免疫组库测序技术应用非常广泛,目前已经在肿瘤预后评价、白血病微小残留病变监测、自身免疫性疾病诊断和疾病生物标志物开发等方面取得了一定的进展。
单细胞免疫组库测序是在免疫组库测序加入单细胞分选技术,在单细胞水平进行的免疫组库测序,可在免疫组库测序提供的信息基础上,揭示细胞的免疫异质性信息,更加全面、深入地揭示肿瘤、疾病中的免疫机制。
单细胞蛋白质组学
尽管单细胞基因组和转录组能够揭示单细胞水平的 DNA 和 RNA 结构,但是在细胞内主要发挥功能的成分是蛋白质,因而研究单细胞蛋白质组学成为新兴领域。单个细胞中蛋白质的总量通常小于 1ng,比用于常规蛋白质组分析的量至少减少 100 倍,而且数以千计的蛋白质具有高度的动态范围和化学计量,因而单细胞蛋白质组学目前还存在诸多难点,技术仍处于早期发展阶段。前文介绍的质谱流式技术和其他流式技术都是目前已有的重要的单细胞蛋白组学技术。
目前,单细胞蛋白组学技术主要对细胞表面蛋白的检测,通过类似于流式细胞术的表面抗体标记技术,将细胞的免疫表型与转录组学得到的细胞群相匹配。不同于流式细胞术的荧光标记抗体,单细胞表型的蛋白质组学使用寡核苷酸耦合的抗体,从而不受限于荧光通道和荧光补偿,可以在单细胞表面标记上百种甚至上千种蛋白,从而显著提高了基于流式细胞术和质谱流式的单细胞蛋白质组的通量。
主流的单细胞蛋白质组的检测有 BD 公司的 AbSeq 和 Biolgend 公司的 TotalSeq。
BD 公司的 AbSeq 平台,结合 BD 公司的 Rhapsody,将单细胞表面标记和测序相结合,基于细胞表面的标记的 Hashtag 抗体,能够对不同样品来源的细胞进行 barcode 标记,提高通量、降低成本。此外如 4.2 章所述,有自身对应的转录组和免疫组的后续流程。同为 Rhapsody 系统,使用的蜂巢板技术是依靠细胞重力自由沉降,避免了 10x Genomics 中存在的碰撞,所以对于起始细胞活性要求较低。此外,BDTMAbSeq 抗体 - 寡核苷酸复合物利用寡核苷酸测序来获得多重蛋白检测,用于单细胞水平的多组学分析,使得研究者可以在同一实验中同时检测蛋白质(抗体 - 抗原相互作用分析)和 mRNA 表达。BD 多样本分析试剂盒,同样利用抗体偶联样本标签(寡核苷酸序列)对不同来源样本进行标记,然后混样进行检测,可以显著降低时间成本和实验成本(较多可实现 12 个样本的同时检测),还可以通过样本标签识别多细胞数据,提高单细胞数据质量。
Biolgend 的 TotalSeq 技术是目前应用较广泛的单细胞蛋白质组方案。TotalSeq 无缝对接现有的单细胞 RNA 测序工作流程中,包括 Drop-Seq 和 10x Genomics 提供的工作流程,如 Cellranger 等,使数据分析效率显著提高。同时提供三类不同的寡核苷酸偶联抗体:TotalSeqA, B, C,分别对应 10x Genomics 的单细胞转录组和免疫组的应用。现有的表面标记抗体超过一千种,能够对单细胞的免疫表型进行全面解读。同时开发 cell-hashing 的技术,使用 hashtag 抗体对不同样本进行标记,从而在后续分析中通过去卷积的方法获得对应样品的数据信息,显著提高输入样品的通量和实验成本。此外,Biolegend 提供预制混合好的冻干的抗体组合,使用方便且通量提高。
更多伯豪生物服务