目录

专题

单细胞多元数据整合分析

Eason/编译

不断成熟的单细胞RNA测序技术(single-cell RNA sequencing, scRNA-seq)已经与其它革命性新技术一起,从遗传(genetic)、表观遗传(epigenetic)、空间(spatial)、蛋白质组(proteomic)和谱系(lineage)等各个方面,为我们揭开了单细胞的面纱。虽然还存在计算方面的问题,但这些科技进展也为我们提供了前所未有的机会,让我们能够利用多种不同的技术,对不同种类的细胞进行联合研究。这种综合分析(Integrated analysis)能够发现不同细胞之间的关系,全面了解不同细胞状态的意义,将各个单独的研究和技术获得的数据综合起来进行整体分析。本文,我们将探讨近年来在单细胞层面上综合分析研究的最新进展,重点关注综合分析在基因表达数据方面的应用。

一、单细胞多重检测

Eason/编译

各种单细胞分子检测技术最初关注的都是如何准确地检测单个细胞在某一状态下的某一项指标,比如最开始的半定量检测结果,以及后来的高通量DNA测序结果。最近,大家开始对单细胞多项参数的同时检测产生了兴趣,希望能够对细胞有一个综合的认识和了解。这其中往往就包括单细胞RNA测序工作以及DNA测序、蛋白质丰度检测,或者表观遗传学检测等。我们可以使用4种策略来获得一个细胞的多种数据(图2)。首先,在进行测序之前,使用非破坏性的检测;然后分离不同的细胞组份,同时进行多种试验;接下来,将多种数据进行实验转换(experimental conversion),使其成为常见的分子形式(molecular format),以便能够使用常用的方法(如DNA测序)同时检测多种数据;最后,对这些不同的数据进行分析,比如了解DNA序列、RNA丰度和序列多态性等信息。

二、整合不同单细胞试验获得的数据

Eason/编译

前面,我们重点介绍了同一个细胞不同数据的整合方法,可是在单细胞生物学领域,如何将不同单细胞的数据整合起来,才是一个大难题。另外,还需要解决大量数据集之间的“批次校正(batch-correction)”问题,这也是妥善利用不同实验室和不同试验流程得出结果的先决条件。可是现有的手段都无法适用于单细胞数据分析,因为无法区分不同种类细胞在组份比例上的区别,以及细胞内分子过程上的变化。所以我们迫切需要开发出新的单细胞批次校正技术,而这首要的便是需要能够识别出不同数据集之间共有的生物学状态,比如匹配的细胞种类(图4a)。目前,这个研究领域也已经成为了一个飞速发展的领域。

三、将测序结果与空间数据相结合

Eason/编译

细胞在组织里的空间组织信息往往折射出不同细胞在功能上的区别,以及细胞谱系和最终命运间的差异。基因表达在空间上的差异也增加了给发育中的多细胞器官做注释的复杂程度,因为不同基因的表达决定了细胞不同的分化途径,也决定了这些细胞在空间上的精确排布,并最终决定了整个组织和器官的形成。更重要的是,我们无法通过细胞的RNA表达谱来获得这些空间信息,因为进行RNA测序之前,都会先破坏组织,使细胞溶解、释放出来。可能具有相似基因表达谱的等效细胞(Equivalent cell types)能够在原位保持特定的空间结构,因此,丢失空间结构信息成为很多单细胞分析手段的致命缺陷。将细胞的空间结构信息与基因表达信息相结合,则有望解决这个问题(图6a)。我们可以借助计算机软件,或者同时收集细胞的原位空间坐标信息和基因表达值信息,来达到这个目的。

四、前景展望

Eason/编译

随着各种单细胞研究技术的不断发展和成熟,不论是数据的规模,还是质量,都在飞速增长。