一组计算生物学家开发了一种算法,可以将多个测序数据集与单细胞分辨率“对齐”。今天发表在“自然生物技术”杂志上的这种新方法,有助于更好地了解疾病进展过程中不同细胞群的变化,药物治疗或进化过程。
“这种数据整合方法将能够比较单细胞数据集和剖析它们之间差异的能力,”该研究的资深作者Rahul Satija解释说,他是纽约大学基因组学和系统生物学中心的助理教授,纽约基因组中心的核心教员。“此外,这些方法对于整合个体和实验室产生的各种数据集非常有价值 - 甚至对研究不同物种的相同组织的研究人员也是如此。”
单细胞测序领域正在迅速扩大,有可能精确研究生命的基本构建模块如何发挥作用和发展。但是,仍然存在重大的计算挑战,特别是在分析多个数据集时。例如,当团队独立分析由两个独立实验室生产的相同骨髓干细胞的数据集时,他们获得了截然不同的结果。
“我们需要一种新方法,可以识别和对齐多个实验中存在的共享细胞群,以便我们可以将数据集整合在一起,”纽约大学研究生,该研究的第一作者安德鲁巴特勒说。
为了实现这一目标,研究人员修改了专门用于查找图像共享模式的分析技术 - 例如,针对单细胞测序数据在不同光照条件下对齐面部可视化。当他们重复进行骨髓分析时,同样的细胞群体一直出现。
“我们意识到我们可以用这些方法来了解细胞如何改变它们的行为 - 例如,响应药物治疗,”巴特勒指出。
通过分析用干扰素刺激的人体免疫细胞数据集- 一种响应病原体或肿瘤细胞而产生的信号蛋白- 研究小组可以精确地识别13种应答细胞类型中每种基因的基因。此外,他们整合了来自人类和小鼠的胰腺组织的单细胞数据集,从而鉴定了跨物种共享的10种细胞类型,并定义了每组中发生的进化变化。
展望未来,研究人员正在应用他们的方法来研究临床样本中的细胞药物反应,同时也旨在使他们的方法广泛可用。
“我们所有的软件都是开源的,可以在线免费获得,”Satija补充道。“我们希望这些方法能够帮助社区中的其他人发现激动人心的新生物现象。”