单细胞拷贝数变异与事件历史重建的SCICONE模型
肿瘤的发展过程中,基因组拷贝数变异(Copy Number Alterations, CNAs)是驱动肿瘤异质性和进化的重要因素。理解这些变异对于开发个性化的癌症诊断和治疗方法至关重要。单细胞测序技术提供了最高分辨率的拷贝数分析,能够深入到单个细胞水平。然而,低读深(low read-depth)的全基因组测序数据给拷贝数变异的检测带来了巨大的统计和计算挑战。现有的计算方法大多忽略了细胞之间的进化关系,导致检测结果不够准确。因此,开发一种能够结合细胞进化历史的拷贝数检测方法成为当前研究的迫切需求。
论文来源
本论文由ETH Zurich(瑞士联邦理工学院)和SIB Swiss Institute of Bioinformatics(瑞士生物信息学研究所)的研究团队共同完成,主要作者包括Jack Kuipers、Mustafa Anıl Tuncel、Pedro F. Ferreira、Katharina Jahn和Niko Beerenwinkel。论文于2025年发表在《Bioinformatics》期刊上,标题为“Single-cell copy number calling and event history reconstruction”。
研究流程
1. 研究目标与方法概述
本研究的核心目标是开发一种名为SCICONE的统计模型和马尔可夫链蒙特卡罗(MCMC)算法,用于从低读深的单细胞全基因组测序数据中重建拷贝数变异事件的历史,并推断单个细胞的拷贝数图谱。SCICONE通过整合细胞的进化关系,提高了拷贝数检测的准确性。
2. 数据预处理与分段
研究首先对单细胞测序数据进行了预处理,包括GC含量和映射偏差的校正。接着,采用动态规划方法检测基因组中的断点(breakpoints),将基因组划分为多个拷贝数相同的片段。这一步骤的关键在于结合多个细胞的信号,识别出显著的拷贝数变化区域。
3. 拷贝数事件树构建
SCICONE通过构建拷贝数事件树(CNA tree)来模拟肿瘤的进化历史。事件树的节点代表拷贝数事件(如扩增或缺失),而树的拓扑结构则反映了这些事件的顺序和关系。研究采用MCMC算法对事件树进行采样,以找到最可能的树结构和事件组合。
4. 拷贝数图谱推断
在事件树的基础上,SCICONE推断每个细胞的拷贝数图谱。通过将细胞分配到事件树的节点上,研究能够根据路径上的拷贝数事件推断出每个细胞的拷贝数状态。这一过程不仅提高了拷贝数检测的准确性,还能够揭示肿瘤的克隆结构。
5. 模拟与真实数据验证
研究通过模拟数据和真实肿瘤样本验证了SCICONE的性能。模拟数据涵盖了不同读深和片段数量的情况,结果显示SCICONE在低读深和高噪声条件下表现优异。在真实数据中,SCICONE成功重建了三阴性乳腺癌样本的拷贝数进化历史,并检测到了关键的驱动基因变异。
主要结果
1. 模拟数据验证
在模拟数据中,SCICONE在低读深(2x-8x)和高噪声条件下表现出色,拷贝数检测的准确性显著高于其他方法(如HMMCopy、Ginkgo和Scope)。特别是在处理小片段拷贝数事件时,SCICONE的优势更加明显。
2. 真实数据应用
在三阴性乳腺癌样本中,SCICONE重建了肿瘤的克隆结构,并检测到了TP53、PIK3CA和AKT1等关键基因的拷贝数变异。此外,研究还发现了一种全基因组复制事件,这在肿瘤进化中具有重要意义。
3. 算法性能比较
与现有的拷贝数检测方法相比,SCICONE在准确性和鲁棒性方面均有显著提升。特别是在处理低读深数据时,SCICONE能够更好地分离信号与噪声,提供更可靠的拷贝数图谱。
结论与意义
SCICONE通过整合细胞的进化关系,提供了一种全新的单细胞拷贝数检测方法。其核心优势在于能够同时推断拷贝数图谱和进化历史,从而更准确地揭示肿瘤的克隆结构和进化动态。这一方法不仅具有重要的科学价值,还为个性化癌症治疗提供了新的工具。
研究亮点
- 整合进化历史:SCICONE首次将拷贝数检测与细胞进化历史相结合,显著提高了检测的准确性。
- 动态规划断点检测:研究开发了一种基于动态规划的断点检测方法,能够有效识别拷贝数变化的区域。
- MCMC算法优化:通过MCMC算法,SCICONE能够在复杂的树结构空间中进行高效搜索,找到最可能的进化模型。
- 广泛应用前景:SCICONE不仅适用于低读深的单细胞测序数据,还可用于靶向测序和多组学数据分析,具有广泛的应用前景。
其他有价值的信息
研究团队还提供了SCICONE的开源实现,代码可在GitHub上获取(https://github.com/cbg-ethz/scicone)。此外,研究还提供了详细的Snakemake工作流,方便其他研究者复现实验结果。
通过本研究的创新方法,未来有望在肿瘤进化分析、癌症诊断和治疗策略优化等领域取得更多突破。