St. Jude Survivorship Portal:分享和分析大规模临床和基因组数据集

St. Jude Survivorship Portal

St. Jude Survivorship Portal: 分析及共享儿童癌症幸存者的大规模临床和基因组数据

研究背景

在美国,儿童癌症的五年生存率已从20世纪70年代的约60%上升到今天的超过85%。尽管生存率显著提高,但这些儿童癌症幸存者却面临着由于癌症及其治疗而导致的各种不良健康结果的风险。这些不良结果包括过早死亡、器官功能障碍、新生肿瘤、不良的社会经济结果、心理社会挑战以及总体生活质量的下降等。为了应对这些问题,主要的研究工作集中在确定其潜在原因、相关风险以及最易感的患者亚群。

与此有关的大规模纵向研究如St. Jude Lifetime Cohort (SJLife)和Childhood Cancer Survivor Study (CCSS)已生成了大量关于幸存者的综合数据,涵盖了人口统计、诊断、治疗、临床评估、慢性健康状况、自我报告以及全基因组测序 (WGS)数据。这些数据对幸存者研究社区来说是无价的资源,在过去的25年中,这些数据被用于数百篇幸存者研究的发表。

研究来源

这篇题为“St. Jude Survivorship Portal: Sharing and Analyzing Large Clinical and Genomic Datasets from Pediatric Cancer Survivors”的研究文章,由Gavriel Y. Matt、Edgar Sioson、Kyla Shelton、Jian Wang、Congyu Lu等学者共同完成,来自St. Jude Children’s Research Hospital等多个研究机构。该文章发表于《Cancer Discovery》期刊。

研究流程

为了改进癌症幸存者数据的可访问性,研究团队开发了St. Jude Survivorship Portal,这是首个用于共享和探索儿童癌症幸存者数据的门户网站。该门户网站包含了来自超过7700名儿童癌症幸存者的 extensive 临床数据和统一的生殖系WGS变体基因型数据。

数据分享和功能

  1. 数据种类:门户网站集成了SJLife和CCSS两个幸存者队列的数据,总共有5053名SJLife幸存者和2688名CCSS幸存者。队列数据包括从人口统计、癌症诊断、治疗、临床评估、慢性健康状况到自我报告的各种变量,共计1600多个表型变量和4亿个遗传变异。

  2. 数据可视化和分析:用户可以利用门户内的交互式数据词典和基因浏览器,访问和探索这些数据。变量的概要统计是动态计算的,并通过可自定义的交互式图表进行可视化,包括条形图、小提琴图和散点图等。

  3. 分析工具:门户提供了多种分析工具,包括累积发生率分析和回归分析。用户可以使用这些工具对幸存者数据进行实时分析。此外,还提供了一个受控访问界面,允许用户下载个体幸存者数据以进行离线分析。

工作流程详细介绍

  1. 数据获取:首先从两个主要的数据来源 (SJLife和CCSS) 获取所有相关数据。

    • SJLife:包括从1962年到2012年在St. Jude儿童研究医院接受治疗的幸存者。
    • CCSS:包括从1970年到1999年在美国和加拿大的31个儿科肿瘤机构接受治疗的幸存者。
    • 全基因组测序 (WGS) 数据:在血液样本中进行,并覆盖了超过30倍的一致性。
  2. 数据处理和存储:将收集到的表型数据和基因型数据进行加工处理并存储。

    • 表型数据:组织成层级数据字典,便于用户浏览。
    • 基因型数据:通过叫变异和联合基因分型分析生成。
  3. 门户开发与实现:使用先进的工程技术确保用户能在门户内进行实时的数据探索和分析。

    • 技术栈:JavaScript语言、Node.js环境、SQLite等。

分析和结果

  1. 表型和遗传数据分析:通过门户的数据词典和基因浏览器对幸存者队列数据进行探索。用户可以选择不同的变量查看其概要统计信息,并通过交互式图表进行数据可视化。例如,用户可以分析某特定癌症诊断组中的遗传变异及其与患者人种的关系。

  2. 耳毒性分析:研究团队应用了门户的分组和总结绘图功能,对铂类化疗药物(如顺铂和卡铂)的耳毒性效应进行了研究。分析结果表明,接受顺铂治疗的幸存者更容易出现严重的听力损失,而卡铂的耳毒性相对较低。

  3. 心理健康和截肢之间的关联:研究人员通过回归分析功能,发现了心理健康、年龄和截肢之间的新的相互作用。数据显示,截肢幸存者的心理健康状况受年龄影响,年龄越小,心理健康风险越高,其机制可能是年龄较大的患者截肢后更能适应和恢复。

  4. 心肌病的累积发病率和遗传关联分析:研究表明,非裔幸存者较高的心肌病风险主要由男性驱动。此外,通过研究NRG1基因位点,在非裔幸存者体内发现了与心肌病显著相关的变异。

研究亮点

  1. 数据开放访问:包括实时数据探索和分析功能的St. Jude Survivorship Portal,是第一个公开共享和探索儿童癌症幸存者数据的门户网站,为研究社区提供了强大的研究工具。

  2. 新发现带来的科学价值:通过Portal,研究人员能轻松验证和探索如ARID5B基因的关联性研究,以及新发现的与心肌病风险相关的Magi3基因位点的单倍型,推动了研究的透明度和可再现性。

  3. 未来扩展计划:计划将包括纵向数据、单细胞多组学数据和图像数据等纳入Portal,不断丰富数据类型和功能,进一步扩大研究队列,提高诊断和治疗的标准,带动更深入的幸存者研究。

St. Jude Survivorship Portal通过提供对大量临床和基因数据的访问和分析工具,极大地推动了儿童癌症幸存者研究的发展。未来的扩展计划将进一步提升其科研价值,为长期研究提供坚实的数据支持。