心电图诊断基础模型:诊断与解释

基于信号-语言架构的心电图诊断基础模型研究

学术背景

心血管疾病(CVD)是全球范围内导致死亡的主要原因,早期识别高风险人群至关重要。心电图(ECG)作为一种非侵入性、成本低廉且广泛应用的诊断工具,每年记录超过3亿次,是早期诊断心血管疾病的重要手段。然而,即使是经验丰富的心脏病专家,解读复杂的心电图仍然是一项耗时且容易出错的任务。在偏远和医疗资源匮乏的地区,提供准确的诊断尤为困难。

近年来,人工智能(AI)在心电图解读中的应用显示出巨大潜力。研究表明,基于AI的心电图诊断在某些特定疾病的诊断上已经超越了普通心脏病专家。然而,现有的主流自动心电图诊断系统通常针对少数特定疾病进行训练,数据分布的差异和多中心疾病的广泛性使得这些模型难以直接应用于其他中心的数据集。因此,开发一种能够在初始训练后不依赖标注数据的自动诊断系统,对于大规模多中心临床环境,尤其是偏远和医疗资源匮乏地区,具有重要的实际意义。

论文来源

本论文由Yuanyuan Tian、Zhiyuan Li、Yanrui Jin等作者共同撰写,作者来自上海交通大学机械系统与振动国家重点实验室、人工智能研究院以及上海交通大学附属第一人民医院心内科。论文于2024年12月17日发表在《Cell Reports Medicine》期刊上,题为《Foundation Model of ECG Diagnosis: Diagnostics and Explanations of Any Form and Rhythm on ECG》。

研究流程

1. 模型设计与训练

研究团队提出了一种基于信号-语言架构的心电图诊断基础模型(KED),该模型利用大语言模型(LLMs)将心电图信号的领域知识融入模型训练中。KED模型在近16万名患者的80万份心电图数据上进行训练,尽管训练数据来自单一中心,但该模型在包括中国、美国和其他地区的不同人群中表现出卓越的零样本诊断能力。

2. 数据集与评估

研究使用了MIMIC-IV-ECG临床数据库进行预训练,该数据库包含来自Beth Israel Deaconess医疗中心的急诊、住院和门诊患者的约80万份心电图数据。为了全面评估模型的诊断性能,研究团队使用了五个外部数据集,分别来自中国、美国东南部和其他地区,涵盖了不同种族、年龄和心电图采集设备。

3. 模型架构

KED框架包括四个主要模块:心电图信号编码器、知识编码器、标签查询网络(LQN)和分类头。在训练阶段,研究团队提出了一种新的对比学习策略——增强信号-文本-标签对比学习(AugCL),通过引入标签维度来构建独立的对比空间,从而减少多标签分类中的噪声。

4. 零样本诊断与微调

研究团队评估了KED模型在零样本诊断和少样本微调中的表现。零样本诊断指的是模型在没有额外训练数据的情况下对未知类别的数据进行诊断。研究结果表明,KED模型在多个外部数据集上表现出色,尤其是在中国、美国东南部和其他地区的不同人群中,模型能够对训练中未遇到的疾病进行诊断。

主要结果

1. 中国人群中的零样本诊断表现

在中国人群的心电图数据集(CPS2018和Chapman)上,KED模型表现出色。例如,在CPS2018数据集中,模型对心房颤动、早搏、传导阻滞等异常心电图数据的零样本诊断AUC(曲线下面积)达到了0.900,敏感性为0.695,特异性为0.949。对于训练中未遇到的ST段压低(STD),模型也表现出一定的诊断能力。

2. 美国东南部人群中的零样本诊断表现

在代表美国东南部人群的Georgia数据集上,KED模型对20种心电图描述的零样本诊断AUC为0.900,敏感性为0.696,特异性为0.925。对于训练中未遇到的Q波异常(QAB)和T波倒置(TINV),模型也表现出一定的诊断能力。

3. 其他地区人群中的零样本诊断表现

在代表其他地区人群的PTB-XL数据集上,KED模型对46种心电图陈述的零样本诊断AUC为0.744,敏感性为0.623,特异性为0.768。对于训练中未遇到的某些缺血性心脏病,模型也表现出一定的诊断能力。

4. 与心脏病专家的比较

在临床数据集上,KED模型的零样本诊断性能与中国顶级医院的三位心脏病专家相当。例如,模型对心房颤动的诊断AUC为0.994,敏感性为0.949,特异性为0.975,与专家的诊断性能相当。

结论与意义

KED模型展示了卓越的零样本诊断能力和泛化性能,能够在不同地区、种族和心电图采集设备的数据上进行有效诊断,甚至能够对训练中未遇到的疾病进行诊断。这一能力在医疗资源匮乏的地区具有重要的应用价值,能够辅助诊断和早期快速筛查。

此外,KED模型通过少样本微调能够快速适应目标人群的心电图模式变化,进一步提升了其在实际环境中的应用潜力。研究团队提出的信号-语言架构、知识增强方法和对比学习策略为心电图诊断模型的开发提供了新的思路。

研究亮点

  1. 零样本诊断能力:KED模型能够在没有额外训练数据的情况下对未知类别的疾病进行诊断,展示了强大的泛化能力。
  2. 多中心数据适用性:模型在不同地区、种族和心电图采集设备的数据上表现出色,突破了传统模型的局限性。
  3. 少样本微调:通过少量目标中心数据的微调,模型能够快速适应新的心电图模式,提升了实际应用中的灵活性。
  4. 信号-语言架构:研究团队提出的信号-语言架构通过文本作为监督信号,充分利用了大语言模型的丰富语义知识,提升了模型的零样本迁移能力。

其他有价值的信息

研究团队还探讨了KED模型的局限性,例如训练数据中的错误标签问题和大语言模型的幻觉风险。未来的研究将致力于收集更多手动标注的数据,并探索更精确的心电图与医学文本知识对齐方法,以进一步扩展模型的应用范围。

KED模型为心电图诊断提供了一种新的解决方案,具有广泛的应用前景,尤其是在医疗资源匮乏的地区,能够显著提升心电图诊断的效率和准确性。