StrokeClassifier:使用电子健康记录的集合共识模型进行缺血性脑卒中病因分类

StrokeClassifier:人工智能工具基于电子健康记录对缺血性卒中进行病因分类

项目背景及研究动机

脑卒中(尤其是急性缺血性卒中,AIS)的病因识别工作对二次预防至关重要,但诊断起来往往非常困难。在美国,每年的缺血性卒中新发病例近67.6万,其中四分之一的患者曾有过卒中史。这种病症的再发率较高,甚至可能导致死亡或进一步的残疾。缺血性卒中的病因可以多种多样,包括大动脉粥样硬化、心源栓塞、小血管病以及其他罕见病因。然而,美国大约20-30%的缺血性卒中患者在经过评估后,病因依然无法确定,被归类为隐源性卒中。这部分患者的再发卒中风险特别高。因此,能够准确识别隐源性卒中的病因,对于优化治疗方案、提高患者预后具有重要意义。然而,做出准确诊断需要整合大量的数据,包括临床史、体检结果、实验室数据、心脏节律检测、影像学检查等。由于新血管专家紧缺,诊断能力可能受到限制。本文的作者们试图通过开发一种自动化、基于电子健康记录(EHR)的人工智能工具,对脑卒中病因进行分类,以提高诊断的准确性和一致性。

论文及作者信息

该研究论文题为“strokeclassifier: ischemic stroke etiology classification by ensemble consensus modeling using electronic health records”,由Ho-Joon Lee, Lee H. Schwamm, Lauren H. Sansing, Hooman Kamel, Adam De Havenon, Ashby C. Turner, Kevin N. Sheth, Smita Krishnaswamy, Cynthia Brandt, Hongyu Zhao, Harlan Krumholz和Richa Sharma共同撰写,文章发表于《NPJ Digital Medicine》期刊,并公开于与首尔国立大学Bundang医院合作的特刊中。

研究流程及方法

研究对象及数据来源

论文选取了来自两个学术医院的2039名非隐源性AIS患者的EHR文本数据,开发并验证了一种名为StrokeClassifier的自动分类工具。另有406份来自MIMIC-III数据集的出院总结文本,通过一名血管神经学家进行了外部验证。研究利用了自然语言处理(NLP)技术从出院总结文本中提取特征,生成9种机器学习分类器构成的集合共识元模型。通过对比血管神经学家的诊断结果,StrokeClassifier在多类分类任务中实现了平均交叉验证准确率0.74,权重F1值为0.74。在MIMIC-III数据集中,准确率和权重F1值分别为0.70和0.71。最重要的五个特征包括房颤、年龄、大脑中动脉闭塞、颈内动脉闭塞和额叶卒中位置。通过设计确定性启发法,对788名隐源性卒中的患者进行分类,将隐源性诊断率从25.2%降低到7.2%。

算法及模型开发

研究样本由3,262条具有AIS诊断的出院总结组成,分别来自YNHH、MGH和BIDMC。提取的特征包括医学史、影像学、心脏、实验室数据和UMLS概念唯一标识符(CUI)。采用了多种机器学习算法(包括逻辑回归、支持向量机、随机森林和XGBoost)进行模型训练,并对模型的超参数进行了优化。对2039名非隐源性卒中样本进行了预处理,使用Metamap作为输入进行模型开发,并使用MICE在衍生队列样本上进行特征插补;在外部验证队列上使用基于随机森林的插补。主要利用PCA(主成分分析),以提高数据的降维性能,并选择了前十个特征对每个类进行进一步的模型开发。最终,采用了多目标模型形成的“StrokeClassifier”进行集合共识分类。

研究结果

StrokeClassifier对多类分类任务进行了性能评估,并进行了准确性与模型性能对比。结果表明,基于回归Logistic(LR)、支持向量机(SVC)、XGBoost(XGB)和随机森林(RF)优化的模型均显示出较高的交叉验证准确性和F1分数。StrokeClassifier在外部验证上表现出比单个基础模型更高的预测性能。集合模型通过一定程度的偏差减少方法,提升了模型输出的鲁棒性和通用性。对比血管神经学家所提供的病因诊断结果,StrokeClassifier对多类非隐源性卒中病因预测平均准确性为0.744,平衡准确性为0.710,权重F1为0.740,普遍与神经学家裁定结果达成了一致。

进行300次重复多层级交叉验证后,进一步验证了模型的性能与普适性。不同年龄、性别和种族亚组的分析显示,StrokeClassifier在不同实验类别下的预测性能能有效适应多种临床背景。

对于Misclassification(错误分类)的样本,研究通过对特征频率进行进一步分析,确保模型能够正确处理未来处理类似数据时的误判情况,示范了9个基本模型的广泛验证结果。对于具有特定Toast病因的隐源性卒中患者,应用一种特定的确定性启发法进行了进一步分类,证明该工具在多类分类与外部验证数据集中的优越性能。

研究结论与意义

该研究证明了StrokeClassifier作为一种自动化机器学习工具在缺血性脑卒中病因分类上的高效性与准确性,其与血管神经学家提供的诊断水平相当。通过进一步的训练和临床应用,StrokeClassifier可以作为临床决策支持系统,显著提高卒中病因诊断的准确性,推动针对具体病因的治疗方案的及时实施,同时增强临床研究和公共卫生工作的进展。

StrokeClassifier在EHR文本数据输入下,通过自动化、实时的方式实现对脑卒中病因的分类,具有广泛的应用前景。它可以在健康系统中复杂的合并数据分析任务中应用,特别是在缺乏专业知识的医疗环境中,改善诊断一致性与准确性,推动高效诊疗过程的标准化。

该研究通过详细的数据分析与模型优化,为未来研究提供了坚实的基础,进一步应用在多个临床和流行病学领域,将对卒中防治工作带来持续的科研进展与临床收益。