基于知识图谱的可解释和个性化认知推理模型--助力全科医学决策
面向全科诊断决策的基于知识图谱的可解释个性化认知推理模型
背景介绍
全科医学作为社区和家庭医疗的重要组成部分,覆盖了不同年龄、性别、器官系统及各类疾病。其核心理念是以人为中心、以家庭为单位,强调长期负责的综合健康维护和促进。然而,现有证据显示,中国的初级卫生保健(Primary Health Care, PHC)质量仍未达到令人满意的水平。在临床诊断和治疗准确性方面存在着显著需要提升的空间。为了应对这一问题,基于人工智能的决策工具逐渐成为全科医生诊断疾病的有力辅助。然而,现有的研究主要存在两个问题:一是缺乏足够的可扩展性和解释能力;二是现有模型大多操作复杂,难以适用于实际的全科医疗环境。
论文来源
这篇名为《An Explainable and Personalized Cognitive Reasoning Model Based on Knowledge Graph: Toward Decision Making for General Practice》的研究论文由Qianghua Liu, Yu Tian, Tianshu Zhou, Kewei Lyu, Zhixiao Wang, Yixiao Zheng, Ying Liu, Jingjing Ren和Jingsong Li共同撰写。论文发表于IEEE Journal of Biomedical and Health Informatics,卷28,第2期,2024年2月。
研究概要
本文提出了一种基于知识图谱的可解释个性化认知推理模型(Cognitive Reasoning Model based on Knowledge Graph, CRKG),旨在利用患者的电子健康记录(Electronic Health Records, EHRs)和知识图谱,提供个性化诊断和决策支持。特别关注腹部疾病,首先构建了一个半自动化的腹部疾病知识图谱(Abdominal disease Knowledge Graph, AKG)。结合认知科学中的双过程理论,CRKG通过图神经网络和注意力机制实现了对全科疾病诊断的超越。实验证据显示,该模型在精准度和召回率方面均优于现有基线模型。
研究流程
知识图谱构建
知识来源:本研究的知识来源包括中文临床指南、医学书籍和通过UpToDate网站获取的信息。同时,也从PubMed的SemMedDB库和中文版ICD-10自动提取相关知识。
知识提取模板:设计了一个提取模板,将结构化知识以三元组(head, relation, tail)的形式加入知识图谱。实体类型包括疾病、症状、体征、过程、测量、病史、药物等,关系包括“共存”、“是-一种”、“引起”、“影响”、“倾向”和“检查”等。
知识图谱更新策略
为了赋予知识图谱语义信息,设计了一种基于消息传递神经网络(Message-Passing Neural Network, MPNN)的更新策略。具体步骤如下: 1. 节点信息交换:消息从节点h通过关系r传递到目标节点t。 2. 消息聚合:根据所有边的节点信息综合生成节点的隐藏表示。 3. 节点状态更新:运用残差连接方式,避免信息丢失,并引入可学习参数以优化图结构学习。
个人认知图谱构建
每次患者问诊均可被建模为一个认知图谱(Personal Cognitive Graph, PCG)。具体过程如下: 1. 初始认知构建:将患者的初步临床数据作为基础PCG。 2. 直观注意捕获模块:根据患者数据,从知识图谱中抓取相关信息加载至PCG,应用图注意力网络(Graph Attention Network, GAT)进行注意力转移。 3. 显性推理模块:通过显示和有意识的决策进行疾病推理,进一步更新节点状态并最终预测患者的潜在疾病。
实验结果
论文对CRKG模型和现有一些推荐系统基线模型进行了对比实验: 1. 模型性能:CRKG在精准率和召回率等方面表现优异。例如,CRKG在precision@1上达到0.7873,recall@10上达到0.9020, hits@10上达到0.9340,这显著高于其他基线模型。 2. 解释能力:通过模型可以直观地显示每次患者问诊的推理过程,提高临床医生对模型判断的理解,从而增加模型的可解释性。
研究结论与价值
CRKG模型具有显著的科学和应用价值: 1. 科学贡献:本文研究提出的一种结合图神经网络和注意力机制的知识图谱更新策略及推理方法,为认知智能的发展提供了新路径,使得人工智能决策工具更贴近人类的认知过程。 2. 应用前景:该模型不仅能有效提高全科医生的疾病诊断准确性和效率,还可以早期识别关键患者并给予及早转诊建议,为中国初级卫生保健的改进提供了技术支撑。
研究亮点
- 创新方法:CRKG结合了双过程理论(直观认知和分析认知),创新性地设计了半自动知识提取和推理过程。
- 优异性能:实验表明,CRKG在多项指标上均超越现有基线模型,展示了其卓越的诊断性能。
- 可解释性:通过可视化推理过程,增强了医生对模型的信任和理解,提高了模型在临床上的应用潜力。
通过本研究,不仅丰富了全科医疗的智能化工具,同时为进一步探索和应用广泛的健康信息学技术提供了坚实的理论和实践基础。