本文介绍了一项关于慢性头晕(chronic dizziness)病因分类的研究,该研究由Xiaowei Xu、Ruixuan Jiang等作者共同完成,并于2024年发表在《Journal of Healthcare Informatics Research》期刊上。研究团队来自中国医学科学院医学信息研究所、北京天坛医院神经内科、清华大学人工智能研究所等多个机构。研究的主要目标是利用大语言模型(Large Language Model, LLM)和机器学习技术,开发一种名为DizzyInsight的创新模型,以提高慢性头晕病因分类的准确性和可靠性。
慢性头晕是指持续3个月或更长时间的眩晕症状,严重影响患者的日常生活和心理健康。常见的慢性头晕病因包括持续性姿势-知觉性头晕(Persistent Postural-Perceptual Dizziness, PPPD)、焦虑和抑郁障碍等。慢性头晕的诊断复杂,涉及多个学科的知识,尤其是在初级医疗环境中,医生往往难以准确诊断。因此,开发一种能够辅助诊断的工具显得尤为重要。
研究团队设计了一个名为DizzyInsight的模型,该模型基于大语言模型ChatGLM,能够从病历记录中提取特征数据,并构建决策树进行病因分类。研究分为三个主要模块:数据转换引擎、验证处理器和决策建模器。
研究纳入了260名患者的数据,平均年龄为59.52岁,女性占59.62%。最常见的诊断为PPPD(51.92%)和焦虑及抑郁障碍(43.85%)。DizzyInsight模型在分类PPPD和焦虑及抑郁障碍方面表现出较好的性能,PPPD的阳性预测值为0.69,敏感性为0.86;焦虑及抑郁障碍的阳性预测值为0.81,敏感性为0.66。
研究还对比了基于BERT模型和直接使用大语言模型的分类效果。结果显示,BERT模型在某些方面表现优于DizzyInsight,尤其是在PPPD的分类准确性和焦虑及抑郁障碍的敏感性方面。然而,DizzyInsight在数据提取和模型可解释性方面具有优势。
DizzyInsight模型的开发为慢性头晕的病因分类提供了一种新的工具,尤其是在初级医疗环境中,能够帮助医生快速确定诊断方向,减少不必要的检查,提高诊断效率。此外,该研究展示了利用大语言模型处理非结构化医疗数据的潜力,为未来的医疗决策支持系统开发提供了新的思路。
尽管DizzyInsight模型表现出较好的性能,但仍存在一些局限性。首先,模型的准确性依赖于专家的领域知识输入,若专家在特征识别中出现错误,模型无法自行修正。其次,大语言模型在处理数据时可能存在“幻觉”问题,即生成不准确的信息。未来研究需要进一步探索如何提高模型的内部自验证能力,以增强其准确性。
DizzyInsight模型为慢性头晕的病因分类提供了一种创新的解决方案,展示了利用大语言模型和机器学习技术提升医疗诊断效率的潜力。未来的研究应进一步验证该模型在初级医疗环境中的适用性,并探索其在其他医疗领域的应用。