多模态大语言模型在放射学图像解释中的准确性评估

大型语言模型在放射学图像解读中的表现:与人类读者的比较研究 学术背景 近年来,大型语言模型(Large Language Models, LLMs)在多个领域展现了强大的能力,尤其是在自然语言处理方面。随着多模态LLMs的发展,这些模型不仅能够处理文本,还能够处理音频、视觉和视频等多种输入形式。代表性的多模态LLMs包括OpenAI的GPT-4 Turbo with Vision(GPT-4V)、Google DeepMind的Gemini 1.5 Pro以及Anthropic的Claude 3。这些模型在放射学领域的应用也逐渐增多,尤其是在生成和结构化放射学报告方面。然而,尽管LLMs在文本输入方面表现出色,其在解读放射学图像方面的能力仍然受到质疑。此前的研究表明,LLMs在基于患者病史和...

人工智能解释类型对胸部X光诊断性能及医生信任度的影响

人工智能解释类型对医生诊断表现和信任的影响 学术背景 近年来,人工智能(Artificial Intelligence, AI)在医疗保健和放射学领域的诊断系统发展迅速,尤其是在辅助超负荷工作的医疗提供者方面,AI系统展现了改善患者护理的潜力。截至2022年,美国食品药品监督管理局(FDA)已批准了190个放射学AI软件程序,且批准率逐年上升。然而,AI从概念验证到实际临床应用的整合仍存在巨大鸿沟。为了弥合这一差距,培养对AI建议的适当信任至关重要。尽管高准确性的AI系统已在真实临床环境中证明了其提升医生诊断表现和患者结果的能力,但错误的AI建议可能会降低诊断表现,这无疑导致了AI在临床中的延迟应用。 医生们呼吁AI工具应具备透明性和可解释性。在医学影像领域,AI工具可以提供两类解释:局部解...

GPT-4在胸部X光片评估中的潜在应用

GPT-4在胸部X光片评估中的潜力:一项回顾性研究 学术背景 近年来,人工智能(AI)在医疗领域,尤其是放射学中的应用日益广泛。AI工具的引入正在改变临床实践,尤其是在影像诊断中。然而,AI工具的广泛采用面临诸多挑战,包括资金不足、信息技术(IT)集成效率低下以及验证不足等问题。此外,医疗专业人员,尤其是放射科医生,普遍缺乏足够的统计学知识,这进一步阻碍了他们对AI工具的深入理解和应用。随着放射学研究越来越依赖于数据驱动技术,放射科医生需要具备批判性评估统计方法及其局限性的能力。 大型语言模型(LLMs),如OpenAI的GPT-4,因其能够理解自然语言、推理和解释复杂信息的能力,逐渐在放射学中得到认可。GPT-4的Advanced Data Analysis(ADA)扩展功能使其能够分析数...

GPT-4V在放射学中的定量评估:多模态和多解剖区域能力

大型视觉语言模型在放射学中的应用:GPT-4V的多模态与多解剖区域能力定量评估 学术背景 近年来,大型语言模型(Large Language Models, LLMs)如OpenAI的ChatGPT在文本生成领域取得了显著进展。这些模型基于Transformer架构,通过海量文本数据进行训练,能够在无需大量示例的情况下生成可信的文本输出(few-shot learning和zero-shot learning)。LLMs在医学领域的应用也日益广泛,例如将自由文本的放射学报告转换为标准化模板,以及从肺癌的CT报告中挖掘数据。此外,LLMs在放射学考试中的表现也显示出其具备一定的“知识”储备,并能够帮助简化放射学报告。 随着GPT-4V(GPT-4 with Vision)的推出,模型不仅能够处...

将人工智能衍生软件在肺结节测量精确度和准确性提高中的潜力转化为对临床实践的影响—模拟研究

基于人工智能软件提升计算机断层扫描中肺结节测量精度的潜在改进对临床实践的影响——模拟研究 背景介绍 肺结节的准确测量对肺癌的检测和管理至关重要。结节尺寸是现有指南中风险分类的主要依据。然而,不同医生手动测量的结果可能存在很大差异。本研究探讨了人工智能(AI)辅助软件在肺结节测量中的潜在改进,以及其与手动测量相比对临床管理的影响。 肺结节是胸部计算机断层扫描(CT)中常见的发现,约95%的肺结节是良性的,但其余的可能是癌性的,需采取进一步行动。肺结节的大小和生长速度与其恶性风险有很强的相关性,因此准确测量肺结节的大小和生长速度是当前肺结节及肺癌诊断和管理路径中的关键要素。 文章来源 本文由Mubarak Patel(MSc)、Peter Auguste(PhD)、Jason Madan(PhD...

人工智能辅助的PD-L1肿瘤比例评分在非小细胞肺癌中预测免疫检查点抑制剂响应的临床验证

PD-L1肿瘤比例评分在非小细胞肺癌免疫检查点抑制剂响应预测中的人工智能解读临床验证 在肿瘤治疗和诊断领域,PD-L1(Programmed Death-Ligand 1)肿瘤比例评分(TPS)的评估是一项至关重要的工作,特别是在针对非小细胞肺癌(NSCLC)的免疫检查点抑制剂(ICI)治疗反应预测方面。然而,由病理学家评估PD-L1 TPS受主客观因素的限制,如内观察者/间观察者偏差以及肿瘤内异质性等问题。最近的研究表明,应用人工智能(AI)技术为病理图像提供量化的生物标记物评估能力,预示着AI在病理学诊断中的应用前景。 由首尔国立大学仁川医院的Hyojin Kim博士、Seokhwi Kim博士以及其他作者共同进行的这项研究成果发表在2024年5月9日的《JCO Precision On...

基于切片池化的AI辅助胶质瘤分级算法

基于切片池化的AI辅助胶质瘤分级算法

AI 辅助的基于切片池化的胶质瘤分级影像组学算法 背景介绍 胶质瘤(Glioma)是中枢神经系统中最常见和最具威胁的肿瘤,具有高发病率、高复发率、高死亡率和低治愈率。世界卫生组织(WHO)将胶质瘤分为四级(I、II、III和IV),其中I级和II级被称为低级别胶质瘤(LGG),而III级和IV级被称为高级别胶质瘤(HGG)。高级别胶质瘤是一种更具侵袭性的恶性肿瘤,其预期寿命约为两年。尽管WHO在2016年引入了分子分型,可以排除不敏感的治疗,但胶质瘤的分级仍然是一个重要的诊断标准,因为它决定了治疗方案的选择。 磁共振成像(MRI)是检测和分析胶质瘤的常用成像技术。它是一种无创且快速的方法,同时MRI图像包含了丰富的信息,这些信息仅凭医生的观察很难获取。影像组学(Radiomics)作为人工智...

将大型语言模型和知识图谱统一起来

统一大语言模型与知识图谱 背景 近年来,自然语言处理和人工智能领域涌现了大量研究成果,其中,大语言模型(Large Language Models, LLMS)如 ChatGPT 和 GPT-4 表现出色。然而,尽管这些模型具有出色的泛化能力,常常因其黑箱性质无法有效捕捉和访问事实知识而受到批评。另一方面,知识图谱(Knowledge Graphs, KGs)如 Wikipedia 和 Huapu 通过结构化形式存储了大量事实知识,但构建和演化知识图谱的过程却非常复杂。因此,研究人员提出将大语言模型与知识图谱相结合,利用两者的优势以实现互补。 来源 本文发表在《IEEE Transactions on Knowledge and Data Engineering》2024年7月第36卷第7期...

DRGI: 深度关系图信息增益用于知识图谱构建完成

知识图谱(Knowledge Graph,KG)嵌入技术是人工智能领域中的一个重要研究课题,主要用于知识获取和知识图谱的扩展。近年来,尽管有许多基于图嵌入的方法被提出,但这些方法通常只能关注知识图谱的语义信息,忽略了图的自然结构信息。因此,尽管图卷积网络(Graph Convolutional Networks,GCN)方法能够捕捉部分结构信息,但由于知识图谱的不完全性,它们仍然面临信息不足的问题。为了克服这一问题,本研究提出了一种新的模型,即深度关系图信息增益(Deep Relational Graph Infomax,DRGI),通过互信息(Mutual Information,MI)最大化充分利用了结构信息和语义信息。 本文由来自中国电子科技大学未来媒体中心的Shuang Liang,...

基于人工智能的乳腺病变分类

基于人工智能的乳腺病变分类多中心研究 在乳腺癌领域,早期诊断对于提高治疗效果和生存率至关重要。乳腺癌主要分为原位癌和浸润性癌两类,这两类癌症在治疗策略和预后上存在显著差异。原位癌的腋窝受累发生率较低(1-2%),不推荐进行前哨淋巴结活检(SLNB);而对于浸润性癌症,SLNB或腋窝淋巴结清扫(ALND)是必要的。因此,能够在术前准确区分良性、恶性以及原位和浸润癌症显得格外重要。 对比增强乳腺摄影(CEM)是一种新兴的技术,因其能够体现病变的血管特性而在临床应用中日益广泛。然而,CEM在诊断乳腺癌方面尽管对恶性病变具有高敏感性,但其特异性却不尽如人意(66-84%)。此外,传统影像学检查的解释还会受到放射科医生经验的影响,不同的放射科医生之间存在较大的差异。因此,开发一种自动、可靠,并且能够在...