多模态大语言模型在放射学图像解释中的准确性评估

大型语言模型在放射学图像解读中的表现:与人类读者的比较研究 学术背景 近年来,大型语言模型(Large Language Models, LLMs)在多个领域展现了强大的能力,尤其是在自然语言处理方面。随着多模态LLMs的发展,这些模型不仅能够处理文本,还能够处理音频、视觉和视频等多种输入形式。代表性的多模态LLMs包括OpenAI的GPT-4 Turbo with Vision(GPT-4V)、Google DeepMind的Gemini 1.5 Pro以及Anthropic的Claude 3。这些模型在放射学领域的应用也逐渐增多,尤其是在生成和结构化放射学报告方面。然而,尽管LLMs在文本输入方面表现出色,其在解读放射学图像方面的能力仍然受到质疑。此前的研究表明,LLMs在基于患者病史和...

深度学习算法在英国乳腺癌筛查队列中的应用

深度学习算法在乳腺癌筛查中的应用 学术背景 乳腺癌是全球女性中最常见的癌症之一,早期筛查对于提高治愈率至关重要。传统的计算机辅助检测(Computer-Aided Detection, CAD)系统在乳腺X线摄影筛查中已被广泛使用,尤其是在美国。然而,这些系统虽然提高了召回率,但对读者(即放射科医生)的表现改善有限。近年来,深度学习(Deep Learning, DL)算法在医学影像分析中的应用迅速增长,特别是在乳腺癌筛查领域。多项系统综述和荟萃分析表明,自2017年以来,DL算法在乳腺X线摄影筛查中的证据迅速增加。尽管一些研究表明,DL算法作为单一读者时表现不逊于人类读者,但目前尚无独立算法能够在保持可接受召回率的同时,优于标准的双阅读系统。因此,DL算法目前还无法完全取代人类读者在双阅读...

大型语言模型在翻译CT和MRI自由文本放射学报告中的能力

大型语言模型在翻译CT和MRI自由文本放射学报告中的能力 学术背景 在全球化的背景下,患者的流动性增加,放射学报告作为疾病诊断和管理的重要工具,常常需要被翻译成不同的语言。然而,语言障碍可能会影响这些报告的有效使用,进而影响患者的及时和准确管理。随着远程医疗的兴起,患者越来越多地寻求远程专家咨询或第二意见,这进一步加剧了语言障碍的挑战。如果没有准确的翻译,这些报告可能会被误解或忽视,导致诊断延迟和潜在的错误。 由于具备医学专业知识的人工翻译并不总是随时可用,基于人工智能的模型,特别是大型语言模型(LLMs),提供了有前景的替代方案。尽管这些模型最初是为通用语言处理任务设计的,但它们在翻译等应用中也展示了良好的效果。然而,LLMs在翻译放射学报告方面的能力尚未得到充分探索,尤其是在处理低资源语...

乳腺癌筛查数字乳腺断层合成检查中读者顺序阅读表现的变化

数字乳腺断层合成(DBT)筛查中顺序阅读的读者性能变化研究 学术背景 乳腺癌是全球女性中最常见的癌症之一,早期筛查对于提高治愈率至关重要。传统的乳腺X线摄影(Digital Mammography, DM)是乳腺癌筛查的主要手段,但其在检测乳腺组织重叠区域的病变时存在一定的局限性。近年来,数字乳腺断层合成(Digital Breast Tomosynthesis, DBT)技术逐渐成为乳腺癌筛查的重要工具。DBT通过生成乳腺的三维图像,能够更清晰地显示乳腺组织,减少组织重叠带来的误诊和漏诊。多项临床观察研究表明,DBT在乳腺癌筛查中的表现优于传统的DM(1-6)。因此,许多医疗机构已经大量投资于DBT设备的引进和升级。 然而,随着DBT在筛查中的广泛应用,研究者们开始关注影响筛查性能的因素,...

3T与5T心肌延迟钆增强MRI评估心肌纤维化的早期结果

5T与3T心肌延迟增强MRI在心肌纤维化评估中的对比研究 学术背景 心肌纤维化是多种心脏疾病的共同病理特征,准确评估心肌纤维化对于疾病的诊断、治疗和预后具有重要意义。心脏磁共振成像(Cardiac MRI)是目前评估心肌结构和功能的重要手段,尤其是延迟钆增强(Late Gadolinium Enhancement, LGE)技术,能够精确显示心肌纤维化的区域。LGE技术的原理是基于心肌纤维化区域细胞外间隙增大和毛细血管密度降低,导致钆对比剂在纤维化区域的滞留时间延长。 近年来,超高场强MRI设备逐渐进入市场,尤其是5T MRI设备,相较于传统的3T MRI,其在组织对比度和信噪比(Signal-to-Noise Ratio, SNR)方面具有潜在优势。然而,超高场强MRI在心脏成像中也面临诸...

人工智能解释类型对胸部X光诊断性能及医生信任度的影响

人工智能解释类型对医生诊断表现和信任的影响 学术背景 近年来,人工智能(Artificial Intelligence, AI)在医疗保健和放射学领域的诊断系统发展迅速,尤其是在辅助超负荷工作的医疗提供者方面,AI系统展现了改善患者护理的潜力。截至2022年,美国食品药品监督管理局(FDA)已批准了190个放射学AI软件程序,且批准率逐年上升。然而,AI从概念验证到实际临床应用的整合仍存在巨大鸿沟。为了弥合这一差距,培养对AI建议的适当信任至关重要。尽管高准确性的AI系统已在真实临床环境中证明了其提升医生诊断表现和患者结果的能力,但错误的AI建议可能会降低诊断表现,这无疑导致了AI在临床中的延迟应用。 医生们呼吁AI工具应具备透明性和可解释性。在医学影像领域,AI工具可以提供两类解释:局部解...

GPT-4在胸部X光片评估中的潜在应用

GPT-4在胸部X光片评估中的潜力:一项回顾性研究 学术背景 近年来,人工智能(AI)在医疗领域,尤其是放射学中的应用日益广泛。AI工具的引入正在改变临床实践,尤其是在影像诊断中。然而,AI工具的广泛采用面临诸多挑战,包括资金不足、信息技术(IT)集成效率低下以及验证不足等问题。此外,医疗专业人员,尤其是放射科医生,普遍缺乏足够的统计学知识,这进一步阻碍了他们对AI工具的深入理解和应用。随着放射学研究越来越依赖于数据驱动技术,放射科医生需要具备批判性评估统计方法及其局限性的能力。 大型语言模型(LLMs),如OpenAI的GPT-4,因其能够理解自然语言、推理和解释复杂信息的能力,逐渐在放射学中得到认可。GPT-4的Advanced Data Analysis(ADA)扩展功能使其能够分析数...

GPT-4V在放射学中的定量评估:多模态和多解剖区域能力

大型视觉语言模型在放射学中的应用:GPT-4V的多模态与多解剖区域能力定量评估 学术背景 近年来,大型语言模型(Large Language Models, LLMs)如OpenAI的ChatGPT在文本生成领域取得了显著进展。这些模型基于Transformer架构,通过海量文本数据进行训练,能够在无需大量示例的情况下生成可信的文本输出(few-shot learning和zero-shot learning)。LLMs在医学领域的应用也日益广泛,例如将自由文本的放射学报告转换为标准化模板,以及从肺癌的CT报告中挖掘数据。此外,LLMs在放射学考试中的表现也显示出其具备一定的“知识”储备,并能够帮助简化放射学报告。 随着GPT-4V(GPT-4 with Vision)的推出,模型不仅能够处...

CT检测肝脂肪变性的诊断准确性:系统综述与荟萃分析

CT在检测肝脂肪变性中的诊断准确性:系统综述与Meta分析 学术背景 肝脂肪变性(hepatic steatosis)是肝细胞内甘油三酯异常积累的结果,可能引发一系列炎症反应,称为脂肪性肝病(steatotic liver disease, SLD)。代谢功能障碍相关的脂肪性肝病(metabolic dysfunction–associated SLD)是美国乃至全球最常见的SLD形式,并迅速成为慢性肝病的主要原因。肝脂肪变性是心血管疾病、肝纤维化、肝硬化、肝癌、肝衰竭和死亡的重要风险因素。早期检测肝脂肪变性对于及时干预和预防并发症至关重要。 传统的肝活检是诊断和分级肝脂肪变性的金标准。近年来,基于MRI的脂肪定量技术被引入作为活检的替代方法,特别是MRI质子密度脂肪分数(proton de...

基于乳腺X线检查结果的筛查超声非肿块性病变评估

乳腺非肿块性病变的超声筛查研究:基于乳腺X线检查结果的评估 学术背景 乳腺癌是全球女性中最常见的恶性肿瘤之一,早期发现和诊断对于提高患者的生存率至关重要。乳腺超声(Breast Ultrasound, US)作为一种无创、无辐射的影像学检查手段,在乳腺疾病的筛查和诊断中发挥着重要作用。特别是在乳腺密度较高的女性中,乳腺超声能够有效检测出乳腺X线检查(Mammography)难以发现的早期乳腺癌。然而,乳腺超声检查中常常会遇到一种称为“非肿块性病变”(Nonmass Lesions, NMLs)的影像学表现。NMLs通常表现为与周围乳腺组织相比回声纹理发生改变的离散区域,但缺乏肿块的三维特征或明显的边缘、形状等特征。尽管NMLs在乳腺超声检查中较为常见,但其良恶性鉴别仍然具有挑战性,尤其是在筛...