多模态大语言模型在放射学图像解释中的准确性评估

大型语言模型在放射学图像解读中的表现:与人类读者的比较研究 学术背景 近年来,大型语言模型(Large Language Models, LLMs)在多个领域展现了强大的能力,尤其是在自然语言处理方面。随着多模态LLMs的发展,这些模型不仅能够处理文本,还能够处理音频、视觉和视频等多种输入形式。代表性的多模态LLMs包括OpenAI的GPT-4 Turbo with Vision(GPT-4V)、Google DeepMind的Gemini 1.5 Pro以及Anthropic的Claude 3。这些模型在放射学领域的应用也逐渐增多,尤其是在生成和结构化放射学报告方面。然而,尽管LLMs在文本输入方面表现出色,其在解读放射学图像方面的能力仍然受到质疑。此前的研究表明,LLMs在基于患者病史和...