放射線画像解釈における多モーダル大規模言語モデルの精度評価

大規模言語モデルの放射線画像解釈における性能:人間の読者との比較研究 学術的背景 近年、大規模言語モデル(Large Language Models, LLMs)は、特に自然言語処理の分野で強力な能力を発揮しています。マルチモーダルLLMsの発展により、これらのモデルはテキストだけでなく、音声、視覚、ビデオなど多様な入力形式を処理できるようになりました。代表的なマルチモーダルLLMsには、OpenAIのGPT-4 Turbo with Vision(GPT-4V)、Google DeepMindのGemini 1.5 Pro、そしてAnthropicのClaude 3があります。これらのモデルは、放射線学分野での応用も増えており、特に放射線レポートの生成や構造化において優れた性能を示していま...