放射学におけるGPT-4Vの多モードおよび多解剖領域能力の定量的評価
大規模視覚言語モデル(GPT-4V)の放射線学における多モード・多解剖領域能力の定量的評価 学術的背景 近年、OpenAIのChatGPTのような大規模言語モデル(Large Language Models, LLMs)は、テキスト生成の分野で大きな進歩を遂げています。これらのモデルはTransformerアーキテクチャに基づいており、膨大なテキストデータを学習することで、少ない例(few-shot learningやzero-shot learning)でも信頼性の高いテキストを生成することができます。LLMsは医学分野でも広く応用されており、自由形式の放射線レポートを標準化されたテンプレートに変換したり、肺癌のCTレポートからデータをマイニングしたりするのに使用されています。さらに、LL...