放射線画像解釈における多モーダル大規模言語モデルの精度評価

大規模言語モデルの放射線画像解釈における性能:人間の読者との比較研究 学術的背景 近年、大規模言語モデル(Large Language Models, LLMs)は、特に自然言語処理の分野で強力な能力を発揮しています。マルチモーダルLLMsの発展により、これらのモデルはテキストだけでなく、音声、視覚、ビデオなど多様な入力形式を処理できるようになりました。代表的なマルチモーダルLLMsには、OpenAIのGPT-4 Turbo with Vision(GPT-4V)、Google DeepMindのGemini 1.5 Pro、そしてAnthropicのClaude 3があります。これらのモデルは、放射線学分野での応用も増えており、特に放射線レポートの生成や構造化において優れた性能を示していま...

AIの説明タイプが医師の診断性能とAIへの信頼に影響を与える

人工知能(AI)説明タイプが医師の診断パフォーマンスと信頼に及ぼす影響 学術的背景 近年、人工知能(Artificial Intelligence, AI)は、医療および放射線学の診断システムにおいて急速に発展しており、特に過剰な負担を抱える医療提供者を支援することで、患者ケアの改善に貢献する可能性を示しています。2022年までに、米国食品医薬品局(FDA)は190の放射線学AIソフトウェアプログラムを承認しており、その承認率は年々上昇しています。しかし、概念の証明から実際の臨床応用までの間には大きな隔たりが存在します。このギャップを埋めるためには、AIの助言に対する適切な信頼を育むことが極めて重要です。高い精度を持つAIシステムは、実際の臨床環境において医師の診断能力と患者の結果を向上させ...

GPT-4の胸部X線評価における有用性

GPT-4の胸部X線評価における有用性:隠された宝の山 学術的背景 近年、人工知能(AI)は医療分野、特に放射線学において急速に普及しています。AIツールの導入は臨床実践を変革しつつあり、特に画像診断においてその影響が顕著です。しかし、AIツールの広範な採用には、資金不足、情報技術(IT)統合の非効率性、検証不足などの課題があります。さらに、医療専門家、特に放射線科医は統計学の知識が不足していることが多く、これがAIツールの深い理解と応用を妨げています。放射線学研究がデータ駆動型の技術に依存するようになるにつれ、放射線科医は統計的手法とその限界を批判的に評価する能力を備える必要があります。 大規模言語モデル(LLMs)、例えばOpenAIのGPT-4は、自然言語を理解し、推論し、複雑な情報を...

放射学におけるGPT-4Vの多モードおよび多解剖領域能力の定量的評価

大規模視覚言語モデル(GPT-4V)の放射線学における多モード・多解剖領域能力の定量的評価 学術的背景 近年、OpenAIのChatGPTのような大規模言語モデル(Large Language Models, LLMs)は、テキスト生成の分野で大きな進歩を遂げています。これらのモデルはTransformerアーキテクチャに基づいており、膨大なテキストデータを学習することで、少ない例(few-shot learningやzero-shot learning)でも信頼性の高いテキストを生成することができます。LLMsは医学分野でも広く応用されており、自由形式の放射線レポートを標準化されたテンプレートに変換したり、肺癌のCTレポートからデータをマイニングしたりするのに使用されています。さらに、LL...

人工知能由来のソフトウェアによる肺結節測定の精度と正確性の向上の可能性を臨床実践への影響に翻訳する—シミュレーション研究

人工知能ソフトウェアによるコンピュータ断層撮影における肺結節測定精度向上の潜在的改善が臨床実践に与える影響 - シミュレーション研究 背景紹介 肺結節の正確な測定は肺がんの検出と管理に非常に重要です。結節のサイズは、現行のガイドラインにおけるリスク分類の主要な基準です。しかし、異なる医師による手動測定の結果には大きな差異が生じる可能性があります。本研究では、人工知能(AI)支援ソフトウェアの肺結節測定における潜在的な改善と、手動測定と比較した場合の臨床管理への影響を探ります。 肺結節は胸部コンピュータ断層撮影(CT)で一般的に見られる所見で、約95%の肺結節は良性ですが、残りは悪性の可能性があり、さらなる対応が必要です。肺結節の大きさと成長速度はその悪性リスクと強い相関があるため、肺結節の大...

非小細胞肺癌に対する免疫チェックポイント阻害剤の応答予測のためのAI搭載PD-L1腫瘍割合スコア解釈の臨床検証

非小細胞肺癌における免疫チェックポイント阻害剤の応答予測におけるPD-L1腫瘍割合スコアの人工知能解釈の臨床検証 腫瘍治療と診断の分野では、PD-L1(Programmed Death-Ligand 1)腫瘍割合スコア(TPS)の評価が極めて重要です。特に非小細胞肺癌(NSCLC)における免疫チェックポイント阻害剤(ICI)治療の反応予測において重要です。しかし、病理学者によるPD-L1 TPSの評価には、観察者間・観察者内の偏差や腫瘍内部の異質性など、主観的・客観的な要因の制約があります。最近の研究は、病理学画像に定量的なバイオマーカー評価能力を提供する人工知能(AI)の技術応用が、病理学診断におけるAIの応用の可能性を示唆しています。 この研究はソウル国立大学仁川病院のHyojin Ki...

スライスプールを基にしたAI駆動型ラジオミクスアルゴリズムによるグリオーマグレーディング

スライスプールを基にしたAI駆動型ラジオミクスアルゴリズムによるグリオーマグレーディング

AI補助のスライスプーリングに基づくグリオーマグレーディングのラジオミクスアルゴリズム 背景紹介 グリオーマ(Glioma)は中枢神経系で最も一般的かつ脅威的な腫瘍であり、高発病率、高再発率、高死亡率、低治癒率を持ちます。世界保健機関(WHO)はグリオーマを四段階(I、II、III、IV)に分類し、そのうちI級とII級は低度グリオーマ(LGG)、III級とIV級は高度グリオーマ(HGG)と呼ばれます。高度グリオーマはより侵襲性のある悪性腫瘍で、予期寿命は約2年です。2016年にWHOは分子タイプ分けを導入し、感受性の低い治療を排除できるようになりましたが、グリオーマのグレーディングは依然として治療方針の選定において重要な診断基準となっています。 磁気共鳴画像法(MRI)は、グリオーマの検出と...

大規模言語モデルと知識グラフの統合:ロードマップ

統一大言語モデルと知識グラフ 背景 近年、自然言語処理と人工知能の分野には多くの研究成果が現れており、その中でも大言語モデル(Large Language Models, LLMs)として知られるChatGPTやGPT-4が優れた成果を示しています。しかし、これらのモデルは優れた一般化能力を持ちながらも、そのブラックボックス性から事実知識を効果的に捕捉しアクセスすることが困難とされ批判を受けることも多いです。一方、知識グラフ(Knowledge Graphs, KGs)として知られるWikipediaやHuapuは、構造化形式で大量の事実知識を保存していますが、知識グラフの構築と進化のプロセスは非常に複雑です。そこで、研究者たちは大言語モデルと知識グラフを組み合わせ、それぞれの長所を生かして...

知識グラフ補完のための深い関係グラフインフォマックス(DRGI)

知识グラフ(Knowledge Graph, KG)埋め込み技術は人工知能分野における重要な研究課題であり、主に知識の取得と知識グラフの拡張に使用されます。近年、多くのグラフ埋め込みに基づく手法が提案されていますが、これらの手法は通常、知識グラフの意味情報にのみ注目し、グラフの自然な構造情報を無視しています。そのため、グラフ畳み込みネットワーク(Graph Convolutional Networks, GCN)手法が一部の構造情報を捉えることができても、知識グラフの不完全性のために依然として情報不足の問題に直面しています。この問題を克服するために、本研究では新たなモデルである深層関係グラフ情報利得(Deep Relational Graph Infomax, DRGI)を提案し、相互情報量...

人工知能を用いた乳腺病変の分類:多施設共同研究

人工知能に基づく乳房病変の分類に関する多施設研究 乳がん領域では、早期診断は治療効果と生存率の向上に不可欠です。乳がんは、非浸潤がん(原発性がん)と浸潤がんの2種類に大別されます。これらの2つのタイプのがんでは、治療戦略と予後が大きく異なります。非浸潤がんではリンパ節転移のリスクが低い(1-2%)ため、センチネルリンパ節生検(SLNB)は推奨されません。一方、浸潤がんの場合、SLNBまたは腋窩リンパ節郭清(ALND)が必要です。したがって、術前に良性、悪性、非浸潤がん、浸潤がんを正確に区別することが非常に重要です。 コントラスト強調乳房撮影(CEM)は、腫瘍の血管特性を描出できる新しい技術で、臨床応用が広がっています。しかし、CEMは乳がんの診断では悪性病変に対する感度は高いものの、特異度は...