超音波およびマンモグラフィー画像を組み合わせた深層学習によるBF-RADS US 4a病変の悪性度予測:診断研究

深層学習を用いた乳房X線写真と超音波画像を組み合わせたBI-RADS US 4Aレジオンの悪性度予測に関する診断研究

背景紹介

乳がんは女性で最も一般的な悪性腫瘍で、comparatively高い発症率と死亡率を示しています。以前の研究では、乳腺の密度が高い女性ほど乳がんになりやすいことが示されています。アジア人女性の乳腺密度は一般に、アフリカ系アメリカ人や白人女性よりも高いため、乳腺密度の高いアジア人女性を対象とした研究が特に重要です。

乳房X線撮影(マンモグラフィー)は、乳がんのスクリーニングに重要な手段と考えられており、乳がん関連死亡率を30%減らすことができると言われています。しかし、マンモグラフィーは乳腺密度の高い女性の乳腺病変の検出能力が低く、感度は48%~85%に低下することがあり、これは主に腺組織による遮蔽が原因です。このような場合、超音波検査は乳腺密度の高い女性のスクリーニングと診断に欠かせない役割を果たします。乳腺密度の高い患者にマンモグラフィーと超音波検査を併用すると、検出率が向上します。メタ分析の結果によると、マンモグラフィーに加えて超音波検査を行うことで、無症候性乳がんの検出率が平均で40%上がることが示されています。

米国放射線学会(ACR)は、2013年に第5版の乳房画像報告およびデータシステム(BI-RADS)アトラスを発表し、BI-RADS 4カテゴリのレジョンをサブカテゴリーの4A、4B、4Cに分類しました。これらのサブカテゴリーでは、悪性の可能性が異なります。4Aレジョンの悪性率は比較的低く、通常は2%~10%ですが、BI-RADS 4カテゴリーの中では最も一般的で、55.6%を占めています。したがって、定期的な生検を行うと、患者に不必要な不安を与え、時にはCompいくつかの合併症や医療費がかかる可能性があります。実際の臨床では、放射線科医は通常、最終的な評価をBI-RADSの基準に基づいて行いますが、主観的な解釈の影響を受ける可能性があります。そのため、BI-RADS 4A乳腺病変患者の早期診断を改善するためには、客観的な方法が必要不可欠です。人工知能(AI)は画像データから複雑な情報を抽出できるため、迅速で定量的な代替手段を提供する可能性があります。

論文の出典

本論文は、Yang Yaping、Zhong Ying、Li Junwei、Feng Jiahao、Gong Chang、Yu Yunfang、Hu Yue、Gu Ran、Wang Hongli、Liu Fengtao、Mei Jingsi、Jiang Xiaofang、Wang Jin、Yao Qinyue、Wu Wei、Liu Qiangらによって執筆されました。研究は中山大学附属腫瘍病院乳腺腫瘍センターとCellVision(広州)医療科技有限公司の共同で行われました。本論文は、2024年2月12日に国際的な権威ある学術誌「International Journal of Surgery」にオンライン掲載されました。

研究方法

研究の流れ

本研究には合計1210名の女性が募集されました。対象者は回顾性グループと前向きグループに分かれています。992名の患者がランダムに割り付けられ、トレーニングセット(789名)とテストセット(203名)に4:1の比率で分けられました。さらに218名の患者が前向きの検証セットに組み入れられました。トレーニングでは、転移学習と重みつきランダムサンプリングが用いられ、不均衡なデータ問題に対処し、モデルの一般化能力を高めました。ResNet18が基本的な深層学習モデルとして使用されました。

データ処理と実験設計

すべての乳房超音波画像と乳房X線写真は、同じ解像度の正規化処理が施されました。深層学習モデルでは、過適合を減らすために、マルチモーダル特徴消去手法とオンラインデータ augmentation手法が採用されました。モデルの性能は、受信者操作特性(ROC)曲線とその曲線下面積(AUC)によって評価されました。異なるモデルの感度と特異度を比較することで、悪性度予測の性能が評価されました。

データ解析

トレーニングセット、テストセット、検証セットの患者の基本的な臨床病理学的特徴は、頻度と割合で表されました。不均衡データの問題に対処するため、トレーニング時に重みつきランダムサンプリングが採用されました。ROC曲線とAUCは、異なるモデルの性能評価に使用されました。さらに、決定曲線分析(DCA)が使われ、様々な確率閾値における臨床的ユーティリティがモデル化されました。

研究結果

ベースライン特性

研究には合計1210名の被験者が含まれ、被験者の年齢の中央値は44歳で、すべての患者はBI-RADS US 4Aレジョンと高い乳腺密度の診断を受けていました。トレーニングセットとテストセットは、病理結果、年齢、レジョンのサイズなどの点で比較可能でしたが、家族歴や画像特徴などでは異なっていました。トレーニングセットの悪性率は8.7%、テストセットでは12.3%、検証セットでは9.2%でした。

モデルの性能

ResNet18がベースモデルとして選ばれました。これは、テストセットで最高の感度(92%)と特異度(88.2%)を示したためです。テストセットでは、超音波画像とマンモグラフィー画像の組み合わせモデルが、最も高いAUCスコア0.940(95%信頼区間: 0.874-1.000)を示し、悪性度予測能力が最も優れていました。検証セットにおいても、組み合わせモデルはAUCスコア0.906(95%信頼区間: 0.817-0.995)と高い値を示しました。

結論

本研究では、超音波画像とマンモグラフィー画像の特徴を組み合わせた高性能で客観的な深層学習モデルを開発しました。このモデルはBI-RADS US 4Aレジョンの悪性度予測の正確性を大幅に向上させました。不必要な生検を減らすことができるため、このモデルは顕著な効果を示しています。このモデルは臨床医に適切な臨床判断を下す手助けとなり、不必要な生検を避け、臨床ワークフローの再現性と信頼性を高める可能性があります。

研究のハイライト

  1. 高い正確性: BI-RADS US 4Aレジョンの悪性度予測において、高いAUCスコアを示しました。
  2. マルチモーダル融合: 超音波とマンモグラフィーの画像特徴を組み合わせることで、単一モーダルよりも大幅に優れた性能を発揮しました。
  3. 医用画像におけるAIの応用: 診断の正確性を高め、主観的要因を排除するAIと深層学習の大きな可能性を示しています。

研究の重要性と応用価値

本研究では、高性能なAI支援診断手法を提供し、複数の医用画像モーダリティを統合することで、診断の正確性と効率性を大幅に向上させることができました。不必要な生検を減らすことで、医療資源を節約するだけでなく、患者の不安も大きく軽減できます。今後、臨床現場で活用されれば、このモデルは乳がん診断と治療における医師の重要なツールとなる可能性があります。さらに、複数の施設での幅広い検証を行い、モデルの一般化能力と実際の臨床適用性をさらに高める必要があります。