PETと表形式データを統合した解釈可能な変換モデルによる濾胞性リンパ腫の病理学的分類と予後:多機関デジタル生検研究
PET画像と臨床データを融合したTransformerモデル: 濾胞性リンパ腫の病理学的グレード予測と予後評価を目的とした多施設間デジタルバイオプシー研究
学術的背景
濾胞性リンパ腫(Follicular Lymphoma, FL)は、西洋諸国で最も一般的な惰性非ホジキンリンパ腫であり、新たに診断される非ホジキンリンパ腫全体の約30%を占めています。世界保健機関(WHO)の分類に基づき、濾胞性リンパ腫は病理学的に3つのグレード(1~3級)に分類されており、このグレードは高倍率視野(High-Power Field, HPF)ごとの中心母細胞(Centroblasts)の数に基づいています。しかし、3級はさらに3a級と3b級に細分化され、特に3b級はより侵攻的な生物学的挙動を示し、患者の予後が悪いことが知られています。このため、治療戦略はびまん性大細胞型B細胞リンパ腫(Diffuse Large B-Cell Lymphoma, DLBCL)とほぼ同様となります。一方で、1-2級の患者は通常病気の進行が遅く、無症状で腫瘍負荷が低い患者では「経過観察」の管理戦略が採用されることもあります。しかし、3a級の患者は1-2級と3b級の中間的な生物学的特性と臨床的表れを持ち、同じグレード内でも生存率に有意な差が存在することが確認されています。
現在のところ、生検と免疫組織化学分析を組み合わせることが、濾胞性リンパ腫の病理学的グレードを確定するための「ゴールドスタンダード」とされています。しかし、この方法はサンプリングの偏りや体内深部病変部からのサンプル取得の難しさといった限界に直面しています。このような状況下で、18F-FDG PET/CTは広く濾胞性リンパ腫の病期分類に使用されていますが、そのグレード予測における可能性は十分に探求されていません。これまでの研究では、SUVmax(最大標準化取り込み値)、TMTV(総代謝腫瘍ボリューム)、およびTLG(総病変糖酵解)といったPETパラメータを用いて濾胞性リンパ腫のグレードを区別しようと試みてきましたが、これらの研究はサンプル数が少なく、単一施設で実施されたものが多く、その結果の一般化可能性に疑問が生じています。さらに、従来の代謝パラメータでは腫瘍の不均一性についての洞察が限られており、その生物学的変動を包括的に捉えるのは難しいのが現状です。
近年、人工知能(Artificial Intelligence, AI)技術の台頭により、医学画像の詳細分析が可能となり、特にPET画像から詳細な病理学的情報を抽出する分野で深層学習モデルが顕著な可能性を示しています。しかし、従来のAIモデルは主に放射線学的特徴量(Radiomic Features)に依存するか、画像から直接情報を抽出する方法が主であり、臨床データとの効果的な統合が課題とされています。また、多くのAIモデルは「ブラックボックス」形式であり、予測結果がどのように形成されたかを説明するのが難しく、臨床応用において信頼性の危機に直面する場合があります。
これらの課題に対処するため、本研究では、PET画像と臨床データを統合することで、濾胞性リンパ腫の病理学的グレードを正確に予測し、さらに予後評価を行うことができる「説明可能な(Explainable)」多モーダル融合Transformerモデルの開発を目的としています。
論文出典
本研究は四川大学華西病院核医学科の研究チームを中心に、南京大学医学院附属鼓楼病院、山東大学斉魯病院、南京医科大学第一附属病院、及び厦門大学附属第一病院の研究者が共同で実施しました。論文は《European Journal of Nuclear Medicine and Molecular Imaging》誌に2025年1月に掲載されています。本研究の主な著者はChong JiangおよびZekun Jiangです。
研究プロセス
データと研究対象
本研究には、中国国内の5つの独立した医療センターから計513例の濾胞性リンパ腫患者が登録され、病理学的グレードに基づき1-2級、3a級、および3b級に分類されました。地域ごとの医療センターからのデータは以下のように分類されました: - トレーニングデータ:四川大学華西病院、南京鼓楼病院、山東大学斉魯病院のランダム抽出データ、計275例。 - 内部検証データ:69例。 - 外部検証データ:独立したデータセットで、南京医科大学第一附属病院および厦門大学病院からのデータ、計169例。
データの前処理
- PET画像処理:患者ごとの腫瘍体積領域(Volume of Interest, VOI)を抽出し、スキャン装置の強度変化を消去するため標準化処理を行い、モデル入力に最適化された寸法に統一しました。41%のSUVmax閾値を用いた半自動的な描画が技術的に採用されました。
- 臨床データの標準化:年齢、LDH(乳酸脱水素酵素)、B症状など8つの臨床特徴を含む表形式データを正規化し、モデルトレーニングに使用しました。
- 画像拡張:モデルの汎化能力を向上させるため、データの多様性を高めるために、PET画像に対して回転やスケーリングなどの画像拡張操作を施しました。
モデルの設計と開発
本研究で構築したTransformerモデルは以下の4つのモジュールを含んでいます: 1. 画像エンコーダ:Swin Transformerアーキテクチャに基づき、3D方式でPET画像特徴を符号化。 2. 表形式データエンコーダ:多層パーセプトロン(Multilayer Perceptron, MLP)構造を採用し、臨床データを符号化。 3. 融合ネットワーク:交差注意レイヤーを使用してPET画像と臨床データ間の関係を捉え、自注意レイヤーを通じてクロスモーダル融合後の特徴を抽出。 4. 分類ヘッド:符号化された特徴を一連の全結合層と非線形層を経て分類予測し、濾胞性リンパ腫の三種分類を実現。
過学習を防ぐため、モデルにはドロップアウト(Dropout)正則化が採用されました。さらに、動的学習率調整のためAdamWオプティマイザーと余弦退火スケジューラーが使用されました。
モデルの説明メカニズム
臨床での説明可能性を高めるため、本モデルには以下の3つの説明メカニズムが統合されています: 1. Grad-CAM(勾配重み付きクラス活性化マッピング):ヒートマップを生成し、分類予測に最も影響を及ぼすPET画像上の具体的な領域を特定。 2. SHAP(Shapley加法的説明)分析:表形式データ内の各臨床特徴に重要度スコアを付与し、分類予測への寄与度を明らかに。 3. 交互注意の重みづけ解析:画像と表形式データの融合比率を解析し、決定プロセス内での各モーダルの影響力を検証。
結果の要約
分類モデルの性能
研究の結果、融合Transformerモデルは病理学的グレード分類において優れた性能を示し、トレーニングデータ、内部検証データ、外部検証データすべてでROC曲線下面積(AUC)>0.9を達成しました。特に外部検証データでは以下のようでした: - 1-2級の予測:AUC = 0.936、正確度 = 86.4%; - 3a級の予測:AUC = 0.927、正確度 = 88.2%; - 3b級の予測:AUC = 0.994、正確度 = 97.0%。
さらに、アブレーション実験の結果、融合モデルはPETや臨床データのみの単一モーダルモデルよりも有意に優れていると確認されました。
臨床的解釈と予後分析
- Grad-CAMのヒートマップ:モデルが腫瘍のコア領域に集中し、一部周辺情報も捕捉できることが確認され、臨床知識と一致。
- SHAP分析:年齢とSUVmax(最大標準化取り込み値)がグレード予測において最も重要な特徴であることを明らかにしました。特に年齢は濾胞性リンパ腫の侵襲性と強く関連。
- 予後層別化:Transformerモデルの予測結果に基づくKaplan-Meier曲線の結果、異なる予測分類患者の無進行生存率(PFS)に有意な違いが示されました。特に1-2級の患者の予後が最も良く、3b級は最も悪い結果でした。
研究意義とハイライト
- 革新的なモデル構造:Transformerアーキテクチャを初めて採用し、PET画像と表形式データの統合解析を実現、単一モーダル分析の限界を突破。
- 臨床的説明性:Grad-CAMとSHAPを使用することで、モデルの意思決定根拠を明確化し、臨床医に信頼性のある参考材料を提供。
- 広範な一般化可能性:多施設検証研究が、多地域や異なる装置環境下での適用可能性を裏付け。
- 実際応用価値:モデルの高精度な病理グレード分類能力は、非侵襲的分級手法の臨床適用を促進し、高リスク患者への早期介入を可能に。
結論
本研究では、PET画像と表形式データを効率よく統合する説明可能な多モーダル融合Transformerモデルを開発し、濾胞性リンパ腫のグレード予測および予後評価における非侵襲的な代替手段を提供しました。このモデルは性能が優れているだけでなく、臨床応用の説明性を大幅に向上させ、精密医療の進展に新たな可能性を切り開きました。