細胞学に基づく深層学習による原因不明の癌の腫瘍起源の予測
背景紹介
原発不明癌(Cancer of Unknown Primary, CUP)は、組織病理学的に悪性転移が確認されるものの、通常の基線診断方法では原発部位が特定できない悪性疾患の一種です。CUPは診断が非常に難しく、治療も困難であり、全ての癌症例の3〜5%を占めるとされています。最も一般的な病理タイプは腺癌で、次いで扁平上皮癌および未分化癌が報告されています。複数の化学療法を試みても、患者の全体的な予後は非常に悪く、10か月の中央値生存期間に達する患者はわずか20%です。CUPの顕著な特徴は、その早期の転移と強い侵襲性、多臓器にわたる影響です。
免疫組織化学染色(Immunohistochemistry, IHC)は、CUPの原発部位を予測するための重要な手段として一般的に使用されますが、約20種類の異なる免疫染色ユニットを組み合わせても、正確に特定できるCUP症例は30%未満です。したがって、正確な原発部位の予測は効果的かつ個別化された治療の実施にとって極めて重要です。
論文出典
本論文はFei Tianらによって執筆され、著者の所属機関には天津医科大学癌症研究所および第一附属病院、蘇州大学第一附属病院、鄭州大学第一附属病院、そしてアメリカのHarvard大学などが含まれます。この研究は2023年5月に提出され、2024年3月に受理され、2024年4月に《Nature Medicine》でオンライン発表されました。
研究目的
本研究は、深層学習を用いて細胞学画像に基づく腫瘍の原発部位の予測モデルを開発することを目的としています。従来の細胞学分析に基づき、研究チームはTORCH(Tumor Origin Classification through Homeostasis)と名付けられた深層学習モデルを開発しました。このモデルは、四つの三次病院からの57220例の細胞学画像を利用して悪性腫瘍の診断と原発部位の予測をおこないます。
研究プロセス
データ収集と処理
研究は2010年6月から2023年10月にかけて、四つの大規模病院から90572枚の細胞塗抹画像を収集しました。これらの画像は76183名の患者から得られました。原発部位を特定できない24808枚の悪性画像を除外した後、最終的なデータセットには57220枚の画像と43688名の患者が含まれました。トレーニングセットには29883枚の画像と20638名の患者が含まれ、12種類の腫瘍サブタイプをカバーしています。トレーニングセット内には19406枚の腫瘍画像の他に10477枚の良性疾患の画像が含まれます。内部テストセットは天津、鄭州、蘇州の三つの病院から11799枚の画像が含まれており、外部テストセットは天津と煙台の二つの病院から合計14538枚の画像が含まれます。
モデル開発と検証
チームは四種類の異なる深層神経ネットワークを使用し、三種類の異なる入力タイプでトレーニングを行い、合計十二種類の異なるモデルを生成しました(Methods部分)。これらのモデルの結果を統合するために、モデルのアンサンブル学習を行い、モデルの汎化能力と互換性を向上させました。三つの内部テストセットと二つの外部テストセットにおいて、TORCHモデルは合計27337例のテストで0.969の平均AUROC値を達成しました。具体的には、天津、鄭州、蘇州の三つの内部テストセットで、それぞれ0.953、0.962、0.979のAUROC値を記録し、二つの外部テストセットでそれぞれ0.958と0.978の値を記録しました。
実験結果
- 癌診断性能:TORCHモデルは五つのテストセットでそれぞれ0.974のAUROC値、92.6%の精度、92.8%の感度、92.4%の特異度を達成しました。
- 腫瘍原発部位予測性能:全体の精度は0.969(95%CI: 0.967–0.970)、Top-1精度は82.6%、Top-3は98.9%に達しました。モデルはそれぞれ0.930、0.962、0.960の最高AUROC値と、0.799、0.905、0.947の次高AUROC値を実現しました。
- 病理学者との比較:TORCHの予測能力は病理学者よりも明らかに高く、特に初級病理学者の診断スコア向上に顕著な効果が認められました。
- 生存分析:TORCHが予測した原発部位に一致する治療を受けたCUP患者は、一致しない治療を受けた患者と比較して生存期間が長かった(27ヶ月 vs. 17ヶ月、p=0.006)。
研究結論
TORCHモデルは、臨床実践における重要な補助ツールとしての可能性を示し、細胞画像を用いた癌の診断および原発部位の特定において、顕著な応用の展開が見込まれます。将来のランダム化試験でさらに検証が必要ですが、本研究はCUP患者の臨床管理および個別化治療に信頼性の高い補助データを提供します。
研究のハイライト
- 革新性と応用価値:この研究はCUPの迅速診断において、初めて深層学習の画像解析技術を適用し、診断と予測の精度を著しく向上させました。
- データ量とカバー範囲の広さ:四つの医学センターからの大規模な細胞画像データセットを利用し、研究結果の信頼性と普遍性を高めました。
- インテリジェントな診断支援:TORCHモデルは初級病理学者の診断精度を上級病理学者に近づけ、診断の時間とコストを低減しました。
- 患者の生存期間延長:実際の臨床応用において、TORCHは患者の生存期間を実際に向上させ、その臨床的価値を証明しました。
さらなる研究方向
TORCHモデルは良好な初期結果を示していますが、将来の研究ではさらに多くの臨床データタイプ(例:遺伝データ、放射線画像など)を組み合わせることを検討することができます。また、異なる人種や地域の患者においてその汎用性を確認することが期待されます。
まとめ
本研究は深層学習に基づく腫瘍原発部位予測モデルを提案および検証し、CUPの診断と治療に新しい視点と方法を提供しました。また、医療診断における人工知能の応用において、重要なケーススタディを提供しました。