低線量CT再構成のための雑音生成および画像化メカニズムに着想を得た暗黙の正則化学習ネットワーク

ノイズ生成とイメージングメカニズムに基づく暗黙の正則化学習ネットワークの低線量CT再構成への応用

低線量コンピュータ断層撮影(Low-Dose Computed Tomography, LDCT)は、放射線リスクを低減しつつ画像品質を維持するための重要なツールとなっています。しかし、X線の線量を減少させるとデータの損失が生じ、初通ボタン(FBP)再構成が悪化して画像品質に影響を及ぼします。この問題に対処するため、研究者たちはノイズやアーチファクトを減少させつつ、高品質な画像を取得するための高度なアルゴリズムを開発し続けています。本報告では、高性能なLDCT再構成を実現するための新しい研究成果を詳細に紹介します。

暗黙の正則化学習ネットワーク

背景紹介

X線CTイメージングでは、放射線量を減少させることが常に目標とされており、X線管の電流や電圧の低減、スパースビュー、および角度スキャンの制限などで実現されます。しかし、これらのイメージングプロトコルはデータの損失と不安定な再構成を引き起こし、古典的なFBPアルゴリズムを用いることで得られる画像品質が劣ることがあります。そのため、新しい高品質な再構成アルゴリズム、特にLDCTにおけるアルゴリズムの開発が緊急に求められています。

従来の方法は大きく三つに分かれます:投影に基づく補正方法、画像に基づく復元方法、および反復再構成アルゴリズム。投影に基づく補正方法は、測定されたノイズの統計特性と先験的知識を組み合わせてデノイズし、その後FBP再構成を用いて投影データを得ます。画像に基づく復元方法は、画像領域の先見情報を利用してアーチファクトやノイズを処理します。反復再構成アルゴリズムは、測定されたノイズの統計特性とCT画像の先見情報を組み合わせて目的関数を構築し、最適化の反復を通じて高品質なCT画像を得ます。しかし、適切な正則化とハイパーパラメータの選択は非常に困難で、反復アルゴリズムは頻繁な前後投影による計算コストが高く、臨床応用に制限があります。

近年、CT再構成技術は徐々にディープラーニング(Deep Learning, DL)手法に集中し、特にデータ駆動とモデル駆動のディープラーニング戦略が注目されています。これらの戦略は、対になるトレーニングデータを用いてノイズ測定値または画像から目標画像への非線形写像を学習します。これらの方法は計算コストと応用において有望ですが、その出力はデータ一貫性に欠けることがあり、大量の臨床トレーニングデータが必要です。

研究出典

この研究論文「Noise-Generating and Imaging Mechanism Inspired Implicit Regularization Learning Network for Low Dose CT Reconstruction」はIEEE Transactions on Medical Imaging誌に掲載されており、巻号43、番号5、発行時期は2024年5月です。著者には、西安交通大学、オタワ大学、南方医科大学、深圳先進技術研究院などの研究機関のXing Li、Kaili Jing、Yan Yang、Yongbo Wang、Jianhua Ma、Hairong Zheng、Zongben Xuが含まれています。

研究手法

本文では、全域ノイズ生成とイメージングメカニズムに基づくLDCT再構成の新しいモデルを提案し、LDCTに内在するノイズの統計的特性と画像領域およびシノグラム領域の先見情報を総合的に考慮します。このモデルは、近接勾配技術に基づく最適化アルゴリズムを用いて解決され、具体的な手順は以下の通り:

モデル構築

  1. 生成モデルの定義

    • 投影データ ( s ) は通常ノイズを含み、次の生成モデルを設定します:[ s = t + \epsilon ]
    • ここで ( t ) は検出器によって得られる放射量子を表し、ポアソン分布に従います。 ( \epsilon ) は電子ノイズを表し、正規分布に従います。
  2. 最適化問題の変換

    • 最大事後確率推定(MAP)理論に基づき、ノイズのない清潔な投影データ ( y ) を見つけます。また、再構成されたCT画像 ( x ) のデータ忠実度制約およびs形とイメージング領域の充足な正則化を加えて、次のように最適化問題を形式化します:[ \min{t,y,x} \sum{i=1}^n ((s_i - t_i )^2 / 2\sigma^2 - t_i \ln I_0 + t_i y_i + \ln t_i ! + I_0 e^{-y_i}) + \lambda_1 g_1(y) + \lambda_2 g_2(x) + |Ax - y|_2^2 / 2 ]

モデル最適化

投影領域、シノグラム領域、および画像領域のデータを交互に更新します。

  1. 投影データ ( t ) の更新

    • ポアソン分布パラメータの複合を求解し、連続変数緩和問題によりニュートン法を用いて投影データを更新します。
  2. シノグラムデータ ( y ) の更新

    • 近似二次導関数最小化対象関数に基づき、 ( y ) の更新公式を求めます:[ y^{(n)} = \textrm{prox}_{\lambda_1 \eta_2}(y^{(n-1)} - \eta_2 \nabla f(y^{(n-1)})) ]
  3. CT画像 ( x ) の更新

    • 同様にして二次導関数最小化対象関数を使用し、 ( x ) の更新公式を求めます:[ x^{(n)} = \textrm{prox}_{\lambda_2 \eta_3}(x^{(n-1)} - \eta_3 \nabla f(x^{(n-1)})) ]

ネットワーク構造

提案するアルゴリズムを深層ネットワークに展開し、各ステップを繰り返すことで、NGIM-IRLと呼ばれるネットワークアーキテクチャを構築しました。このネットワークには以下の三つのモジュールが含まれます:

  1. T-Net:サブ問題を解決し、投影データを更新します。
  2. Y-Net:シノグラムデータ復元問題を解決します。
  3. X-Net:CT画像の復元問題を解決します。

このネットワーク構造は、シノグラムおよび画像領域の対応する正則化オペレーターを暗黙的に学習する二つの深層ニューラルネットワークを通じて、再構成プロセスの説明性と効果を向上させます。

研究結果

この方法は複数のデータセットでその優れた性能を示しました。

データセットと実験設定

Mayo Clinicの全身CTスキャン画像データセットおよびLodopab-CTデータセットを使用し、さまざまな劣化レベルの低線量画像をシミュレートして実験を行いました。

実験結果

異なる線量レベル下での実験結果は、従来の方法や他のディープラーニングに基づく方法と比較して、NGIM-IRLがピーク信号対雑音比、構造類似度指数、平均二乗誤差などにおいて優れた性能を示していることを明らかにしました。具体的には:

  1. 低線量CTグランドチャレンジデータセット:三つの異なる線量レベルで、提案する方法は常に最良の画像品質と低いアーチファクトレベルを示しました。
  2. Lodopab-CTデータセット:定量指標において他の比較方法よりも顕著に優れており、低線量CT再構成タスクにおける良好な適応性と堅牢性を示しました。

ネットワーク訓練と実行効率

他の反復ディープラーニング方法と比較して、NGIM-IRLの訓練時間が短く、実行時間も速いため、特に臨床応用において重要です。

研究意義

  1. 科学的意義:本研究はノイズ生成とイメージングメカニズムに基づく新しいモデルを提案し、LDCT再構成の理論と実践を改良し、従来の方法と単なる機械学習に基づく方法の間のギャップを埋めました。
  2. 応用価値:本方法は計算コストの低減と画像品質の向上において顕著な利点を示し、重要な臨床応用の潜在力を持っています。

要するに、本論文で提案するNGIM-IRL方法は、複数の定量指標において既存の方法を超越し、実際の画像品質と実行効率においても顕著な利点を示しています。LDCT再構成分野に新たな解決策および研究方向を提供し、研究チームはこの方法をフォトンカウントCTやスペクトルCTに拡張する可能性をさらに探求し、臨床応用価値を一層高めていく予定です。