小児患者における30日院内死亡率のための術前リスクスコアの国際的多施設外部検証

小児患者における30日院内死亡率の術前リスクスコアの国際的多施設外部検証

学術的背景

小児患者の周術期死亡率は低い(<0.5%)ものの、臨床実践において重要な問題である。従来のリスク評価ツールである米国麻酔科学会(ASA)身体状態スコア(ASA Physical Status, ASA PS)は簡潔であるが、小児患者の個別化されたリスクを完全に反映することはできない。小児患者の周術期死亡率をより正確に予測するために、研究者はさまざまなリスク予測スコアモデルを開発してきた。これらのモデルは、患者の人口統計学的特徴、併存疾患、術前の生理学的データ、薬物使用、手術特性などの多様な要素を組み合わせており、臨床的意思決定を支援することを目的としている。

しかし、これらのリスクスコアモデルを臨床実践で使用するためには、異なる時間、場所、集団での有効性を確認するための外部検証が必要である。これまでの研究では、小児周術期死亡率リスクスコアモデルのうち、外部検証が行われたものはごくわずかである。したがって、本研究の主な目的は、多施設周術期結果グループ(Multicenter Perioperative Outcomes Group, MPOG)の登録データを使用して、小児患者の30日院内死亡率に関する2つのリスクスコアモデルを外部検証し、再調整することである。

論文の出典

本論文は、複数の機関の著者によって共同で執筆され、主な著者にはVirginia E. Tangel(Erasmus University Medical Centre, Rotterdam, Netherlands; Weill Cornell Medicine, New York, NY, USA)、Sanne E. Hoeks(Erasmus University Medical Centre, Rotterdam, Netherlands)、Robert Jan Stolker(Erasmus University Medical Centre, Rotterdam, Netherlands)などが含まれる。論文は2024年10月29日に《British Journal of Anaesthesia》(BJA)にオンライン掲載され、DOIは10.1016/j.bja.2024.09.003である。

研究の流れ

データソースと研究対象

本研究では、MPOGデータベースのデータを使用した。このデータベースには、米国とオランダの複数の病院からの麻酔記録が含まれており、患者の併存疾患、薬物使用、生命徴候、手術タイプ、周術期の転帰などの情報が網羅されている。研究では、2015年10月1日から2020年12月31日までの間に18歳未満の小児患者を対象とし、心臓手術および診断的画像検査の症例を除外した。最終的に、研究には56の病院から606,488症例が含まれた。

リスクスコアモデルの外部検証

本研究では、小児リスク評価スコア(Pediatric Risk Assessment, PRAM)内在的術中リスクスコア(Intrinsic Surgical Risk Score)の2つのリスクスコアモデルを検証した。これらのスコアモデルは、米国外科学会国家手術品質改善プログラム-小児(ACS NSQIP-P)データに基づいて開発され、本研究ではMPOGデータを使用して外部検証を行った。

1. PRAMスコアの外部検証

PRAMスコアモデルには、緊急手術、呼吸器疾患、先天性心疾患、術前の急性または慢性腎疾患などの複数の予測変数が含まれている。MPOGデータベースには一部の変数(例:術前心肺蘇生)が欠如しているため、これらの変数は検証プロセスで省略された。ロジスティック回帰モデルを使用して、PRAMスコアの外部検証における性能は以下の通りであった: - AUROC(受信者動作特性曲線下面積):0.856(95% CI: 0.844-0.869) - AUC-PR(適合率-再現率曲線下面積):0.008

PRAMスコアは、低死亡率確率において良好な較正を示したが、高死亡率確率では性能が低下した。意思決定曲線分析では、PRAMスコアの臨床実践における有用性は限定的であることが示された。

2. 内在的術中リスクスコアの外部検証

内在的術中リスクスコアモデルには、新生児、体重<5kg、ASA PSスコアなどの変数が含まれている。MPOGデータベースでは「内在的術中リスク」という変数を再構築できなかったため、この変数は検証プロセスで省略された。ロジスティック回帰モデルを使用して、内在的術中リスクスコアの外部検証における性能は以下の通りであった: - AUROC:0.925(95% CI: 0.914-0.936) - AUC-PR:0.085

PRAMスコアと比較して、内在的術中リスクスコアは識別能力において優れていたが、依然として多くの偽陽性症例が存在した。意思決定曲線分析では、このスコアの臨床実践における有用性も限定的であることが示された。

モデルの再調整

モデルの予測能力をさらに向上させるために、PRAMスコアと内在的術中リスクスコアを再調整した。再調整後のPRAMスコアのAUROCは0.873(95% CI: 0.861-0.886)、AUC-PRは0.031であった。内在的術中リスクスコアのAUROCは0.925(95% CI: 0.915-0.936)、AUC-PRは0.094であった。再調整後もモデルの識別能力は向上したが、全体的な性能は元の研究を下回った。

主な結果

  1. PRAMスコア:外部検証では、PRAMスコアのAUROCは0.856、AUC-PRは0.008であった。再調整後、AUROCは0.873、AUC-PRは0.031に向上した。識別能力は改善されたものの、PRAMスコアは高死亡率確率における較正性能が低く、意思決定曲線分析では臨床的有用性が限定的であることが示された。

  2. 内在的術中リスクスコア:外部検証では、内在的術中リスクスコアのAUROCは0.925、AUC-PRは0.085であった。再調整後、AUROCは変わらず、AUC-PRは0.094に向上した。このスコアはPRAMスコアよりも識別能力が優れていたが、依然として多くの偽陽性症例が存在し、意思決定曲線分析では臨床的有用性が限定的であることが示された。

結論

本研究では、MPOGデータを使用してPRAMスコアと内在的術中リスクスコアの外部検証と再調整を行った。内在的術中リスクスコアはPRAMスコアよりも識別能力が優れていたが、両スコアモデルとも外部検証における性能は元の研究を下回った。較正指標は低死亡率症例が多いため有利に見えたが、高死亡率確率では両スコアモデルとも過剰予測の傾向を示した。意思決定曲線分析では、これらのスコアモデルを臨床実践で使用することの利点は限定的であることが示された。

研究のハイライト

  1. 外部検証の重要性:本研究は、リスクスコアモデルが臨床応用される前に外部検証を受ける必要性を強調している。PRAMスコアと内在的術中リスクスコアは元の研究では良好な性能を示したが、外部検証では性能が低下し、リスクスコアモデルが異なるデータセットでの適用性に差異があることが示された。

  2. 臨床判断の価値:内在的術中リスクスコアの優れた性能は、ASA PSスコアに大きく依存しており、これは臨床判断が高リスク小児患者の死亡率予測においてリスクスコアモデルよりも有効である可能性を示唆している。

  3. 偽陽性の問題:両スコアモデルとも多くの偽陽性症例を生成し、臨床実践では不必要なリソース配分を招く可能性があるが、偽陰性症例に比べると患者の転帰への影響は小さい。

研究の意義

本研究は、PRAMスコアと内在的術中リスクスコアの臨床実践における限界を外部検証を通じて明らかにした。これらのスコアモデルは元の研究では良好な性能を示したが、外部検証では性能が低下し、リスクスコアモデルが異なるデータセットでの適用性に差異があることが示された。さらに、研究結果は、臨床判断が高リスク小児患者の死亡率予測においてリスクスコアモデルよりも有効である可能性を示唆している。今後の研究では、リスクスコアモデルを改良し、臨床実践での有用性を高めるためのさらなる探求が必要である。

その他の価値ある情報

本研究の限界は、MPOGデータベースに一部の重要な変数(例:術前心肺蘇生や内在的術中リスク)が欠如していることである。これにより、スコアモデルの外部検証における性能が低下した可能性がある。さらに、MPOGデータベースは主に米国の学術医療センターからのデータであり、他の地域やリソースが限られた環境での小児患者集団を完全に代表しているとは限らない。今後の研究では、より広範な集団で検証を行い、これらのリスクスコアモデルの適用性をさらに評価する必要がある。