使用多视角自适应加权图卷积网络预测非小细胞肺癌的免疫治疗效果

非小细胞肺癌的免疫疗法疗效预测:多视角自适应加权图卷积网络研究报告

背景介绍

肺癌是一种具有极高发病率和较差预后效果的恶性肿瘤,长期以来其致命率居高不下。在所有的肺癌患者中,非小细胞肺癌(Non-Small Cell Lung Cancer,简称NSCLC)约占85%。作为一种新兴的治疗手段,肿瘤免疫疗法为癌症患者提供了新的治疗思路。然而,免疫疗法费用高昂,且仅有约20%到50%的患者能够通过免疫疗法获得满意的疗效。此外,在治疗过程中,免疫性肺炎和肝炎等副作用可能发生。因此,在患者接受免疫疗法治疗前预测其疗效具有重要意义。

近年来,以机器学习为基础的放射组学在预测NSCLC免疫疗法的疗效方面表现出潜力。放射组学特征已经被证明为有效预测免疫疗法疗效的代理标志物。然而,大多数研究仅考虑了个体患者的放射组学特征,忽略了患者间的相互关系。此外,它们通常将不同特征串联作为单一视角模型的输入,未能充分考虑多种类型特征之间复杂的相关性。

论文来源

这篇题为《Immunotherapy Efficacy Prediction for Non-Small Cell Lung Cancer Using Multi-View Adaptive Weighted Graph Convolutional Networks》的论文由Qiong Wu, Jun Wang(IEEE会员), Zongqiong Sun, Lei Xiao, Wenhao Ying 和 Jun Shi(IEEE会员)共同完成。论文发表在《IEEE Journal of Biomedical and Health Informatics》2023年第27卷第11期上,发表时间为2023年11月。

研究流程

数据来源及预处理

本文研究的数据集包含2018年1月至2020年10月期间回顾性收集的107名NSCLC患者的数据。这些患者在接受抗程序性死亡-1(anti-PD-1)免疫疗法前三天进行了CT影像扫描。免疫疗效的评估依据免疫相关的实体肿瘤响应评估标准(Immune-Related Response Evaluation Criteria In Solid Tumors,简称iRECIST)标准,由有经验的放射科医生进行评估,并得到相应的伦理批准。

放射组学特征提取

使用图像生物标志物标准化计划(Image Biomarker Standardization Initiative,简称IBSI)指南并采用开源软件包Pyradiomics,从CT图像的感兴趣区域(ROIs)中提取多种类别的放射组学特征。这些图像分别经多种滤波器如小波滤波器、平方、平方根、对数、指数、梯度和局部二值模式2D(LBP2D)滤波器处理,特征按照图像预处理滤波器类型分为三组。

多视角图构建

在多视角环境下,我们使用X_m表示第m视角中的特征矩阵,A_m表示第m视角中的邻接矩阵。基于Baseline患者特征(如年龄、病理类型和PD-L1表达)计算患者之间的相似性,并构建多视角图。具体的相似性计算方法和公式如下:

A_m(i, j) = s(x_{i, m}, x_{j, m}) \sum_{k=1}^{k}J(p_i^(k), p_j^(k)),
s(x_i, x_j) = exp(-\frac{c^2(x_i, x_j)}{2\sigma^2}),
c(x_1, x_2) = 1 - \frac{cov(x_1, x_2)}{\sigma(x_1) \sigma(x_2)},
J(p_i^(k), p_j^(k)) = \left\{
    \begin{array}{ll}
        1 & \text{if } |p_i^(k) - p_j^(k)| < \tau \\
        0 & \text{otherwise}
    \end{array}
\right.

提出的方法:多视角自适应加权图卷积网络(MVAW-GCN)

网络结构

本文提出了一种多视角自适应加权图卷积网络MVAW-GCN,包含三个通道,每个通道包含两层图卷积和一层可分离图卷积操作,输出包括视角共享和视角特定的嵌入,随后通过注意力机制融合这些嵌入。

图卷积公式为:

H_m^(l) = ReLU(D_m^(∼) ^{-1/2}A_m^(∼) D_m^(∼)^{-1/2}H_m^{(l-1)}W_m^{(l)})

可分离图卷积操作的输出计算公式为:

H_m = ReLU(D_m^(∼) ^{-1/2}A_m^(∼) D_m^(∼)^{-1/2} H_m^{(l-1)} W_m^s) + ReLU(D_m^(∼) ^{-1/2}A_m^(∼) D_m^(∼)^{-1/2} H_m^{(l-1)} W_c)

视角融合模块

视角融合模块通过注意力机制为各视角赋予自适应权重。具体注意力值的计算公式为:

h̃_i,m = tanh(W_att h_i,m + b_att),
α_i,m = softmax(v^t h̃_i,m)

视角权重为:

h = ∑_m^M λ_m H_m

损失函数

考虑到多视角间的视角共享和视角特定信息,本文引入了两种损失函数:一致性损失(consistency loss,L_c)和多样性损失(diversity loss,L_d)。

一致性损失:

L_c = \frac{1}{M} \sum_{m=1}^{M}||H_m^c - H^c||_F^2,
H^c = \frac{1}{M} \sum_{m=1}^{M} H_m^c

多样性损失:

L_d = \sum_{m_1=1}^{M}\sum_{m_2=1}^{m_2≠m_1}HSIC(H_m1^s, H_m2^s)

最终损失函数:

L = L_p + β_1 L_c + β_2 L_d

结果

本文在107名NSCLC患者组成的数据集上验证了提出的方法,共包含52名有效疗效患者和55名无效疗效患者。本文方法在疗效预测上达到了77.27%的准确率和0.7780的AUC,显示出其在NSCLC免疫疗法疗效预测中的有效性。

  1. 准确性对比实验:本文方法使用多个视角的放射组学特征相较于单视角及简单特征拼接的方法在准确率、敏感性、特异性和F1评分上均有提升,表现出多视角学习的优势。
  2. 损失函数的有效性分析:在同时考虑一致性和多样性损失的情况下,本文方法在准确性和AUC上达到最佳,表明综合考虑视角间共享信息和特定信息的重要性。
  3. 注意力机制的有效性:本文通过实验展示了在训练过程中,注意力机制能够动态调整各视角的权重,使得分类结果更为准确。

研究意义

本文提出了一种基于多视角自适应加权图卷积网络的方法,通过综合考虑影像和非影像信息,有效提升了NSCLC免疫疗法疗效预测的准确性。这一研究不仅为机器学习和放射组学在医疗领域的应用提供了新的思路,也为临床医疗决策提供了重要参考,有助于在治疗前评估患者是否能从免疫疗法中受益,减少不必要的治疗费用和副作用风险。

未来展望

尽管本文在NSCLC免疫疗法疗效预测上取得了显著成果,但仍存在一些限制,如样本数限制和单中心数据问题。未来的研究可以考虑多中心数据的收集和验证,以及进一步研究更为全面的生物标志物,如PD-L1表达的影响。

本文研究为利用多视角图卷积网络预测NSCLC免疫疗法疗效提供了有力的理论和实验支持,为该领域的进一步研究奠定了基础。