基于多站点静息态fMRI数据集的精神疾病分类管道综合评估
背景介绍
精神病学领域长期以来依赖于症状和医学访谈进行诊断,缺乏客观的生物标志物(biomarkers)。静息态功能磁共振成像(resting-state functional magnetic resonance imaging, rs-fMRI)被广泛认为能够揭示大脑结构和功能的特征模式,从而为精神疾病的诊断提供潜在的分类标志物。然而,由于分析管道的多样性,目前尚未形成广泛接受的标志物。不同分析管道的选择对诊断和泛化性能有显著影响,但很少有研究系统地探索理想的管道。因此,本研究旨在通过大规模、多站点的rs-fMRI数据集,全面评估用于重度抑郁症(major depressive disorder, MDD)分类标志物的分析管道,以期为精神疾病的诊断提供标准化流程。
论文来源
本论文由来自日本多个研究机构的团队合作完成,主要作者包括Yuji Takahara、Yuto Kashiwagi、Tomoki Tokuda等,研究团队来自Advanced Telecommunications Research Institute International、Shionogi & Co., Ltd.、The University of Tokyo等机构。论文于2025年2月28日在线发表在《Neural Networks》期刊上,DOI为10.1016/j.neunet.2025.107335。
研究流程
1. 数据集与预处理
研究使用了三个数据集: - 数据集I:包含713名参与者(564名健康对照和149名MDD患者),来自四个站点,数据采集采用统一协议。 - 数据集II:包含449名参与者(264名健康对照和185名MDD患者),来自四个独立站点,数据采集采用异质协议。 - 数据集III:包含231名参与者(125名自闭症谱系障碍患者和106名精神分裂症患者),用于验证管道的泛化能力。
数据预处理使用fMRIprep工具进行,包括切片时间校正、运动校正、共配准、失真校正、T1加权图像分割和标准化等步骤。
2. 分析管道的构建
研究探索了四个子过程中的选项组合: - 脑区划分(parcellation):包括六种方法,如Glasser表面划分、Shen图谱、数据驱动的字典学习等。 - 功能连接(functional connectivity, FC)估计:包括四种方法,如Pearson全相关、切线空间协方差、偏相关和距离相关。 - 站点差异校正(harmonization):包括三种方法,如旅行受试者校正、Combat校正和无校正。 - 机器学习方法:包括五种方法,如Lasso、稀疏逻辑回归、Ridge、支持向量机(SVM)和随机森林。
通过组合这些选项,共构建了360种不同的MDD分类标志物。
3. 分类标志物的构建与验证
使用数据集I作为发现数据集,构建MDD分类标志物,并通过10折嵌套交叉验证(cross-validation, CV)进行评估。随后,将标志物应用于数据集II进行独立验证。为了排除数据集依赖性,研究还交换了数据集I和数据集II的角色,重复了上述流程。
4. 性能评估
评估指标包括曲线下面积(area under the curve, AUC)、准确性、敏感性、特异性和Matthews相关系数(MCC)。研究还定义了“综合得分”(composite score)和“不稳定性”(instability)两个自定义指标,用于全面评估标志物的性能。
5. 标志物相似性分析
研究对排名前10的标志物进行了分类结果和权重相似性分析,以验证其一致性。通过将功能连接映射到Yeo等人的大脑网络,比较了不同标志物在重要功能连接上的网络使用率。
6. 应用于其他精神疾病
研究将排名前10的管道应用于自闭症谱系障碍(ASD)和精神分裂症(SCZ)的数据集,验证其在这些疾病中的分类性能。
主要结果
1. 分类性能比较
研究发现,Glasser表面划分和数据驱动的字典学习在脑区划分中表现最佳,Pearson全相关和切线空间协方差在功能连接估计中表现优异。在站点差异校正中,旅行受试者校正和无校正方法表现相当,而Combat校正的性能显著较低。在机器学习方法中,非稀疏方法(如Ridge和SVM)表现优于稀疏方法。
2. 数据集角色交换验证
通过交换数据集I和数据集II的角色,研究验证了管道的泛化能力。结果显示,Glasser表面划分和Pearson全相关方法在不同数据集角色下均表现稳定。
3. 标志物相似性
排名前10的标志物在分类结果上表现出高度一致性,权重模式在8个标志物中也高度相似。使用数据驱动的字典划分和切线空间协方差的两个标志物与其他标志物的权重相似性较低,表明其可能捕捉了不同的MDD特征。
4. 应用于其他精神疾病
在ASD和SCZ的分类中,排名前10的管道中有8个表现出足够的分类性能,表明这些管道在其他精神疾病中也有广泛的应用潜力。
结论与意义
本研究通过大规模、多站点的rs-fMRI数据集,全面评估了用于MDD分类标志物的分析管道,并确定了在脑区划分、功能连接估计、站点差异校正和机器学习方法中的最佳选项。研究结果表明,Glasser表面划分、Pearson全相关、无校正和非稀疏机器学习方法在构建具有高泛化性能的分类标志物中表现优异。此外,这些管道在ASD和SCZ的分类中也表现出良好的性能,为精神疾病的诊断提供了标准化流程。
研究亮点
- 系统性评估:本研究首次系统地评估了多种先进方法(如Glasser表面划分、距离相关和站点差异校正)在统一框架下的性能。
- 泛化性能验证:通过交换数据集角色,研究验证了管道的泛化能力,确保了其在不同数据集下的稳健性。
- 多疾病应用:研究将排名前10的管道应用于ASD和SCZ,证明了其在多种精神疾病中的广泛应用潜力。
其他有价值的信息
本研究的数据和代码可通过DECNEF项目脑数据仓库(https://bicr.atr.jp/decnefpro/data)获取,为其他研究者提供了宝贵的研究资源。