基于贝叶斯张量建模的阿尔茨海默病影像分类

2024-07-30 Tue
基于贝叶斯张量建模的阿尔茨海默病影像分类引言神经影像学研究是当代神经科学的重要组成部分，极大地丰富了我们对大脑结构和功能的认识。通过这些非侵入性的视觉化技术，研究人员可以更精确地预测某些神经和精神疾病的风险，进而在早期阶段进行干预和治疗，从而改善患者的健康和生活质量。特别是在阿尔茨海默病（Alzheimer’s Disease，以下简称AD）的研究中，神经影像学提供了宝贵的病理机制见解，能跟踪病情进展，识别早期症状并区分其他导致痴呆的原因。
然而，在处理神经影像数据时会面临多个重大挑战，例如数据空间依赖性、高维度及噪声，并且往往难以在异构条件下识别合适的神经生物标志物。为了应对这些复杂的影像数据问题，研究者提出了多种统计和机器学习方法，其中包括基于影像特征的分类模型。
尽管现有的方法有着不同的优缺点，但它们并没有显式考虑影像体素的空间配置，从而可能在处理高维度影像数据时出现瓶颈。在这个背景下，本文提出了一种基于张量表示的数据增强的贝叶斯分类方法，特别适用于影像预测器。
研究来源本研究由Rice University的Rongke Lyu、Marina Vannucci和MD Anderson Cancer Center的Suprateek Kundu，以及来自Alzheimer’s Disease Neuroimaging Initiative（ADNI）的研究者们共同合作完成。论文已被《Neuroinformatics》期刊接受，于2024年5月20日正式发表。
研究流程方法本文提出的贝叶斯分类方法，主要模型是基于张量表示的数据增强方法，具体包含两种增强方案：一种生成支持向量机（Support Vector Machine，简称SVM）类型分类器，另一种生成逻辑回归分类器。
研究中采用了以下关键技术：
张量解析：张量自然继承了多维结构，能很好地表示复杂的数据结构，如大脑区域的空间特征。此外，张量技术能在保持数据结构的基础上实现维度减少。
Parafac分解：这是一种张量分解技术，将高维张量表示为低维因子的组合，既保留了空间信息，也减少了参数的数量。
数据增强：本文采用马尔科夫链蒙特卡洛（Markov Chain Monte Carlo，简称MCMC）算法实现模型，并引入了Polya-gamma潜变量用于逻辑回归模型中的贝叶斯推断。
模拟研究我们在多个模拟场景中验证了方法性能，包括：
场景1：张量系数通过低秩Parafac分解构建，生成二分类结果。
场景2：手动设置张量边际值，生成二分类结果。
场景3：矩形区域内张量系数设置为1，其余区域为0。
场景4：圆形区域内张量系数设置为1，其余区域为0。
场景5：基于ADNI数据集的实际脑部皮层厚度图像进行模拟。
结果发现，我们的方法在系数估计、分类准确率和特征选择的各个指标上均优于现有的惩罚化逻辑回归（fallahati等，2014）和l1范数支持向量机方法。
应用研究我们将方法应用于ADNI数据集，进行以下分类任务：
正常控制组（NC）和AD患者的分类。
正常控制组与轻度认知障碍（MCI）患者的分类。
MCI与AD患者的分类。
性别分类（男性与女性）。
基于MMSE评分（高分与低分）的认知表现分类。
研究发现，我们的方法在各项分类任务中均表现出更高的分类准确率，尤其是在AD与MCI分类中的效果最为显著。其中，切片23在AD与MCI分类任务中表现最好。
主要结果分类准确性：无论是SVM还是逻辑回归增强方案，我们的方法在各类任务中均展现了更高的分类准确度；相比之下，传统的惩罚化逻辑回归和l1范数支持向量机方法在处理高维影像数据时表现较差。
特征选择：贝叶斯逻辑回归方法在特征选择方面表现出更高的敏感性和特异性。
参数估计：贝叶斯SVM方法在参数估计上则更为精准。
结论本文提出的基于贝叶斯张量建模的影像分类方法，通过有效的Parafac分解和数据增强技术，解决了影像数据高维度和空间依赖性问题，显著提高了分类准确性，并能进行明确的特征选择和不确定性量化。未来，本文将致力于开发更高效、更可扩展的版本以应用于三维影像的分类任务，并探索更有效的先验选择以提升特征选择性能。
研究价值本研究为神经影像学数据的高效分析提供了重要方法支持，特别是对于神经退行性疾病的早期检测和风险预测具有重要意义。相较于传统方法，本文所提方法在确保分类准确性的同时，更能精准地选择关键特征，减少模型复杂度，避免过拟合，推动了贝叶斯张量建模在神经科学和医疗数据分析中的应用。