使用PED算法识别自闭症谱系障碍的诊断生物标志物

使用PED算法识别自闭症谱系障碍的诊断生物标志物

通过PED算法识别自闭症谱系障碍的诊断生物标志物

在神经信息学领域,自闭症谱系障碍(ASD)的研究多集中于脑部区域之间的双向连接关系,而较少涉及脑部区域的高阶相互作用异常。为了探讨脑区的复杂关系,作者团队采用了部分熵分解(Partial Entropy Decomposition, PED)算法,通过计算三脑区(triads)的高阶相互依赖性来捕捉高阶相互作用。本文提出了一种基于PED和替代检验方法的方法,检验单个脑区对三重脑区的影响,发现了关键的三脑区。进一步采用超图模块优化算法揭示了高阶脑结构,在ASD中,右丘脑与左丘脑的连接相比于典型对照(TC)更松散。关键的冗余三脑区(左小脑、左楔前叶和右下枕回)的相互作用表现出显著的衰减,而协同的关键三脑区(右小脑、左中央后回和左舌回)的相互作用明显下降。分类模型的结果进一步证实了关键三脑区作为诊断生物标志物的潜力。

研究背景及问题

自闭症谱系障碍(ASD)是一种神经发育非局灶性脑部疾病,其主要特征为社会交流障碍、兴趣狭窄和重复行为。ASD的诊断通常依赖于行为观察、临床访谈和问卷调查,但这些方法可能导致误诊。寻找客观的生物标志物以诊断ASD变得至关重要。在阐明ASD的神经变化时,ASD被认为是一种连接组功能障碍综合征,表现为脑部本质功能连接的异常。功能连接被描述为两个脑区之间的相关性,广泛应用于ASD相关研究。此外,另一种脑连接类型称为有效连接,常见方法有格兰杰因果关系、条件熵等,帮助研究者了解不同脑区之间的信息传递路径。然而,无论是有效还是功能连接,仅描述了双脑区之间的影响作用。考虑到脑区内的复杂关系,分析多个脑区的高阶相互作用不可或缺。

论文来源

本文由来自江南大学的Hao Wang、Yanting Liu和Yanrui Ding撰写,并于2024年3月23日被Springer Science+Business Media, LLC, part of Springer Nature接受,发表在《Neuroinformatics》期刊上。

研究方法及工作流程

研究主要包含以下几个步骤: 1. 数据集:研究采用了ASD和TC的静息态功能磁共振成像(rs-fMRI)数据,数据来自NYU Langone Medical Center,自闭症脑成像数据交换项目(ABIDE)的第一期。 2. 数据预处理:脑部血氧水平依赖(BOLD)信号,对数据进行分离时校正、强度归一化、图像重对准等预处理。 3. 辛格拉电子核函数分解(PED)及高阶依赖性测量:通过PED算法计算所有三脑区(triads)的冗余与协同信息,这些信息用于表征高阶脑结构,并过滤出一些区分ASD和TC的关键三脑区。 4. 分类模型构建:利用关键三脑区的信息(冗余信息和协同信息)作为特征,构建支持向量机(SVM)分类器进行训练,通过网格搜索方法确定最佳参数,并采用十重交叉验证评估分类结果的鲁棒性。

数据集及预处理

研究使用了ABIDE I项目中的静息态功能磁共振成像(rs-fMRI)数据,该数据集已匿名化并根据HIPAA指南不包含受保护的健康信息。数据集由三位人类学家筛选,排除了不完整脑覆盖、高峰值运动、重影和扫描仪伪影的受试者。最终选择了172名受试者,包括74名ASD和98名TC。受试者的脑区通过Craddock 200(CC200)图谱定义,该图谱将脑分为200个不同区域,并采用可配置的脑连接分析管道(C-PAC)进行数据预处理。

部分熵分解(PED)及高阶依赖性测量

通过PED算法计算ASD和TC受试者的所有三脑区的冗余与协同信息,并利用替代数据检验来评估各脑区在三脑区中的重要性。当脑区时间序列替换为随机数据时,重新计算高阶依赖性测量值,发现其是否显著不同于原始高阶依赖性测量值,从而确定关键三脑区。

PED基础上的分类模型

构建分类模型: - 提取关键三脑区的冗余和协同信息作为特征向量,并输入支持向量机(SVM)分类器进行训练。 - 采用五种不同的方法将数据分为训练集和测试集,并使用十重交叉验证评估分类结果的稳健性,分类质量通过准确率、敏感性、特异性、F1评分和曲线下面积进行测量。

研究结果

冗余与协同结构的组间差异

使用超图模块最大化算法生成每个受试者的冗余和协同结构,并与经典七个Yeo系统进行关联分析。结果显示,ASD与TC受试者中某些脑区对的冗余与协同信息显著不同,特别是左小脑和右下枕回等脑区展示了较高的冗余与协同信息差异。

高阶依赖性测量的组间差异

通过两样本t检验发现,ASD显示了在25-183-190的三脑区中冗余相互作用的增加,而在18-31-42、20-62-102等多个三脑区中冗余和协同相互作用减少。

关键三脑区模式的组间差异

注意到在ASD和TC之间的关键三脑区模式发生了变化,特别是在18-108-150、25-183-190等关键三脑区中,ASD更常见的模式是(0, 0, 0),意味着这些脑区在ASD中表现出整体普通状态。

ASD-TC分类模型的性能

使用关键三脑区冗余和协同信息作为特征构建分类模型,当使用冗余信息作为特征时准确率为85%,而使用协同信息作为特征时准确率为80%。综合使用冗余和协同信息作为特征时获得83%的准确率,在不同训练集/测试集划分情况下,最高准确率可达97%。

结论及研究意义

本文提出结合PED与替代检验的方法,解决了PED在单个脑区研究中的局限。研究结果指出ASD中三脑区相互作用或信息传递路径的变化,这些变化是由单个脑区的异常状态引起的。分类模型验证显示,关键三脑区具有潜在的诊断生物标志物价值,为ASD的识别提供了重要依据。这些结果不仅加深了ASD脑功能组织与认知行为变化的理解,还为后续研究提供了重要方向。