心脏介入手术中的路径规划模仿学习

模仿学习在心脏经皮介入手术路径规划中的应用

学术背景

心脏瓣膜疾病,尤其是二尖瓣反流(mitral regurgitation, MR),是全球范围内第三大常见的心脏瓣膜疾病,尤其在老年人群中发病率较高。二尖瓣反流的特征是二尖瓣在收缩期无法完全闭合,导致血液从左心室倒流回左心房,如果不及时治疗,可能导致心力衰竭等严重并发症。传统的开胸手术虽然有效,但对患者的创伤较大,恢复时间较长。近年来,微创经皮介入手术(如经导管二尖瓣修复术,TEER)因其创伤小、恢复快等优势,逐渐成为替代传统手术的选择。然而,这类手术对操作者的手眼协调能力要求极高,学习曲线陡峭,且手术通常只能在配备专业设备的中心进行,限制了其普及。

为了应对这些挑战,研究者们开始探索如何通过自动化技术来优化这些手术,特别是如何为机器人操作定义安全的导航路径。然而,心脏内部的动态环境(如二尖瓣的周期性运动)使得传统的静态路径规划方法难以应对。因此,本研究旨在开发一种基于学习方法的路径规划框架,专门用于心脏经皮介入手术中的二尖瓣修复,以应对动态环境和安全需求。

论文来源

本论文由Angela Peloso、Rossella Damiano、Xiu Zhang、Anna Bicchi、Emiliano Votta和Elena De Momi共同撰写,作者分别来自意大利米兰理工大学(Politecnico di Milano)和意大利国家研究委员会生物医学技术研究所(ITB-CNR)。论文于2024年发表在IEEE期刊《IEEE Transactions on Biomedical Engineering》上。研究得到了欧盟“地平线2020”计划的支持,项目名称为ARTERY,资助协议号为101017140。

研究流程

1. 研究目标与方法

本研究的主要目标是开发一种基于模仿学习(imitation learning, IL)的路径规划框架,用于二尖瓣修复手术中的导管导航。研究比较了生成对抗模仿学习(generative adversarial imitation learning, GAIL)和行为克隆(behavioral cloning, BC)等学习方法与传统路径规划算法(如快速扩展随机树,RRT)的性能。研究使用了患者特定的解剖数据,创建了一个数字孪生模型,模拟了二尖瓣的动态运动。

2. 数字孪生模型的构建

研究首先基于患者的CT扫描数据,使用3D Slicer软件对心脏的关键解剖结构(如左心房、二尖瓣和左心室)进行分割,并将其导入Unity平台中构建静态环境。为了模拟二尖瓣的动态运动,研究者提取了二尖瓣环在收缩期的位移数据(mitral annular plane systolic excursion, MAPSE),并通过插值方法在Unity中动态更新目标位置,以模拟二尖瓣的周期性运动。

3. 学习算法的设计与训练

研究采用了四种学习方法进行路径规划:PPO(Proximal Policy Optimization)、BC、GAIL以及GAIL+BC的组合。训练过程中,研究者通过Unity模拟环境记录了100条由专家操作员完成的导管路径作为示范数据。学习算法通过观察当前状态(如导管位置、目标位置、距离等)并采取行动(如导管的前进或旋转)来学习如何规划路径。训练过程中,研究者还设计了任务导向的奖励函数,以引导算法在训练中逐步优化路径规划。

4. 参数调优与验证

为了确保算法的稳定性和性能,研究者进行了超参数网格搜索,并选择了表现最佳的模型进行验证。研究比较了学习算法与RRT算法在静态和动态环境下的性能,评估指标包括路径执行时间、路径长度、目标位置误差、障碍物最小距离和路径平均曲率。

主要结果

1. 参数调优结果

在静态环境下,BC算法在强度参数为0.1时表现最佳,GAIL算法在强度参数为0.1时表现最佳,而GAIL+BC组合在强度参数为0.1-0.1时表现最佳。在动态环境下,BC算法和GAIL+BC组合在强度参数为0.1-0.1时表现最佳,而GAIL算法未能成功到达目标。

2. 路径规划性能比较

在静态环境下,BC和GAIL+BC算法的路径长度和目标位置误差显著低于RRT算法,且路径平滑度更高,障碍物最小距离更大。在动态环境下,GAIL+BC算法在目标位置误差和路径平滑度方面表现优于BC算法,但路径长度略高于RRT算法。整体而言,学习算法在路径重复性和安全性方面表现优异,能够生成与专家操作相似的路径,而无需后续调整。

3. 统计分析与结果解释

统计分析显示,学习算法在路径规划中的目标位置误差显著低于RRT算法,尤其是在动态环境下。此外,学习算法生成的路径在障碍物最小距离和路径平滑度方面也表现出色,表明其在临床应用中具有较高的安全性和可行性。

结论

本研究提出了一种基于学习方法的路径规划框架,用于二尖瓣修复手术中的导管导航。通过结合生成对抗模仿学习和行为克隆,研究成功地在静态和动态环境下生成了安全、平滑且重复性高的路径。相比传统的RRT算法,学习算法在目标位置误差、路径长度和障碍物最小距离等方面表现出显著优势,且无需后续调整。这一框架为未来机器人辅助心脏介入手术的发展奠定了基础,有望减少操作者的依赖性,降低手术风险,并提高患者预后。

研究亮点

  1. 创新性:本研究首次将生成对抗模仿学习和行为克隆应用于心脏经皮介入手术的路径规划中,成功应对了动态环境和安全需求。
  2. 实用性:通过嵌入专家示范数据,学习算法能够生成与临床操作相似的路径,减少了后续调整的需求,提高了手术的标准化和可重复性。
  3. 临床价值:该框架为机器人辅助心脏介入手术提供了新的技术路径,有望推动微创手术的普及和优化。

其他有价值的信息

研究还指出,未来的工作可以进一步扩展该框架,以应对不同患者解剖结构的差异,并在真实临床场景中进行验证。此外,研究还提出了在模拟和物理系统之间进行校准的可能性,以确保机器人导管在现实手术中的精确导航。