分享自:

基于深度强化学习的弹性光网络路由与频谱分配方法研究

期刊:Journal of Lightwave TechnologyDOI:10.1109/JLT.2022.3175865

类型a:这篇文档报告了一项原创研究。

主要作者和机构,以及发表期刊和时间
本研究的主要作者包括Liufei Xu、Yue-cai Huang(通讯作者)、Yun Xue和Xiaohui Hu,他们均来自华南师范大学的物理与电信工程学院或电子信息工程学院。该研究于2022年8月1日发表在《Journal of Lightwave Technology》第40卷第15期。

学术背景
这项研究属于光通信和弹性光网络(Elastic Optical Networks, EONs)领域。随着社会对通信需求的增长,现有的网络架构面临巨大压力,而弹性光网络因其高吞吐量和传输灵活性成为下一代骨干网络的热门候选技术。然而,在弹性光网络中,路由和频谱分配(Routing and Spectrum Assignment, RSA)是一个关键且复杂的NP难问题。传统的启发式方法难以捕捉网络环境中的复杂特征,因此限制了其性能提升。近年来,深度强化学习(Deep Reinforcement Learning, DRL)被引入RSA问题以克服这些局限性。尽管如此,当前基于DRL的方法在状态表示和特征提取方面仍存在不足,尤其是未能充分考虑光网络拓扑信息和路径级特征。为解决这些问题,本研究提出了一种结合图卷积神经网络(Graph Convolutional Network, GCN)和循环神经网络(Recurrent Neural Network, RNN)的新方法,用于提取网络拓扑特征和聚合链路级特征,从而提高RSA决策的性能。

研究流程
本研究的工作流程主要包括以下几个步骤:

  1. 网络拓扑特征提取
    研究首先将原始网络拓扑转换为一种新的图结构,称为TSG(Transformed and Simplified Graph)。TSG通过将链路视为节点并保留其连接关系来简化拓扑信息。随后,使用GCN模块提取TSG中的拓扑特征。具体来说,每个候选路径的链路-路径关系矩阵作为输入,通过GCN的逐层传播公式(如公式(1)所示)聚合相邻节点的特征,最终得到每个路径的拓扑特征表示。

  2. 路径级特征提取
    在提取拓扑特征后,研究进一步利用RNN模块聚合链路级特征到路径级特征。由于不同路径的链路数量可能不同,研究设计了一种“开关”机制控制RNN的循环次数,确保所有路径的特征都能被有效提取。最终,RNN模块输出路径级特征,这些特征反映了候选路径的整体特性。

  3. 全连接层特征聚合
    提取的拓扑特征和路径级特征与交通请求及频谱可用性分布信息一起输入到全连接神经网络层进行整合。全连接层负责将所有信息融合,并生成策略网络和价值网络的输出。策略网络通过Softmax层输出动作概率分布,而价值网络通过线性层输出状态值函数。

  4. 训练过程
    本研究采用优势演员-评论家(Advantage Actor-Critic, A2C)算法进行模型训练。训练过程中,代理(Agent)与弹性光网络环境交互,收集样本并计算优势函数(如公式(8)所示)。通过梯度下降和上升法更新策略网络和价值网络的参数(如公式(9)和公式(10)所示),以优化长期奖励。

主要结果
1. 不同拓扑结构下的性能表现
研究在NSFNet、Cost-239和USNet三种不同拓扑结构的弹性光网络上进行了仿真。结果表明,所提出的方法在降低阻塞概率方面优于传统KSP-FF算法和DeepRMSA方法。例如,在NSFNet拓扑中,阻塞概率分别降低了30.14%(对比KSP-FF)和14.08%(对比DeepRMSA)。

  1. 带宽需求分布的影响
    在非均匀带宽需求分布下,所提出的方法仍然表现出优越性能。仿真结果显示,无论是在小带宽需求为主还是大带宽需求为主的场景中,该方法均能显著降低阻塞概率。

  2. 流量负载变化的影响
    研究还探讨了流量到达率变化对性能的影响。实验表明,即使在迁移学习(Transfer Learning)的情况下,所提出的方法仍能在不同流量负载下保持良好的性能。例如,在NSFNet拓扑中,当到达率为7到23时,“Our Approach(TF)”的平均阻塞概率比KSP-FF降低了28.15%,比DeepRMSA(TF)降低了22.77%。

结论及其意义
本研究成功提出了一种基于GCN和RNN的深度强化学习方法,用于弹性光网络中的路由和频谱分配问题。实验结果表明,该方法在多种拓扑结构、带宽需求分布和流量负载条件下均具有优越性能。此外,研究还展示了迁移学习在实际应用中的潜力,为未来弹性光网络的智能化管理提供了重要参考。

研究亮点
1. 创新性方法:首次将GCN和RNN结合用于弹性光网络的状态特征提取,解决了传统方法在拓扑信息和路径级特征提取上的不足。
2. 广泛适用性:所提出的方法在不同拓扑结构、带宽需求分布和流量负载下均表现出色,具有较强的通用性。
3. 迁移学习的应用:研究验证了迁移学习在流量负载变化场景中的有效性,减少了重新训练的需求。

其他有价值内容
研究指出,未来工作可以进一步探索输入状态表示、GCN和RNN架构设计的优化方向。此外,数字孪生(Digital Twin)技术被建议作为强化学习模型的训练环境,以减少实际部署中的风险和成本。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com