基于CORDIC的高效激活函数实现方法,用于FPGA上的RNN加速

RNN高效激活函数实现:CORDIC算法与FPGA硬件加速的突破 背景与研究意义 近年来,随着深度学习技术的迅猛发展,循环神经网络(Recurrent Neural Networks, RNNs)尤其是长短时记忆网络(Long Short-Term Memory, LSTM),在时间序列任务中展现出了强大的能力,例如在自然语言处理(Natural Language Processing, NLP)、语音识别和医学诊断等领域取得了广泛应用。然而,与卷积神经网络(Convolutional Neural Networks, CNNs)相比,RNN模型因其复杂性和大量非线性激活函数需求,导致计算代价显著增加。特别是在资源有限的边缘设备(Edge Devices)中部署RNN模型时,激活函数的实现成...