基于内存计算的深度贝叶斯主动学习研究

随着人工智能(AI)技术的快速发展,深度学习在复杂任务中取得了显著进展。然而,深度学习的成功在很大程度上依赖于大量标注数据,而数据的标注过程不仅耗时、劳动密集,还需要专业的领域知识,成本高昂。特别是在一些专业领域中,如机器人技能学习、催化剂发现、药物发现和蛋白质生产优化等,获取标注数据的难度和成本尤其突出。为了解决这一问题,深度贝叶斯主动学习(Deep Bayesian Active Learning, DBAL)应运而生。DBAL通过主动选择最有信息量的数据进行标注,显著提高了标注效率,从而在有限标注数据的情况下实现高质量的学习。 然而,DBAL的实现面临着一个重要的技术挑战:它需要处理大量的随机变量和高带宽的数据传输,这对传统的确定性硬件提出了极高的要求。传统的互补金属氧化物半导体(Co...

基于多目标进化优化的移民重新安置问题研究

通过多目标进化优化解决移民安置问题的新框架研究报告 在全球化进程加速和不断变化的社会经济背景下,移民(migrants)现象已经成为一种不可忽视的全球趋势。不管是出于人道主义救助的角度,还是从全球化经济的可持续发展出发,有效地管理和安置移民已成为一个复杂的重要课题。据统计,截止2019年,国际移民的总数已达到2.72亿人,呈现出大幅超出先前预测的增长趋势,并且这一现象在未来还将持续。然而,与此同时,移民安置过程中也面临着诸多挑战:如何提升移民的就业率以及如何合理分配移民至合适的定居点?这些问题的答案对移民本身、对东道国、乃至整个社会的经济与文化福祉都有重要影响。 基于这一全球性问题,本研究由南京大学、Peng Cheng实验室及Southern University of Science a...

混合环境中基于关系图学习的强化学习多智能体协作导航

多智能体混合环境协作导航研究:基于关系图学习的强化学习新方法 移动机器人技术正随着人工智能领域的发展迎来应用热潮,其中导航能力是移动机器人研究的核心热点之一。传统导航方法在面对动态环境、障碍物规避以及多机器人协作任务时,往往面临算法复杂度、计算资源消耗以及模型普适性的问题。针对这些问题,来自Central South University与Zhejiang University of Technology的研究团队提出了一种基于关系图注意力网络(Graph Attention Network, GAT)的新方法,称为GAR-CoNav,为混合环境中的多目标协作导航问题(Multi-Robot Cooperative Navigation Problem, MCNP)提供了新的解决方案。这篇发...

自适应复合固定时间强化学习优化的非线性系统控制及其在智能船舶自动驾驶上的应用

智能船舶自动驾驶的非线性固定时间强化学习优化控制研究 近年来,智能自动驾驶技术逐渐成为自动化控制领域的研究热点之一。在复杂的非线性系统中,优化控制策略的设计,尤其是在固定时间内实现系统稳定性和性能优化方面,是控制工程师和研究人员面临的重要挑战之一。然而,现有的固定时间控制理论在实现系统状态收敛时,往往忽略了资源利用效率和平衡问题,这可能导致过度补偿或欠补偿的现象,从而使系统的稳态误差增加。此外,对于如何在时间限定内实现非线性不确定性估计误差的最小化,相关研究依然较少。因此,本研究旨在提出一种自适应复合固定时间强化学习优化控制解决方案,进一步解决这一关键问题。 研究背景及目的 固定时间控制理论自提出以来,由于收敛时间不依赖于初始状态的特点,其应用得到了广泛关注。相比有限时间控制方法,固定时间控...

基于策略共识的分布式确定性多智能体强化学习方法研究

基于策略共识的分布式确定性多智能体强化学习研究报告 强化学习(Reinforcement Learning, RL)近年来在诸多领域取得了显著突破,包括机器人学、智能电网和自动驾驶等。然而,在实际场景中,常常涉及到多智能体(Multi-Agent Reinforcement Learning, MARL)的协作学习问题。这类问题的核心挑战在于设计高效的多智能体协作强化学习算法,尤其是在受制于通信能力限制或隐私保护的情况下。目前,多数的MARL算法依赖一种被广泛采用的集中化训练-分布式执行(Centralized Training with Decentralized Execution, CTDE)范式。该范式虽然可以有效解决环境的非平稳性问题,但由于其重通信和集中化处理的本质,使其在实际部...

基于SHAP误差补偿方法的改进可解释电价预测模型

基于SHAP的电力价格预测模型改进研究及其可解释性分析 背景与研究动机 电力市场中的价格预测模型近年来成为研究热点,尤其是考虑到电力市场波动对利益相关方的财务影响。特别是,在欧洲能源市场中,受能源危机和地缘政治影响,最近几年燃料价格急剧上升,导致电力市场的价格波动性显著增加。即使是1%的预测误差,也可能对发电公司、负荷服务实体和交易公司产生巨大的财务后果。例如,对于用电量达到1GW的公司而言,仅1%的预测改进便可带来每年约1200万美元的节省。因此,提高电力价格预测(Electricity Price Forecasting,EPF)模型的精准度对市场参与者来说至关重要。 虽然基于机器学习(Machine Learning,ML)和深度学习(Deep Learning)技术的EPF模型在预测...

通过多任务遗传编程实现带目标偏好的多目标动态灵活车间调度

多目标动态灵活作业车间调度的突破性研究:一种通过多任务学习优化目标偏好遗传规划的创新方法 背景介绍 动态灵活作业车间调度(Dynamic Flexible Job Shop Scheduling, DFJSS)是一个重要的组合优化问题,在制造、仓储等领域的生产过程具有广泛的实际应用。例如,它被用于优化制造过程中的任务分配或仓库的订单拣选工作。该问题的核心是如何在动态环境中,为多个机器和多个作业执行灵活的任务分配和操作排序决策,从而最大化某些效率指标或最小化时间成本。然而,这个问题的复杂性极高,尤其是当任务动态到达或机器发生故障时,传统的优化方法往往面临计算复杂度和实时性不足等问题。 近年来,遗传规划(Genetic Programming, GP)作为一种超启发式方法,被广泛用于为动态灵活作...

NPE-DRL: 一种用于无人机在感知受限环境下规避障碍物的非专家策略增强深度强化学习方法

基于非专家策略强化学习改进无人机视觉受限环境下的避障能力研究 近年来,无人机(Unmanned Aerial Vehicle,UAV)凭借其卓越的机动性和多样化的功能,广泛应用于包裹递送、风险评估和紧急救援等民用领域。然而,随着无人机执行任务的复杂性、范围和时长的增加,其自主导航的难度也显著上升,尤其是在拥挤且高度不确定的环境中实现避障。然而,传统的全球导航方法通常依赖全局信息,难以处理视觉受限条件下的障碍场景。本研究的目的是解决这些场景中的避障问题,提升无人机的实时导航能力。 此外,尽管基于深度强化学习(Deep Reinforcement Learning,DRL)的避障算法通过端到端处理方式表现出色,能够减小计算复杂度并提升适应性和可扩展性,但它们的采样效率偏低,需要大量的样本迭代以实...

基于CORDIC的高效激活函数实现方法,用于FPGA上的RNN加速

RNN高效激活函数实现:CORDIC算法与FPGA硬件加速的突破 背景与研究意义 近年来,随着深度学习技术的迅猛发展,循环神经网络(Recurrent Neural Networks, RNNs)尤其是长短时记忆网络(Long Short-Term Memory, LSTM),在时间序列任务中展现出了强大的能力,例如在自然语言处理(Natural Language Processing, NLP)、语音识别和医学诊断等领域取得了广泛应用。然而,与卷积神经网络(Convolutional Neural Networks, CNNs)相比,RNN模型因其复杂性和大量非线性激活函数需求,导致计算代价显著增加。特别是在资源有限的边缘设备(Edge Devices)中部署RNN模型时,激活函数的实现成...

基于单片3D IGZO-RRAM-SRAM集成架构实现稳健且高效的计算存储

基于单片集成的三维IGZO-RRAM-SRAM计算存储新架构研究:提高神经网络计算效率的突破 背景与研究动机 随着神经网络(Neural Network, NN)在人工智能领域应用的不断深入,传统计算架构难以满足其在能耗、速度和密度方面的需求。这促使研究者将目光投向计算存储(Compute-In-Memory, CIM)芯片技术。CIM通过将计算单元与存储单元集成在一个架构中,避免大量数据在存储与计算单元间传递的“存储墙”效应,从而显著提高系统效率。已有CIM架构主要基于静态随机存取存储器(Static Random Access Memory, SRAM)、电阻随机存取存储器(Resistive Random Access Memory, RRAM)和氧化铟镓锌(Indium-Galliu...