信息受限环境中的自模型自由学习与外部奖励学习对比研究

自模型自由学习与有外部奖励学习在信息受限环境中的对比:一种新的强化学习框架 近年来,随着网络和人工智能系统的发展,网络化学习机制受到显著的安全挑战。在强化学习(Reinforcement Learning, RL)领域,奖励信号丧失、数据包丢失以及故意的网络攻击已成为影响学习系统性能的重要障碍。针对这一问题,来自乔治亚理工学院的Prachi Pratyusha Sahoo(IEEE学生会员)和Kyriakos G. Vamvoudakis(IEEE高级会员)提出了一种依靠内部奖励信号的新型强化学习框架,称为“自模型无学习”(Self-Model-Free RL)。本文发表于2024年12月《IEEE Transactions on Artificial Intelligence》,展示了在奖...

基于时空图的智能电网对抗性虚假数据注入规避攻击的生成与检测

基于时空图的智能电网对抗性虚假数据注入逃逸攻击的生成与检测 背景介绍 随着现代智能电网的不断发展,电网作为一种典型的网络化信息物理系统(Cyber-Physical Systems, CPS),因其需要在不同组件之间交换大量数据,面临各种安全威胁。其中,虚假数据注入攻击(False Data Injection Attacks, FDIAs)因其能够篡改传感器数据而备受关注。攻击者可以借助这些虚假数据绕过传统的坏数据检测系统(Bad Data Detection, BDD),从而导致错误的操作决策,甚至可能使系统过载。然而,传统FDIAs相对简单,其明显的数据异常容易被数据驱动的机器学习模型检测到。 相比之下,对抗性虚假数据注入逃逸攻击(Adversarial False Data Inje...

基于样本可迁移性加权的部分域适应用于构建钻孔岩性模型

基于弱地质先验的孔隙构建岩性模型的部分域适配研究 背景与研究问题 岩性识别在地层特性分析和油气储层勘探中扮演着至关重要的角色。然而,现有的基于人工智能和机器学习的岩性识别方法,在处理跨井数据时,仍面临着严峻的挑战。具体而言,由于各井之间复杂的沉积环境、不一致的物探设备及测量技术,导致跨井数据分布差异显著。此外,目标井可能包含全新的岩性类别,与已标注的源井数据之间存在标签空间的不一致性 (unshared label space),这进一步加剧了模型在目标井中预测的难度。 本研究提出了一种基于部分域适配(Partial Domain Adaptation,PDA)的创新框架,用于实现复杂地质条件下的跨井岩性预测。核心挑战在于: 1. 数据分布的显著差异导致源井训练的模型无法直接适用于目标井数据...

基于简化核的成本敏感广义学习系统在故障诊断中的应用

基于简化核的代价敏感广泛学习系统(SKCSBLS)应对不平衡故障诊断的研究报告 研究背景及意义 进入工业4.0时代,智能制造日益依赖于工业大数据分析,通过提取机器运行数据中的关键信息,可以提升设备健康管理的有效性,从而实现企业生产的安全性和高效性。然而,在实际工业应用中,不平衡数据给智能制造领域的故障诊断带来了严峻挑战。多数情况下,设备运行数据中正常状态的数据占压倒性多数,而故障数据往往稀少。这种类别分布不均衡可能导致模型的预测准确性下降,并使得小类别(故障类别)难以被有效识别。 目前,深度学习方法(如卷积神经网络和递归神经网络)被广泛应用于故障检测。但这些模型需要大量的训练数据,如果数据量有限,则易出现过拟合问题;此外,这些方法的计算复杂度较高,训练耗时较长。因此,科研人员开始关注结构较为...

基于事件触发的模糊自适应抛物型PDE-ODE系统稳定性控制

科研新闻报告:关于《Event-Triggered Fuzzy Adaptive Stabilization of Parabolic PDE–ODE Systems》 研究背景及意义 在现代工程系统中,例如柔性机械臂、热传导设备和反应器控制器等,许多复杂系统需要通过偏微分方程(Partial Differential Equations, PDE)建模,而PDE通过其独特的反应-扩散特性经常用于描述无穷维系统。然而,当这些系统与常微分方程(Ordinary Differential Equations, ODE)级联组成反应扩散控制系统时,设计有效的控制方案变得更为复杂,尤其是在存在耦合现象或非线性因素的情况下。 特别是在金属轧制、柔性海洋升降装置以及高超音速飞行器热保护等工程领域中,这些...

具有Wiener和Poisson噪声的随机马尔可夫跳跃系统的最优控制:两种强化学习方法

基于Wiener和Poisson噪声的随机Markov跳跃系统的最优控制:两种强化学习方法 学术背景 在现代控制理论中,最优控制是一个非常重要的研究领域,其目标是在各种约束条件下为动态系统设计一个最优控制策略,以最小化给定的成本函数。对于随机系统,传统的最优控制方法通常需要系统的完整模型信息,这在实际应用中存在很大的局限性。近年来,强化学习(Reinforcement Learning, RL)作为一种无需系统模型的方法,逐渐成为解决最优控制问题的重要工具。RL通过直接从数据中学习,能够获得最优值函数和最优策略,并且通过策略迭代(Policy Iteration)方法可以不断改进性能。 随机Markov跳跃系统(Stochastic Markovian Jump Systems, SMJS)...

基于实时神经网络的智能耳机系统创建可编程声泡

探讨“声泡”与未来耳戴式设备:基于实时神经网络的创新研究 在日常生活中,噪声和复杂音景 (Acoustic Scene) 经常造成话语难以辨别,特别是在拥挤的环境中,例如餐厅、会议室或飞机上。传统的降噪耳机虽然能在一定程度上抑制环境噪声,但无法区分音源的距离,亦无法根据特定音源的空间位置精准塑造声场。基于此背景,来自华盛顿大学Paul G. Allen计算机科学与工程学院、微软以及AssemblyAI的团队开展了一项重要研究。他们开发了一套能够创建“声泡”(Sound Bubbles)的智能耳戴式设备,借助多通道麦克风阵列及实时嵌入式神经网络,解决了上述困境。本文发表在《Nature Electronics》2024年11月期,展示了这项研究在听觉增强领域的重要突破和技术实现。 技术背景与科...

基于多光电晶体管-单忆阻器阵列的可重构传感器内处理

基于多光晶体管-单忆阻器阵列的可重构传感器内处理:一种融合机器学习与类脑神经网络的新型视觉计算平台 学术背景及问题提出 人工视觉系统作为智能边缘计算的重要组成部分,长期以来受到传统基于CMOS(互补金属氧化物半导体)技术与冯·诺依曼架构的限制。这类系统的图像处理效率受制于独立的图像传感器、存储模块以及处理器之间的物理分离。这种分离导致大量数据冗余和信号处理延迟,增加了电路复杂性和功耗问题,限制了实时处理能力。在自然环境中,传统视觉系统需要完成从信号捕获到图像处理的一系列繁杂过程,但其效率有限。 近年来,传感器内计算(in-sensor computing)这一融合感知与计算的新型架构,由于其具备内存计算(in-memory computing)和神经形态特性,逐渐受到关注。在此领域,光学神经...

基于单换能器的可穿戴回声肌电图系统

穿戴式单一声波肌电图系统的创新突破:从肌肉动态监测到复杂手势跟踪 学术背景与研究意义 近年来,穿戴式电子设备因其在健康监测和人机交互领域中的巨大潜力而备受关注。其中,表面肌电图(Electromyography,EMG)作为一种能够测量肌肉活动的技术,已成为研究的热点。然而,EMG 信号存在诸多限制:信号强度弱且不稳定,空间分辨率较低,且信噪比不佳。其随机性和低同步性的问题导致测量结果的不一致,使得难以实现对特定肌肉纤维贡献的有效分离。此外,为提高信号质量所采用的大型电极会进一步降低空间分辨率。 相比之下,超声波肌电图(Echomyography,ECMG)是一种利用超声波来测量肌肉活动的技术,具有安全、稳定、灵敏度高等特点。然而,目前依赖刚性或柔性传感器阵列的 ECMG 系统需要复杂的线路...

使用范德华金属阴极实现模拟开关和高开关比的忆阻器

基于二维范德华金属阴极的模拟电阻开关存储器研究 学术背景 随着人工智能(AI)应用的快速发展,传统的冯·诺依曼架构在数据密集型计算任务中面临性能瓶颈。神经形态计算(neuromorphic computing)作为一种新兴的计算范式,能够以更高的速度和效率处理数据密集型任务。在这一领域中,忆阻器(memristor)因其能够实现内存计算和模拟计算而备受关注。特别是具有多级电导状态的模拟忆阻器,能够显著提高神经形态计算的效率。然而,现有的模拟忆阻器通常具有较小的开关比(on/off ratio),这限制了其在高精度权重映射中的应用。 为了解决这一问题,研究人员一直在探索如何提高模拟忆阻器的开关比,同时保持其多级电导状态。传统的忆阻器主要分为两类:基于价态变化机制(valence-change-...