基于视觉语言整合的零样本人-物交互检测研究

基于视觉语言整合的零样本人-物交互检测研究

基于视觉-语言整合的零样本人-物交互检测研究 学术背景 人-物交互(Human-Object Interaction, HOI)检测是计算机视觉领域的一个重要研究方向,旨在识别图像中人与物体之间的交互行为。传统的HOI检测方法主要依赖于监督学习,即需要大量的人工标注数据来训练模型。然而,这种方法在面对未见过的物体类别时,泛化能力有限。此外,现实世界中的人-物交互种类繁多且复杂,手动标注所有可能的交互类别既耗时又费力。 近年来,随着视觉-语言模型(Vision-Language Models, VLM)的快速发展,零样本学习(Zero-Shot Learning)成为了一个热门研究方向。零样本学习的目标是让模型能够识别在训练过程中从未见过的类别。基于这一背景,作者提出了一种名为“知识整合到HO...

基于电阻式存储器的零样本液态状态机实现多模态事件数据学习

新型阻变存储器驱动的零样本多模态事件学习系统:硬件-软件协同设计的研究报告 学术背景 人类大脑是一种复杂的脉冲神经网络(Spiking Neural Network, SNN),能够以极低的功耗在多模态信号中进行零样本学习(Zero-shot Learning),即通过泛化已有知识来处理新任务。然而,将这种能力复制到神经形态硬件中面临着硬件和软件的双重挑战。硬件方面,摩尔定律的放缓以及冯·诺依曼瓶颈(von Neumann bottleneck)限制了传统数字计算机的效率;软件方面,脉冲神经网络的训练复杂度极高。为了解决这些问题,研究人员提出了一种硬件-软件协同设计的方法,结合了阻变存储器(Resistive Memory)和人工神经网络(Artificial Neural Network,...