利用联邦学习检测心音异常的一项多机构合作研究

利用联邦学习检测心音异常的一项多机构合作研究

利用联邦学习检测心音异常的一项多机构合作研究 学术背景 心血管疾病(Cardiovascular diseases, CVDs)已经成为主要的死亡原因之一,特别在老年人口中,心血管健康问题亟待社会关注。早期筛查、诊断和预后管理对于预防住院具有重要意义。心音信号携带丰富的生理和病理信息,通过心音进行CVDs早期诊断具有容易获取、广泛存在和非侵入性等优势。近年来,人工智能(AI)在心音辅助诊断中的应用引起了广泛关注,自动心音听诊技术有助于快速、有效地评估心脏状态。然而,现有研究在应用过程中忽略了数据安全和隐私问题,尤其是在多机构数据合作时。 研究来源 本文由Wanyong Qiu, Chen Quan等人撰写,作者分别来自北京理工大学、日本东京大学教育生理学实验室、英国帝国理工学院等知名学术机构...

用于量化帕金森病患者步态冻结的双重门槛模型

帕金森患者步态冻结量化模型研究 背景介绍 帕金森病 (Parkinson’s Disease, PD) 是一种常见的神经退行性疾病,伴随复杂的运动障碍。在帕金森病患者的后期阶段,“步态冻结” (Freezing of Gait, FOG) 现象尤为突出,指患者在行走过程中突然无法启动或继续行走的短暂现象。这种现象不仅会增加跌倒风险,还会显著降低患者的行动能力,严重影响其生活质量。因此,准确量化FOG的严重程度对于帮助临床医生管理此症状并减轻其影响至关重要。 目前临床上常用的新型步态冻结问卷(new Freezing of Gait Questionnaire, NFOG-Q)主要依靠患者自我报告和医生的经验进行评估。然而,这种评估方法带有主观性和不确定性,无法提供精准细致的量化结果。随着技术...

基于领域对抗训练CNN实现在线注意力解码的脑机接口

基于领域对抗训练CNN实现在线注意力解码的脑机接口

跨主体脑机接口:基于卷积神经网络的领域对抗训练实现实时注意力解码 学术背景 注意力解码在我们日常生活中扮演着至关重要的角色,其基于脑电图(EEG)的实现已经引起了广泛关注。然而,由于EEG信号在个体间的显著差异性,为每个人训练一个通用的模型在实践中是不可行的。因此,本文提出了一种端到端的脑机接口(BCI)框架,旨在解决这一挑战,特别是利用了时间和空间的一维卷积神经网络(1D CNN)及领域对抗训练策略(Domain-Adversarial Training)。 传统注意力解码方法通常依赖于预定义的特征提取和模式分类技术,如线性判别分析(LDA)和支持向量机(SVM),但这些方法在处理跨主体数据时表现出局限。另外,深度学习方法虽然在分类性能上表现出色,但如何处理EEG信号的显著个体差异性依旧是...

运动功能障碍的量化和诊断

背景与研究动机 帕金森病(Parkinson’s Disease, PD)是一种神经退行性疾病,主要影响患者的运动能力,导致震颤、运动迟缓、四肢僵硬和行走平衡问题。这种运动缺陷严重影响患者的独立生活能力和生活质量。据统计,预计到2030年,仅在美国就会有近1.2百万人患有帕金森病,而全球的患者数更是超过1000万人。因此,如何准确评估和诊断患者的运动缺陷是一个急需解决的关键问题。 现有的PD严重性评估方法主要依赖于临床医生的主观观察和经验,通过患者在实验室或诊所中进行特定动作来评估。这种方法不仅受到人为主观因素的影响,且在受控环境中的观察无法充分反映患者在日常生活中的实际运动情况。因此,研究人员亟需一种可靠的、非侵入式的量化方法,能客观地评估帕金森病患者的运动缺陷,从而提供更及时有效的康复反...

一种仿生视觉检测模型:基于分数脉冲神经元电路的事件驱动LGMDs实现

一种仿生视觉检测模型:基于分数脉冲神经元电路的事件驱动LGMDs实现

学术报道:基于分数脉冲神经元电路的仿生视觉检测模型研究 在智能自动驾驶和无人驾驶飞行器等领域中,迅速有效地预测碰撞并触发避让行为具有非常重要的应用价值。蚱蜢的巨型运动探测器 (LGMDs) 能够在碰撞发生前有效地预测碰撞,并触发避让。这种能力使得LGMD成为设计碰撞避让人工视觉系统的理想模型。不同于传统CMOS摄像机,事件相机(DVS)能够模拟生物视觉系统中的光感受器,从底层仿真LGMD系统的分野,提供高时间分辨率、高动态范围和最小运动模糊等优势。 背景及意义 本次研究的作者为Yabin Deng、Haojie Ruan、Shan He、Tao Yang和Donghui Guo,分别来自厦门大学和福州大学,并在IEEE Transactions on Biomedical Engineeri...

使用FOV IoU实现360° 图像中的对象检测

使用FOV IoU实现360° 图像中的对象检测 360°摄像机近年来在虚拟现实、自动驾驶和安全监控等多个领域中得到了广泛应用。随着360°图像数据的增加,对360°图像识别任务尤其是对象检测的需求也在不断增长。由于传统方法在360°图像处理中的不足,Miao Cao、Satoshi Ikehata和Kiyoharu Aizawa等研究人员提出了两种基础技术:视场IoU(Field-of-View Intersection over Union,简称FOV-IoU)和360度增强(360augmentation),用以改善360°图像中对象检测的效果。 背景和研究动机 现代大多数对象检测神经网络主要设计用于透视图像,但当应用于等距矩形投影(EquiRectangular Projection...

DVMark:基于多尺度深度学习的视频水印框架

DVMark:基于多尺度深度学习的视频水印框架

DVMark:基于多尺度深度学习的视频水印框架 视频水印技术通过在覆盖视频中嵌入信息来实现数据隐藏。本文提出的DVMark模型是一种基于深度学习的多尺度视频水印解决方案,具有较高的鲁棒性和实用性,能够在保证视频质量的前提下,抵抗各种可能的失真和攻击。 背景与动机 视频水印技术涉及在覆盖视频中嵌入消息,可以是可见的也可以是不可见的。不可见水印因其不会干扰原始内容且难以被攻击者检测到而具有优势。水印可以应用于多种场景,如包含视频创建元数据、时间戳以及创作者信息等。此外,水印也广泛用于信息监控和追踪,这是因为水印即便在视频传播过程中遭受一定程度的失真和修改后仍然可以恢复。 目前,评估视频水印系统的主要因素包括不可见性(质量)、鲁棒性和有效载荷(消息比特数量)。传统的水印方法多依赖于手工设计特征,通...

用于语义分割的堆叠反卷积网络

用于语义分割的堆叠反卷积网络

用于语义分割的堆叠反卷积网络 引言 语义分割在计算机视觉领域中是一项关键任务,其目的是对图像中的每一个像素进行分类,预测其类别。然而,现有的全卷积网络(Fully Convolutional Networks, FCNs)在处理空间分辨率方面存在局限性,容易出现物体边界模糊和小物体丢失的问题。为了解决这些问题,本文提出了一种堆叠逆卷积网络(Stacked Deconvolutional Network, SDN)来提升语义分割的效果。 研究背景 在深度卷积神经网络(Deep Convolutional Neural Networks, DCNNs)的推动下,语义分割取得了显著进展。DCNN通过强大的学习能力可以获取高级语义特征,比如图像分类、目标检测和关键点预测等。然而,DCNN在语义分割任...

FP-Age:利用人脸解析注意机制进行野生环境中的面部年龄估计

FP-Age:利用人脸解析注意机制进行野生环境中的面部年龄估计

FP-Age:利用人脸解析注意机制进行野生环境中的面部年龄估计 研究背景 在人脸图像上进行年龄估计是一项重要的计算机视觉任务,它在法医、安全、健康福祉和社交媒体等多种实际应用中具备广泛的应用前景。然而,由于头部姿势、面部表情和遮挡等多样化因素的存在,深度学习模型在人脸年龄估计领域的表现尚有提升空间。特别是在非受控环境下(“in-the-wild”)的人脸图像中,这些问题尤为突出。为了提高模型在不同条件下的鲁棒性和准确性,作者提出了一种新的方法,旨在将面部语义信息引入到年龄估计过程中,使模型能够有效关注最具信息量的面部区域。 研究人员与发表信息 这篇论文的主要作者包括Imperial College London的Yiming Lin、Jie Shen (通讯作者)、Yujiang Wang和...

TGFuse:基于Transformer和生成对抗网络的红外与可见光图像融合方法

TGFuse:基于Transformer和生成对抗网络的红外与可见光图像融合方法

TGFuse:基于Transformer和生成对抗网络的红外与可见光图像融合方法 背景介绍 随着成像设备和分析方法的发展,多模态视觉数据迅速涌现,具有许多实际应用。在这些应用中,图像融合在帮助人眼感知多模态数据的信息关联中起到了重要作用。尤其是红外和可见光图像的融合,在军事、安全和视觉追踪等领域具有重要应用,成为图像融合任务的重要一环。设计一个自然且高效的图像融合算法,能够提升整图级别的感知,从而适应复杂场景的融合需求。然而,现有基于卷积神经网络(CNN)的融合方法直接忽略了远程依赖性,这妨碍了对整幅图像的平衡感知。 传统的多尺度变换基础上的融合算法,通过提取源图像的多尺度表示并进行融合和还原,获得了初步的研究成果。然而,这些方法在复杂场景的融合方面能力有限,且容易引入噪声,操作效率低。随着...