基于扩散模型的特征增强在整张切片图像多实例学习中的应用

基于扩散模型的特征增强:针对全视野病理图像多实例学习的新方法 学术背景与研究动机 在计算病理学(computational pathology)领域,如何有效分析全视野扫描病理图像(Whole Slide Images,WSIs)是当前研究的热点。WSIs 是超高分辨率的图像,通常具有广域的视野,广泛用于癌症诊断。然而,由于病例标记的稀缺性以及图像自身的体量庞大,基于深度学习的多实例学习(Multiple Instance Learning,MIL)在WSI的自动化分析中面临诸多挑战。 MIL 是一种经典的弱监督学习方法,核心思路在于将整个WSI看作一个“袋”级别的实例,而每块小图像(patch)作为单独的“袋中实例”。虽然袋级别的标签已知,但单个实例的标签未知。在 MIL 的应用中,常见的...

基于单换能器的可穿戴回声肌电图系统

穿戴式单一声波肌电图系统的创新突破:从肌肉动态监测到复杂手势跟踪 学术背景与研究意义 近年来,穿戴式电子设备因其在健康监测和人机交互领域中的巨大潜力而备受关注。其中,表面肌电图(Electromyography,EMG)作为一种能够测量肌肉活动的技术,已成为研究的热点。然而,EMG 信号存在诸多限制:信号强度弱且不稳定,空间分辨率较低,且信噪比不佳。其随机性和低同步性的问题导致测量结果的不一致,使得难以实现对特定肌肉纤维贡献的有效分离。此外,为提高信号质量所采用的大型电极会进一步降低空间分辨率。 相比之下,超声波肌电图(Echomyography,ECMG)是一种利用超声波来测量肌肉活动的技术,具有安全、稳定、灵敏度高等特点。然而,目前依赖刚性或柔性传感器阵列的 ECMG 系统需要复杂的线路...

深度学习算法在英国乳腺癌筛查队列中的应用

深度学习算法在乳腺癌筛查中的应用 学术背景 乳腺癌是全球女性中最常见的癌症之一,早期筛查对于提高治愈率至关重要。传统的计算机辅助检测(Computer-Aided Detection, CAD)系统在乳腺X线摄影筛查中已被广泛使用,尤其是在美国。然而,这些系统虽然提高了召回率,但对读者(即放射科医生)的表现改善有限。近年来,深度学习(Deep Learning, DL)算法在医学影像分析中的应用迅速增长,特别是在乳腺癌筛查领域。多项系统综述和荟萃分析表明,自2017年以来,DL算法在乳腺X线摄影筛查中的证据迅速增加。尽管一些研究表明,DL算法作为单一读者时表现不逊于人类读者,但目前尚无独立算法能够在保持可接受召回率的同时,优于标准的双阅读系统。因此,DL算法目前还无法完全取代人类读者在双阅读...

基于CellMincer的电压成像数据自监督去噪方法

学术背景 电压成像(voltage imaging)是一种用于研究神经元活动的强大技术,但其有效性通常受到低信噪比(SNR)的限制。传统的去噪方法,如矩阵分解,对噪声和信号结构施加了严格的假设,而现有的深度学习方法未能完全捕捉电压成像数据中固有的快速动态和复杂依赖关系。为了解决这些问题,本文提出了一种名为CellMincer的新型自监督深度学习方法,专门用于去噪电压成像数据集。CellMincer通过掩码和预测短时间窗口内的稀疏像素集,并结合预计算的时空自相关来有效建模长程依赖关系,从而显著提高了去噪效果。 电压成像利用荧光报告分子(如小分子染料或基因编码的蛋白质)来测量电活性细胞的膜电位。与传统的膜片钳电生理学(patch-clamp electrophysiology, EP)相比,电压...

溶液中RNase P RNA的构象空间研究

RNA构象空间的研究:RNase P RNA在溶液中的动态结构 学术背景 RNA的构象多样性在生物学中具有重要作用,尤其是在RNA剪接、包装、细胞转录激活以及环境刺激响应等过程中。然而,传统的生物物理技术无法直接可视化RNA在溶液中的完整构象空间。RNase P RNA是一种存在于所有生命体中的RNA酶,负责编辑前体tRNA(pre-tRNA)的5’端。由于其底物特异性广泛,RNase P RNA被认为具有高度的构象灵活性,这种灵活性与其酶活性所需的刚性结构之间存在着复杂的平衡关系。理解这种构象灵活性与结构刚性之间的关系,对于揭示RNA的功能和生物学意义至关重要。 论文来源 本论文由Yun-Tzai Lee、Maximilia F. S. Degenhardt、Ilias Skeparnia...

动态注意视觉-语言Transformer网络在人员重新识别中的应用

动态注意力视觉语言Transformer网络用于行人再识别的研究报告 近年来,基于多模态的行人再识别(Person Re-Identification, ReID)技术在计算机视觉领域受到越来越多的关注。行人再识别旨在通过跨摄像机视角识别特定行人,是安全与监控应用(如寻找失踪人员、追踪犯罪分子)的关键技术。然而,多模态ReID技术融合视觉和文本信息时面临重大挑战,包括特征融合的偏差以及领域差异对模型性能的影响。 本文由Guifang Zhang、Shijun Tan、Zhe Ji和Yuming Fang等人撰写,来自江西财经大学计算与人工智能学院及纽卡斯尔大学纽卡斯尔商学院,发表于2024年《International Journal of Computer Vision》。研究提出了一种动...

重新思考用于生物识别数据错误校正的当代深度学习技术

重新思考深度学习技术在生物特征数据纠错中的应用 背景介绍 随着信息技术的发展,生物特征数据在身份验证和安全存储中的应用愈发广泛。传统密码学通常依赖均匀分布且可精确重现的随机字符串,然而,现实中大多数数据(如指纹、虹膜扫描等生物特征)并不具备这样的属性,导致在实际应用中存在生成、存储和检索的诸多挑战。近年来,基于生物特征数据的密码学系统(biometric cryptosystems)被广泛研究,旨在利用独特的生物特征(例如指纹、虹膜等)作为生成加密密钥的来源。然而,由于生物特征数据的固有可变性以及传感器噪声等外部因素,精确恢复加密密钥变得复杂,进而对纠错机制提出了更高的要求。 在这种背景下,近年来深度学习方法凭借其在语音识别、图像处理等领域的卓越表现,被尝试应用于提升生物特征数据的纠错能力。...

NAF和SynthStab:基于RAFT的网络和合成数据集的数字视频稳定方法

基于深度学习的视频稳定方法改进与合成数据集SynthStab的研究 背景介绍 数字视频稳定技术通过软件去除不必要的振动和相机运动痕迹,是现代视频处理中的关键技术,尤其在业余视频拍摄中应用广泛。然而,现有基于深度学习的直接变形(Direct Warping Stabilization,简称DWS)方法虽然在低质量视频中表现良好,但在应对剧烈不稳定性时效果有限,且难以达到传统方法的稳定水平。这主要源于以下原因:现有数据集的稳定视频定义不够明确、模型结构简单、对未来帧的预测信息利用不足等。 为此,本文提出一种新型的基于RAFT(Recurrent All-Pairs Field Transforms)的半在线直接变形方法——NAFT,以及一个新的合成数据集SynthStab,用以解决上述问题。这些...

多视角变换网络(MVTN):3D理解的最新方法

多视角变换网络(MVTN):3D理解的最新方法

多视角变换网络(MVTN)推动3D理解研究的新进展 背景与研究动机 在计算机视觉领域,三维(3D)数据的深度学习研究近年来取得了显著进展,尤其是在分类、分割和检索任务中。然而,如何有效利用三维形状信息仍然是一个重要的挑战。常用的三维数据表示方法包括点云(Point Clouds)、网格(Meshes)和体素(Voxels)。此外,另一种流行的策略是通过多视角投影技术,将3D对象或场景渲染成多个二维(2D)视图。这种方法与人类视觉系统接收的图像流更为相似,并且可以充分利用2D深度学习的先进成果。 多视角方法如MVCNN(Su et al., 2015)通过渲染固定视点的2D图像,显著提升了3D形状分类的性能。然而,这些方法普遍依赖固定的视角配置(如随机采样或预定义视点),难以根据具体任务动态调...

基于Transformer的对象再识别综述

Transformer for Object Re-Identification: A Survey 背景与研究意义 对象重新识别(Object Re-Identification,简称Re-ID)是一项重要的计算机视觉任务,旨在跨时间和场景识别特定对象。这一领域在深度学习技术的推动下取得了显著进展,尤其是基于卷积神经网络(Convolutional Neural Networks,简称CNNs)的研究。然而,随着视觉Transformer的出现,Re-ID研究开启了新的篇章。本文综述了基于Transformer的Re-ID技术,分析其在图像/视频、少数据/少标注、多模态及特殊应用场景中的优势与挑战。 研究团队与发表信息 本文由来自武汉大学、Sun Yat-Sen University和In...