计算机科学-学科-FmRead学术前沿

深度学习中非对称双任务协同模型改进部分标签学习的研究研究背景在深度学习领域，监督学习已成为众多人工智能任务的核心方法。然而，训练深度神经网络需要大量准确标注的数据，而这类数据的构建往往成本高昂且耗时。弱监督学习（Weakly Supervised Learning）作为一种有效的替代方法近年来引起了广泛关注，其中部分标签学习（Partial Label Learning, PLL）是弱监督学习的一种典型问题。它假定每个训练实例被一个候选标签集（Candidate Label Set）标注，该标签集中包含真实标签和若干错误标签。由于候选标签中存在标签歧义问题，部分标签学习成为一个充满挑战的领域。在部分标签学习的研究中，一个关键目标是消解这种标签歧义，正确识别每个样本的真实标签。以往的方法...

基于多光谱光声断层成像和水平集分割的亚洲人皮肤黑色素型基底细胞癌精准测绘的概念验证研究

研究助力皮肤癌诊断的新方法：基于光声成像与水平集分割算法的研究近年来，随着全球人口老龄化和环境变化，皮肤癌的发病率逐年攀升。皮肤癌已成为重要的公共卫生问题，其中主要的非黑色素瘤类型包括鳞状细胞癌（Squamous Cell Carcinoma, SCC）和基底细胞癌（Basal Cell Carcinoma, BCC）。其中，基底细胞癌是最常见的一种。据统计，美国每年约有430万例新的基底细胞癌病例。尽管这种癌症死亡率较低，但对患者的生活质量和医疗资源造成了巨大挑战。基底细胞癌的临床诊断和治疗仍存在诸多问题。传统的肿瘤边界评估方法主要依赖组织病理学（histopathology），这种方法虽然精准，但需通过活检等侵入性手术获取样本，并且需要耗费大量时间。此外，诸如光学相干断层成像（Opt...

光学相干断层扫描与机器人学相结合：当前研究与未来展望学术背景光学相干断层扫描（Optical Coherence Tomography，OCT）是一种非侵入性、高分辨率的光学成像技术，自其诞生以来就广泛应用于生物医学成像领域。它在微米级别对组织的结构进行可视化，尤其在眼科领域取得了巨大成功，例如用于角膜、视网膜等组织的成像和疾病诊断。然而，传统的OCT设备通常用于静态环境中的成像，受到体积、视场（Field of View, FOV）和操作灵活性的限制。当应用于动态、复杂的医疗场景或外科手术中时，传统OCT设备的局限性变得更加明显，例如无法适应手术目标物的移动，或难以提供实时的高分辨率成像以指导手术操作。与此同时，医学机器人的快速发展为OCT的进一步集成提供了可能性。医学机器人以其高精...

研究揭示硅橡胶电气跟踪降解机制的前沿科学新闻背景介绍：研究动机及问题随着电力传输和配电系统的快速发展，高分子复合绝缘子已逐渐取代传统玻璃和陶瓷绝缘子，成为户外高压输电领域中的首选材料。这其中，基于硅橡胶的复合绝缘子因其重量轻、耐热性高、化学稳定性佳及疏水性能（hydrophobicity）的优秀表现，备受工程界的青睐。它们不仅在生产安装过程中具有较高的性价比，同时也能在长期运行中表现出优越的抗老化特性。然而，这些绝缘材料在实际的运行条件下会因受电气和环境应力（例如高电压、多变的天气因素、盐雾腐蚀等）的影响而逐渐退化，最终可能导致设备的失效甚至电网故障。因此，深入了解硅橡胶材料的退化机制，研究其材料结构随退化发生的重要变化，具有重要的科学意义和应用价值。为了应对这一问题，本文研究基于实际...

解码生物医学图像分析的未来：多模态联合分割、检测和识别的基础模型背景介绍在生物医学研究中，图像分析已成为推动生物医学发现的重要工具，能够跨越从亚细胞器到器官层面的多尺度研究。然而，传统的生物医学图像分析方法大多将分割（segmentation）、检测（detection）和识别（recognition）作为独立的任务分别处理，这种割裂式的方法不仅限制了任务间交互的信息共享，也增加了处理复杂多样的生物医学图像数据的难度。例如，传统的分割方法通常依赖人工指定的边界框（bounding box）来标注感兴趣目标的区域，这对形状不规则或数量庞大的目标（如病理全片图像中的所有细胞）来说是具有挑战性的。此外，忽略目标检测和语义识别（metadata-like semantic informatio...

克服单粒子冷冻电镜中的优选取向问题：深度学习的创新解法背景介绍近年来，单粒子冷冻电子显微镜（Single-Particle Cryo-EM）技术因其能够解析生物大分子在接近天然状态下的原子分辨率结构，已成为结构生物学领域的核心技术。然而，在实际应用中，研究者一直面临一个棘手的技术瓶颈，即“优选取向”（Preferred Orientation）问题。这一问题主要由于生物分子在冷冻电镜网格上分布不均，导致在某些方向上的数据采样不足。这种取向偏差通常是由样品制备过程中分子与空气-水界面（Air-Water Interface, AWI）或支撑膜-水界面的相互作用引起的。优选取向问题在三维重构中显得尤为突出，因为它带来的各向异性（Anisotropy）会使三维结构受损，甚至失真，具体表现为二...

人工智能与地面激光雷达点云在森林监测中的应用：学术报告学术背景随着全球气候变化和森林资源管理的日益重要，精准林业（Precision Forestry）成为了现代林业管理的关键方向。精准林业依赖于高精度的森林数据采集与分析，而地面激光雷达（Terrestrial LiDAR, TLS）和移动激光雷达（Mobile LiDAR, MLS）技术的进步为森林监测提供了前所未有的细节。然而，处理这些高密度的三维点云数据仍然是一个巨大的挑战，尤其是在个体树木分割、树种分类和森林结构分析等任务中。传统的方法依赖于手工设计的特征和启发式算法，但这些方法在处理复杂的自然环境和多样化的森林结构时往往表现不佳。近年来，人工智能（Artificial Intelligence, AI），特别是深度学习（De...

基于Delaunay三角剖分的3D形状表示学习学术背景在计算机视觉和图形学领域，从点云数据中重建表面是一个长期存在的问题。传统的隐式方法（如Poisson表面重建）通过计算隐式函数并使用Marching Cubes算法提取表面，虽然能够生成水密（watertight）的网格，但在处理复杂结构时往往会导致细节丢失和过度平滑。另一方面，显式方法（如Delaunay三角剖分）通过点集的三角剖分直接构建网格，能够更好地保留尖锐特征和细节，但在复杂拓扑结构上推断三角形连接性仍然具有挑战性。近年来，基于学习的方法在表面重建任务中取得了显著进展。然而，现有的学习型显式方法在处理复杂结构时仍然存在困难，尤其是在推断局部形状连接性时，容易产生伪影和非水密三角形。为了解决这些问题，本文提出了一种基于Del...

基于扩散模型的服务机器人动态人员跟踪学术背景在复杂和拥挤的人类中心环境中，动态人员的跟踪是机器人技术中的一个具有挑战性的问题。由于存在遮挡、姿态变形和光照变化等类内差异，传统的跟踪方法往往难以准确识别和跟踪目标。现有的机器人跟踪方法通常依赖于独立的检测和跟踪系统，这种方法在计算效率和实时性方面存在瓶颈，尤其是在面对类内差异时，检测器的失败可能导致跟踪的中断。为了解决这些问题，本文提出了一种基于条件潜在扩散模型（Conditional Latent Diffusion Models）的新型深度学习架构——潜在扩散跟踪（Latent Diffusion Track, LDTrack）。该架构通过捕捉时间上的人员嵌入（temporal person embeddings），能够适应人员外观随...

学术背景与问题提出多视角立体视觉（Multi-View Stereo, MVS）是三维计算机视觉中的一项基础任务，旨在从多个视角的图像中恢复场景的三维几何结构。这一技术在机器人、场景理解、增强现实等领域具有广泛的应用。近年来，基于学习的MVS方法通过采用从粗到细的深度估计框架取得了显著进展。然而，现有方法在无纹理区域、物体边界和薄结构区域的深度恢复上仍面临困难，主要原因包括低纹理区域的匹配线索区分度差、用于成本体积正则化的3D卷积神经网络（3D CNN）固有的平滑特性，以及最粗尺度特征的信息丢失。为了解决这些问题，本文提出了一种上下文感知的多视角立体网络（Context-Aware Multi-View Stereo Network, CANet），利用图像中的上下文信息实现高效的边缘保...

Asyco: 一种用于部分标注学习的非对称双任务共训练模型

基于多光谱光声断层成像和水平集分割的亚洲人皮肤黑色素型基底细胞癌精准测绘的概念验证研究

机器视觉方向的光学相干断层扫描与机器人技术结合的最新进展及未来展望

硅橡胶在电痕化导致下的表面结构变化

跨九种模态的生物医学对象联合分割、检测和识别的基础模型

使用自监督深度学习解决冷冻电镜中的偏好取向问题

人工智能与地面点云在森林监测中的应用

DMNet+：基于Delaunay三角剖分的三维形状表示学习

LDTrack：基于条件潜在扩散模型的服务机器人动态人员跟踪

CANet：基于上下文感知的多视角立体网络实现高效边缘保留深度估计