人工智能与地面点云在森林监测中的应用

人工智能与地面激光雷达点云在森林监测中的应用:学术报告 学术背景 随着全球气候变化和森林资源管理的日益重要,精准林业(Precision Forestry)成为了现代林业管理的关键方向。精准林业依赖于高精度的森林数据采集与分析,而地面激光雷达(Terrestrial LiDAR, TLS)和移动激光雷达(Mobile LiDAR, MLS)技术的进步为森林监测提供了前所未有的细节。然而,处理这些高密度的三维点云数据仍然是一个巨大的挑战,尤其是在个体树木分割、树种分类和森林结构分析等任务中。 传统的方法依赖于手工设计的特征和启发式算法,但这些方法在处理复杂的自然环境和多样化的森林结构时往往表现不佳。近年来,人工智能(Artificial Intelligence, AI),特别是深度学习(De...

多模态深度学习在儿童低级别胶质瘤术后复发风险预测中的应用

深度学习在儿童低级别胶质瘤术后复发预测中的应用 背景介绍 儿童低级别胶质瘤(Pediatric Low-Grade Gliomas, PLGGs)是儿童中最常见的脑肿瘤类型之一,占所有儿童中枢神经系统肿瘤的30%-50%。尽管PLGGs的预后相对较好,但其术后复发风险难以通过传统的临床、影像学和基因组因素准确预测。术后复发的异质性使得术后管理决策变得复杂,尤其是关于辅助治疗和影像监测的决策。因此,开发一种能够准确预测术后复发风险的工具对于优化患者管理和改善预后具有重要意义。 近年来,深度学习(Deep Learning, DL)在医学影像分析中的应用取得了显著进展,尤其是在肿瘤分割和预后预测方面。然而,由于PLGGs的罕见性和数据稀缺性,深度学习在该领域的应用仍面临挑战。本研究旨在通过结合术...

DMNet+:基于Delaunay三角剖分的三维形状表示学习

基于Delaunay三角剖分的3D形状表示学习 学术背景 在计算机视觉和图形学领域,从点云数据中重建表面是一个长期存在的问题。传统的隐式方法(如Poisson表面重建)通过计算隐式函数并使用Marching Cubes算法提取表面,虽然能够生成水密(watertight)的网格,但在处理复杂结构时往往会导致细节丢失和过度平滑。另一方面,显式方法(如Delaunay三角剖分)通过点集的三角剖分直接构建网格,能够更好地保留尖锐特征和细节,但在复杂拓扑结构上推断三角形连接性仍然具有挑战性。 近年来,基于学习的方法在表面重建任务中取得了显著进展。然而,现有的学习型显式方法在处理复杂结构时仍然存在困难,尤其是在推断局部形状连接性时,容易产生伪影和非水密三角形。为了解决这些问题,本文提出了一种基于Del...

LDTrack:基于条件潜在扩散模型的服务机器人动态人员跟踪

基于扩散模型的服务机器人动态人员跟踪 学术背景 在复杂和拥挤的人类中心环境中,动态人员的跟踪是机器人技术中的一个具有挑战性的问题。由于存在遮挡、姿态变形和光照变化等类内差异,传统的跟踪方法往往难以准确识别和跟踪目标。现有的机器人跟踪方法通常依赖于独立的检测和跟踪系统,这种方法在计算效率和实时性方面存在瓶颈,尤其是在面对类内差异时,检测器的失败可能导致跟踪的中断。 为了解决这些问题,本文提出了一种基于条件潜在扩散模型(Conditional Latent Diffusion Models)的新型深度学习架构——潜在扩散跟踪(Latent Diffusion Track, LDTrack)。该架构通过捕捉时间上的人员嵌入(temporal person embeddings),能够适应人员外观随...

CANet:基于上下文感知的多视角立体网络实现高效边缘保留深度估计

学术背景与问题提出 多视角立体视觉(Multi-View Stereo, MVS)是三维计算机视觉中的一项基础任务,旨在从多个视角的图像中恢复场景的三维几何结构。这一技术在机器人、场景理解、增强现实等领域具有广泛的应用。近年来,基于学习的MVS方法通过采用从粗到细的深度估计框架取得了显著进展。然而,现有方法在无纹理区域、物体边界和薄结构区域的深度恢复上仍面临困难,主要原因包括低纹理区域的匹配线索区分度差、用于成本体积正则化的3D卷积神经网络(3D CNN)固有的平滑特性,以及最粗尺度特征的信息丢失。 为了解决这些问题,本文提出了一种上下文感知的多视角立体网络(Context-Aware Multi-View Stereo Network, CANet),利用图像中的上下文信息实现高效的边缘保...

深入研究长尾图像识别中的简单性偏差

学术背景与问题提出 近年来,深度神经网络在计算机视觉领域取得了显著进展,尤其是在图像识别、目标检测和语义分割等任务中。然而,当面对长尾分布(long-tailed distribution)数据时,即使是目前最先进的深度模型也表现不佳。长尾分布指的是数据集中少数类(tail classes)的样本数量远远少于多数类(head classes)的样本数量。这种数据不平衡问题在许多实际应用中普遍存在,例如管道故障检测和人脸识别等。 长尾图像识别的主要挑战在于如何有效处理数据不平衡问题,尤其是如何提升少数类的泛化性能。常见的解决方案包括重采样(re-sampling)、损失重加权(loss re-weighting)和数据增强(data augmentation)等。然而,这些方法往往无法从根本上...

FedRVR :基于关系引导的多功能正则化的联邦半监督学习

学术背景与问题提出 随着数据隐私问题的日益突出,联邦学习(Federated Learning, FL)作为一种去中心化的机器学习范式,逐渐成为研究热点。联邦学习允许多个客户端在不共享数据的情况下协作训练一个全局模型,从而保护数据隐私。然而,现有的联邦学习方法通常假设每个客户端的数据都是完全标注的,这在实际应用中往往是不现实的,尤其是在标注能力有限的情况下。为了解决这一问题,联邦半监督学习(Federated Semi-Supervised Learning, FSSL)应运而生。FSSL 旨在利用大量未标注的数据进行知识挖掘,从而在保护隐私的同时提升模型性能。 然而,现有的 FSSL 方法主要依赖于数据增强来保持局部模型与全局模型之间的一致性,这导致了分类器的偏差,并且在未标注客户端数据分...

基于类平衡多中心动态原型伪标记的无源域自适应方法

学术背景与问题提出 近年来,深度学习模型(Deep Neural Networks, DNNs)在计算机视觉任务中取得了显著的成功,但这些模型的训练依赖于大量的标注数据。然而,当模型应用于新的、未标注的目标领域时,由于领域差异(domain shift),模型的泛化能力往往较差。为了解决这一问题,领域自适应(Domain Adaptation, DA)技术应运而生。领域自适应的目标是通过利用源领域的知识来提升模型在目标领域的表现,尤其是在目标领域没有标注数据的情况下。 然而,传统的领域自适应方法通常需要访问源领域的原始数据,这在许多实际应用中是不现实的,原因包括数据隐私、数据安全和数据传输效率等问题。为了解决这一问题,源数据不可访问的领域自适应(Source-Free Domain Adap...

PICK:基于预测与掩码的半监督医学图像分割方法

PICK模型在半监督医学图像分割中的应用 学术背景 医学图像分割在临床实践中具有重要意义,能够为医生提供关于器官或肿瘤的体积、位置和形状等关键信息。近年来,基于深度学习的模型在医学图像分割任务中表现出色,但这些模型通常需要大量的标注数据。然而,医学图像的标注需要专业的临床医生,获取这些标注数据既耗时又昂贵。因此,如何在有限的标注数据下提高模型性能成为了一个重要的研究问题。 半监督学习(Semi-Supervised Learning, SSL)通过同时利用有限的标注数据和大量的未标注数据,成为解决这一问题的有效方法。现有的SSL方法主要分为两类:伪标签(Pseudo-labeling)和基于一致性的协同训练(Consistency-based Co-training)。然而,这些方法在处理未...

鲁棒的序列深度伪造检测

鲁棒的序列深度伪造检测 学术背景 随着深度生成模型(如GANs)的快速发展,生成逼真的人脸图像已经变得非常容易。然而,这种技术的滥用也引发了严重的安全问题,尤其是深度伪造(Deepfake)技术的滥用。深度伪造技术可以生成与真实图像几乎无法区分的伪造图像,这些图像可能被用于传播虚假信息、制造假新闻等恶意用途。为了应对这一问题,研究者们提出了多种深度伪造检测方法。然而,现有的方法主要集中在检测单步的人脸篡改操作,而随着易于使用的面部编辑应用程序的普及,人们可以通过多步操作对人脸进行序列化的篡改。这种新的威胁要求我们能够检测出一系列的面部篡改操作,这对于检测深度伪造媒体以及后续恢复原始人脸图像至关重要。 基于这一观察,本文提出了一个新的研究问题——序列深度伪造检测(Sequential Deep...