PPlaneSDF:基于伪平面正则化符号距离场的神经室内场景重建

基于伪平面正则化符号距离场的神经室内场景重建 学术背景 室内场景的三维重建是计算机视觉领域中的一个重要任务,具有广泛的应用前景,如计算机图形学、虚拟现实等。传统的三维重建方法通常依赖于昂贵的三维地面真值数据,而近年来,基于神经辐射场(NeRF)的隐式神经表示方法在仅使用多张图像的情况下,展示了强大的三维表面重建能力。然而,由于NeRF主要基于颜色的体渲染进行优化,其在低纹理区域(如地板、墙壁等)的重建效果通常较差。这些低纹理区域在室内场景中普遍存在,且通常对应于平面结构。因此,如何在不引入额外监督信号或对房间布局做出额外假设的情况下,提升低纹理区域的重建质量,成为了一个亟待解决的问题。 本文提出了一种基于伪平面正则化符号距离场(PPlaneSDF)的室内场景重建方法。该方法通过将颜色相似的相...

基于选择性频率交互网络的航空目标检测增强

提升无人机目标检测的选择性频域交互网络 研究背景及问题提出 随着计算机视觉技术的发展,无人机目标检测已成为遥感领域的重要研究方向之一。无人机目标检测旨在从倾斜拍摄和高度多变的航拍图像中识别出诸如车辆、建筑物等目标。这一技术在环境监测、灾害管理以及安全监控等领域具有广泛应用。然而,受目标尺度、方向以及复杂背景的影响,无人机目标检测面临诸多挑战,包括目标间密集分布、光照差异和视角变化等问题。 当前大多数基于卷积神经网络(Convolutional Neural Networks, CNN)的解决方案主要注重空间和通道交互,忽视频域信息的重要性。频域信息对于捕捉对象的纹理、边缘等特定特征具有不可替代的作用,然而,现有的权重分配方法,例如通道注意力机制,难以完全利用频域信息,往往导致信息丢失。这种不...

StyleAdapter:一种统一风格化的图像生成模型

StyleAdapter:一种统一风格化的图像生成模型 近年来,文本到图像(Text-to-Image, T2I)生成技术和深度学习模型的快速发展,显著推动了人工智能在图像生成领域的研究进展。然而,将参考图像的特定风格融入文本生成的高质量图像中仍然是一个挑战。为了解决这一问题,Zhouxia Wang等人提出了一种名为StyleAdapter的统一风格化图像生成模型。这篇论文发表于International Journal of Computer Vision,由香港大学、腾讯ARC Lab、澳门大学以及上海人工智能实验室的研究人员共同完成。 研究背景与意义 目前主流的风格化图像生成方法包括DreamBooth和LoRA。这些方法通过对原始扩散模型进行微调,或增加额外的小型网络来适应特定风格...