一种增强几何控制和多视图一致性的统一网格和纹理生成框架

一种增强几何控制和多视图一致性的统一网格和纹理生成框架

学术背景 随着游戏、建筑和社交媒体等行业对高质量3D内容的需求不断增加,手动创建3D资产的过程不仅耗时且技术复杂,还成本高昂。特别是在游戏行业,角色和家具等资产的审美质量直接影响游戏环境的沉浸感。建筑行业则需要精确的建筑模型进行可视化、模拟和规划。社交媒体平台则越来越多地利用3D内容增强现实(AR)和虚拟现实(VR)体验。然而,3D模型的真实感往往依赖于详细的网格表示,包括顶点、边、面和纹理。因此,自动化生成可控、高质量的纹理网格成为迫切需求。 现有的生成模型(如GET3D和3DGen)虽然能够同时生成几何和纹理,但往往在几何精度和纹理细节之间难以平衡,导致生成的3D形状几何结构不准确,纹理细节过于粗糙或不真实。为此,本文提出了一种新的框架,将几何生成和纹理生成分离,通过稀疏潜在点扩散模型(...

从行为到自然语言:无人机意图识别的生成方法

基于生成模型的无人机行为意图识别:从行为到自然语言的跨模态研究 背景及研究目标 近年来,无人机(Unmanned Aerial Vehicle,UAV)技术取得飞速发展,广泛应用于民用与军事领域,如搜索救援、农业精准作业和通信中继等。然而,随着无人机群规模的扩大以及智能化水平的提升,空中指挥与控制领域对于更高水平的智能需求日益迫切。在复杂的对抗环境中,提高无人机的“态势感知”(situation awareness)水平已然成为关键问题,尤其是如何有效识别无人机的操作意图。这一识别过程有助于揭示对手操作意图与战术欺骗间的关系,优化信息在指挥层级中的流动,并为决策提供指导。 传统基于分类任务的意图识别方法受到数据库分布失衡和鲁棒性差等问题的限制,导致分类精度难以应用于现实复杂场景。本研究提出了...

Q-Cogni:一种集成因果强化学习框架

科研动态分析报告:Q-Cogni——一种综合的因果强化学习框架 近年来,人工智能(Artificial Intelligence, AI)技术的快速发展促使研究人员在如何构建更高效、更可解释的强化学习(Reinforcement Learning, RL)系统方面进行了深入探索。强化学习因其模仿人类决策过程的能力,在自动化规划、导航、机器人控制和健康诊断等领域得到了广泛应用。然而,现有强化学习方法仍面临诸多挑战:大量样本需求、对环境建模的复杂性、低水平的决策可解释性以及因缺乏因果推理(Causal Inference)导致模型难以应对复杂动态环境。基于这些背景问题,Cristiano da Costa Cunha、Wei Liu、Tim French和Ajmal Mian团队提出了Q-Cog...

低资源领域适应的神经机器翻译中的情景课程学习

Epi-Curriculum:用于低资源领域自适应的情景课程学习 研究背景与问题陈述 近年来,神经机器翻译 (Neural Machine Translation, NMT) 成为自然语言处理技术领域的标杆。然而,尽管神经机器翻译在处理大规模并行语料库任务上的表现已接近人类翻译水平,但其在低资源和新领域的表现仍然不尽如人意。这种不足主要体现在两个方面:模型对领域切换的鲁棒性差以及在目标领域小数据集条件下的适应能力较低。现有研究往往仅解决其中一个问题,比如增强领域切换的鲁棒性或提升对于新领域的适应能力,却缺乏一种能够同时解决这两个关键问题的统一解决方案。 在分析这些问题的背景下,来自University of South Florida的Keyu Chen等学者与Snap Inc.的Di Zh...

基于选择性频率交互网络的航空目标检测增强

提升无人机目标检测的选择性频域交互网络 研究背景及问题提出 随着计算机视觉技术的发展,无人机目标检测已成为遥感领域的重要研究方向之一。无人机目标检测旨在从倾斜拍摄和高度多变的航拍图像中识别出诸如车辆、建筑物等目标。这一技术在环境监测、灾害管理以及安全监控等领域具有广泛应用。然而,受目标尺度、方向以及复杂背景的影响,无人机目标检测面临诸多挑战,包括目标间密集分布、光照差异和视角变化等问题。 当前大多数基于卷积神经网络(Convolutional Neural Networks, CNN)的解决方案主要注重空间和通道交互,忽视频域信息的重要性。频域信息对于捕捉对象的纹理、边缘等特定特征具有不可替代的作用,然而,现有的权重分配方法,例如通道注意力机制,难以完全利用频域信息,往往导致信息丢失。这种不...

基于可控扩散模型的射电天文图像生成方法

RaDiff: 用于无线电天文图生成的可控扩散模型” 全面学术新闻报道 背景介绍 随着平方公里阵列(Square Kilometer Array, SKA)望远镜的建造接近完成,无线电天文学将在宇宙研究领域迎来革命性进展。SKA的灵敏度和空间分辨率达到了前所未有的高度,然而,由其前身望远镜产生的海量数据已经对数据处理提出了严峻挑战。具体来说,后台自动化、高效的数据挖掘工具变得至关重要。自动源检测与分类任务成为研究中的核心问题,尤其对于那些背景噪声显著或源形态复杂的无线电图像(如银河系平面观测)尤为困难。 深度学习(Deep Learning)作为机器学习的一种先进方法,近年来被广泛应用于无线电天文学。然而,此方法依赖于庞大的高质量标注数据集,而无线电天文数据因为人工标注过程复杂且耗时,难以实...

基于高阶几何结构建模的点云无监督域适应

基于高阶几何结构建模的点云无监督领域适配 研究背景及动因 点云数据是一种描述三维空间的关键数据形式,广泛应用于自动驾驶、遥感等现实场景中。点云可以捕获精确的几何信息,但在跨设备或跨场景应用时,采集点云的几何特性可能会由于传感器噪声、采样方式及环境影响而发生显著改变。这种显著的几何变化(即领域间差距,domain gap),导致了在一个领域进行训练的神经网络难以在其他领域上保持性能。这一问题限制了点云深度学习方法在实际应用中的推广。 目前,无监督领域适配(Unsupervised Domain Adaptation, UDA)为解决这一问题提供了一种有效途径。其核心目标是将源领域(有标签数据)的知识迁移至目标领域(无标签数据),通过学习共享结果的跨域特征表征来缩小领域间差距。然而,已有方法主要...

基于扩散模型的特征增强在整张切片图像多实例学习中的应用

基于扩散模型的特征增强:针对全视野病理图像多实例学习的新方法 学术背景与研究动机 在计算病理学(computational pathology)领域,如何有效分析全视野扫描病理图像(Whole Slide Images,WSIs)是当前研究的热点。WSIs 是超高分辨率的图像,通常具有广域的视野,广泛用于癌症诊断。然而,由于病例标记的稀缺性以及图像自身的体量庞大,基于深度学习的多实例学习(Multiple Instance Learning,MIL)在WSI的自动化分析中面临诸多挑战。 MIL 是一种经典的弱监督学习方法,核心思路在于将整个WSI看作一个“袋”级别的实例,而每块小图像(patch)作为单独的“袋中实例”。虽然袋级别的标签已知,但单个实例的标签未知。在 MIL 的应用中,常见的...

基于多目标进化框架的高阶有向社区检测

高阶有向社区检测的多目标进化框架 背景与研究动机 在复杂网络科学领域,社区结构是网络研究中至关重要的特性之一。这种结构在众多实际网络中普遍存在,如社交网络、生物网络、交通网络等。社区检测技术可以有效地揭示网络的拓扑属性和功能特性,从而促进对网络行为机制的理解。目前,多数传统的社区检测方法依赖于低阶节点和边的连接模式。然而,研究表明,网络中的高阶特性——即重复出现的小子图结构“基元”(Motif)——在塑造网络的拓扑形态和功能特性中发挥着关键作用。 在有向网络中,基于基元的高阶社区检测近年来引起了广泛关注。这种方法不仅可以揭示网络的高阶中尺度结构,还能捕捉系统的功能特性。然而,现有方法通常侧重于基元密度的优化,忽略了有向边的方向性(非对称方向弧)及其对信息流特性的影响。由于信息流是决定网络传播...

水平联邦学习的成本高效特征选择

水平联邦学习中高效特征选择的新方法研究 近年来,随着联邦学习(Federated Learning, FL)逐渐成为一种保护数据隐私的分布式机器学习方法,如何在不同用户(即客户端)之间共享信息以训练高效的全局模型,吸引了广泛的关注。在水平联邦学习(Horizontal Federated Learning, HFL)中,所有客户端共享相同的特征空间,但各自的数据样本不同。然而,数据特征的冗余和维度灾难问题严重影响了模型的性能和训练效率。为此,特征选择(Feature Selection, FS)作为机器学习中的一种重要预处理技术,在去除冗余特征和增强模型性能方面具有突出的作用。本研究针对HFL场景下的特征选择问题提出了新方法,以解决这一领域的关键挑战。 论文来源 本论文题为 “Cost-Ef...