计算机视觉-术语-FmRead学术前沿

自动化技术在胚胎滋养层细胞活检中的应用研究学术背景胚胎活检（Embryo Biopsy）是辅助生殖技术（In Vitro Fertilization, IVF）中的重要环节，尤其是在植入前遗传学检测（Preimplantation Genetic Testing, PGT）中。通过胚胎活检，医生可以从胚胎中提取少量细胞进行遗传分析，以避免遗传疾病的传递并提高胚胎植入的成功率。然而，传统的胚胎活检依赖于人工操作，存在操作时间长、成功率不稳定以及胚胎损伤风险高等问题。随着单细胞生物学研究的深入，自动化技术的引入成为解决这些问题的关键。本文旨在开发一种基于计算机视觉和图像反馈控制算法的自动化系统，用于在小鼠囊胚阶段进行滋养层细胞（Trophectoderm, TE）活检，以提高活检的精确性和可...

一种用于指代表达分割与生成的互监督框架研究背景与问题提出近年来，视觉-语言交互技术在人工智能领域取得了显著进展。其中，指代表达分割（Referring Expression Segmentation, RES）和指代表达生成（Referring Expression Generation, REG）作为两个核心任务，分别旨在根据自然语言描述定位图像中的目标对象并生成其分割掩码，以及为特定目标生成清晰准确的语言描述。尽管这两个任务本质上是互逆的，但它们的研究通常被分开进行，缺乏系统性地探讨两者如何相互促进的方法。现有研究面临的主要问题包括：1）RES任务依赖大量标注数据，而这些数据的获取成本高昂；2）REG生成的表达可能存在歧义，难以准确定位目标对象；3）联合训练RES和REG的任务虽然...

基于伪平面正则化符号距离场的神经室内场景重建学术背景室内场景的三维重建是计算机视觉领域中的一个重要任务，具有广泛的应用前景，如计算机图形学、虚拟现实等。传统的三维重建方法通常依赖于昂贵的三维地面真值数据，而近年来，基于神经辐射场（NeRF）的隐式神经表示方法在仅使用多张图像的情况下，展示了强大的三维表面重建能力。然而，由于NeRF主要基于颜色的体渲染进行优化，其在低纹理区域（如地板、墙壁等）的重建效果通常较差。这些低纹理区域在室内场景中普遍存在，且通常对应于平面结构。因此，如何在不引入额外监督信号或对房间布局做出额外假设的情况下，提升低纹理区域的重建质量，成为了一个亟待解决的问题。本文提出了一种基于伪平面正则化符号距离场（PPlaneSDF）的室内场景重建方法。该方法通过将颜色相似的相...

提升无人机目标检测的选择性频域交互网络研究背景及问题提出随着计算机视觉技术的发展，无人机目标检测已成为遥感领域的重要研究方向之一。无人机目标检测旨在从倾斜拍摄和高度多变的航拍图像中识别出诸如车辆、建筑物等目标。这一技术在环境监测、灾害管理以及安全监控等领域具有广泛应用。然而，受目标尺度、方向以及复杂背景的影响，无人机目标检测面临诸多挑战，包括目标间密集分布、光照差异和视角变化等问题。当前大多数基于卷积神经网络（Convolutional Neural Networks, CNN）的解决方案主要注重空间和通道交互，忽视频域信息的重要性。频域信息对于捕捉对象的纹理、边缘等特定特征具有不可替代的作用，然而，现有的权重分配方法，例如通道注意力机制，难以完全利用频域信息，往往导致信息丢失。这种不...

StyleAdapter：一种统一风格化的图像生成模型近年来，文本到图像（Text-to-Image, T2I）生成技术和深度学习模型的快速发展，显著推动了人工智能在图像生成领域的研究进展。然而，将参考图像的特定风格融入文本生成的高质量图像中仍然是一个挑战。为了解决这一问题，Zhouxia Wang等人提出了一种名为StyleAdapter的统一风格化图像生成模型。这篇论文发表于International Journal of Computer Vision，由香港大学、腾讯ARC Lab、澳门大学以及上海人工智能实验室的研究人员共同完成。研究背景与意义目前主流的风格化图像生成方法包括DreamBooth和LoRA。这些方法通过对原始扩散模型进行微调，或增加额外的小型网络来适应特定风格...

囊胚期胚胎滋养层细胞活检的自动化与控制

基于相互监督框架的指代表达分割与生成

PPlaneSDF：基于伪平面正则化符号距离场的神经室内场景重建

基于选择性频率交互网络的航空目标检测增强

StyleAdapter：一种统一风格化的图像生成模型