基于多焦相机阵列记录动态面部微表情

高分辨率动态面部微表情捕捉:多聚焦相机阵列的革新

背景与研究问题

在生物医学、情感识别、疾病诊断、外科手术评估、面部修复,以及基因特征研究等多个领域,高质量的动态面部影像捕捉具有至关重要的意义。人类面部表情,尤其是微表情,可以提供丰富的生物医学信息。例如,研究表明捕捉高分辨率动态面部表情有助于提升情感计算精度、诊断某些疾病、评估手术效果以及生成高精度面部假体。在这些应用背景下,面部曲面细节的高清捕捉成为科学界亟需解决的核心问题。

传统的单摄像机成像系统由于景深(Depth of Field, DOF)、视野(Field of View, FOV)和分辨率之间的固有限制,难以同时实现高分辨率和大景深全面覆盖。例如,目前流行的数据集中,诸如2014年发布的BP4D-SPONTANEOUS和SAMM(Spontaneous Micro-Facial Movement Dataset)等,分辨率和景深均难以满足更加细致的表情捕捉需求。

为解决这一技术瓶颈,来自Duke University(杜克大学)和Ramona Optics Inc.的研究团队提出了一种革命性的多摄像机阵列显微镜(Multi-Camera Array Microscope, MCAM)系统,通过多聚焦策略同时解决曲面成像的高分辨率和大景深难题。

研究来源与发表信息

本研究由Lucas Kreiss和Weiheng Tang领衔,Ramana Balla、Xi Yang、Amey Chaware等研究人员共同完成。研究分别由Duke University和Ramona Optics Inc.的科研人员合作完成,文章于2025年2月1日发表在《Biomedical Optics Express》期刊的第16卷第2期,研究核心成果已通过doi链接(https://doi.org/10.1364/boe.547944)公开。

研究流程与实验方法

本研究采用了多步骤的设计与实验验证,以展示其多聚焦相机阵列在捕捉动态高分辨率面部影像中的优势。研究流程主要包括系统配置、性能表征、面部影像采集和动态表情捕捉四个关键环节。

1. 系统设计与多聚焦配置

研究使用了一个由54台相机组成的紧凑型9×6阵列。每个相机内置的镜头焦距为25.05 mm,物侧数值孔径为0.04,搭载的图像传感器为13百万像素的Onsemi AR1335 CMOS芯片,单像素宽度为1.1 µm。每个相机单元被固定在由电路板(PCB板)支撑的13.5 mm间距排列结构上。

为了实现多聚焦成像,研究团队以一个解剖学上精确的泡沫面部模型作为基准。通过数字游标卡尺测量模型上的深度分布(范围为0-40 mm),并根据这一深度分布调整每台相机的焦平面位置,形成“多聚焦深度曲线”。例如,研究设置了工作距离范围从200 mm到240 mm进行焦距调节,并在焦平面内采用高分辨率参考样本用于校准。

影像叠合采用了Hugin算法,校准步骤先在每台相机拍摄的清晰图像中设定拼接参数,再用于后续面部图像组合,以生成高分辨率的全景拼接图像。

2. 多聚焦系统性能表征

为了验证和表征系统的光学性能,研究团队使用分辨率目标样本结合高精密位移台(位移精度0.01 mm),系统全面评估了各个相机在不同焦平面上的成像分辨率、景深和扩展景深(Extended Depth of Field, eDOF)。

首先,逐步收集焦点栈图像,对每个相机逐平面计算图像“清晰度指标”,并通过高斯轮廓的全宽半高(Full Width at Half Maximum, FWHM)估算景深。其次,团队提取清晰图像的边缘扩展函数(Edge Spread Function, ESF)和调制传递函数(Modulation Transfer Function, MTF),以得出各相机的横向分辨率,标准实验测得∼26.14 µm ± 5.8 µm。此外,测量显示系统整体扩展景深高达约43 mm,比传统单焦平面配置增加了10倍。

3. 面部影像采集与动态捕捉

为了捕捉真实的面部曲线,研究搭建了一个包含三个LED环形灯光源的实验环境,灯光分别布置在面部正前方、左侧和右侧。志愿者将面部固定在下巴支架上,通过45°角反射镜捕捉面部影像。研究验证了系统在高分辨率(超过13000×9000分辨率)下实现整个面部清晰成像的能力。

此外,研究进一步采集动态表情影像,记录了12帧每秒(fps)的人体面部动态特征。这些实验展示了系统的动态表现能力和高效拼接算法的实际效果。

研究结果与结论

主要结果

  • 每个相机单元的景深为∼4.7 mm,整个阵列通过多聚焦配置,实现了43 mm的扩展景深。
  • 拼接图像的分辨率达到了∼13,394×9,062像素,横向分辨率为26 µm左右。
  • 动态表情捕捉成功展示了面部细节,包括皱纹、毛孔和其他微特征。

结论

研究提出了一种创新性的成像系统设计,成功在面部曲面影像采集中突破了传统单镜头系统的景深-分辨率权衡限制,实现了同时覆盖高分辨率、大景深和动态表情捕捉的目标。系统在面部微表情和临床诊断等应用领域体现了深远意义,展示了巨大的实用潜力。

研究亮点

  • 重大技术创新:首次通过多相机阵列解决面部成像的非平面曲面聚焦难题。
  • 高分辨率与扩展景深结合:提供50倍于现有公开数据集的解析度。
  • 广泛应用前景:特别适用于生物医学诊断、虚拟现实、情感计算和安防系统。

后续研究与应用潜力

研究团队计划在未来系统中集成可调焦镜头和实时运动补偿算法,以进一步改进自适应聚焦能力和系统鲁棒性。同时,改进光照均匀性和放大校准,将使MCAM系统在更复杂的应用场景中具备出色表现。

本研究在高分辨率面部成像领域对技术流程的革新和其多领域的应用潜力,预示着未来将为科研和产业界带来广泛的技术改进和实际效益。