专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
今天看啥  ›  专栏  ›  将门创投

面部表情姿态全覆盖,Omni-ID:5s 生成高保真个体图片

将门创投  · 公众号  · 科技创业  · 2024-12-20 08:22
    

文章预览

团队提出了 Omni-ID,这是一种为生成任务设计的创新人脸表示方法。Omni-ID 能够编码个体在多种表情和姿态下的全面人脸信息。它将多个非结构化的人脸图像整合为固定大小的结构化表示,每个表示条目捕捉特定的全局或局部人脸特征。 通过  few-to-many identity reconstruction (少对多人脸重建) 的训练范式,团队使用少量图像输入,重建同一人在多种姿态和表情下的多张目标图像。Omni-ID 的训练框架采用   multi-decoder objectives (多解码器策略) ,结合了不同解码器的优势,以增强人脸特征。 与传统人脸表示(如 ArcFace和CLIP)的判别式或对比式目标不同,Omni-ID 使用生成式目标进行优化,从而更细腻地捕捉适用于生成任务的人脸特征。在团队开发的  MFHQ 数据集  训练后,Omni-ID 在不同下游生成任务中表现出了显著的性能提升。 论文题目: Omni-ID: Holistic I ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览