文章预览
AIGC Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Foundation|Human Vision Models Sapiens: Foundation for Human Vision Models Sapiens 2024-08-22|Meta|ECCV 2024 | ⭐️ ⭐️ http://arxiv.org/abs/2408.12569v1 https://about.meta.com/realitylabs/codecavatars/sapiens 概述 在这篇研究中,作者介绍了"Sapiens", 一个专门为四种人类中心视觉任务开发的模型系列,分别为2D姿态估计、身体部位分割、深度估计和表面法线预测 。Sapiens模型在多个基准测试中超越了现有的最先进模型,其出色的泛化能力使其能有效处理稀缺标注数据或纯合成数据。这些模型通过基于超过3亿张人类图像的预训练,展现出在实际应用中的实用性和准确性。作者还强调,Sapiens模型设计的简便性使其在不同任务之间的适应性显著提高,并在扩大参数量时,表现出逐步的性能提升。 方法 "Sapiens"的创建
………………………………