今天看啥  ›  专栏  ›  字节跳动技术团队

Github获8k Star!入选苹果CoreML模型库的Depth Anything是怎么做出来的?

字节跳动技术团队  · 公众号  ·  · 2024-07-10 20:11

文章预览

字节跳动大模型团队成果 Depth Anything V2 现已被苹果官方收入 Core ML 模型库。 本文介绍了  Depth Anything 系列成果的研发历程、技术挑战与解决方法,分享了团队对于 Scaling Laws 在单一视觉任务方面的思考。值得一提的是,Depth Anything V1 与 V2 两个版本论文一作是团队实习生。 近日, 字节跳动 大模型 团队开发的成果 Depth Anything V2 ,入选苹果公司 Core  ML  模型库,目前已呈现在开发者相关页面中。 Depth Anything 是一种单目深度估计模型,V1 版本发布于 2024 年初,V2 版本发布于 2024 年 6 月,包含 25M 到 1.3B 参数的不同大小模型,可应用于视频特效、自动驾驶、3D 建模、增强现实、安全监控以及空间计算等领域。 相比上一代版本,V2 版在细节处理上更精细,鲁棒性更强,并且对比基于 Diffusion 的 SOTA 模型,速度上有显著提升。 目前  Github  上该系列成果总 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览