专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

英伟达华人硬核AI神器,「描述一切」秒变细节狂魔!仅3B逆袭GPT-4o

新智元  · 公众号  · AI  · 2025-04-27 09:30
    

文章预览

   新智元报道   编辑:桃子 【新智元导读】 视觉AI终极突破来了!英伟达等机构推出超强多模态模型DAM,仅3B参数,就能精准描述图像和视频中的任何细节。 有了AI,谁还愿意用手配「字幕」? 刚刚,英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model(DAM),仅3B参数。 论文地址:https://arxiv.org/pdf/2504.16072 正如其名Describe Anything,上传一张图,圈哪点哪,它即可生成一段丰富的文字描述。 即便是一段视频,DAM也能精准捕捉到白色SUV,给出详细的描述。 DAM是一个专为详细局部标注(DLC)而设计的模型,即为特定区域生成详细且精确的描述。 通过两大创新,研究人员在细节与上下文之间找到平衡: · 焦点提示:对目标区域进行高分辨率编码,就像给模型配备了一副「放大镜」,清晰捕捉到局部区域细微特征 · 局部视觉骨 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览