今天看啥  ›  专栏  ›  爱可可爱生活

爱可可 AI 前沿推介(12.6)

爱可可爱生活  · 公众号  ·  · 2024-12-06 06:16
    

文章预览

LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 1、[CV] Navigation World Models 2、[CL] Best-of-N Jailbreaking 3、[LG] FlashAttention on a Napkin:A Diagrammatic Approach to Deep Learning IO-Awareness 4、[LG] Theoretical limitations of multi-layer Transformer 摘要:导航世界模型、针对大语言模型的Best-of-N越狱攻击、深度学习IO感知的图表方法、多层Transformer的理论下界 1、[CV] Navigation World Models A Bar, G Zhou, D Tran, T Darrell, Y LeCun [Meta & Berkeley AI Research] 导航世界模型 要点: 导航世界模型 (NWM) 的介绍:一个可控的视频生成模型,基于过去的观测和导航动作预测未来的视觉观测。使用了条件扩散Transformer (CDiT)。 可扩展性和数据多样性:在包含来自人类和机器人代理的大量自我中心视频(10亿参数)的数据集上进行训练,能够跨越不同的环境和实施方式进行泛化。 反直觉的 CDiT 效率:提出的 CDiT 架构实现 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览