文章预览
以下 文 章来源于微信公众号:新智元 作者: 新智元 链接:https://mp.weixin.qq.com/s/wJRDkwt-XvxJR5JhYLU6ZQ 本文仅用于学术分享,如有侵权,请联系 后 台作删文处理 导读 英伟达官宣了首个「世界基础模型」Cosmos。从此,物理AI数据不够的问题将有望解决!而就在刚刚,75页技术报告火热出炉,GitHub项目更是冲破了2k星。本文对此做了详细解读,希望对大家有所帮助。 CES大会上,老黄称,「AI下一个前沿就是物理AI」。 为此,英伟达重磅官宣了世界基础模型开发平台——Cosmos,其模型基于在200万小时视频上完成训练。 它一共包含了四大功能模块: 扩散模型 、 自回归模型 、 视频分词器 ,以及 视频处理与编辑流程 。 用英伟达高级科学家Jim Fan的话来总结: 两种形式: 扩散模型(生成连续的token);自回归模型(生成离散的token) 两种生成模式: 文本->视
………………………………