普通人的AGI月评2024.8 | AI游戏引擎，多模态&机器人百家争鸣

普通人的AI自由 · 公众号 · 科技创业科技自媒体 · 2024-09-05 11:48

主要观点总结

文章主要讨论了技术月评中关注的技术进展，包括游戏引擎、多模态技术、人形机器人、语音交互以及OpenAI和Antrhpic与美国政府的签订的安全协议等五个方面的关键内容。

关键观点总结

关键观点1: Google GameNGen迈出大模型游戏引擎的第一步

Google发布的GameNGen是条件化控制的Diffusion模型，用于生成游戏画面。目前还存在一些局限，如无法生成全新游戏资产和玩法，泛化能力有限，但为游戏制作带来了更高的效率。未来随着技术的发展，基于大模型的全新游戏体验有望达成。

关键观点2: 多模态技术产品层出不穷，技术向商用发力

多家公司推出多模态模型，包括视频生成模型等。AI视频技术逐渐从炫技向商业化落地过渡，商用技术要求生成内容可编辑、准确等。本月重要进展包括ControlNeXt提升视频可控性，以及多家公司在多模态领域的决心展示。

关键观点3: 人形机器人领域的新进展

Figure 02和1X Neo两家OpenAI参投的人形机器人公司推出新款机器人。人形机器人领域竞争激烈，国内有大量冗余公司。需要关注机器人的安全性以及他们可能对物理世界的入侵。

关键观点4: 更快的语音交互成为趋势

GPT-4o秀肌肉后，各家跟进支持语音打断、低延时的语音通话功能。延时缩短对用户体验有显著提升，但要达到更高水平仍需在模型层做更多努力。多厂商加入战斗表明语音交互在陪伴/助手类赛道中的优势。

关键观点5: OpenAI和Antrhpic与美国政府签订安全协议

美国政府AI Safety Institute可以访问和监测OpenAI和Anthropic的模型。审查目的包括满足政治正确要求、监管模型对选举和舆论的引导，以及从国家竞争力和安全出发的限制。模型安全性仍是监管的一部分，但目前对模型机制和模型安全的研究和投入水平令人担忧。

文章预览

排除噪音，抓住主线 “技术月评”的目的不是全面及时，而是退一步抓住重点，避免过载。以及，思考这些技术产生的商业与社会影响。 2024年8月AGI主线进展迈向大模型游戏引擎：Google GameNGen 多模态百家争鸣：产品层出不穷，技术向商用发力机器人进展：Figue 02, 1X Neo Her? : Gemini Live, GPT 4o, 科大讯飞 OpenAI + Antrhopic 与美国政府签订安全协议 [作者] MK, Lian 正文 < 1> Google GameNGen 迈出大模型游戏引擎的第一步自从AIGC热潮的兴起，最大的想象空间之一就是游戏制作：用AI建立一个内容实时生成、场景无限扩展、有独立个性NPC的虚拟游戏世界。每个人都可以有无限的游戏体验，甚至可以生产UGC游戏。但实际上这个宏大想法的落地仍然很难：实时生成稳定性-合理性不足，场景生成质量-速度都不成熟，AI NPC仍然无法解决记忆问题……所以说AI当前在游戏制 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博