主要观点总结
文章主要讨论了技术月评中关注的技术进展,包括游戏引擎、多模态技术、人形机器人、语音交互以及OpenAI和Antrhpic与美国政府的签订的安全协议等五个方面的关键内容。
关键观点总结
关键观点1: Google GameNGen迈出大模型游戏引擎的第一步
Google发布的GameNGen是条件化控制的Diffusion模型,用于生成游戏画面。目前还存在一些局限,如无法生成全新游戏资产和玩法,泛化能力有限,但为游戏制作带来了更高的效率。未来随着技术的发展,基于大模型的全新游戏体验有望达成。
关键观点2: 多模态技术产品层出不穷,技术向商用发力
多家公司推出多模态模型,包括视频生成模型等。AI视频技术逐渐从炫技向商业化落地过渡,商用技术要求生成内容可编辑、准确等。本月重要进展包括ControlNeXt提升视频可控性,以及多家公司在多模态领域的决心展示。
关键观点3: 人形机器人领域的新进展
Figure 02和1X Neo两家OpenAI参投的人形机器人公司推出新款机器人。人形机器人领域竞争激烈,国内有大量冗余公司。需要关注机器人的安全性以及他们可能对物理世界的入侵。
关键观点4: 更快的语音交互成为趋势
GPT-4o秀肌肉后,各家跟进支持语音打断、低延时的语音通话功能。延时缩短对用户体验有显著提升,但要达到更高水平仍需在模型层做更多努力。多厂商加入战斗表明语音交互在陪伴/助手类赛道中的优势。
关键观点5: OpenAI和Antrhpic与美国政府签订安全协议
美国政府AI Safety Institute可以访问和监测OpenAI和Anthropic的模型。审查目的包括满足政治正确要求、监管模型对选举和舆论的引导,以及从国家竞争力和安全出发的限制。模型安全性仍是监管的一部分,但目前对模型机制和模型安全的研究和投入水平令人担忧。
文章预览
排除噪音,抓住主线 “技术月评”的目的不是全面及时,而是退一步抓住重点,避免过载。 以及,思考这些技术产生的商业与社会影响。 2024年8月AGI主线进展 迈向大模型游戏引擎:Google GameNGen 多模态百家争鸣:产品层出不穷,技术向商用发力 机器人进展:Figue 02, 1X Neo Her? : Gemini Live, GPT 4o, 科大讯飞 OpenAI + Antrhopic 与美国政府签订安全协议 [作者] MK, Lian 正文 < 1> Google GameNGen 迈出大模型游戏引擎的第一步 自从AIGC热潮的兴起,最大的想象空间之一就是游戏制作: 用AI建立一个内容实时生成、场景无限扩展、有独立个性NPC的虚拟游戏世界。每个人都可以有无限的游戏体验,甚至可以生产UGC游戏。 但实际上这个宏大想法的落地仍然很难:实时生成稳定性-合理性不足,场景生成质量-速度都不成熟,AI NPC仍然无法解决记忆问题……所以说AI当前在游戏制
………………………………