主要观点总结
本文主要讨论了技术评估月评的目的不是全面及时,而是抓住重点避免过载,并思考技术产生的商业与社会影响。文章涵盖了2024年9-10月AGI主线的进展,AI行业的回调与蓄力,探索LLM新交互形态,开源端侧模型和视觉理解技术,OpenAI动态,多模态生成技术,以及关于2024年诺贝尔AI奖的预测。
关键观点总结
关键观点1: 技术评估月评的重点
技术评估月评旨在抓住重点避免过载,并思考技术产生的商业与社会影响。
关键观点2: AGI主线的进展
文章讨论了AGI主线的进展,特别是在AI行业的里程碑式进展有限的情况下,AGI的商业应用和深入生活预计将在未来几年内实现。
关键观点3: LLM新交互形态的探索
文章指出头部厂商正在探索LLM新交互形态,如Claude Artifacts, ChatGPT Canvas等,旨在探索新的通用交互方式。
关键观点4: 开源技术和视觉理解的进展
文章讨论了开源技术的进展,包括端侧模型和视觉理解技术。开源大户Mistral推出了新的模型,而Mo2Mo视觉理解模型系列也取得了一定的成果。
关键观点5: OpenAI的动态
文章介绍了OpenAI的动态,包括新产品o1系列的发布、人事动荡和融资情况。同时指出OpenAI在开发新技术的同时面临失去初心的质疑。
关键观点6: 多模态生成技术的竞争
文章讨论了多模态生成技术的竞争情况,包括Flux 1.1 [pro]、快手可灵、Pika等技术的进展和差异化特点。
关键观点7: 关于诺贝尔AI奖的预测
文章还提及了关于2024年诺贝尔AI奖的预测和授奖情况的分析,强调了深度学习技术和AlphaFold的革命性贡献。
文章预览
排除噪音,抓住主线 “技术月评”的目的不是全面及时, 而是退一步抓住重点,避免过载。 以及,思考这些技术产生的商业与社会影响。 2024年9-10月AGI主线进展 2024Q3进展有限,AI行业回调与蓄力中 探索 LLM新交互形态 :Claude Artifacts, ChatGPT Canvas, Google NotebookLM 开源——端侧模型 & 视觉理解 :Llama 3.2, Qwen 2.5, Molmo, Ministral3B/8B OpenAI新能力差强人意 :o1系列、4o语音全面开放、蒸馏工具、人事动荡、融资 多模态继续狂卷 :Flux 1.1 [pro],MiniMax海螺图生视频,快手可灵1.5,Pika 1.5,Vidu主体参照,字节PixelDance & Seaweed,Meta Movie Gen,Adobe Firefly/Premier 2024诺贝尔AI奖 :物理学奖、化学奖均授予AI相关工作 [作者] MK, Lian 前言 十一放假,月评迟到~需要道个歉~ 今年7-9月里,AI行业的里程碑式进展是有限的:OpenAI迫于融资压力推出的o1差强人意,模型基础能力演进似
………………………………