主要观点总结
这篇文章主要介绍了OpenAI的连续发布会、最新模型o3的表现、以及字节跳动在火山引擎Force大会上发布的新模型和技术。OpenAI发布了新模型o3,在多个基准测试中创下新纪录,并与苹果有智能合作。字节跳动发布了豆包视觉理解模型等,并宣布未来的计划。此外,文章还涉及苹果、博通、Nvidia等公司的AI模型和技术发展,以及芯片供应链的前景。
关键观点总结
关键观点1: OpenAI连续发布会及最新模型o3的表现
OpenAI连续12天发布会,加强了语音、视频理解、搜索、视频生成。o3模型在多个基准测试中创下新纪录,包括EpochAI Frontier Math和SWE-bench Verified基准。o3在数学、物理、agi评测方面表现优秀。
关键观点2: 字节跳动的新模型和技术发展
字节跳动在火山引擎Force大会上发布了豆包视觉理解模型、豆包3D生成模型等。还宣布了豆包视频生成模型1.5版的推出计划和豆包端到端实时语音模型的上线时间。
关键观点3: 其他科技公司的AI发展及芯片供应链前景
苹果公司正在与腾讯、字节跳动谈判整合AI模型。供应链表示字节跳动将贡献博通可观的芯片代工收入,而openai计划在2027年量产自研芯片。Nvidia在训练与推理能力方面领先,但大厂仍有省成本需求和量产瓶颈风险。长期投入自研生产已成为各家共识,芯片设计代工与生产等相关硬件供应链将持续受惠。
文章预览
1: 算力持续爆发 OpenAI连续12天发布会,加强了语音、视频理解、搜索、视频生成,宣布与苹果智能合作,在最后一天发布了最新模型o3,o3在全球顶尖数学家共同推出号称业界最强数学基准的EpochAI Frontier Math中创下新纪录,分数达到25.2。而其他模型都没有超过2,在软件工程SWE-bench Verified基准上,o3的代码性能从o1的48.9%狂飙22.8%,达到了71.7%,o3在数学、物理、agi评测都很强,目前没有更多paper与资料佐证产出的方法,虽然这些有可能过拟和,但编程强太多,openai可能又找到了进一步“堆算力”转化成智能的路径,由计算成本o3还不是很经济,用户能够以每项任务大约5美元的价格来支付人工解决ARC-AGI任务,而在低推理模式下,o3完成每个任务需要花费17-20美元,而GPT-4o约在0.1-0.01美元。在近日举行的火山引擎Force大会上,字节跳动正式
………………………………