刚刚，OpenAI又双叒叕鸽了！没等来“草莓”发布，只敷衍发了评测集，网友：拿这来抢谷歌发布会风头？

AI前线 · 公众号 · AI · 2024-08-14 04:00

主要观点总结

文章介绍了OpenAI与谷歌之间的“大战”，包括OpenAI发布的SWE-bench Verified测试集、新模型“草莓计划”（Strawberry）的相关情况，以及谷歌发布的硬件活动和AI应用。同时，文章也描述了AI技术在各行各业的应用和发展趋势。

关键观点总结

关键观点1: OpenAI的SWE-bench Verified测试集

为了解决SWE-bench测试集存在的问题，OpenAI与专业人员合作发起了人工注释活动，发布了SWE-bench Verified测试集，该测试集包含了500个经过人工验证的样本。同时，OpenAI还发布了所有SWE-bench测试样本的人工注释和新的评估工具。

关键观点2: OpenAI的“草莓计划”（Strawberry）

OpenAI的新模型“草莓计划”旨在使ChatGPT能够更自由地搜索网络并解决复杂问题。该计划细节尚未公开，但据知情人士透露，Strawberry模型将使OpenAI的人工智能能够自主可靠地浏览互联网并执行所谓的“深度研究”。OpenAI公司发言人表示，希望人工智能模型能够像人一样看待和理解世界。

关键观点3: 谷歌的硬件活动和AI应用

谷歌在“Made by Google 2024”硬件活动上发布了多款硬件产品，包括Pixel 9系列手机、Pixel Watch 3和Pixel Buds Pro等。同时，谷歌还推出了新的AI聊天机器人Gemini，并介绍了其在Android 15中的新功能和广泛应用。此外，谷歌还发布了一些其他的AI应用，如Pixel Weather和Call Notes等。

关键观点4: AI技术的发展趋势和应用

AI技术正在不断发展和应用于各行各业，从教育、零售到通信、金融等领域。大模型技术的引领和创新提升了行业效率，AI不仅是技术革新的先锋，更是社会经济发展的强大驱动力。智能时代已经到来，AI技术正在塑造我们的生活方式和行业变革。

文章预览

整理 | 李冬梅褚杏娟大家期待中的 OpenAI 与谷歌“大战”并未如约而至，双方都打出了“毫无杀伤力”的棉花拳。以为能等到“草莓”，没想到来了个“羽衣甘蓝” 尽管全世界都在盯着“草莓计划”，但似乎叛逆的 OpenAI 总是不尽如人愿。你要“草莓”，他们偏偏给你个“羽衣甘蓝”。北京时间 14 日凌晨 2 点，OpenAI 在其官网上发文称正在发布一个经过人工验证的 SWE-bench 子集，该子集可以更可靠地评估 AI 模型解决现实世界软件问题的能力。 SWE-bench Hugging Face 地址： https://huggingface.co/datasets/princeton-nlp/SWE-bench_Verified 作为准备框架的一部分（准备框架是 OpenAI 设立的一套安全地开发和部署其前沿模型的方法），OpenAI 开发了一系列指标来跟踪、评估和预测模型的自主行动能力。一直以来，自主完成软件工程任务的能力是前沿模型自主风险类 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博