专栏名称: AI前线
InfoQ十年沉淀,为千万技术人打造的专属AI公众号。追踪技术新趋势,跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。
今天看啥  ›  专栏  ›  AI前线

刚刚,OpenAI又双叒叕鸽了!没等来“草莓”发布,只敷衍发了评测集,网友:拿这来抢谷歌发布会风头?

AI前线  · 公众号  · AI  · 2024-08-14 04:00
    

主要观点总结

文章介绍了OpenAI与谷歌之间的“大战”,包括OpenAI发布的SWE-bench Verified测试集、新模型“草莓计划”(Strawberry)的相关情况,以及谷歌发布的硬件活动和AI应用。同时,文章也描述了AI技术在各行各业的应用和发展趋势。

关键观点总结

关键观点1: OpenAI的SWE-bench Verified测试集

为了解决SWE-bench测试集存在的问题,OpenAI与专业人员合作发起了人工注释活动,发布了SWE-bench Verified测试集,该测试集包含了500个经过人工验证的样本。同时,OpenAI还发布了所有SWE-bench测试样本的人工注释和新的评估工具。

关键观点2: OpenAI的“草莓计划”(Strawberry)

OpenAI的新模型“草莓计划”旨在使ChatGPT能够更自由地搜索网络并解决复杂问题。该计划细节尚未公开,但据知情人士透露,Strawberry模型将使OpenAI的人工智能能够自主可靠地浏览互联网并执行所谓的“深度研究”。OpenAI公司发言人表示,希望人工智能模型能够像人一样看待和理解世界。

关键观点3: 谷歌的硬件活动和AI应用

谷歌在“Made by Google 2024”硬件活动上发布了多款硬件产品,包括Pixel 9系列手机、Pixel Watch 3和Pixel Buds Pro等。同时,谷歌还推出了新的AI聊天机器人Gemini,并介绍了其在Android 15中的新功能和广泛应用。此外,谷歌还发布了一些其他的AI应用,如Pixel Weather和Call Notes等。

关键观点4: AI技术的发展趋势和应用

AI技术正在不断发展和应用于各行各业,从教育、零售到通信、金融等领域。大模型技术的引领和创新提升了行业效率,AI不仅是技术革新的先锋,更是社会经济发展的强大驱动力。智能时代已经到来,AI技术正在塑造我们的生活方式和行业变革。


文章预览

整理 | 李冬梅 褚杏娟 大家期待中的 OpenAI 与谷歌“大战”并未如约而至,双方都打出了“毫无杀伤力”的棉花拳。 以为能等到“草莓”,没想到来了个“羽衣甘蓝” 尽管全世界都在盯着“草莓计划”,但似乎叛逆的 OpenAI 总是不尽如人愿。你要“草莓”,他们偏偏给你个“羽衣甘蓝”。 北京时间 14 日凌晨 2 点,OpenAI 在其官网上发文称正在发布一个经过人工验证的 SWE-bench 子集,该子集可以更可靠地评估 AI 模型解决现实世界软件问题的能力。 SWE-bench Hugging Face 地址: https://huggingface.co/datasets/princeton-nlp/SWE-bench_Verified 作为准备框架的一部分(准备框架是 OpenAI 设立的一套安全地开发和部署其前沿模型的方法),OpenAI 开发了一系列指标来跟踪、评估和预测模型的自主行动能力。 一直以来,自主完成软件工程任务的能力是前沿模型自主风险类 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览