专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

谷歌再次称霸！出自伯克利等华人学生项目，竟成世界170+模型竞技场

新智元 · 公众号 · AI · 2024-12-09 15:05

主要观点总结

文章介绍了由UC伯克利、斯坦福、UCSD等高校华人学生发起的AI擂台，现已成为全球最大的AI模型竞技场。谷歌的Gemini技术实验版本在Chatbot Arena上发布后，与OpenAI等科技巨头展开激烈竞争。文章还提到了Chatbot Arena的评分方式、用户反馈的重要性以及未来的发展方向。

关键观点总结

关键观点1: AI擂台的发展

从最初的华人学生发起，到现在成为全球超过170款模型的大比竞技场，吸引了全球初创公司和科技巨头的参与。

关键观点2: 谷歌Gemini技术的竞争

谷歌在Chatbot Arena上发布了Gemini技术的实验版本，与OpenAI等科技巨头展开激烈竞争，通过不断更新追赶领先位置。

关键观点3: Chatbot Arena的评分方式

采用用户提出问题，两个匿名AI模型给出答案，然后评判哪个回答更好的方式。这种全新的评估方式吸引了众多科技公司和用户的关注。

关键观点4: 用户反馈的重要性

Chatbot Arena收集的用户反馈成为开发者的重要数据来源，平台定期公开部分数据以确保实用性和防止企业操纵评分系统。

关键观点5: 项目的未来发展方向

虽然前路漫长，但团队并没有打算将Chatbot Arena转变为营利性项目，他们希望将其打造成AI领域的维基百科。

文章预览

新智元报道编辑：好困【新智元导读】当初，由UC伯克利、斯坦福、UCSD等高校华人学生发起的AI擂台，如今已经成为了超过170款模型的大比竞技场！全世界的初创公司和科技巨头都在拼命争夺第一的位置。就在谷歌庆祝自家大模型Gemini发布一周年之际，最新版本的gemini-exp-1206也成功强势回归！不仅重新登顶Chatbot Arena总榜第一，而且还在代码能力榜上与o1并驾齐驱。最新亮点（括号内为与gemini-exp-1121相比的进步）：总排名登顶第一（从第2升至第1）在风格控制评测中与GPT-4o-1120并列第一（从第4升至第1）在代码能力榜单与o1并列第一（从第3升至第1）在复杂提示词测试中独占鳌头（从第2升至第1）左右滑动查看来自UC伯克利、斯坦福、UCSD等高校的学生联合项目，引发了AI界的狂热有趣的是，当Chatbot Arena在去年年初刚刚发布时，没人会 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博