专栏名称: 赛博禅心
拜AI古佛,修赛博禅心
目录
相关文章推荐
中国中医  ·  节气养生 | ... ·  2 天前  
今天看啥  ›  专栏  ›  赛博禅心

剧透:扣子正上线「大模型竞技场」

赛博禅心  · 公众号  ·  · 2024-06-12 17:06
    

文章预览

长话短说 扣子将在今日正式更新 带来「大模型竞技场」,盲测版 可以试试下面这个链接,现在放出来了没 https://www.coze.cn/model/arena 也就是 让俩大模型答一个问题 用户投票决优劣 比如 询问:桃源结义时,刘关张拜的谁? 在大模型回复结束后, 会弹框 而在用户评价后 才会告诉说这是哪个模型 (豆包竟然还不错...之前一直觉得挺...) 然后这些成绩会被并入榜单 (下个月初会发榜) 为什么我会说,这个更新很重要? 众所周知,各家 评分都是第一 很困扰开发者 有盲测榜单,会好很多 保守来说,大多数的排名、测试、评分,不可信:- 任何的大模型,在特有约束下,都可以是第一 - 任何的大模型,都可以通过一定方法,在某些测试里成绩突出 - 测试者很可能不知道 web 端和 api 端的区别 金色传说大聪明,公众号:赛博禅心 AI 生态:我说几句实话 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览