专栏名称: 极市平台

极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台，为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯，行业动态，在线分享信息，线下活动等。网站: http://cvmart.net/

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

北大新作：让大模型来做peer-review结果会怎样？

极市平台 · 公众号 · · 2024-11-15 22:00

文章预览

↑ 点击蓝字关注极市平台作者丨CVer粉丝投稿来源丨CVer 编辑丨极市平台极市导读让大模型来做peer-review结果会怎样？ >> 加入极市CV技术交流群，走在计算机视觉的最前沿 PiCO: Peer Review in LLMs based on the Consistency Optimization. 论文： https://arxiv.org/abs/2402.01830 github.com/PKU-YuanGroup/Peer-review-in-LLMs 和人类论文审稿一样，大模型也可以来进行peer-review吗？北大团队受启发于同行评审机制（peer-review），探索了一种全新的开放环境下大模型无监督自动评估方法，叫做“PiCO”。该工作的核心点是想去回答如下问题，在开放环境下，能否通过无监督的方式来得到比较公平、合理、且更接近人类偏好的大模型能力排序？背景现有的大模型评估方式面临着各式各样的问题，基于Benchmark的评估方式没法对齐人类实际使用的真实偏好，同时开始有不少文章讨伐这种 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

芝能汽车 · 新能源周销量｜2025年第7周：销量开始逐步恢复

20 小时前

洪观新闻 · 宝马全球首家5S店被比亚迪经销商承租，工作人员：将售卖腾势、方程豹

昨天

洪观新闻 · 宝马全球首家5S店被比亚迪经销商承租，工作人员：将售卖腾势、方程豹

昨天

汽车金融大全APP · 一种超级好的扣划方式来了

2 天前

汽车金融大全APP · 易鑫车主融大大拓展客户边界，油车可做 12 年了

2 天前

体外诊断观察 · 分子诊断龙头裁员175名，关闭部分工厂！

7 月前

曾嵘胡扯的地方 · 9月5日我讲了什么？小游戏创业/韩国发行/游戏投资

5 月前

小小包麻麻 · 非遗国潮套盒来袭！有趣有寓意，让娃自己“造”出新年味儿

1 月前

国家林业和草原局 · 大熊猫短视频展播 | 《香香吃竹子》

3 天前