专栏名称: AI TIME 论道

AI TIME是一群关注人工智能发展，并有思想情怀的青年学者创办的圈子，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，链接全球AI学者，以辩论的形式探讨人工智能领域的未来。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

ALI-Agent: 基于智能体的LLMs对齐性评测

AI TIME 论道 · 公众号 · · 2024-07-03 18:00

文章预览

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入！本文围绕大语言模型（LLMs）的对齐问题展开，旨在解决当前模型在与人类价值观存在偏差时可能面对的风险。我们提出了ALI-Agent评估框架，利用LLM驱动的智能体(LLM-empowered agents) 进行全面且深入的对齐评估。代码：https://github.com/SophieZheng998/ALI-Agent.git 论文地址：https://arxiv.org/abs/2405.14125 AITIME 01 研究背景大语言模型（LLMs）与人类价值观之间的对齐偏差可能导致生成的内容出现延续刻板印象、强化社会偏见、提供非法指令等有害现象，从而对用户和整个社会构成风险。鉴于此，对LLMs进行深入和全面的对齐性评估至关重要。由于现实世界的复杂性和开放性，评估LLMs与人类价值观的一致性充满挑战。目前的对齐性评估基准主要依赖专家设计的情境，然而这些基准的测试范围有限，难以推广到各种 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

奇点网 · 《循环》：降压，还是得运动上强度！UCL团队发现，将21分钟久坐替换成跑步或爬楼梯，可显著改善血压

昨天

练瑜伽 · 黄晓明为什么不让叶珂闭嘴？

昨天

丁香园 · 乙肝五项看不懂？漫画教你轻松读懂 24 种组合！

3 天前

丁香园肿瘤时间 · 「骨保护神药」地舒单抗比唑来膦酸更好吗？

4 天前

中化二建 · 廉语清风 | 以案明纪 2024年7月全国查处违反中央八项规定精神问题20151起

2 月前

橄榄古典音乐 · 音乐和金融如何选择？看看天才小提琴少女朱蕾雅

1 月前