专栏名称: AI TIME 论道
AI TIME是一群关注人工智能发展,并有思想情怀的青年学者创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,链接全球AI学者,以辩论的形式探讨人工智能领域的未来。
今天看啥  ›  专栏  ›  AI TIME 论道

ALI-Agent: 基于智能体的LLMs对齐性评测

AI TIME 论道  · 公众号  ·  · 2024-07-03 18:00

文章预览

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 本文围绕大语言模型(LLMs)的对齐问题展开,旨在解决当前模型在与人类价值观存在偏差时可能面对的风险。我们提出了ALI-Agent评估框架,利用LLM驱动的智能体(LLM-empowered agents) 进行全面且深入的对齐评估。 代码 :https://github.com/SophieZheng998/ALI-Agent.git 论文地址 :https://arxiv.org/abs/2405.14125 AITIME 01 研究背景 大语言模型(LLMs)与人类价值观之间的对齐偏差可能导致生成的内容出现延续刻板印象、强化社会偏见、提供非法指令等有害现象,从而对用户和整个社会构成风险。鉴于此,对LLMs进行深入和全面的对齐性评估至关重要。由于现实世界的复杂性和开放性,评估LLMs与人类价值观的一致性充满挑战。目前的对齐性评估基准主要依赖专家设计的情境,然而这些基准的测试范围有限,难以推广到各种 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览