专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
今天看啥  ›  专栏  ›  将门创投

ALI-Agent:基于智能体的LLMs对齐性评测

将门创投  · 公众号  · 科技创业  · 2024-07-17 08:22

文章预览

本文围绕大语言模型(LLMs)的对齐问题展开,旨在解决当前模型在与人类价值观存在偏差时可能面对的风险。我们提出了 ALI-Agent评估框架 ,利用LLM驱动的智能体(LLM-empowered agents) 进行全面且深入的对齐评估。 论文标题:  ALI-Agent: Assessing LLMs' Alignment with Human Values via Agent-based Evaluation  论文链接: https://arxiv.org/abs/2405.14125 代码链接: https://github.com/SophieZheng998/ALI-Agent.git 一、研究背景 大语言模型(LLMs)与人类价值观之间的对齐偏差可能导致生成的内容出现延续刻板印象、强化社会偏见、提供非法指令等有害现象,从而对用户和整个社会构成风险。鉴于此,对LLMs进行深入和全面的对齐性评估至关重要。由于现实世界的复杂性和开放性,评估LLMs与人类价值观的一致性充满挑战。目前的对齐性评估基准主要依赖专家设计的情境,然而这些基准的测试范 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览