专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
今天看啥  ›  专栏  ›  PaperWeekly

港中文领衔发布大语言模型”诚实性“研究综述:让AI更靠谱!

PaperWeekly  · 公众号  · 科研  · 2024-10-07 23:57

文章预览

©PaperWeekly 原创 · 作者 |  李思衡,杨程,吴太强 单位 |  香港中文大学,香港大学,清华大学 研究方向 |  大语言模型 “诚实性”作为大语言模型对齐的“3H”(Helpfulness, Honesty, Halmless)准则 [1] 之一,随着大语言模型在各个领域的广泛应用,近年来逐渐成为关注的焦点。特别是在医疗,法律,金融等高风险场景中,一个“诚实”的模型至关重要。 想象一下,如果 AI 给出错误答案时信誓旦旦,可能会带来多么严重的后果。那么,什么是诚实性?如何评估诚实性?如何让大模型更好地遵循诚实性?  在我们最新的综述研究《A Survey on the Honesty of Large Language Models》中,我们详细探讨了现有大语言模型诚实性的定义,评估方法和提升策略。综述不仅对当前研究成果进行梳理,还提出了未来发展方向的深度思考,旨在激发更多研究人员的探索和创新。  ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览