专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
目录
相关文章推荐
四川日报  ·  2月24日,正式投用! ·  2 小时前  
舜网  ·  苹果最薄机型!iPhone 17 ... ·  23 小时前  
舜网  ·  苹果最薄机型!iPhone 17 ... ·  23 小时前  
自贡网  ·  开学啦 ~! ·  2 天前  
今天看啥  ›  专栏  ›  AINLP

大模型由"社恐"变身"懂王"的迷之自信从何而来?

AINLP  · 公众号  ·  · 2025-01-22 10:10
    

文章预览

想象一下,你让LLM做一道选择题,它直接选答案时像个社恐,支支吾吾说“可能是B吧”;但如果你让它先写个解题过程,它立刻变身“懂王”,拍着胸脯说“必须是B!我算过!”——即使答案是错的! 论文 :Multiple Choice Questions: Reasoning Makes Large Language Models (LLMs) More Self-Confident Even When They Are Wrong 链接 :https://arxiv.org/pdf/2501.09775 这篇论文就是来扒一扒LLM的“迷之自信”。研究团队发现: 让AI先写推理再选答案,无论对错,它的自信心都会暴涨 ,甚至比人类更擅长“自我说服”。比如,当AI答错时,它的自信值提升幅度比答对时还高!这不禁让人怀疑:AI是不是偷偷学了《职场糊弄学》?   方法: 让AI“写小作文”再考试 研究者设计了两套考试模式: 直球模式 :直接给答案(比如“选B”),AI内心OS:“我猜的,别骂我”。 小作文模式 :先写三 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览