专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

大模型由"社恐"变身"懂王"的迷之自信从何而来？

AINLP · 公众号 · · 2025-01-22 10:10

文章预览

想象一下，你让LLM做一道选择题，它直接选答案时像个社恐，支支吾吾说“可能是B吧”；但如果你让它先写个解题过程，它立刻变身“懂王”，拍着胸脯说“必须是B！我算过！”——即使答案是错的！论文：Multiple Choice Questions: Reasoning Makes Large Language Models (LLMs) More Self-Confident Even When They Are Wrong 链接：https://arxiv.org/pdf/2501.09775 这篇论文就是来扒一扒LLM的“迷之自信”。研究团队发现：让AI先写推理再选答案，无论对错，它的自信心都会暴涨，甚至比人类更擅长“自我说服”。比如，当AI答错时，它的自信值提升幅度比答对时还高！这不禁让人怀疑：AI是不是偷偷学了《职场糊弄学》？方法：让AI“写小作文”再考试研究者设计了两套考试模式：直球模式：直接给答案（比如“选B”），AI内心OS：“我猜的，别骂我”。小作文模式：先写三 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

四川发布 · 四川婚假延长政策今年落地？最新回应

2 小时前

四川日报 · 2月24日，正式投用！

2 小时前

自贡网 · 注意！自贡最新天气预报来了——

20 小时前

舜网 · 苹果最薄机型！iPhone 17 Air最新爆料：横向相机条

23 小时前

舜网 · 苹果最薄机型！iPhone 17 Air最新爆料：横向相机条

23 小时前

自贡网 · 开学啦 ~！

2 天前

新浪科技 · 【#波音星际客机飞船返回地球时间无限期推迟#】据IT之家，路透社-20240622103616

8 月前

半月谈公考 · 【资料分析】速算天天练

6 月前

国芯网 · 台积电涨价3%~5%！

6 月前

李峰的投资圈 · 炒股与理财

5 月前

李峰的投资圈 · 炒股与理财

5 月前