专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

To Believe or Not to Believe？DeepMind新研究一眼看穿LLM幻觉

新智元 · 公众号 · AI · 2024-06-08 13:49

文章预览

新智元报道编辑：庸庸乔杨【新智元导读】 DeepMind发表了一篇名为「To Believe or Not to Believe Your LLM」的新论文，探讨了LLM的不确定性量化问题，通过「迭代提示」成功将LLM的认知不确定性和偶然不确定性解耦。研究还将新推导出的幻觉检测算法应用于Gemini，结果表明，与基线方法相比，该方法能有效检测幻觉。大语言模型产生幻觉、胡说八道的问题被诟病，已经不是一天两天了。前有ChatGPT编造法律案件，后有谷歌搜索建议披萨放胶水。就连号称模型更安全、幻觉更少的Claude系列，在Reddit上也能看到不少吐槽。 LLM输出虚假信息的问题，似乎并不能在短时间内彻底解决。这就给很多场景下的应用带来了巨大的障碍，尤其是法律、医疗、学术这样比较严谨的知识领域。如果答案有错，还不如不用。那么能不能有一种方法，至少为LLM的输出划 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · Claude 设计能力确实好，要说让前端和设计师合流，可能部分能-20250303015149

2 天前

人工智能那点事 · 董明珠回应“董明珠健康家”：全部声誉砸进去，做不好就完蛋

2 天前

爱可可-爱生活 · [LG]《Stable-SPAM: How to Train i-20250302061052

2 天前

爱可可-爱生活 · 【[23星]Awesome-Spatial-Reasoning：-20250301193538

3 天前

宝玉xp · GPT 帮你补全：“当你灰心丧气的时候，想到发出这种言论的人都还-20250301125929

3 天前

真甜农业 · 这个“小助手”，教您打开批发市场档口智慧经营的正确方法

6 月前

简单心理 · 一个扎心事实：抑郁会加剧痛经

2 月前

硬十 · 有源分立器件合集

2 月前