专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

深挖大模型幻觉！哈佛大学最新报告：LLM等价于众包，只是在输出「网络共识」

新智元 · 公众号 · AI · 2024-10-25 13:03

主要观点总结

哈佛大学研究了大型语言模型在回答晦涩难懂和有争议问题时产生幻觉的原因，发现模型输出的准确性依赖于训练数据的质量和数量。报告指出大模型在处理有广泛共识的问题时表现较好，但在面对争议性或信息不足的主题时易产生误导性回答。研究包括对不同主题设计提示让四个大模型回答，并观察结果。此外，文章还讨论了认知信任、众包和大模型之间的关系。

关键观点总结

关键观点1: 大型语言模型在回答问题时存在‘幻觉’现象，即生成看似真实但非事实、无意义或与给定提示不一致的回应。

这种现象可能导致错误信息的传播，对关键决策造成有害后果，甚至导致用户对AI系统的不信任。

关键观点2: 大模型产生幻觉的原因与训练数据的质量和数量有关。

大模型通过在海量数据上建立共现词概率模型进行文本生成，但模型的输出并不总是基于真实世界的语义含义或真实性，而是与训练集中所有单词及其出现位置的统计概率有关。

关键观点3: 众包和大模型有相似之处。

大模型可以被认为是众包信任的一种形式，基于互联网上的问题及所有答案来生成常见的回应。当主题有普遍共识时，大模型的输出可以反映出该共识观点；但在处理晦涩或有争议的主题时，生成的结果可能是似是而非的。

关键观点4: 实验结果显示，大型语言模型在处理具有争议性或信息不足的主题时准确性较低。

研究人员通过设计一系列提示让四个大模型回答，并观察到在有争议的主题上模型更易产生幻觉。

关键观点5: 大模型的可变性突显了其依赖于训练数据的数量和质量。

这与众包系统相似，大模型的回复依赖于训练数据的广度和质量。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

爱可可-爱生活 · 晚安～ #晚安# -20250709233352

昨天

AI科技评论 · AI 陪伴赛道，会诞生下一个「泡泡玛特」吗？ | GAIR Live

昨天

新机器视觉 · 平均薪资24333元！大家不如换个赛道卷~

2 天前

宝玉xp · 回复@黄健楸:谢谢补充👍//@黄健楸:字节对编码，还跟词表有关-20250708225722

2 天前

宝玉xp · 纽约时报：AI 会冲击谁的就业？年轻人还是资深员工？在微软和其他-20250708133304

2 天前

川大就业 · 校园招聘 | 航空工业成飞2025届校园招聘正式启动！

1 年前

成都日报 · 重磅！四川盆地有40万亿立方米天然气

6 月前

证券时报 · 热搜！“鹿晗社交平台被禁止关注”，工作室致歉

6 月前

白日梦想家大A · 万0.85优惠开户

4 月前

长春晚报 · 欠税22.7万元！事关网红“东北雨姐”带货的……

2 月前