专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
今天看啥  ›  专栏  ›  DeepTech深科技

研究发现Llama 2在识别失礼行为上优于人类,同样场景下GPT频繁出错

DeepTech深科技  · 公众号  · 科技媒体  · 2024-05-23 21:59
    

文章预览

人类是复杂的生物。我们的沟通方式是多层次的,心理学家已经设计了多种测试来衡量我们从互动中推断彼此的意义和理解的能力。 人工智能模型在这些测试中的表现越来越好。近日,发表在 Nature Human Behavior 上的一项新研究发现,一些大型语言模型在执行被称为“心智理论”的任务时,表现与人类一样好,在某些情况下甚至超越了人类。 这并不意味着人工智能系统实际上能够读懂我们的感受,但它确实表明在评估心理学家认为的人类独有能力的实验中,这些模型表现得越来越好。 为了更好地了解大型语言模型在这些任务中如何成功和失败以及背后的原理,研究人员希望沿用他们用来测试人类心智理论的相同系统性方法。 理论上,人工智能模型越善于模仿人类,它们在与我们的互动中就越有用和富有同情心。 OpenAI 和 谷歌 最近都宣布了超级人 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览