今天看啥  ›  专栏  ›  机器学习研究组订阅

ChatGPT竟会「看人下菜」! OpenAI 53页研究曝惊人结果:「你的名字」能操控AI回答

机器学习研究组订阅  · 公众号  · AI  · 2024-10-16 20:31
    

文章预览

你的名字,是否会影响ChatGPT给出的回答? 今天,OpenAI放出的53页新研究,揭示了出一个令人震惊的结果—— 名字中,隐含不同性别、种族,或民族背景的用户,ChatGPT在整体回应质量上,没有显著差异。 不过,在某些情况下,用户名字偶尔会激发ChatGPT对同一提示词,给出不同回答。 这些差异中,不足1%的响应存在有害的刻板印象。 「第一人称公平性」是指,ChatGPT对参与聊天的用户的公平。 OpenAI想要弄清,它是否会因为用户性别、背景等因素不同,区别对待给出回复。 研究中,他们提出了可扩展的、保护隐私的方法。 论文地址:https://cdn.openai.com/papers/first-person-fairness-in-chatbots.pdf 具体来说,先去评估与用户姓名相关的潜在偏见,再利用第二语言模型独立分析ChatGPT对姓名敏感性,最后通过人工评估分析结果准确性。 值得一提的是,使用RL等后期预 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览