ChatGPT竟会「看人下菜」！ OpenAI 53页研究曝惊人结果：「你的名字」能操控AI回答

机器学习研究组订阅 · 公众号 · AI · 2024-10-16 20:31

文章预览

你的名字，是否会影响ChatGPT给出的回答？今天，OpenAI放出的53页新研究，揭示了出一个令人震惊的结果—— 名字中，隐含不同性别、种族，或民族背景的用户，ChatGPT在整体回应质量上，没有显著差异。不过，在某些情况下，用户名字偶尔会激发ChatGPT对同一提示词，给出不同回答。这些差异中，不足1%的响应存在有害的刻板印象。「第一人称公平性」是指，ChatGPT对参与聊天的用户的公平。 OpenAI想要弄清，它是否会因为用户性别、背景等因素不同，区别对待给出回复。研究中，他们提出了可扩展的、保护隐私的方法。论文地址：https://cdn.openai.com/papers/first-person-fairness-in-chatbots.pdf 具体来说，先去评估与用户姓名相关的潜在偏见，再利用第二语言模型独立分析ChatGPT对姓名敏感性，最后通过人工评估分析结果准确性。值得一提的是，使用RL等后期预 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

黄建同学 · 有趣的小工具！学习英语发音的新方式！1. 如果对哪个单词的发音不-20241228184940

昨天

黄建同学 · DeepSeek-V3这个点很厉害：其训练预算非常低，只用了20-20241227203634

2 天前

宝玉xp · 作为一个内容创作者，我每天创作的来源就是基于看到的信息，学习到的-20241227060236

2 天前

爱可可-爱生活 · 免费书《开放数据结构（伪代码版）》系统讲解数据结构的开源教材，内-20241226081052

3 天前

人工智能那点事 · 担心的事发生了！可可西里“网红狼”疑被轧死，曾有人警告……

4 天前