注册
登录
专栏名称:
机器学习研究组订阅
连接人工智能技术人才和产业人才的交流平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
晚安~ #晚安# -20241123230805
·
昨天
爱可可-爱生活
·
【Observers:一个面向AI可观测性的 ...
·
2 天前
爱可可-爱生活
·
【Grunty:基于Claude的电脑控制A ...
·
2 天前
宝玉xp
·
回复@扯一缕东风:本地模型,不上传数据到服务 ...
·
5 天前
宝玉xp
·
回复@蝈蝈俊:没错//@蝈蝈俊:关键还是大任 ...
·
6 天前
今天看啥
›
专栏
›
机器学习研究组订阅
ChatGPT竟会「看人下菜」! OpenAI 53页研究曝惊人结果:「你的名字」能操控AI回答
机器学习研究组订阅
·
公众号
·
AI
· 2024-10-16 20:31
文章预览
你的名字,是否会影响ChatGPT给出的回答? 今天,OpenAI放出的53页新研究,揭示了出一个令人震惊的结果—— 名字中,隐含不同性别、种族,或民族背景的用户,ChatGPT在整体回应质量上,没有显著差异。 不过,在某些情况下,用户名字偶尔会激发ChatGPT对同一提示词,给出不同回答。 这些差异中,不足1%的响应存在有害的刻板印象。 「第一人称公平性」是指,ChatGPT对参与聊天的用户的公平。 OpenAI想要弄清,它是否会因为用户性别、背景等因素不同,区别对待给出回复。 研究中,他们提出了可扩展的、保护隐私的方法。 论文地址:https://cdn.openai.com/papers/first-person-fairness-in-chatbots.pdf 具体来说,先去评估与用户姓名相关的潜在偏见,再利用第二语言模型独立分析ChatGPT对姓名敏感性,最后通过人工评估分析结果准确性。 值得一提的是,使用RL等后期预 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
晚安~ #晚安# -20241123230805
昨天
爱可可-爱生活
·
【Observers:一个面向AI可观测性的轻量级工具库,可以追-20241123153009
2 天前
爱可可-爱生活
·
【Grunty:基于Claude的电脑控制AI助手,可通过自然语-20241122200042
2 天前
宝玉xp
·
回复@扯一缕东风:本地模型,不上传数据到服务器//@扯一缕东风:-20241120125404
5 天前
宝玉xp
·
回复@蝈蝈俊:没错//@蝈蝈俊:关键还是大任务拆成gpt可以做的-20241119112951
6 天前
标志情报局
·
安徽省胸科医院新LOGO
4 月前
Insight数据库
·
今日,信达 GPRC5D×BCMA×CD3 三抗国内获批临床
4 月前