小白学NLP：ChatGPT稳定性评测

Coggle数据科学 · 公众号 · · 2024-05-15 13:56

文章预览

本文讨论了OpenAI发布的ChatGPT聊天机器人服务。ChatGPT的稳健性对于公众来说仍然不清楚。论文原文：https://arxiv.org/pdf/2302.12095 本文从对抗性和分布外（OOD）的角度对ChatGPT的稳健性进行了全面评估。我们使用AdvGLUE和ANLI基准来评估对抗性稳健性，并使用Flipkart评论和DDXPlus医学诊断数据集进行OOD评估。 unset unset 模型稳定性介绍 unset unset 对抗性稳健性对抗性输入是通过在原始输入上添加一个范围内的、不可察觉的扰动生成的。可以通过优化以下目标来学习最优分类器（Madry等，2017年）：分布外（OOD）稳健性另一方面，OOD稳健性（泛化）旨在通过训练现有数据来学习在未见分布上的最优分类器。一种流行的OOD稳健性公式是最小化所有分布上的平均风险，这些分布是从所有可能分布的集合（可能大于）中采样的： unset unset 稳定性评测方法 unset ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

潇湘晨报 · 网友称高速路上“无奈倒车7公里”，广东高速：拥堵或与清明将至有关

22 小时前

新闻株洲 · 清明假期，株洲天气预报来了！

昨天

湖南日报 · 你的吃辣自由，这位“火辣”院士守护！

昨天

湖南日报 · 成长路上无惧风雨！湘潭上千组家庭雨中遛娃（文末送福利~）

2 天前

湖南日报 · 湖南大山里的妹子变身千万粉丝主播，带货1.4亿元

3 天前

河北交通广播 · 【992 | 视频】车友聚会多车连环追尾，最新回应：雨天路滑，车距太近

9 月前

AMZ123跨境电商 · 加入AMZ123知识星球，解锁高阶运营秘籍

4 月前

冷兔 · 【冷兔•槽】每日一冷NO.4340

1 月前