专栏名称: AI算法与图像处理

考研逆袭985，非科班跨行AI，目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技，共同分享宝贵的资源资料，这里有机器学习，计算机视觉，Python等技术实战分享，也有考研，转行IT经验交流心得

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

goldfish loss：减少训练数据泄漏，提高大语言模型输出的多样性

AI算法与图像处理 · 公众号 · · 2024-06-19 17:00

文章预览

来源：DeephubI mba LLMs（大型语言模型）能够记忆并重复它们的训练数据，这可能会带来隐私和版权风险。为了减轻记忆现象，论文作者引入了一种名为"goldfish loss"的微妙修改，在训练过程中，随机抽样的一部分标记被排除在损失计算之外。这些被舍弃的标记不会被模型记忆，从而防止模型完整复制训练集中的一整个标记序列。论文行了广泛的实验，训练了十亿规模的 Llama-2 模型，包括预训练模型和从头开始训练的模型，并展示出在几乎不影响下游基准测试的情况下，可显著减少记忆现象。 goldfish loss llm通常使用因果语言建模(CLM)目标进行训练，该目标表示令牌的平均对数概率，以所有先前的令牌为条件。对于包含L个训练标记的序列x = {xi}，可以写成: 当模型以高置信度正确预测序列{xi}时，该目标最小化，从而使由下一个标记预测训练的模型易于记 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

6 小时前

西安头条 · 重大合并，批复同意！

昨天

西安头条 · 重大合并，批复同意！

昨天

商学院 · 最新！万科总裁更新朋友圈，此前传其被公安机关带走

3 天前

商学院 · 最新！万科总裁更新朋友圈，此前传其被公安机关带走

3 天前

雪球 · 股市的涨跌就是各路资金打斗出来的结果，但咱们也要注意，场内的打斗-20250117091402

3 天前

金融早实习 · 平均年薪为25.3万！某央国企正大力抢招新兴领域人才，真心建议大家冲一冲！

3 天前

晨明的策略深度思考 · 财务风险识别模型——从蛛丝马迹到全局视角【刘晨明&陈振威】

6 月前

博亚和讯 · 【龙昌动保特约】国家发改委：肉鸡盈利0.09元/只、蛋鸡盈利37.5元/只、生猪盈利542.19元/头

5 月前

川大就业 · 校园招聘 | 中国电子科技集团公司第十研究所2025届秋季校园招聘正式启幕

4 月前