注册
登录
专栏名称:
魔搭ModelScope社区
阿里巴巴达摩院模型开源社区ModelScope官方账号
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
潇湘晨报
·
台湾台中一商场发生事故,已致4人死亡
·
9 小时前
潇湘晨报
·
28岁女子双肺长癌,竟然和这个习惯有关?网友 ...
·
昨天
潇湘晨报
·
CZ6304,紧急备降!
·
2 天前
新闻株洲
·
株洲营商环境这一做法,全国推广!
·
3 天前
潇湘晨报
·
谢娜现身张杰香港演唱会,蔡少芬发文晒照:她前 ...
·
3 天前
今天看啥
›
专栏
›
魔搭ModelScope社区
人类偏好对齐训练技术解析
魔搭ModelScope社区
·
公众号
· · 2024-07-02 18:33
文章预览
背景 大型语言模型(LLMs)通过在大量文本数据集上进行无监督预训练,获得丰富的语言模式和知识,这一阶段训练后的模型被称为base model。base model能够理解语言并生成连贯的文本,但仍然存在一些问题,比如: 不良输出:模型可能会生成各种偏见、不真实信息和有害内容。 跟随指令的能力不足:尽管预训练模型可以生成连贯的文本,但它们在遵循用户指令和特定任务规范方面往往较差。例如,当模型被要求生成尊重特定规则或风格的文本时,它们可能无法完全理解并遵循这些具体的要求。 这些问题有几个原因: 语料偏差: 来源广泛的互联网文本:预训练模型使用大量互联网上的文本数据,这些数据来源多样,包括社交媒体、新闻文章、论坛帖子、百科全书等。这些数据不可避免地包含偏见、不真实信息和有害内容。 数据缺乏筛选和校验:由 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
潇湘晨报
·
台湾台中一商场发生事故,已致4人死亡
9 小时前
潇湘晨报
·
28岁女子双肺长癌,竟然和这个习惯有关?网友:再也不敢了…...
昨天
潇湘晨报
·
CZ6304,紧急备降!
2 天前
新闻株洲
·
株洲营商环境这一做法,全国推广!
3 天前
潇湘晨报
·
谢娜现身张杰香港演唱会,蔡少芬发文晒照:她前一晚急性肠胃炎,是真爱
3 天前