今天看啥  ›  专栏  ›  NLP工作站

如何提升角色扮演大模型的拟人能力?

NLP工作站  · 公众号  ·  · 2024-09-20 23:23

文章预览

今天给大家带来一篇好友知乎@快乐子涵酱 对于角色扮演大模型提升拟人能力的方案介绍。 知乎: https://zhuanlan.zhihu.com/p/719772276 在这里我们先提出一个问题: 在没有大量标注资源的前提下,该如何提升角色扮演模型的拟人化能力呢?或者与其说是如何让模型的回复更像人话,不如说是如何让模型的回复足够以假乱真! 一个解决方案是: 可以尝试使用LCCC这类真人对话数据来提升模型的拟人能力。 但是直接使用LCCC这类数据进行SFT训练会带来很多难以解决的问题,如对话数据没有配套的角色设定导致模型system prompt跟随能力下降。进一步地,如果使用这种没有profile的数据进行训练,一方面会带来巨大的幻觉,另一方面会使模型本身的「性格」发生同质化。具体来说,真人对话数据往往比较随意跳脱,如果使用海量这样的数据进行训练,必定会使模型 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览