文章预览
今天给大家带来一篇好友知乎@快乐子涵酱 对于角色扮演大模型提升拟人能力的方案介绍。 知乎: https://zhuanlan.zhihu.com/p/719772276 在这里我们先提出一个问题: 在没有大量标注资源的前提下,该如何提升角色扮演模型的拟人化能力呢?或者与其说是如何让模型的回复更像人话,不如说是如何让模型的回复足够以假乱真! 一个解决方案是: 可以尝试使用LCCC这类真人对话数据来提升模型的拟人能力。 但是直接使用LCCC这类数据进行SFT训练会带来很多难以解决的问题,如对话数据没有配套的角色设定导致模型system prompt跟随能力下降。进一步地,如果使用这种没有profile的数据进行训练,一方面会带来巨大的幻觉,另一方面会使模型本身的「性格」发生同质化。具体来说,真人对话数据往往比较随意跳脱,如果使用海量这样的数据进行训练,必定会使模型
………………………………