文章预览
专注AIGC领域的专业社区,关注微软 、百度文心一言、讯飞星火等大语言模型(LLM)的发展和 应用 落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 6月9日,著名AI大模型平台Anthropic在官网公布了,其最新大模型Claude 3的个性化性格训练方法。 Anthropic认为,输出内容的安全、合法性对于大模型的场景化落地至关重要,但是一味的打压它们进行超级安全对齐,输出的内容也会千篇一律毫无新意,会使大模型失去个性化,无法突出“智能”的效果。 所以,Anthropic在训练Claude 3时,使用了一种特殊的个性化训练方法(Constitutional AI: Harmlessness from AI Feedback),在保持安全的前提下,还能输出一些有趣、更具创新性的内容,也是该模型实现超强性能的关键之一。 论文地址:https://arxiv.org/abs/2212.08073 从Anthropic发布的论文来看,主要是通过Constitutional AI技术
………………………………