专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

666条数据教会AI写万字长文!模型数据集都开源

量子位  · 公众号  · AI  · 2024-09-27 17:37

文章预览

魔搭ModelScope团队 投稿 量子位 | 公众号 QbitAI 仅需 600多条数据 ,就能训练自己的长输出模型了?! 事情是酱婶儿的—— 虽然大模型的上下文(Context)支持越来越长,但包括GPT-4o,Llama-3.1-70B,Claude 3.5 Sonnet在内的这些业界领先模型,在用户指定所需输出长度的情况下,其最大输出长度仍无法满足要求。 例如,针对“写一篇关于罗马帝国历史的10000字文章”的要求,所有这些通用模型在输出长度上均无法超过2000字。 对此,基于 GLM4-9B ,智谱通过构建长输出的训练数据得到了 LongWriter-GLM4-9B 模型,能够应对超长输出(10000+ words)场景。 与此同时,智谱开源了训练该模型所需的长输出文本数据集LongWriter-6K。 现在,魔搭社区上基于LongWriter-6K过滤精选了 666条数据 (LongWriter-6K-Filtered),也一并开源了。 有啥用?? 一句话,使用该数据集,你就能在自己的模 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览