专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

大模型微调数据生成工具Easy Dataset及KBLaM知识注入框架评析

老刘说NLP  · 公众号  ·  · 2025-03-21 12:10
    

文章预览

今天是2025年3月21日,星期五,北京,天气晴。 今天看两个主题,一个是大模型微调数据生产,一个是知识图谱融合大模型的思路。 也就是Easy Dataset大模型微调数据生成工具的三个问题以及大模型与知识图谱结合框架KBLaM实现分析。 前者是工程化工具,后面是一个结合技术前沿,分打不同的点,根据实际情况做选择,会有更多收获。 抓住根本问题,做根因,专题化,体系化,会有更多深度思考。大家一起加油。 一、Easy Dataset大模型微调数据生成工具的三个问题   Easy Dataset(https://github.com/ConardLi/easy-dataset),一个专为创建大模型(LLM)微调数据集而设计的项目, 提供了直观的界面,用于上传特定领域的文件,智能分割内容,生成问题,并为模型微调生成高质量的训练数据 。社区成员有测试过,还不错,具体说明说明文档在:https://rncg5jvpme.feishu.cn/doc ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览