注册登录

专栏名称: OpenMMLab

构建国际领先的人工智能开源算法平台

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

福州日报 · 断货！全线售罄 · 昨天

福州日报 · 断货！全线售罄 · 昨天

下厨房 · 长在树上的“奶油冰淇淋”，软糯清甜，减脂期多 ... · 昨天

每天学点做饭技巧 · 关系再好，也不要这样聊天！ · 昨天

海伦融媒 · 每件最高2000元！黑龙江省智能家居消费补贴来了 · 2 天前

今天看啥 › 专栏 › OpenMMLab

RAG进阶：混合稠密检索和知识图谱来提升精度

OpenMMLab · 公众号 · · 2024-07-18 18:08

文章预览

HuixiangDou 是群聊场景的 LLM 知识助手。群里人多口杂，机器人显然不应该答复所有消息，它的设计规则为：无关内容不吭声—— 拒答明确该答的，直接回复—— 检索不能违反核心价值观—— 可靠 https://github.com/InternLM/HuixiangDou （文末点击阅读原文可直达，觉得好用欢迎 star）在上一篇文章中，我们用真实群聊数据测试，对比不同方法和调参，最终拒答 F1 score 达到 75.88。本文介绍如何混用知识图谱和稠密检索，把 F1 进一步提升到 77.57。以下是目前所有方法对比：方法 F1 score 备注 BCE+KG混合（本文） 77.57 KG 权重约 20% BCE 75.88 需配合特定 splitter BGE 72.23 使用 bge-large-zh-v1.5 BGE-M3 70.62 测试数据 token 不足 8192，无法评估能力 M3 稠密+稀疏混合 63.85 使用 milvus hybrid_search 测试，WeightedRanker 中稀疏占比越大效果越差本文使用的方法，实质是在稠密检索期 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

福州日报 · 断货！全线售罄

昨天

福州日报 · 断货！全线售罄

昨天

下厨房 · 长在树上的“奶油冰淇淋”，软糯清甜，减脂期多吃也不怕！

昨天

每天学点做饭技巧 · 关系再好，也不要这样聊天！

昨天

海伦融媒 · 每件最高2000元！黑龙江省智能家居消费补贴来了

2 天前

澎湃新闻 · 涉诈骗罪被批捕！已婚女与男友举办婚礼，被丈夫揭穿

8 月前

显明易说 · 新式黄历：2024年7月9日周二

7 月前

光伏资讯 · 刚刚隆基硅片涨价！或有望抑制光伏无序低价竞争

5 月前

北极星太阳能光伏网 · 123家！国电投电池组件、逆变器供应商“白名单”公布

4 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号