注册
登录
专栏名称:
AI工程化
专注于AI领域(大模型、MLOPS/LLMOPS 、AI应用开发、AI infra)前沿产品技术信息和实践经验分享。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
星嘉坡眼
·
终于来了!迪士尼游轮官宣新加坡首航日期,船票 ...
·
昨天
星嘉坡眼
·
新加坡下雪了!游戏嘉年华,15米圣诞树节日氛围拉满
·
2 天前
星嘉坡眼
·
李显龙访美行程曝光!回母校哈佛演讲,出席GI ...
·
2 天前
星嘉坡眼
·
停更3年后李子柒回归,油管评论区炸出全球网友 ...
·
3 天前
今天看啥
›
专栏
›
AI工程化
长文本分块的新策略——后期分块(Late Chunking),让RAG应用"又准又高效"
AI工程化
·
公众号
· · 2024-09-07 19:13
文章预览
你是否曾经为了在海量文档中找到关键信息而苦恼不已?在AI时代,这个问题似乎已经不再是难题。但是,当我们面对特别长的文本时,检索系统往往会陷入两难:要么牺牲精确度,要么付出高昂的成本。最近,JinaAI提出了一个叫 后期分块(Late Chunking) [1] 的新方法,声称可以解决这个难题。 今天,我们就来一探究竟,看看这个新技术到底有什么神奇之处。 后期分块:颠覆传统的新思路 想象一下,你在整理一大堆文件。传统的方法是先把文件分成小堆,然后再逐一处理。而后期分块却反其道而行之:先对整个文件进行全面处理,然后再进行分类整理。这听起来可能有点反直觉,但在AI的世界里,这种方法却显示出了惊人的效果。 具体来说,后期分块是这样工作的: 先用一个长上下文嵌入模型(比如 jina-embeddings-v2-small-en,具有 8K 上下文长度)"读懂"整个文档 然后再把这个"理解"切 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
星嘉坡眼
·
终于来了!迪士尼游轮官宣新加坡首航日期,船票$1285起
昨天
星嘉坡眼
·
新加坡下雪了!游戏嘉年华,15米圣诞树节日氛围拉满
2 天前
星嘉坡眼
·
李显龙访美行程曝光!回母校哈佛演讲,出席GIC晚宴,还不忘拍摄美照
2 天前
星嘉坡眼
·
停更3年后李子柒回归,油管评论区炸出全球网友,她新加坡也很火?
3 天前
春城晚报
·
撕毁公告、拒不腾房…昆明一酒店被强制腾退!
3 周前