Jina AI将LLM Reranker延迟打下来了：21秒变3秒！

深度学习与NLP · 知乎专栏 · · 2024-07-09 11:38

文章预览

继 Jina Reranker v2 之后，Jina AI又开源了 PE-Rank ，一种新的基于LLM的重新排序器，用于高效的列表式段落重新排序。不是将原始文本输入到LLM的上下文窗口，而是使用嵌入模型将每个段落表示为一个特殊标记，然后将[指令]+[查询]+[特殊标记]输入到LLM中。在推理时，PE-Rank将输出空间限制在这些特殊标记上，从而实现更高效的解码。PE-Rank将重新排序 100个文档的延迟从 21秒大幅减少到 3秒。 RankGPT（上）与PE-Rank（下）的比较。 RankGPT将整个段落作为输入，并输出有序数字，而PE-Rank将特殊标记列表作为输入和输出。在右侧，展示了使用不同形式的输入在DL19上重新排序的结果。 PE-Rank背景使用大型语言模型（LLM）作为重新排序器有什么吸引人的地方？新任务的灵活指令零样本能力上下文推理但在实践中，是什么阻止人们使用LLM作为重新排序器？上下文 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

体坛周报 · 热议 | 输麻了！曼城近13场比赛仅1胜……

2 天前

体坛周报 · 热议 | 输麻了！曼城近13场比赛仅1胜……

2 天前

清晨朗读会 · 渊源直播

3 天前

清晨朗读会 · 清晨朗读3135：Believing in Santa doesn't make children act nicer

3 天前

英文悦读 · 介绍一个很好用的听力工具

4 天前

壹点灵心理 · 你应该接受心理咨询的6个信号

3 月前

蔚蓝轨迹 Rail · 再次引进二手电力机车！匈牙利国铁启动阿尔斯通Astride机车测试

2 月前

DataFunTalk · 抖音集团指标管理与消费体系建设实践

2 月前