专栏名称: 老刘说NLP

老刘，NLP开源爱好者与践行者。主页：https://liuhuanyong.github.io。老刘说NLP，将定期发布语言资源、工程实践、技术总结等内容，欢迎关注。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

大模型是否可用于文档OCR校正？兼看精排Rerankers-python工具库

老刘说NLP · 公众号 · · 2024-09-03 10:10

文章预览

今天是2024年9月3日，星期二，北京，天气晴，我们来看看两个问题。一个是Rerankers库统一排序方法，其在RAG中用的较多，封装了许多rerank的模型方法。另一个是使用利用大模型进行基于上下文的OCR校正的一个可行性研究，这个有些意思。一、精排Rerankers-python工具库重排是信息检索流程中的关键组成部分，通常在初步检索到一组候选文档后，使用更强大的模型（通常是神经网络模型）对它们进行重排，以提高检索质量。最近的工作《 rerankers: A Lightweight Python Library to Unify Ranking Methods 》(https://arxiv.org/pdf/2408.17344)介绍了一个名为rerankers的轻量级Python库，它旨在统一多种重排（re-ranking）方法。 rerankers库通过提供简单的接口，使得研究人员和实践者能够轻松地探索不同的重排方法，只需更改一行Python代码即可。也就是说，该工作提供了一个统一的接口 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博