文章预览
这里分享对开发者有用的人工智能技术和信息,每周五发布。 前沿技术 Multi-Head RAG [1] Multi-Head RAG(MRAG)是一种针对大型语言模型(LLMs)的新型检索增强生成方法。传统的 RAG 方法通常无法有效处理需要检索多个内容差异显著的文档的查询。MRAG 通过使用 Transformer 模型的多头注意力层的激活作为检索多方面文档的关键点,来克服这一限制。研究团队认为,不同的注意力头可以学习捕捉数据的不同方面,通过对应的激活,可以得到更全面地代表数据项和查询的不同纬度的嵌入,从而提高复杂查询的检索准确性。 Parrot [2] :从端到端提升LLM应用程序的性能 LLM 应用程序通常需要设计复杂的工作流程,以完成单一任务,但由于现有的公共 LLM 服务仅提供过于简化的请求级 API,导致在应用层面的重要信息丢失。这使得公共 LLM 服务不得不针对单个 LLM 请求进
………………………………