今天看啥  ›  专栏  ›  InfoQ

优化 Uber 的搜索基础设施:升级至Apache Lucene 9.5

InfoQ  · 公众号  · 科技媒体  · 2024-11-22 18:31

主要观点总结

Uber工程团队将搜索基础设施从Apache Lucene 8.0升级到9.5版本,提高了搜索能力、性能和效率。文章详细介绍了升级过程、Uber搜索平台的架构以及Lucene的新特性。此次升级有助于削减基础设施成本,提高搜索速度和效率,为乘客和司机提供更好的体验。

关键观点总结

关键观点1: Uber升级搜索基础设施

从Apache Lucene 8.0升级到9.5版本,提高了搜索能力、性能和效率。

关键观点2: Uber搜索平台架构

包括服务层(读取路径)和摄取层(写入路径),以及用于离线处理的组件。服务层负责处理用户查询并检索信息,摄取层负责更新Lucene索引。

关键观点3: Lucene的新特性

包括预取API IndexInput(支持对文档值做稀疏索引)和升级Snowball字典,改进了分词。这些新特性有助于提高Uber的搜索速度和效率。

关键观点4: 升级的影响

降低CPU使用率,有助于削减基础设施成本,提高搜索速度和效率,为乘客和司机提供更好的体验。


文章预览

作者 | Aditya Kulkarni 译者 | 平川 策划 | Tina   最近,Uber 工程团队宣布升级其搜索基础设施,从 Apache Lucene 8.0 升级到 9.5 版本。此次升级提高了 Uber 各项服务的搜索能力、性能和效率。 在一篇博文中,来自 Uber 搜索平台和数据工程团队的 Anand Kotriwal、Aparajita Pandey、Charu Jain 和 Yupeng Fu 详细阐述了本次升级工作。Uber 搜索平台有一个可靠的架构,包括服务层(读取路径)和摄取层(写入路径),以及用于离线处理的组件。 服务层负责处理用户查询,并从 Lucene 索引中检索信息。它主要包含两个部分:路由服务和搜索服务,前者将传入的查询定向到适当的搜索节点,并管理负载均衡;后者查询 Lucene 索引,实时检索结果。 当数据发生变化时,摄取层会更新 Lucene 索引。基于 Apache Flink 的摄取服务会处理实时更新,确保搜索索引保持最新。 对于离线处 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览