今天看啥  ›  专栏  ›  InfoQ

Tera技术如何支撑百度百亿级实时搜索?|百度沙龙免费招募倒计时

InfoQ  · 公众号  · 科技媒体  · 2017-05-18 08:00
    

文章预览

对于 Tera,很多人并不陌生,它是百度网页搜索部开源的一个高性能、可伸缩的结构化数据存储系统,被设计用来管理搜索引擎万亿量级的超链与网页信息。在 GitHub 社区里,Tera 占据超过 1.3k 的 star,是百度开源项目中最受欢迎的项目之一。 大多数人对 Tera 感兴趣,源于它是百度实时搜索背后的关键数据存储系统,其数十 PB 量级的数据存储和百万 QPS 的实时数据访问能力,支撑着百度搜索引擎的链接存储、实时索引筛选、实时用户行为分析等多个核心系统。 如果让你有机会接触百度网页搜索部门的技术大牛们,听他们介绍 Tera 的数据模型和整体架构;介绍 Tera 如何支撑百度链接存储、实时索引筛选、实时用户行为分析系统,对你来说是不是非常有价值? 那么机 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览