专栏名称: CloudAI Sphere
专注大数据和云计算技术,坚持原创,欢迎和各位业界朋友相互交流和学习。 我们坚持:有深度,技术追根溯源;有态度,无关乎对错。
今天看啥  ›  专栏  ›  CloudAI Sphere

百度 PALO:一款云原生数仓的诞生和发展

CloudAI Sphere  · 公众号  ·  · 2024-09-14 09:07

文章预览

百度数据仓库 Palo 是基于业内领先的 OLAP 数据库 Apache Doris 构建的 MPP 架构云数据仓库。 数据仓库诞生之初是为了解决企业在信息化过程中面临的数据量激增、数据格式多样化以及决策需求提升等问题。 从 20 世纪 70 年代由麻省理工学院的研究员提出将业务处理系统和分析系统分开的架构思路以来,数据仓库经历了几十年的发展,并在1991年被正式定义和广泛认可。 进入 2000 年以后,随着数据规模的增长, 数据仓库在各大互联网企业中得到了广泛应用。 亚马逊、谷歌、微软和 IBM 都推出了各自的数据仓库, 如大家耳熟能详的 Amazon Redshift、Google BigQuery、Microsoft Azure SQL Data Warehouse等 。 同样在这个时期,由于业务规模的发展,百度作为互联网企业也需要解决数据分析过程中数据量增长、性能要求提升带来的各种问题,因此研发了自家的数据仓库技术 PA ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览