文章预览
百度数据仓库 Palo 是基于业内领先的 OLAP 数据库 Apache Doris 构建的 MPP 架构云数据仓库。 数据仓库诞生之初是为了解决企业在信息化过程中面临的数据量激增、数据格式多样化以及决策需求提升等问题。 从 20 世纪 70 年代由麻省理工学院的研究员提出将业务处理系统和分析系统分开的架构思路以来,数据仓库经历了几十年的发展,并在1991年被正式定义和广泛认可。 进入 2000 年以后,随着数据规模的增长, 数据仓库在各大互联网企业中得到了广泛应用。 亚马逊、谷歌、微软和 IBM 都推出了各自的数据仓库, 如大家耳熟能详的 Amazon Redshift、Google BigQuery、Microsoft Azure SQL Data Warehouse等 。 同样在这个时期,由于业务规模的发展,百度作为互联网企业也需要解决数据分析过程中数据量增长、性能要求提升带来的各种问题,因此研发了自家的数据仓库技术 PA
………………………………