专栏名称: 高可用架构
高可用架构公众号。
目录
相关文章推荐
今天看啥  ›  专栏  ›  高可用架构

干货 | 携程数据基础平台2.0建设,多机房架构下的演进

高可用架构  · 公众号  · 架构  · 2024-06-21 12:15
    

文章预览

作者简介 cxzl25,携程高级软件技术专家,关注数据领域生态建设,对分布式计算和存储、调度等方面有浓厚兴趣,Apache Kyuubi PMC Member,Apache Celeborn / ORC Committer。 一、背景 携程数据基础平台主要组件包括:HDFS 分布式存储集群,YARN 计算集群,Spark、Hive 计算引擎。数据基础平台 1.0 版本的架构从 2017 年开始逐步成型,2018 年至 2021 年数据基础团队基于 1.0 的架构做了性能优化和各类 Bug 修复,支撑集群数据和计算任务高速增长。 进入 2023 年以来,随着业务恢复,数据平台存量数据也不断增长,单日数据量净增长超过数 PB,增速前所未见,2 个 IDC 的数据机房物理机架位告急。 在 OPS 团队的大力支持下,启动了第三个 IDC 数据机房建设项目,2 个月内交付了新 IDC。 二、面临的问题 随着集群规模不断增长,2022-2023 年亟待解决的基础平台几大痛点: 多机房 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览
推荐文章