专栏名称: DataFunTalk
专注于大数据、人工智能领域的知识分享平台。
今天看啥  ›  专栏  ›  DataFunTalk

丁香园大数据基于 Apache Kyuubi / Celeborn 的实践

DataFunTalk  · 公众号  ·  · 2024-07-23 13:00
    

文章预览

导读   本文将分享丁香园大数据基于  Apache Kyuubi / Celeborn  的实践 。 主要包括两大部分 : 1.  Apache Kyuubi 2.  Apache Celeborn(Incubating) 分享嘉宾|陈福  丁香园 大数据基础平台负责人 编辑整理|夏明月 内容校对|李瑶 出品社区| DataFun 01 Apache Kyuubi 首先来介绍  Apache Kyuubi  的实践。 1. Kyuubi   总览 引入 Apache Kyuubi 是为了统一 Spark 程序入口,下图是 Kyuubi 的整体架构。Kyuubi 最吸引我们的特性包括兼容 Hive Beeline 和 RESTful API,支持多租户隔离,配合不同的 Share Level 使用,可以有效提升 Yarn 资源利用率,并且为 Spark 提供了很多插件,例如 Z-Order 优化、小文件合并、血缘、审计等。 2. 更灵活的灰度任务配置 在生产环境中,我们希望长时间运行的任务采用 Connection 级别的 share level 独享 Spark 应用资源执行任务,而对于小任务,为了减少 Spark submit 的等待 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览