丁香园大数据基于 Apache Kyuubi / Celeborn 的实践

DataFunTalk · 公众号 · · 2024-07-23 13:00

文章预览

导读本文将分享丁香园大数据基于 Apache Kyuubi / Celeborn 的实践。主要包括两大部分： 1. Apache Kyuubi 2. Apache Celeborn(Incubating) 分享嘉宾｜陈福丁香园大数据基础平台负责人编辑整理｜夏明月内容校对｜李瑶出品社区｜ DataFun 01 Apache Kyuubi 首先来介绍 Apache Kyuubi 的实践。 1. Kyuubi 总览引入 Apache Kyuubi 是为了统一 Spark 程序入口，下图是 Kyuubi 的整体架构。Kyuubi 最吸引我们的特性包括兼容 Hive Beeline 和 RESTful API，支持多租户隔离，配合不同的 Share Level 使用，可以有效提升 Yarn 资源利用率，并且为 Spark 提供了很多插件，例如 Z-Order 优化、小文件合并、血缘、审计等。 2. 更灵活的灰度任务配置在生产环境中，我们希望长时间运行的任务采用 Connection 级别的 share level 独享 Spark 应用资源执行任务，而对于小任务，为了减少 Spark submit 的等待 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

IPRdaily · 【企业招聘新答案】人才盛宴等你来撩！第五届粤港澳大湾区知识产权人才大会系列活动来了！！

昨天

知产库 · 驳回抢注DEEPSEEK商标的通告｜附名单

18 小时前

国家知识产权局 · 数码产品国补“满月” 超2671万名消费者参与

3 天前

成都市青少年宫 · 乐趣一夏等你迎“篮”而上

8 月前

茅台时空 · 缃叶美好生花丨茅台夏至报时——映日荷花

8 月前

西译卫士 · 【荐读】“国家一级演员”，官方改了

6 天前