专栏名称: 美团技术团队
10000+工程师,如何支撑中国领先的生活服务电子商务平台?数亿消费者、数百万商户、2000多个行业、几千亿交易额背后是哪些技术在支撑?这里是美团、大众点评、美团外卖、美团配送、美团优选等技术团队的对外窗口。
今天看啥  ›  专栏  ›  美团技术团队

Spark向量化计算在美团生产环境的实践

美团技术团队  · 公众号  · 架构  · 2024-06-20 19:58
    

文章预览

总第592 篇 |  2024年第012篇 Apache Spark是一个优秀的计算引擎,广泛应用于数据工程、机器学习等领域。向量化执行技术在不升级硬件的情况下,既可获得资源节省,又能加速作业执行。Gluten+Velox解决方案为Spark换上了向量化执行引擎,本文将阐述美团在这一方向的实践和思考。 1 什么是向量化计算 1.1 并行数据处理:SIMD指令 1.2 向量化执行框架:数据局部性与运行时开销 1.3 如何使用向量化计算 2 为什么要做Spark向量化计算 3 Spark向量化计算如何在美团实施落地 3.1 整体建设思路 3.2 Spark+Gluten+Velox计算流程 3.3 阶段划分 4 美团Spark向量化计算遇到的挑战 4.1 稳定性问题 4.2 支持ORC并优化读写性能 4.3 Native HDFS客户端优化 4.4 Shuffle重构 4.5 适配HBO 4.6 一致性问题 5  上线效果 6  未来规划 6.1 Spark向量化之后对开源社区的跟进策略 6.2 提升向量化覆盖率的策略 7 致 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览