深入理解Apache Flink核心技术

互联网后端架构 · 公众号 · 架构 · 2018-03-30 07:27

文章预览

Apache Flink（下简称Flink）项目是大数据处理领域最近冉冉升起的一颗新星，其不同于其他大数据项目的诸多特性吸引了越来越多人的关注。本文将深入分析Flink的一些关键技术与特性，希望能够帮助读者对Flink有更加深入的了解，对其他大数据系统开发者也能有所裨益。本文假设读者已对MapReduce、Spark及Storm等大数据处理框架有所了解，同时熟悉流处理与批处理的基本概念。 Flink简介 Flink核心是一个流式的数据流执行引擎，其针对数据流的分布式计算提供了数据分布、数据通信以及容错机制等功能。基于流执行引擎，Flink提供了诸多更高抽象层的API以便用户编写分布式任务： DataSet API，对静态数据进行批处理操作，将静态数据抽象成分布式的数据集，用户可以方便 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

架构师之路 · CTO问我，为什么不按照教材上的3NF来设计数据库？（第50讲）

昨天

架构师之路 · 吴军，数学之美，90W册...（免费送一批）

3 天前

中央纪委国家监委网站 · 《中国共产党纪律处分条例》解读微视频丨如何理解对瞒报个人有关事项行为的处分规定

9 月前

南方都市报 · 广州官宣！大年初一晚上

2 月前

极目新闻 · 被“鹿晗关晓彤”刷屏！陈赫回应

1 月前