文章预览
导语: 说起MapReduce,只要是大数据领域的小伙伴,相信都不陌生。它作为Hadoop生态系统中的一部分,最早是由Google公司研究提出的一种面向大规模数据处理的并行计算模型。 MapReduce主要由"Map(映射)"和"Reduce(归约)"组成,主要思想是用Map函数用来把一组键值对映射成一组新的键值对,然后指定并发的Reduce函数进行合并输出。 然而就是这个简单的分布式思想,却敲开了大数据时代的大门,很多大数据工作者都把学习MapReduce作为基础的一课。 不过对于大多数小伙伴来说,虽然学习或写了很久的MapReduce,却不一定真正研究过它的源码。 这一期,我就先给大家介绍一下MapReduce中Map(映射)的实现者Mapper。更深入的理解MapReduce,在应用到易观千帆技术数据处理方面时
………………………………