网站介绍:文章浏览阅读531次。自定义输出和输入类型介绍我们在使用MapReduce处理需要两次聚合的数据时,我们会进行两次输出,第二次输出的结果是读取第一次输出的结果进程聚合处理的,但我们只需要看到第二次的聚合的结果就可以了,第一次聚合的结果我们是否能看懂都无所谓,此时我们在进行第一次输出时,我们可以将输出类型由原来(当我们未自定义时默认的输入和输出类型都是TextInputFormat和TextOutputFormat)改为SequenceFileOutputFormat,Sequence相对于Text类型处理速度较快,且更节约内_hadoop 中的map需要设置key和value输入输出类型吗
- 链接地址:https://blog.csdn.net/WuBoooo/article/details/108157119#comments_20583466
- 链接标题:大数据之Hadoop_MapReduce自定义输出和输入类型_hadoop 中的map需要设置key和value输入输出类型吗-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:3083
- 网站标签:hadoop 中的map需要设置key和value输入输出类型吗