大数据之Hadoop_MapReduce自定义输出和输入类型_hadoop 中的map需要设置key和value输入输出类型吗-CSDN博客

网站介绍:文章浏览阅读531次。自定义输出和输入类型介绍我们在使用MapReduce处理需要两次聚合的数据时,我们会进行两次输出,第二次输出的结果是读取第一次输出的结果进程聚合处理的,但我们只需要看到第二次的聚合的结果就可以了,第一次聚合的结果我们是否能看懂都无所谓,此时我们在进行第一次输出时,我们可以将输出类型由原来(当我们未自定义时默认的输入和输出类型都是TextInputFormat和TextOutputFormat)改为SequenceFileOutputFormat,Sequence相对于Text类型处理速度较快,且更节约内_hadoop 中的map需要设置key和value输入输出类型吗