Hadoop入门指南之分组实战_hadoop 分组-CSDN博客

网站介绍:文章浏览阅读227次。介绍完了Shuffle的分区、排序、规约之后,还有最后一个阶段,就是分组。分组就是把符合同一规则的数据分在同一组,由同一个Reducer处理。还是用库存的例子,现在是这样的一组数据:p004,2021-01-05,9,1p001,2021-01-08,2,1p004,2021-01-01,5,2p003,2021-01-07,3,1p003,2021-01-01,8,1p004,2021-01-05,2,2p002,2021-01-03,3,3p002,2021-01-07,6,_hadoop 分组