网站介绍:文章浏览阅读227次。介绍完了Shuffle的分区、排序、规约之后,还有最后一个阶段,就是分组。分组就是把符合同一规则的数据分在同一组,由同一个Reducer处理。还是用库存的例子,现在是这样的一组数据:p004,2021-01-05,9,1p001,2021-01-08,2,1p004,2021-01-01,5,2p003,2021-01-07,3,1p003,2021-01-01,8,1p004,2021-01-05,2,2p002,2021-01-03,3,3p002,2021-01-07,6,_hadoop 分组
- 链接地址:https://blog.csdn.net/shenjuntao520/article/details/113558817
- 链接标题:Hadoop入门指南之分组实战_hadoop 分组-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:619
- 网站标签:hadoop 分组