网站介绍:文章浏览阅读1.4w次。其实我一直很不明白的是,为什么有groupByKey了还要有groupBy,今天被一位同事问到了怎么对rdd分组的时候,这个疑问算是彻底惹恼我了,我一定要搞清楚这东西怎么用的,嗯,对比一下groupByKey()函数,无参数,pairRdd之际调用即可返回根据分组好的内容,如JavaPairRDD>,但是这个必须是JavaPairRDD类型,也就是说必须是元组的key,value形式。但是Rd_spark groupby
- 链接地址:https://blog.csdn.net/fjr_huoniao/article/details/51554597
- 链接标题:spark 的groupby_spark groupby-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:1521
- 网站标签:spark groupby