文章浏览阅读2.1k次,点赞51次,收藏49次。本文带你了解一下大数据中的Spark的一些基本概念与基本操作_spark操作类型...
2024-01-21 12:52 阅读 阅读全文文章浏览阅读7.2k次。partitionBy案例1. 作用:对pairRDD进行分区操作,如果原有的partionRDD和现有的partionRDD是一致的话就不进行分区,否则会生成ShuffleRDD,即会产生shuffle过程。2. 需求:创建一个4个分区的RDD,对其重新分区(1)创......
2024-01-23 13:10 阅读 阅读全文