spark常用的算子API_spark转换算子api-CSDN博客

网站介绍:文章浏览阅读339次。转换算子(Transformation): map(func) :返回一个新的分布式数据集,由每个原元素经过func函数转换后组成。 mapPartitions(func): 与map类似,但map中的func作用的是RDD中的每个元素,而mapPartitions中的func作用的对象是RDD的一整个分区。所以func的类型是Iterator<T> =>Iter..._spark转换算子api