第四章 Spark RDD_actions操作出发时会执行rdd记录的所有运行transformations操作并计算结果结-CSDN博客

网站介绍:文章浏览阅读1.3k次。学习目标:熟悉 Spark RDD 的使用方法。学习原理:RDD(Resilient Distributed Datasets)可扩展的弹性分布式数据集,RDD是spark最基本的数据抽象,RDD表示一个只读、分区且不变的数据集合,是一种分布式的内存抽象,与分布式共享内存(DistributedShared Memory,DSM)都是分布式的内存抽象,但两者是不同的。RDD支持两种类型的操作: transformations(转换)和 actions(动作)。transformations操作._actions操作出发时会执行rdd记录的所有运行transformations操作并计算结果结