网站介绍:文章浏览阅读1.3k次。学习目标:熟悉 Spark RDD 的使用方法。学习原理:RDD(Resilient Distributed Datasets)可扩展的弹性分布式数据集,RDD是spark最基本的数据抽象,RDD表示一个只读、分区且不变的数据集合,是一种分布式的内存抽象,与分布式共享内存(DistributedShared Memory,DSM)都是分布式的内存抽象,但两者是不同的。RDD支持两种类型的操作: transformations(转换)和 actions(动作)。transformations操作._actions操作出发时会执行rdd记录的所有运行transformations操作并计算结果结
- 链接地址:https://blog.csdn.net/qq_56437391/article/details/124006738
- 链接标题:第四章 Spark RDD_actions操作出发时会执行rdd记录的所有运行transformations操作并计算结果结-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:3599
- 网站标签:actions操作出发时会执行rdd记录的所有运行transformations操作并计算结果结