网站介绍:文章浏览阅读217次。第二节、Spark核心核心组件、概念一、RDD1.RDD(Resilient Distributed Datesets)弹性分布式数据集①RDD是Spark中计算和数据的抽象,它标识已经分片(partition),不可变的并能够被并行计算的数据集合。②RDD可以被存储在内存中也可以存储在磁盘里③RDD提供了两种类型的变化操作:Transformation和Action④RD..._spark中的rdd是什么?spark中的核心组件有哪些?
- 链接地址:https://blog.csdn.net/hehe_soft_engineer/article/details/103451232
- 链接标题:Spark学习之路——2.核心组件、概念_spark中的rdd是什么?spark中的核心组件有哪些?-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:9198
- 网站标签:spark中的rdd是什么?spark中的核心组件有哪些?