Spark学习之路——2.核心组件、概念_spark中的rdd是什么?spark中的核心组件有哪些?-CSDN博客

网站介绍:文章浏览阅读217次。第二节、Spark核心核心组件、概念一、RDD1.RDD(Resilient Distributed Datesets)弹性分布式数据集①RDD是Spark中计算和数据的抽象,它标识已经分片(partition),不可变的并能够被并行计算的数据集合。②RDD可以被存储在内存中也可以存储在磁盘里③RDD提供了两种类型的变化操作:Transformation和Action④RD..._spark中的rdd是什么?spark中的核心组件有哪些?