Spark的RDD介绍_spark和rdd的关系-CSDN博客网友收藏

SparkRDD介绍_sparkrdd关系-CSDN博客

文章浏览阅读2.2k次。1、什么是RDDRDD(Resilient Distributed Dataset)叫做弹性的分布式数据集合,是Spark中最基本的数据抽象,它代表一个不可变、只读的,被分区的数据集。弹性的体现:RDD可以通过lineage(血统)进行恢复、数据持久化(内存、......
阅读全文