网友收藏Spark的RDD介绍_spark和rdd的关系-CSDN博客文章浏览阅读2.2k次。1、什么是RDDRDD(Resilient Distributed Dataset)叫做弹性的分布式数据集合,是Spark中最基本的数据抽象,它代表一个不可变、只读的,被分区的数据集。弹性的体现:RDD可以通过lineage(血统)进行恢复、数据持久化(内存、...... 2024-01-23 05:04 评论 0 阅读 阅读全文