Spark入门——1:RDD及编程接口_spark preferlocation-CSDN博客

网站介绍:文章浏览阅读1.9k次。RDD是Spark的核心,也是整个Spark的架构基础。spark与mapreduce相比,前者提供了更加丰富的编程接口给程序猿们。所以下面主要说明RDD的基本概念,以及其重要接口。 RDD包含4大操作: 1,创建操作:RDD的创建有两个途径。一个是来之外部存储系统(例如:HDFS,S3)或者内部集合,另外一个是来自其他RDD的转换操作(例如m_spark preferlocation