网站介绍:文章浏览阅读1k次。文章目录一、名词解释1. RDD二、Spark核心概念三、RDD基础1. 转化操作和行动操作的区别2. 创建RDD3. 转化操作4. 行动操作5. 惰性求值6. 常见的转化操作7. 常见的行动操作8. 持久化一、名词解释1. RDD弹性分布式数据集(resilient distributed dataset, 简称RDD)在Spark中,对数据的所有操作不外乎创建RDD、转化已有RDD以及调用RDD操作进行求值。二、Spark核心概念每个Spark 应用都由一个驱动器程序(driver pro_spark教程菜鸟教程
- 链接地址:https://blog.csdn.net/Eric_qiushui/article/details/117981358
- 链接标题:Spark入门_spark教程菜鸟教程-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:4413
- 网站标签:spark教程菜鸟教程