网站介绍:文章浏览阅读170次。Spark 简介Spark 是整个 BDAS 的核心组件,是一个大数据分布式编程框架,不仅实现了MapReduce的算子map 函数和reduce函数及计算模型,还提供更为丰富的算子,如filter、join、groupByKey等。是一个用来实现快速而同用的集群计算的平台。 Spark将分布式数据抽象为弹性分布式数据集(RDD),实现了应用任务调度、RPC、序列化和压缩,并为运行在其上的上层..._spark数据解读
- 链接地址:https://blog.csdn.net/qq_43958467/article/details/99073604
- 链接标题:大数据之Spark 知识体系完整解读_spark数据解读-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:7421
- 网站标签:spark数据解读