网站介绍:文章浏览阅读66次。一、前述Spark是基于内存的计算框架,性能要优于Mapreduce,可以实现hadoop生态圈中的多个组件,是一个非常优秀的大数据框架,是Apache的顶级项目。One stack rule them all 霸气。但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce...
- 链接地址:https://blog.csdn.net/weixin_34279579/article/details/93341406
- 链接标题:【Spark篇】---Spark初始-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:7536
- 网站标签:【Spark篇】---Spark初始