Spark系列(一)spark简介及安装配置_spark配置-CSDN博客

网站介绍:文章浏览阅读5.6k次,点赞2次,收藏31次。什么是Spark:Spark是一个用于大规模数据处理的统一计算引擎注意:Spark不仅仅可以做类似于MapReduce的离线数据计算,还可以做实时数据计算,并且它还可以实现类似于Hive的SQL计算,等等,所以说它是一个统一的计算引擎内存计算Spark中一个最重要的特性就是基于内存进行计算,从而让它的计算速度可以达到MapReduce的几十倍甚至上百倍2. spark特点:2.1 Speed:速度快由于Spark是基于内存进行计算的,所以它的计算性能理论上可以比MapReduce快100倍。_spark配置