网站介绍:文章浏览阅读1.5k次。Spark是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序。Spark特点运行速度快:Spark使用先进的DAG(Directed Acyclic Graph,有向无环图)执行引擎,以支持循环数据流与内存计算,基于内存的执行速度可比Hadoop MapReduce快上百倍,基于磁盘的执行速度也能快10倍。容易使用:Spark支持使用Scala、Java、Python和R语言进行编程,简洁的API设计有助于用户轻松构建并行程序,并且可以通过Spark Shell进行交互式_spark教程
- 链接地址:https://blog.csdn.net/qq_43057549/article/details/109321729
- 链接标题:Spark 基础教程_spark教程-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:1668
- 网站标签:spark教程