Spark详细总结_爱责-CSDN博客

网站介绍:文章浏览阅读9.1k次,点赞2次,收藏4次。flatmapmapmapValues一:Spark简介 park和Hadoop的根本差异是多个作业之间的数据通信问题 : Spark多个作业之间数据通信是基于内存,而Hadoop是基于磁盘。 Spark的缓存机制比HDFS的缓存机制高效。二:wordCount()分析 (flatmap() 与 map())flatmap与map我的理解:读取数据是一行一行读的,(如果每一行的数据源是 (Hello World Hell..._爱责