文章浏览阅读1.2w次。RDD(弹性分布式数据集合)是Spark的基本数据结构,Spark中的所有数据都是通过RDD的形式进行组织。本文讲解RDD的属性、创建方式、广播与累加器等重要知识点,并图解RDD高频算子。_基于spark的大数据分析...
2024-01-23 23:14 阅读 阅读全文 文章浏览阅读752次。first Codecpublic class Friend { public static void main(String[] args){ System.out.println("BigData:"+"--"+"947967114"); }}SPARK源码解析首先看一段使用scala编写的spark代码:pa......
2024-01-22 22:05 阅读 阅读全文 文章浏览阅读2.1k次。Spark发展到今年,也已经有了十个年头了,在这十年的时间里,Spark在数据分析方面的优势得以显现,成为越来越多的企业的选择。Spark做数据分析,得益于Spark计算框架的优势,也获得了很好的竞争优势。今......
2024-01-22 14:27 阅读 阅读全文