文章浏览阅读582次。Spark中Map和flatMap的区别Spark 中 map函数————————会对每一条输入进行指定的操作,然后为每一条输入返回一个对象; flatMap函数———— 操作1:同map函数一样......
2024-01-24 06:59 阅读 阅读全文Hadoop主要解决,海量数据的存储和海量数据的分析计算。Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。 Hadoop与Spark历史Hadoop与Spark框架对比 Spark内置模块Spark Core:实现了Spark的基本功能,包含任务调度、内......
2024-01-24 08:07 阅读 阅读全文文章浏览阅读1.2k次,点赞3次,收藏6次。Spark安装配置文章目录Spark安装配置2.1 Spark安装2.2 本地模式2.3 伪分布式2.4 集群模式--Standalone模式2.4.1 Standalone 配置2.4.2 运行模式(cluster / client)2.1 Spark安装官网地址:http://spark.apache.org/文档......
2024-01-24 05:55 阅读 阅读全文文章浏览阅读428次。Scala和Java实现SparkStreamingScala版本实现SparkStreamingJava版本实现SparkStreamingScala版本实现SparkStreaming添加maven依赖<dependencies> <dependency> <groupId>com.fasterxml.jackson.core</groupId> <artifactId>jac......
2024-01-22 14:08 阅读 阅读全文文章浏览阅读467次。Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必......
2024-01-23 23:10 阅读 阅读全文文章浏览阅读670次。在大数据处理上,Spark计算框架是不可忽视的一个,并且随着Spark的进一步发展,Spark计算框架也在不断地更新优化,以满足大数据领域的最新技术趋势。今天,我们就从Spark功能架构模型的角度,来仔细聊聊S......
2024-01-22 14:27 阅读 阅读全文文章浏览阅读1.4k次。1. 学会变量声明2. 掌握数据类型_bi-spark 看数据类型...
2024-01-22 17:25 阅读 阅读全文文章浏览阅读798次。Spark SQL1、相应于Hive: SQL —> MapReduce2、底层依赖RDD: SQL —> RDD一、Spark SQL基础1、什么是Spark SQL?参考官网2、核心概念:DataFrame(表)= Schema(表结构) + Data(表数据) (*)就是表,是Spar......
2024-01-23 01:13 阅读 阅读全文文章浏览阅读220次。Spark一、Spark基础及安装(单机)二、Spark核心组件、运行架构及RDD创建三、Spark的RDD算子操作四、Spark算子:Java版本(map、flatMap、distinct、subtract、combineByKey等)五、RDD算子:reduceByKey、foldByKey、SortByKey六、Spa......
2024-01-23 12:47 阅读 阅读全文文章浏览阅读220次。Spark一、Spark基础及安装(单机)二、Spark核心组件、运行架构及RDD创建三、Spark的RDD算子操作四、Spark算子:Java版本(map、flatMap、distinct、subtract、combineByKey等)五、RDD算子:reduceByKey、foldByKey、SortByKey六、Spa......
2024-01-23 12:49 阅读 阅读全文