SPARK-艾客网

文章浏览阅读2.4k次。Spark3.1.2 on k8s配置日志存储路径：spark-defaults.conf使用的Hadoop版本是2.7.3 HDFS端口号9000192.168.x.x是Hadoop的namenode节点IP地址18080是默认的历史日志的端口号spark.yarn.historyServer.address=192.168.x.x:18080spark.history.ui.port=1808......

2024-01-24 09:48 评论 0 阅读

阅读全文

Spark3.2教程（前置）关于Spark3.2.0与Scala版本的坑_scala2.12对应的spark版本是多少-CSDN博客

文章浏览阅读4.9k次。搭建和使用最新版的Spark3.2.0，在版本上踩了很多坑，特此记录一下，避免后来者犯错。首先看下图，即官网下载Spark的版本选择上的红框介绍：这里介绍了Spark3用的是Scala2.12，Spark3.2+用的是Scala2.......

2024-01-25 06:45 评论 0 阅读

阅读全文

Spark 常用 API_spark api-CSDN博客

一、 map：返回一个新的 RDD, 该 RDD 是由原 RDD 的每个元素经过函数转换后的值组成，就是对 RDD 中的数据做转换def main......

2023-10-10 03:39 评论 0 阅读

阅读全文

spark写入hdfs_spark 写入hdfs-CSDN博客

文章浏览阅读1w次。spark streaming写入hdfs场景：需要将数据写入hdfs，打包成一个gz包，每5分钟执行一次spark任务。最终的结果如下：5分钟跑一次spark，将数据写入hdfs，会产生很多的小文件。spark代码val hadoopConf: Configuration = rdd.co......

2024-01-23 07:37 评论 0 阅读

阅读全文

「Spark从入门到精通系列」3. Apache Spark结构化API（上）-CSDN博客

文章浏览阅读363次。来源 | Learning Spark Lightning-Fast Data Analytics，Second Edition作者 | Damji，et al.翻译 | 吴邪大数据4..._apache spark api文档...

2024-01-23 12:35 评论 0 阅读

阅读全文