文章浏览阅读2.8k次,点赞3次,收藏11次。spark的核心组件1.1DriverSpark 驱动器节点,用于执行 Spark 任务中的 main 方法,负责实际代码的执行工作。Driver 在 Spark 作业执行时主要负责:1.1.1) 将用户查询转化为任务;1.1.2)在 Executor 之......
2024-01-24 00:11 阅读 阅读全文文章浏览阅读374次。spark piorg.apache.spark.examples.SparkPi 原理package com.shujia.sparkimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}import scala.util.Randomobject Demo22PI..._org.apache.spark.examples.sparkpi...
2024-01-24 00:23 阅读 阅读全文文章浏览阅读1.7k次。安装 Spark 之前需要先安装 Java,Scala 及 Python。一、安装javajava安装过程不在多说,可以在我其他文章中查找,下面附上java SE JDK下载链接http://www.oracle.com/technetwork/java/javase/downloads/index.html查看java版本1.2 安装 ......
2024-01-24 07:16 阅读 阅读全文文章浏览阅读153次。import scala.Tuple2;import spark.api.java.JavaPairRDD;import spark.api.java.JavaRDD;import spark.api.java.JavaSparkContext;import spark.api.java.function.FlatMapFunction;import spark.api.java.function..._java sparkapi...
2024-01-24 08:31 阅读 阅读全文文章浏览阅读789次。Task序列化问题问题现象本质原因1.封装数据的bean没有实现序列化(报错图1)封装数据的bean需要写入本地磁盘和在网络中传输,没有实现序列化出出错2.rdd的算子中传入的函数用到了外部引用类型(闭包),且没有......
2024-01-23 02:50 阅读 阅读全文文章浏览阅读140次。Spark总结欢迎进入陶笔记博文什么是spark?spark整体脉络spark-core搭建集群(spark)-框架集群机器的准备工作集群的安装插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容......
2024-01-23 20:47 阅读 阅读全文文章浏览阅读254次。Spark的部署和Application提交方式会按照Cluster Manager和Deploy Mode进行划分。。。以前只知道Spark的Cluster部署分为Standalone、YARN和Mesos。。。 关于Cluster Manager和Deploy Mode的组合在SparkSubmit.scala的createLaunchEnv中有比较详......
2024-01-24 05:19 阅读 阅读全文资源浏览查阅86次。本来不打算写的了,但是真的是闲来无事,整天看美剧也没啥意思。这一章打算讲一下Sparkonyarnspringboot提交spark任务更多下载资源、学习资料请访问CSDN文库频道....
2024-01-24 05:38 阅读 阅读全文文章浏览阅读1.3k次。一、Spark 的运行流程?二、Spark 有哪些组件?三. Spark 中的 RDD 机制理解吗?四、RDD的操作分类五、如何区分 RDD 的宽窄依赖?为什么要设计宽窄依赖?六、RDD 持久化原理?七、Checkpoint 检查点机制?八、Check......
2024-01-24 05:51 阅读 阅读全文此部分是接着第一部分而写的,有了这两部分的内容我们就可以模拟好友间发送消息了。spark客户端作用:我们可以通过客户端发送消息,实现消息拦截的现象展示。下载并安装Spark下载地址。在Openfire服务器页面新建两个用户修......
2023-10-10 03:39 阅读 阅读全文