文章浏览阅读320次。文章目录简单回顾基本概念术语任务层面的术语任务配置及调度操作层面资源层面资源调度和任务调度详细流程细节把握1.workers集合为什么要是用HashSet集合?2.启动Executor的时候为什么不需要考虑数据的位置......
2024-01-25 06:15 阅读 阅读全文文章浏览阅读381次。目录spark 程序的执行架构spark on yarn 中 client 模式和 cluster 模式提交任务(资源调度)的区别Spark 比 MapReduce 快的一个原因yarn client 模式提交任务的流程yarn cluster 模式提交任务的流程资源调度和任务调度宽依赖和......
2024-01-24 00:21 阅读 阅读全文文章浏览阅读435次。 1,当每个worker启动起来之后,会向master注册信息(内容:当前worker进程所管理的资源情况);这样Master就掌握了整个集群的资源情况2,当new SparkConf 和SparkContext的时候Driver当中就启动了DAGScheduler和TaskScheduler;这......
2024-01-24 05:04 阅读 阅读全文