文章浏览阅读187次。一、二、案例:详见代码。针对案例提出的6个问题:假设要针对整个网站的历史数据进行处理, 量有 1T, 如何处理?放在集群中, 利用集群多台计算机来并行处理如何放在集群中运行?简单来讲, 并行计算就是同......
2024-01-25 06:44 阅读 阅读全文文章浏览阅读115次。一、二、案例:详见代码。针对案例提出的6个问题:假设要针对整个网站的历史数据进行处理, 量有 1T, 如何处理?放在集群中, 利用集群多台计算机来并行处理如何放在集群中运行?简单来讲, 并行计算就是同......
2024-01-24 05:01 阅读 阅读全文文章浏览阅读245次。《深入理解Spark:核心思想与源码分析》一书前言的内容请看链接《深入理解SPARK:核心思想与源码分析》一书正式出版上市《深入理解Spark:核心思想与源码分析》一书第一章的内容请看链接《第1章 环境准......
2024-01-23 23:23 阅读 阅读全文文章浏览阅读1.7k次。第65课:SparkSQL下Parquet深入进阶本期内容:1 SparkSQL下的Parquet序列化2 SparkSQL下的Parquet源码解读3 SparkSQL下Parquet总结 Parquet中关键概念:1 Block2 File3 Column Chunk数据按列存储时,每一列的数据被分割成多个列块......
2024-01-23 18:32 阅读 阅读全文文章浏览阅读3k次。概述前几篇博文都在介绍Spark的调度,这篇博文我们从更加宏观的调度看Spark,讲讲Spark的部署模式。Spark部署模式分以下几种:local 模式local-cluster 模式Standalone 模式YARN 模式Mesos 模式我们先来简单介绍下YARN模......
2024-01-24 09:26 阅读 阅读全文文章浏览阅读606次。Scala深入浅出进阶经典第67讲:Scala并发编程匿名Actor、消息传递、偏函数实战解析及其在Spark源码中的应用解析_actor 偏函数...
2024-01-23 18:27 阅读 阅读全文文章浏览阅读57次。 本期视频通过代码实战详解了Scala并发编程匿名Actor、消息传递、偏函数实战解析及其在Spark源码中的应用解析:(1)匿名Actor是通过Actor伴生对象的actor方法直接创建和启动的,不像Actor的子类需要调用自......
2024-01-23 18:27 阅读 阅读全文