SPARK-艾客网

Spark初级入门——Spark编程基础（二）_在线视频教程-CSDN程序员研修院

通过大量的案例说明常用transformation函数的使用...

2024-01-24 08:33 评论 0 阅读

大数据之spark_spark中的特殊算子cache、persist、checkpoint_spark cache算子-CSDN博客

文章浏览阅读451次。cache、persist将数据缓存到内存，第一次触发Action，才会将数据放入内存，以后在触发Action，可以复用前面内存中缓存的数据，可以提升技术效率cache和persist的使用场景：一个application多次触发Action，为了复用......

2024-01-23 02:50 评论 0 阅读

阅读全文

Spark集群安装部署_那我们通过这个spark客户点节点,向hadoop集群上提交spark任务-CSDN博客

文章浏览阅读2k次。Spark集群安装部署Spark集群有多种部署方式，比较常见的有Standalone模式和ON YARN模式Standalone模式就是说部署一套独立的Spark集群，后期开发的Spark任务就在这个独立的Spark集群中执行ON YARN模式是说使用现有的Hado......

2024-01-24 06:29 评论 0 阅读

阅读全文

Spark学习笔记-Day4 Mac-Yarn模式启动Spark_spark3.4 yarn-CSDN博客

文章浏览阅读303次。Yarn 模式启动Spark准备运行环境1. 用下面的命令下载spark和hadoop包至mac电脑或虚拟机.wget https://mirrors.estointernet.in/apache/spark/spark-3.1.1/spark-3.1.1-bin-hadoop2.7.tgzwget https://archive.apache.org/dist/hadoop/common/hadoop-2.7.7/hadoop-2.......

2024-01-24 07:43 评论 0 阅读

阅读全文

部署Spark的历史服务器---Spark History Server_hive on spark的历史服务器-CSDN博客

文章浏览阅读1.1k次。部署Spark的历史服务器—Spark History Server一、配置spark历史服务器此操作是建立在“部署基于Standalone模式部署Spark集群”之上的，也是我的上一篇博客https://editor.csdn.net/md/?articleId=1090158941.1、进入Spark安装目录......

2024-01-24 06:02 评论 0 阅读

阅读全文

Spark入门实战系列--7.Spark Streaming（上）--实时流计算Spark Streaming原理介绍_如何接受一个实时的数据流-CSDN博客

文章浏览阅读1.6k次。1、Spark Streaming简介1.1 概述Spark Streaming 是Spark核心API的一个扩展，可以实现高吞吐量的、具备容错机制的实时流数据的处理。支持从多种数据源获取数据，包括Kafk、Flume、Twitter、ZeroMQ、Kinesis 以及TCP sockets，......

2024-01-24 06:48 评论 0 阅读

阅读全文

【Spark-core学习之三】 Spark集群搭建 & spark-shell & Master HA-CSDN博客

文章浏览阅读127次。环境　　虚拟机：VMware 10 　　Linux版本：CentOS-6.5-x86_64 　　客户端：Xshell4　　FTP：Xftp4　　jdk1.8　　scala-2.10.4(依赖jdk1.8)　　spark-1.6一、搭建集群组建方案：master:PCS101，slave:PCS102、PCS103搭建方式一：Standalone......

2024-01-24 06:51 评论 0 阅读

阅读全文