Spark之RDD概述_spark rdd种类-CSDN博客网友收藏

Spark之RDD概述_spark rdd种类-CSDN博客

文章浏览阅读903次。一、什么是RDDRDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。代码中是一个抽象类,它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。1.弹性:存储的弹......
阅读全文
Spark的HA配置-02_spark ha 部署-CSDN博客网友收藏

Spark的HA配置-02_spark ha 部署-CSDN博客

文章浏览阅读264次。https://blog.csdn.net/kxj19980524/article/details/90743861在01的基础上操作spark的HA是基础zookeeper的,所以在这之前先搭建好zookeeper集群编辑conf目录下的spark-env.sh文件,添加zookeeper配置信息,然后把SPARK_MASTER_HOST注释掉.export SPA......
阅读全文