SPARK-艾客网

Spark RDD之Key-Value类型操作详解_rdd key value-CSDN博客

文章浏览阅读7.2k次。partitionBy案例1. 作用：对pairRDD进行分区操作，如果原有的partionRDD和现有的partionRDD是一致的话就不进行分区，否则会生成ShuffleRDD，即会产生shuffle过程。2. 需求：创建一个4个分区的RDD，对其重新分区（1）创......

2024-01-23 13:10 评论 0 阅读

阅读全文

spark进阶（三）：scala基础_scala println $_泛泛之素的博客-CSDN博客

spark进阶（三）：scala基础Spark本身就是使用Scala语言开发的，spark和flink的底层通讯都是基于的高并发架构akka开发，然而akka是用scala开发的，Scala与Spark可以实现无缝结合，因此，Scala顺理成章地成为了开发Spark应用的首选语言，大......

2023-10-10 03:20 评论 0 阅读

阅读全文

使用java和scala编写spark-WordCount示例_java scalawordcountlocal-CSDN博客

文章浏览阅读2.7k次。前言：最近博主在学习spark相关知识，感觉是个挺不错的框架，它的分布式处理大数据集的思想还是值得我们好好学习的。个人感觉以后java开发肯定不仅仅是SSM这一套东西了，当数据量越来越大时，我......

2024-01-22 22:14 评论 0 阅读

阅读全文

sparklinux服务器日志信息,启动 Spark 历史记录服务器 - AWS Glue-CSDN博客

文章浏览阅读361次。本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。启动 Spark 历史记录服务器您可以使用在 EC2 实例上托管服务器的 AWS CloudFormation 模板启动 Spark 历史记录服务器，也可以使......

2024-01-24 05:46 评论 0 阅读

阅读全文

大数据系列第七课：RDD于Spark运行机制_大数据技术,rdd的运行机制-CSDN博客

文章浏览阅读1k次。第一阶段（1-3月）：会从浅入深，基于大量案例实战，深度剖析和讲解Spark，并且会包含完全从企业真实复杂业务需求中抽取出的案例实战。课程会涵盖Scala编程详解、Spark核心编程、Spark SQL和Spark Streaming、Spar......

2024-01-22 21:31 评论 0 阅读

阅读全文

Scala_Spark中aggregate用法以及结果分析_aggregation如何获取value值-CSDN博客

文章浏览阅读5.2k次。只做记录，部分结果在代码注释部分：aggregate()：是一个聚合函数，接受多个输入，并按照一定的规则运算以后输出一个结果值getNumPartitions：获取RDD的分区数foreachPartition()：遍历分区中的元素,参数为函数，......

2024-01-23 01:59 评论 0 阅读

阅读全文

Spark-实现自定义排序的六种方法（Scala版本）_scalal将年龄排序-CSDN博客

文章浏览阅读1.6k次。原文链接：https://www.toutiao.com/i6845585556722680328/在实际开发中经常需要对数据进行排序统计，Spark的sortBy以及SortByKEy算子并不能完全适用开发场景，需要我们自定义排序规则，例如如下数据：Array("张三 16 98......

2024-01-22 23:12 评论 0 阅读

阅读全文

Update：spark_rdd算子：第1节 RDD_定义_转换算子：深入RDD-CSDN博客

文章浏览阅读187次。一、二、案例：详见代码。针对案例提出的6个问题：假设要针对整个网站的历史数据进行处理, 量有 1T, 如何处理?放在集群中, 利用集群多台计算机来并行处理如何放在集群中运行?简单来讲, 并行计算就是同......

2024-01-25 06:44 评论 0 阅读

阅读全文

idea新建scala文件_通过IDEA搭建scala开发环境开发spark应用程序-CSDN博客

文章浏览阅读435次。一、idea社区版安装scala插件因为idea默认不支持scala开发环境，所以当需要使用idea搭建scala开发环境时，首先需要安装scala插件，具体安装办法如下。1、打开idea，点击configure下拉菜单中的plugins选项：2、在弹出......

2024-01-21 12:41 评论 0 阅读

阅读全文

第四课 Scala模式匹配、类型系统彻底精通与Spark源码阅读_case x :: y :: nil-CSDN博客

文章浏览阅读353次。一: 守卫 var ch = ‘+’ ch match { case '+' => sign = 1 case '-' => sign = -1 case _ if Character.isDigit(ch) => digit = Character.digit(ch, 10) case _ => sign = 0}_case x :: y :: nil...

2024-01-22 16:54 评论 0 阅读

阅读全文