SPARK-艾客网

mr的shuffle和spark的shuffle之间的区别-CSDN博客

文章浏览阅读3.7k次。mr的shuffle mapShuffle 数据存到hdfs中是以块进行存储的，每一个块对应一个分片，maptask就是从分片中获取数据的在某个节点上启动了map&nbsp;Task,map&nbsp;Task读取是通过k-v来读取的,读取的数据会放到环形缓......

2024-01-25 06:42 评论 0 阅读

阅读全文

spark-core_15:sparkContext初始化源码分析_sparkcore初始化-CSDN博客

文章浏览阅读592次。这幅图是网友提供的，非常感谢/** * Main entry point for Sparkfunctionality. A SparkContext represents the connection to a Spark cluster, andcan be used to create RDDs, accumulators and broadcast variables on thatclu..._sparkcore初始化...

2024-01-23 23:23 评论 0 阅读

阅读全文

Spark集群安装_先把slaves.template重命名为slaves-CSDN博客

文章浏览阅读2k次。1、下载spark安装包下载地址spark官网：http://spark.apache.org/downloads.html这里我们选择spark-2.0.2-bin-hadoop2.7这个版本2、上传安装包到服务中这里我们配置三台机器分别是node-1,node-2,node-3,先在node-1中配好后再分发到另......

2024-01-24 06:47 评论 0 阅读

阅读全文

大数据之Spark案例实操完整使用(第六章)-CSDN博客

文章浏览阅读2.3k次，点赞4次，收藏18次。上面的数据图是从数据文件中截取的一部分内容，表示为电商网站的用户行为数据，主要包含用户的 4 种行为：搜索，点击，下单，支付。数据规则如下：➢ 数据文件中每行数据采用下......

2024-01-22 17:09 评论 0 阅读

阅读全文

spark进阶（三）：scala基础_scala println-CSDN博客

文章浏览阅读1.1k次。spark进阶（三）：scala基础Spark本身就是使用Scala语言开发的，spark和flink的底层通讯都是基于的高并发架构akka开发，然而akka是用scala开发的，Scala与Spark可以实现无缝结合，因此，Scala顺理成章地成为了开发Spar......

2024-01-23 10:54 评论 0 阅读

阅读全文

storm与spark streaming反压机制_storm backpress-CSDN博客

文章浏览阅读5k次。因特殊业务场景，如大促、秒杀活动与突发热点事情等业务流量在短时间内剧增，形成巨大的流量毛刺，数据流入的速度远高于数据处理的速度，对流处理系统构成巨大的负载压力，如果不能正确处理，可能......

2024-01-23 11:33 评论 0 阅读

阅读全文

HDFS+Clickhouse+Spark：从0到1实现一款轻量级大数据分析系统-CSDN博客

文章浏览阅读341次。导语 | 在产品精细化运营时代，经常会遇到产品增长问题：比如指标涨跌原因分析、版本迭代效果分析、运营活动效果分析等。这一类分析问题高频且具有较高时效性要求，然而在人力资源紧张情况，传统的......

2024-01-23 22:29 评论 0 阅读

阅读全文

大数据：Spark Storage（二）集群下的broadcast_大数据storage-CSDN博客

文章浏览阅读4.3k次。Spark BroadCastBroadcast 简单来说就是将数据从一个节点复制到其他各个节点，常见用于数据复制到节点本地用于计算，在前面一章中讨论过Storage模块中BlockManager，Block既可以保存在内存中，也可以保存在磁盘中......

2024-01-24 05:05 评论 0 阅读

阅读全文

scala array 删除元素_学好Spark必须要掌握的Scala技术点-CSDN博客

前言Scala是以JVM为运行环境的面向对象的函数式编程语言，它可以直接访问Java类库并且与Java框架进行交互操作。正如之前所介绍，Spark是用Scala语言编写的，Kafka server端也是，那么深入学习Scala对掌握Spark、Kafka是必备掌握技能。......

2023-10-10 03:10 评论 0 阅读

阅读全文

慕课网Spark SQL日志分析 - 5.DateFrame&Dataset-CSDN博客

文章浏览阅读127次。5.DateFrame&amp;Dataset1.DateFrame产生背景DataFrame 不是Spark Sql提出的。而是在早起的Python、R、Pandas语言中就早就有了的。Spark诞生之初一个目标就是给大数据生态圈提供一个基于通用语言的，简单易用的API。1.如......

2024-01-23 23:41 评论 0 阅读

阅读全文