SPARK-艾客网

stage 的计算模式，资源调度，资源调度的结论，spark基于standalone与yarn模式提交任务，集群高可用的原理，shuffle调优中调节参数的集中方式：配置这些参数有两种方式_stage模式-CSDN博客

文章浏览阅读453次。stage 的计算模式原文链接：https://blog.csdn.net/wyqwilliam/article/details/81123227stage 的计算模式就是：pipeline 模式，即计算过程中数据不会落地，也就是不会存到磁盘，而是放在内存中直接给下一个函数使用，stage ......

2024-01-24 09:26 评论 0 阅读

阅读全文

第68讲：Scala并发编程原生线程Actor、Cass Class下的消息传递和偏函数实战解析及其在Spark中的应用源码解析学习笔记_原生代码可以用cass么-CSDN博客

文章浏览阅读788次。使用actor时要注意的风险：1)receive中case不匹配时，此actor可能被一些无关的消息占满而无法接收更多消息，所以在实际编程时用case _ 方式，2）消息发送是异步的。消息何时到达无法保证，所以写程序时不应......

2024-01-23 18:27 评论 0 阅读

阅读全文

小问题可能存在大问题，希望大神帮忙解答。Spark本地运行模式中单线程与多线程问题之setMaster("local")可以运行，但是设置成setMaster("local[3]")或setMaste-CSDN博客

文章浏览阅读8.3k次，点赞2次，收藏7次。小问题可能存在大问题，希望大神帮忙解答。Spark本地运行模式中单线程与多线程问题之setMaster("local")可以运行，但是设置成setMaster("local[3]")或setMaster("local[*]")则报......

2024-01-23 23:54 评论 0 阅读

阅读全文

spark集群：无法指定被请求的地址,Service 'Driver' could not bind on a random free port._service 'sparkdriver' could not bind on a random f-CSDN博客

文章浏览阅读8.2k次，点赞2次，收藏3次。19/07/09 17:00:48 INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users with view permissions: Set(root); groups with view permissions: Set(); users with modify pe..._service 'sparkdriver' could not bind on a r......

2024-01-24 05:39 评论 0 阅读

阅读全文

智慧出行/spark Streaming-Dstream流优化:1.消费并行度,2.序列化,3.限流,压背,冷启4.cpu空转时间,5.不要在代码中判断这个表是否存在,6.推测执行7.开启动态资源分配_dstream 消费总量-CSDN博客

文章浏览阅读339次。1.设置合理的消费并行度最优的方案是:kafka分区数:broker *3/6/9kafka分区能不能增加,能不能减少?kafka分区数是可以增加的,但是不能减少2.序列化java的序列化,很沉重,会序列化好多无关的,耗时特别长..._dstream 消费......

2024-01-21 08:22 评论 0 阅读

阅读全文

Spark DataFrame:value $ is not a member of StringContext df.select($"name", $"age" + 1).show()_value '$' is not a member of stringcontext-CSDN博客

文章浏览阅读3.5k次，点赞5次，收藏2次。错误信息Error:(29, 15) value $ is not a member of StringContext df.select($"name", $"age" + 1).show()解决方案··· //在创建SparkSession之后 import sparkSession.implicits._ ···..._value '$' is not a member o......

2024-01-24 05:22 评论 0 阅读

阅读全文

【[2020.6] 数据挖掘：基于Spark框架的K-Means聚类2】在Iris数据集上借助pyspark实现K-Means聚类_kmeans算法对iris数据集实现聚类-CSDN博客

文章浏览阅读1.6k次。【[2020.6] 数据挖掘：基于Spark框架的K-Means聚类2】在Iris数据集上借助pyspark实现K-Means聚类Iris（鸢尾花）数据集Iris数据集简介Iris数据集下载和处理基于pypark的K-Means 聚类实验与参数分析Spark组件MLlib[^2]实验步骤......

2024-01-23 22:57 评论 0 阅读

阅读全文

【[2020.6] 数据挖掘：基于Spark框架的K-Means聚类2】在Iris数据集上借助pyspark实现K-Means聚类_kmeans算法对iris数据集实现聚类-CSDN博客

2024-01-23 23:00 评论 0 阅读

阅读全文

hadoop安全模式问题mkdir: Cannot create directory /spark/data/words. Name node is in safe mode._mkdir: cannot create directory /data. name node is-CSDN博客

文章浏览阅读1k次，点赞2次，收藏8次。hadoop启动后安全模式问题问题：正常启动hadoop集群后，准备在hadoop里创建一个目录结果出现如下：[root@master ~]# hdfs dfs -mkdir -p /spark/data/words/mkdir: Cannot create directory /spark/data/words. Name node is in......

2024-01-22 17:34 评论 0 阅读

阅读全文

Spark的执行原理,本地Master模式, Yarn_cluster模式运行, Yarn_client模式运行, Yarn_cluster和Yarn_client的区别 14_master yarn-cluster is de-CSDN博客

文章浏览阅读2.2k次，点赞2次，收藏2次。1. 本地Master负责调度资源1.1 命令行bin/spark-submit --class cn.spark.com.WordCountForHDFS \--master spark:node01:8080 \--executor-memory 1g \ //每个executor分配1g的内存--total-executor-cores 4 \ //所有的executor加起来核......

2024-01-24 07:16 评论 0 阅读

阅读全文