SPARK-艾客网

为什么学习大数据框架Spark要用Python而不是用Scala_大数据语言一定要用scala吗-CSDN博客

文章浏览阅读2k次。Apache Spark，它是用于大数据分析、处理和计算的通用引擎。与MapReduce相比，它具有几个优点：它更快、更易于使用、简单，并且几乎可以在任何地方运行。它具有用于 SQL、机器学习和流式传输的内置工具，这......

2024-01-22 17:28 评论 0 阅读

阅读全文

Scala深入浅出进阶经典第67讲：Scala并发编程匿名Actor、消息传递、偏函数实战解析及其在Spark源码中的应用解析_actor 偏函数-CSDN博客

文章浏览阅读606次。Scala深入浅出进阶经典第67讲：Scala并发编程匿名Actor、消息传递、偏函数实战解析及其在Spark源码中的应用解析_actor 偏函数...

2024-01-23 18:27 评论 0 阅读

阅读全文

SparkOnYarn专题四--cluster模式和client模式资源分配的详解_spark任务cluster模式本地的java进程占用和什么有关-CSDN博客

2024-01-24 07:40 评论 0 阅读

阅读全文

涤生大数据_系统学python基础原理与应用,Hive/MR原理剖析/优化实战,Scala/Spark应用剖析与开发优化-CSDN博客

涤生大数据擅长系统学python基础原理与应用,Hive/MR原理剖析/优化实战,Scala/Spark应用剖析与开发优化,等方面的知识,涤生大数据关注hive,cloudera,支持向量机,scala,数据仓库,神经网络,推荐算法,sql,算法,java,数据分析,机器学习,spark,霍夫......

2023-10-10 03:04 评论 0 阅读

阅读全文

hadoop-2.6.0.tar.gz + spark-1.6.1-bin-hadoop2.6.tgz的集群搭建（单节点）（CentOS系统）-CSDN博客

文章浏览阅读323次。前言　　本人呕心沥血所写，经过好一段时间反复锤炼和整理修改。感谢所参考的博友们！同时，欢迎前来查阅赏脸的博友们收藏和转载，附上本人的链接。http://www.cnblogs.com/zlslch/p/5847528.html 关于几......

2024-01-24 06:19 评论 0 阅读

阅读全文

Spark RDD的持久化（缓存、检查点、广播变量和累加器）_想一想rdd持久化起到的作用是什么?-CSDN博客

文章浏览阅读224次。RDD持久化1：缓存RDD缓存机制缓存数据至内存/磁盘，可大幅度提升Spark应用性能。cache=persist(MEMORY)persist缓存策略：StorageLevelMEMORY_ONLY（默认）MEMORY_AND_DISKDISK_ONLY…缓存应用场景从文件加载数据后，因为重新获......

2024-01-23 12:49 评论 0 阅读

阅读全文

spark学习4之集群上直接用scalac编译.scala出现的MissingRequirementError问题（已解决）_scala.reflect.internal.missingrequirementerror: ob-CSDN博客

文章浏览阅读2.9k次。报错代码：hadoop@Master:~/cloud/test/sh_spark_xubo/SparkPi$ scalac org/apache/spark/examples/SparkPi.scala error: scala.tools.nsc.MissingRequirementError: object scala.reflect.Manifest not found. at_scala.reflect.internal.missingrequirementerror: object scala.runtime......

2024-01-22 22:01 评论 0 阅读

阅读全文

spark常用的linux命令,GitHub - Sparkinzy/linux-command: Linux命令大全搜索工具，内容包含Linux命令手册、详解、学习、搜集。...-CSDN博客

Linux Command 516 个 Linux 命令大全，内容包含 Linux 命令手册、详解、学习，值得收藏的 Linux 命令速查手册。请原谅我写了个爬虫，爬了他们家的数据linuxde.net，同时进行了编辑，增加了一些数据。对他们的辛勤劳动表示敬意，个人......

2023-10-10 02:19 评论 0 阅读

阅读全文

SparkStreaming实现wordcount案例_下图为项目的流程图,通过nc.命令,向9999端口持续发送消息,并使用spark streaming-CSDN博客

文章浏览阅读381次。项目需求：需求：使用netcat工具向9999端口不断的发送数据，通过SparkStreaming读取端口数据并统计不同单词出现的次数。代码实现：def main(args: Array[String]): Unit = { //创建配置对象文件 val conf: SparkConf = new Spa......

2024-01-23 07:23 评论 0 阅读

阅读全文

spark client mode和cluster mode的区别_cluster deploy mode is currently not supported for-CSDN博客

文章浏览阅读1.6k次。今天在看SparkSubmit的源码的过程中，发现了，sparksubmit内部对sparkthriftserver的运行模式做了限制，不能通过cluster的模式进行运行，可以看下面的代码段(clusterManager, deployMode) match { case (STANDALONE, CLUSTER) if args......

2024-01-24 05:11 评论 0 阅读

阅读全文