网友收藏 文章浏览阅读1w次。win10安装部署网络测试工具 NetCat:步骤:提示:这里可以添加要学的内容例如:1、 官方下载2、 复制nc64.exe相关文件3、 执行nc64命令监听端口4、 执行nc64命令,向指定端口发送数据官方下载:下载地址:https:/......
2023-11-11 22:33 阅读
阅读全文 网友收藏 文章浏览阅读221次。一、Flink 简介Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink设计为在所有常见的集群环境中运行,以内存速度和任何规模执行计算。1、无界流和有界流任何类型的数......
2024-01-24 06:48 阅读
阅读全文 网友收藏 文章浏览阅读276次。RDD编程在Spark中,RDD被表示为对象,通过对象上的方法调用来对RDD进行转换。经过一系列的transformations定义RDD之后,就可以调用actions触发RDD的计算,action可以是向应用程序返回结果(count, collect等),或者是向......
2024-01-23 06:40 阅读
阅读全文 网友收藏 文章浏览阅读3.9k次,点赞2次,收藏10次。1. 数组(Array)数组是编程中经常用到的数据结构,一般包括定长数组和变长数组。本教程旨在快速掌握最基础和常用的知识,因此,只介绍定长数组。定长数组,就是长度不变的数组,在S......
2024-01-23 11:16 阅读
阅读全文 网友收藏 文章浏览阅读57次。 本期视频通过代码实战详解了Scala并发编程匿名Actor、消息传递、偏函数实战解析及其在Spark源码中的应用解析:(1)匿名Actor是通过Actor伴生对象的actor方法直接创建和启动的,不像Actor的子类需要调用自......
2024-01-23 18:27 阅读
阅读全文 网友收藏 文章浏览阅读1.7k次,点赞2次,收藏3次。解决Spark 读取 Elasticsearch的array类型报错的问题在我们读取Elasticsearch存储的半结构化的数据是,会遇到需要获取array类型的数据。然而会报错,错误截图如下:es.read.field.as.array.include通过es......
2024-01-24 00:55 阅读
阅读全文 网友收藏 1、环境cdh5.12.3spark2 2.3.02、需要本地地洞spark2-shell用于环境测试错误一:Error: A JNI error has occurred, please check your installation and try againException in thread "main" java.lang.NoClassDefFoundError: org/slf4j......
2023-10-10 03:33 阅读
阅读全文 网友收藏 文章浏览阅读1.3k次。学习目标:熟悉 Spark RDD 的使用方法。学习原理:RDD(Resilient Distributed Datasets)可扩展的弹性分布式数据集,RDD是spark最基本的数据抽象,RDD表示一个只读、分区且不变的数据集合,是一种分布式的内存抽象......
2024-01-23 23:08 阅读
阅读全文 网友收藏 文章浏览阅读3k次,点赞2次,收藏6次。1. 什么是朴素贝叶斯朴素贝叶斯是一种构建分类器,该分类器基于一个理论:所有朴素贝叶斯分类器都假定样本每个特征与其他特征都不相关2. 朴素贝叶斯概率模型概率模型分类器是一个......
2024-01-24 05:05 阅读
阅读全文 网友收藏 文章浏览阅读1.8k次。2、映射:就是把一个数据提出操作,不改变原有的数据,而是生成新的数据。Map(一对一映射)flatMap(一对多映射):一个容器被映射成多个,然后拍扁成一个返回3、过滤:依据条件筛选符合条件的数据Fi......
2024-01-23 10:54 阅读
阅读全文