文章浏览阅读1k次,点赞2次,收藏3次。本子目录主要是针对,在大数据环境下进行机器学习的相关内容介绍子目录,总体内容和目录还是以 《大数据处理实践探索》 为准, 本子目录的内容主要以spark 尤其是pyspark 进行机器学习......
2024-01-23 03:52 阅读 阅读全文文章浏览阅读958次,点赞7次,收藏4次。目录数组重点掌握定长数组变长数组遍历数组数组常用算法数组重点掌握scala中数组的概念是和Java类似,可以用数组来存放一组数据。scala中,有两种数组,一种是定长数组,另一种是变......
2024-01-23 22:19 阅读 阅读全文1)一个完整的数据分析系统通常都是由大量任务单元组成: shell 脚本程序,java 程序,mapreduce 程序、hive 脚本等。 2)各任务单元之间存在时间先后及前后依赖关系。 3)为了很好地组织起这样的复杂执行计划,需要一个工作流......
2023-11-14 05:35 阅读 阅读全文1)一个完整的数据分析系统通常都是由大量任务单元组成: shell 脚本程序,java 程序,mapreduce 程序、hive 脚本等。 2)各任务单元之间存在时间先后及前后依赖关系。 3)为了很好地组织起这样的复杂执行计划,需要一个工作流......
2023-11-21 08:30 阅读 阅读全文文章浏览阅读410次。第一章 数据库的概述1.1 什么是数据库1.2 数据库分类第二章 MongoDB 的简介、下载、安装、启动、配置和关闭2.1 MongoDB 简介2.2 下载 MongoDB2.3 安装 MongoDB2.4 启动 MongoDB2.5 配置 MongoDB 的 windows 服务2.6 关闭 MongoDB第......
2024-01-22 22:00 阅读 阅读全文文章浏览阅读365次。大数据技术之_20_Elasticsearch学习_01_概述 + 快速入门 + Java API 操作 + 创建、删除索引 + 新建、搜索、更新删除文档 + 条件查询 + 映射操作_elasticsearch api baseesmapper.insert...
2024-01-23 16:54 阅读 阅读全文文章浏览阅读189次。简单了解Scala概述spark作为新一代的内存级大数据计算框架,是大数据的重要内容。而spark就是由scala进行编写的,为了更好的学习spark,scala语言编程是不可或缺的一项技能。Scala可以与Java互操作。它用scalac这......
2024-01-23 01:05 阅读 阅读全文文章浏览阅读88次。深圳大数据学习:Scala系列之样例类_Option_偏函数Option类型在Scala中Option类型样例类用来表示可能存在或也可能不存在的值(Option的子类有Some和None)。Some包装了某个值,None表示没有值。object OptionDemo {def main(args: ......
2024-01-22 16:28 阅读 阅读全文文章浏览阅读128次。第四章 解析 Redis 配置文件 redis.conf4.1 Units 单位4.2 INCLUDES 包含4.3 GENERAL 通用4.4 SNAPSHOTTING 快照4.5 SECURITY 安全4.6 LIMITS 限制4.7 APPEND ONLY MODE 追加4.8 常见配置 redis.conf 介绍第五章 Redis 的持久化第六章 Redis 的事务......
2024-01-22 22:00 阅读 阅读全文文章浏览阅读909次。大数据技术之_19_Spark学习_06_Spark 源码解析 + Spark 通信架构、脚本解析、standalone 模式启动、提交流程 + Spark Shuffle 过程 + Spark 内存管理与分配 + Spark 部署模式_spark sql jra...
2024-01-23 16:54 阅读 阅读全文