文章浏览阅读1.1k次。为了采集、存储和分析大数据,互联网公司尝试研发大数据技术,在众多技术方案中,开源系统 Hadoop、 Spark、Elasticsearch等 成为应用最广泛的大数据技术,由于它们的用户量巨大,已经初步成为大数据技术......
2024-01-23 03:53 阅读 阅读全文文章浏览阅读3.1k次。大数据技术之Hive面试题1. Hive 基本概念1.1 什么是 Hive1.2Hive 的优缺点1.2.1 优点1.2.2 缺点1.3 Hive 架构原理1.4 Hive 和数据库比较1.4.1 查询语言1.4.2 数据更新1.4.3 执行延迟1.4.4 数据规模2. Hive 安装2.1 Hive 安装地址2.2H......
2024-01-22 17:45 阅读 阅读全文文章浏览阅读1k次,点赞2次,收藏8次。【学习笔记】大数据技术之Flink(二)_kb_list.flink...
2024-01-22 17:48 阅读 阅读全文第二章 变量2.1 变量是程序的基本组成单位2.2 Scala 变量的介绍2.2.1 概念2.2.2 Scala 变量使用的基本步骤2.3 Scala 变量的基本使用2.4 Scala 变量使用说明2.4.1 变量声明基本语法2.4.2 注意事项2.5 Scala 程序中 +号 的使用2.6 Sca...
2024-01-22 21:58 阅读 阅读全文文章浏览阅读1w次,点赞24次,收藏29次。1. Flink 的特点Flink 具有高吞吐、低延时、高性能的特点 支持基于时间语义、窗口及状态编程 同时还具备了 checkpoint 和 savepoint 的功能2. Flink 和 SparkStreaming 的对比Flink支持实时流处理,而 S......
2024-01-22 17:39 阅读 阅读全文文章浏览阅读2.4k次,点赞2次,收藏5次。大数据技术之Scala第 6 章 面向对象6.1 Scala 包6.1.1 包的命名6.1.2 包说明(包语句)6.1.3 包对象6.1.4 导包说明6.2 类和对象6.2.1 定义类6.2.2 属性6.3 封装==6.1.5 访问权限==6.2.3 方法6.2.4 创建对象6.......
2024-01-22 17:44 阅读 阅读全文文章浏览阅读191次。高并发与负载均衡一、Linux中的init.d目录1./etc/init.d 是 /etc/rc.d/init.d 的软链接(soft link)。可以通过 ll 命令查看。都是用来放服务脚本的,当Linux启动时,会寻找这些目录..._apusic.http.session.serializer...
2024-01-22 17:50 阅读 阅读全文文章浏览阅读1.1w次。要想从急剧增长的数据资源中挖掘分析出有价值的信息,需要先进的分析技术作支撑。从宏观上看,大数据分析技术发展所面临的问题均包含三个主要特征:(1)数据量庞大并以惊人的速度增长;(2)数据......
2024-01-22 20:03 阅读 阅读全文文章浏览阅读1.2k次。很多人在学习大数据的时候比较迷茫,不知从何学起,也不能够比较系统、全面的了解大数据框架。为此,过往记忆花了一个周末的时间把 Awesome Big Data (https..._gainoodt.dataserver...
2024-01-22 17:41 阅读 阅读全文文章浏览阅读542次。一、大数据运维之Linux基础打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,openstack等。因为企业中的项目基本上都是使用Linux环境下搭建或部署的。1)Linux系统概述2)系统安装及相关配置 3......
2024-01-22 16:43 阅读 阅读全文