文章浏览阅读1.2k次。大数据(Big Data),是一个描述大量高速,复杂和可变数据的术语,需要先进的技术来实现信息的捕获,存储,分发,管理和分析。大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理......
2024-01-22 22:47 阅读 阅读全文文章浏览阅读356次。大数据概况及Hadoop环境构建Apache Hadoop 分布式文件系统MapReduce 编程模型基础和实战Hive-数据仓库基础Hive-数据仓库进阶Hive-数据仓库实战Nosql综述和ApacheHBase基础Apache Hbase 进阶及性能优化Apache Sqoop介绍及数据迁......
2024-01-22 22:49 阅读 阅读全文文章浏览阅读261次。Sqoop是一个用于在Hadoop和关系数据库,或商业服务器之间的数据传输的工具从RDB导入数据到HDFS)导出数据从HDFS到RDBSqoop使用MapReduce导入和导出数据,提供并行操作和容错Sqoop 增量导入追加所有匹配的记录(可能 ......
2024-01-22 22:48 阅读 阅读全文大数据是未来的趋势,在数字化转型时代,把握大数据是关键的! 小林玩大数据 华为云开发者联盟...
2024-01-22 20:09 阅读 阅读全文零, 消息队列的两种模式和应用场景, 以及Kafka 消息队列的特点,五, Flume常见组件类型的用法总结,四, 通过Ganglia实现监控Flume数据流,ssh,hadoop,大数据...
2024-01-22 22:38 阅读 阅读全文文章浏览阅读2.2k次。四、DWS 层开发_结合大数据主流开发技术,探讨如何搭建数据仓库...
2024-01-22 16:32 阅读 阅读全文文章浏览阅读3.9w次,点赞208次,收藏343次。Scala是一门多范式的编程语言,一种类似Java的编程语言 ,设计初衷是实现可伸缩的语言 、并集成面向对象编程和函数式编程的各种特性。目前最主流的大数据开发框架Spark的实现就......
2024-01-22 16:56 阅读 阅读全文文章浏览阅读275次。大数据的发展已经进入发展的快车道,当前医疗行业、能源行业、通信行业、零售业、金融行业、体育行业等各行业都可以从其数据的采集、传输、存储、分析等各个环节产生巨大的经济价值,对大数据人才......
2024-01-22 17:41 阅读 阅读全文文章浏览阅读189次。在《Spark大数据开发之旅之一:准备工作》中,我们简单介绍了Spark大数据分析涉及到的软件,这一节中,我们介绍一下这些软件的安装。一、安装JDK8我之前的一篇文章中,介绍了如何使用apt方式安装JDK8,这......
2024-01-22 16:43 阅读 阅读全文