文章浏览阅读228次。为了减少冲突,一般来说版本都用统一的比较好,所以选择CDH的部署。前面的hadoop是选择hadoop-2.6.0-cdh5.7.0 ,所以hive安装的版本跟hadooop的尾巴对准了。1、打开http://archive-primary.cloudera.com/cdh5/cdh/5/2、ctrl+F 搜 hiv......
2024-01-23 20:40 阅读 阅读全文文章浏览阅读1.3k次。大数据学习04 Scala的学习在Spark学习之前,先进行对Scala的学习提示:已经有Scala基础的同学可以先跳过这部分文章目录大数据学习04 Scala的学习Scala是什么一、Scala入门1.为什么学习Scala2.Scala的发展历史二、Scal......
2024-01-23 02:52 阅读 阅读全文文章浏览阅读105次。1、RDD 全称 弹性分布式数据集 Resilient Distributed Dataset它就是一个 class。abstractclassRDD[T:ClassTag](@transientprivatevar_sc:SparkContext,@transientprivatevardeps:Seq[Dependency[_]])......
2024-01-22 22:00 阅读 阅读全文文章浏览阅读490次。大数据技术之_23_Python核心基础学习_02_ 流程控制语句 + 序列(10.5小时)...
2024-01-23 16:52 阅读 阅读全文Scala 是一种有趣的语言。它一方面吸收继承了多种语言中的优秀特性,一方面又没有抛弃Java这个强大的平台,它运行在Java虚拟机 (Java Virtual Machine)之上,轻松实现和丰富的Java类库互联互通。它既支持面向对象的编程方式,又支......
2023-10-10 03:05 阅读 阅读全文文章浏览阅读744次。配置完伪分布式虚拟机后,可以继续配置hadoop集群。配置伪分布式hadoop可以参考:http://dblab.xmu.edu.cn/blog/2441-2/ 教程里也有配置集群,但是是用物理机配置的,我们这里还是选择用虚拟机配置。规划一台主要......
2024-01-23 23:26 阅读 阅读全文大数据入门到精通,hadoop spark hbase kafka elasticsearch实战高端课程,从零基础到精通,详解各种大数据知识...
2024-01-23 23:47 阅读 阅读全文小夕Coding擅长大数据系列,Python | 华为OD机试真题,C++小白学习教程,等方面的知识,小夕Coding关注hive,storm,spark,hadoop,etl领域....
2023-10-10 03:02 阅读 阅读全文文章浏览阅读216次。一、scala语言Scala是一门多范式的编程语言,一种类似java的编程语言,设计初衷是实现可伸缩的语言、并集成面向对象编程和函数式编程的各种特性,这种语言与java类似,有很多java的影子存在,而且还有一......
2024-01-22 16:58 阅读 阅读全文MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。.........
2023-10-11 14:47 阅读 阅读全文