Hadoop、Hive、HDFS、Hbase、KUDU、Spark之间关系_hive和hdfs的关系-CSDN博客

网站介绍:文章浏览阅读3.1k次,点赞6次,收藏38次。Hadoop是一个分布式计算的开源框架,包含三大核心组件:HDFS(Hadoop Distributed System分布式文件系统)、HIVE(数据仓库工具)、HBASEHDFSHDFS是Hadoop生态圈最基础的存储引擎,请注意HDFS的设计主要为大文件存储,为高吞吐量的读取和写入服务,HDFS不适合存储小文件,也不支持大量的随机读写。Hive专门处理存储在HDFS数据仓库工具,通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被_hive和hdfs的关系