从HBase底层原理解析HBASE列族不能设计太多的原因?,Hive面试常问与工作实用 —— Hive Join优化,Hive建表时开启事务机制导致insert失败,大数据...
2024-01-23 11:58 阅读 阅读全文海量数据的存储问题很早就已经出现了,一些行业或者部门因为历史的积累,数据量也达到了一定的级别。很早以前,当一台电脑无法存储这么庞大的数据时,采用的解决方案是使用NFS(网络文件系统)将数据分开存储。但是这种......
2023-10-11 14:26 阅读 阅读全文文章浏览阅读1.1k次,点赞4次,收藏9次。在开始具体操作之前,需要首先选择一个合适的操作系统。尽管Hadoop本身可以运行在Linux、Windows以及其他一些类UNIX系统上,但是Hadoop官方真正支持的作业平台只有Linux。这里选择Linux作为......
2024-01-24 07:22 阅读 阅读全文文章浏览阅读1.1k次,点赞4次,收藏9次。在开始具体操作之前,需要首先选择一个合适的操作系统。尽管Hadoop本身可以运行在Linux、Windows以及其他一些类UNIX系统上,但是Hadoop官方真正支持的作业平台只有Linux。这里选择Linux作为......
2024-01-24 07:22 阅读 阅读全文文章浏览阅读2.1k次,点赞5次,收藏3次。Hadoop是开源的、可运行在大规模计算机集群上的分布式计算平台,它可以完成海量数据的存储与处理分析,被公认为行业大数据标准开源软件,在行业内得到了广泛的应用。文章目录一、......
2024-01-24 07:22 阅读 阅读全文Hadoop大数据平台架构与实践|HDFS,本文来自于简书,本文主要介绍为什么需要分布式文件系统以及HDFS对文件的存储读取和如何使用HDFS,希望对您的学习有所帮助。HDFS作为Hadoop的核心部分,是Hadoop中MapReduce框架的存储层。当文件的......
2023-10-11 14:25 阅读 阅读全文资源浏览查阅45次。内容简介本书从浅显易懂的“大数据和机器学习”原理介绍和说明入手,讲述大数据和机器学习的基本概念,如Hadoop+Spark大数据巨量分析与机器学习整合开发实战更多下载资源、学习资料请访问CSDN文库频道....
2024-01-23 23:26 阅读 阅读全文文章浏览阅读744次。配置完伪分布式虚拟机后,可以继续配置hadoop集群。配置伪分布式hadoop可以参考:http://dblab.xmu.edu.cn/blog/2441-2/ 教程里也有配置集群,但是是用物理机配置的,我们这里还是选择用虚拟机配置。规划一台主要......
2024-01-23 23:26 阅读 阅读全文dinghua_xuexi擅长大数据,数据结构与算法,Hadoop,等方面的知识,dinghua_xuexi关注hive,spark,hadoop,etl领域....
2023-10-11 14:53 阅读 阅读全文大数据技术与应用实战擅长flink,hadoop,java,等方面的知识,大数据技术与应用实战关注hadoop领域....
2023-10-11 14:35 阅读 阅读全文