Hadoop入门_hadoop下标-CSDN博客

网站介绍:文章浏览阅读307次。Hadoop入门分布式文件系统架构文件切分思想文件存放在一个磁盘上效率肯定是低的读取效率低如果文件特别大会超出单机的存储范围字节数组文件在磁盘真实存储文件的抽象概念数组可以进行拆分和组装,源文件不会受到影响切分数据对字节数组进行切分拼接数据按照数组的偏移量将数据连接到一起,将字节数组链接到一起偏移量当前数据在数组中的相对位置,你可以理解为 下标数组都有对应的索引(下标),可以快速的定位数据数据存储的原理不管文件的的大小,所有的文_hadoop下标