hive存储格式_orc分桶表-CSDN博客

网站介绍:文章浏览阅读409次。TEXTFILE默认格式,行存储,导入数据时直接把数据文件拷贝到hdfs的hive表目录(hive location),数据文件可先经过gzip等压缩,再导hive表(系统自动检查,执行查询时自动解压),但使用这种方式,hive不会对数据进行切分,从而无法对数据进行并行操作.优点:数据加载快(load数据快)缺点:数据读取时磁盘开销大,即查询效率低SEQUENCEFILE_orc分桶表