网站介绍:文章浏览阅读409次。TEXTFILE默认格式,行存储,导入数据时直接把数据文件拷贝到hdfs的hive表目录(hive location),数据文件可先经过gzip等压缩,再导hive表(系统自动检查,执行查询时自动解压),但使用这种方式,hive不会对数据进行切分,从而无法对数据进行并行操作.优点:数据加载快(load数据快)缺点:数据读取时磁盘开销大,即查询效率低SEQUENCEFILE_orc分桶表
- 链接地址:https://blog.csdn.net/cm_chenmin/article/details/52801341
- 链接标题:hive存储格式_orc分桶表-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:6026
- 网站标签:orc分桶表