Hive之MapReduce性能优化_mapreduce.input.fileinputformat.split.minsize.per.-CSDN博客

网站介绍:文章浏览阅读3.2k次,点赞2次,收藏17次。Hive优化一、Hive任务创建文件数优化1.1 Map端文件合并减少Map任务数量一般来说,HDFS的默认文件块大小是128M,如果在Hive执行任务时,发现Map端的任务过多,且执行时间多数不超过一分钟,建议通过参数,划分(split)文件的大小,合并小文件。如:set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;set mapreduce.input.fileinputformat.split.m_mapreduce.input.fileinputformat.split.minsize.per.node