Hadoop优化-CSDN博客网友收藏

Hadoop优化-CSDN博客

文章浏览阅读123次。Hadoop优化map端数据倾斜,输入文件有不可分割的压缩包reduce端数据倾斜:分区后某个区的数据过多输入在执行MR之前。提前将小文件合并,压缩成可切片的格式使用CombineTextInputFormatmap阶段减少溢写次数:通过......
阅读全文