网站介绍:文章浏览阅读9.6k次,点赞13次,收藏54次。数据倾斜原因和处理?1原因1)、key分布不均匀2)、业务数据本身的特性3)、建表时考虑不周4)、某些SQL语句本身就有数据倾斜操作情形group bygroup by 维度过小,某值的数量过多Count Distinct某特殊值过多Join大表join小表,其中小表key集中,分发到某一个或几个reduce上的数据远高于平均值2数据倾斜的解决方案2.1参数调节:set hive.map.aggr=true 设置在Map端进行聚合set hive_数据倾斜产生的原因及处理
- 链接地址:https://blog.csdn.net/mqd_chan/article/details/114271037
- 链接标题:数据倾斜原因及处理_数据倾斜产生的原因及处理-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:2733
- 网站标签:数据倾斜产生的原因及处理