hive优化-CSDN博客dashujutongmenghui.blog.csdn.net

网站介绍：文章浏览阅读2.2k次。1、使用分区表和分桶表2、使用count(1)，不使用count(*)3、指定明确字段，不使用select * from emp4、使用特殊的存储格式列式存储： orc parquet5、小表 join 大表，避免笛卡尔积6、开启map端聚合，默认是打开的7、避免 count (distinct 字段)8、适当调整maptask和reducetask个数9、测试数据时，使用本地模式set mapreduce.framework.name=yarn(默认)set mapr

链接地址：https://dashujutongmenghui.blog.csdn.net/article/details/121196219
链接标题：hive优化-CSDN博客
所属网站：dashujutongmenghui.blog.csdn.net
被收藏次数：7061
网站标签：hive优化

分享到各大网站