spark学习-Spark性能调优手段_使spark更快的主要机制-CSDN博客

网站介绍:文章浏览阅读849次。Spark性能调优手段:判断内存消耗:设置RDD并行度,将RDD cache到内存,通过BlockManagerMasterActor添加RDD到memory中的日志查看每个partition占了多少内存,最后乘以partition数量,即是RDD内存占用量。1.Shuffle调优(核心)a.consolidation机制,使shuffleMapTask端写磁盘的文件数量减少,resultTask..._使spark更快的主要机制