网站介绍:文章浏览阅读451次。cache、persist将数据缓存到内存,第一次触发Action,才会将数据放入内存,以后在触发Action,可以复用前面内存中缓存的数据,可以提升技术效率cache和persist的使用场景:一个application多次触发Action,为了复用前面RDD的数据,避免反复读取HDFS(数据源)中的数据和重复计算,persist可以将数据缓存到内存或磁盘【executor所在的内存或磁盘】,第一次触发action才放入到内存或磁盘,以后会缓存的RDD进行操作可以复用缓存的数据。一个RDD多次触发A_spark cache算子
- 链接地址:https://blog.csdn.net/WuBoooo/article/details/108803170
- 链接标题:大数据之spark_spark中的特殊算子cache、persist、checkpoint_spark cache算子-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:1442
- 网站标签:spark cache算子