spark高频面试题_spark面试题-CSDN博客

网站介绍:文章浏览阅读1.3k次。一、Spark 的运行流程?二、Spark 有哪些组件?三. Spark 中的 RDD 机制理解吗?四、RDD的操作分类五、如何区分 RDD 的宽窄依赖?为什么要设计宽窄依赖?六、RDD 持久化原理?七、Checkpoint 检查点机制?八、Checkpoint 和持久化机制的区别?九、RDD中reduceBykey与groupByKey哪个性能好,为什么十. Spark SQL 是如何将数据写到 Hive 表的?十一、Spark RDD转换成DataFrame的两种方式_spark面试题