【精选】3.4.3 Azkaban 工作流调度系统, 概述, 安装部署, 使用(shell调度, job依赖, HDFS调度, MR调度, HIVE脚本调度)_CH_ENN的博客-CSDN博客网友收藏

【精选】3.4.3 Azkaban 工作流调度系统, 概述, 安装部署, 使用(shell调度, job依赖, HDFS调度, MR调度, HIVE脚本调度)_CH_ENN的博客-CSDN博客

文章浏览阅读306次。⼯作流调度系统Azkaban第 1 节 概述1.1 ⼯作流调度系统⼀个完整的数据分析系统通常都是由⼤量任务单元组成:shell脚本程序 java程序 mapreduce程序 hive脚本等各任务单元之间存在时间先后及前后依赖关系,为了很......
阅读全文
Spark调优之 -- 对于 Spark 中的数据倾斜问题(已更新)_hive按key来分组,将key对应的所有的values拼接到一个字符串里-CSDN博客网友收藏

Spark调优之 -- 对于 Spark 中的数据倾斜问题(已更新)_hive按key来分组,将key对应的所有的values拼接到一个字符串里-CSDN博客

文章浏览阅读298次,点赞2次,收藏2次。1. 什么是数据倾斜2. 数据倾斜是如何造成的?3. 发生数据倾斜以后的现象4. 定位数据倾斜出现的原因与出现问题的位置5. 解决方案总体原理说明6. 具体解决方案 6.1 聚合源数据以及过滤导......
阅读全文
经典的SparkSQL/Hive-SQL/MySQL面试-练习题(二)_spark sql查询所有学生的学生学号,学生姓名,选课总数和所有课程的总成绩-CSDN博客网友收藏

经典的SparkSQL/Hive-SQL/MySQL面试-练习题(二)_spark sql查询所有学生的学生学号,学生姓名,选课总数和所有课程的总成绩-CSDN博客

文章浏览阅读421次。第十题存在如下表:table student(s_id string, s_name string, s_birth string, s_sex string) table course(c_id string, c_name string, t_id string) table teacher(t_id string, t_name string) table score(s_id string, c_id string, s_score int)示例数据:student:01 ......
阅读全文
flink报错踩坑:org.apache.flink.table.catalog.hive.client.HiveShimV100.registerTemporaryFunction_org.apache.flink.table.catalog.schemaresolver-CSDN博客网友收藏

flink报错踩坑:org.apache.flink.table.catalog.hive.client.HiveShimV100.registerTemporaryFunction_org.apache.flink.table.catalog.schemaresolver-CSDN博客

文章浏览阅读2.3k次,点赞14次,收藏12次。当想使用本地开发环境运行flink读写线上hive数据来运行时报错。我使用maven管理的开发环境依赖。由于代码发布到测试环境集群上跑时并没有报错,而测试环境对应的依赖都是使用放在......
阅读全文