azkaban统计每日活跃用户_azkaban统计有效数据条数及用户数量最多的前二十个城市.-CSDN博客

网站介绍:文章浏览阅读235次。环境现有用户点击行为数据文件,每天产生会上传到hdfs目录,按天区分目录,现在我们需要每天凌晨两点定时导入Hive表指定分区中,并统计出今日活跃用户数插入指标表中。clickloguserId click_time index uid1 2020-06-21 12:10:10 a.html uid2 2020-06-21 12:15:10 b.html uid1 2020-06-21 13:10:10 c.html uid1 2020-06-21 15:10:10 d.html uid_azkaban统计有效数据条数及用户数量最多的前二十个城市.