HIve 中 collect_list和collect_set 函数的使用总结_小蚂蚁爱吃肉的博客-CSDN博客

网站介绍:Hive中collect相关的函数有collect_list和collect_set。它们都是将分组中的某列转为一个数组返回,collect_list函数不去重而collect_set函数会去重。例如:有如下一个数据表进行行转列很明显我们能看看到,张三做了两次B类项目1、使用 collect_list函数select user , collect_list( project ) from tb group by user ;得到的结果将是张三的两次B类项目,不会进行去重2_collect_list