网友收藏 文章浏览阅读205次。这是大数据测试测试第四章,可参考大数据测试系列说明学习本教程,请先看完第三章 大数据之Hadoop搭建本次教程主要来自基于Hadoop的数据仓库Hive 学习指南,本次的内容全部经过了自己的实践,与参考文档......
2024-01-12 19:38 阅读
阅读全文 网友收藏 文章浏览阅读3.8k次。介绍一下主要的功能函数.参考:https://www.jianshu.com/p/3bcc06b1294bregexp_extract相当于python当中的re.search:遍历匹配,仅可以获取到字符串当中第一个满足匹配条件的字符串然后返回,如果没有匹配到字符串,则返......
2024-01-21 13:19 阅读
阅读全文 网友收藏 文章浏览阅读490次。方案一实现如下:-- 连续登录统计create table login( user_id string, login_time string) row format delimited fields terminated by ',';load data .._使用......
2024-01-23 12:04 阅读
阅读全文 网友收藏 文章浏览阅读306次。⼯作流调度系统Azkaban第 1 节 概述1.1 ⼯作流调度系统⼀个完整的数据分析系统通常都是由⼤量任务单元组成:shell脚本程序 java程序 mapreduce程序 hive脚本等各任务单元之间存在时间先后及前后依赖关系,为了很......
2023-11-11 18:11 阅读
阅读全文 网友收藏 文章浏览阅读298次,点赞2次,收藏2次。1. 什么是数据倾斜2. 数据倾斜是如何造成的?3. 发生数据倾斜以后的现象4. 定位数据倾斜出现的原因与出现问题的位置5. 解决方案总体原理说明6. 具体解决方案 6.1 聚合源数据以及过滤导......
2024-01-23 15:28 阅读
阅读全文 网友收藏 文章浏览阅读1.2k次。文章目录一、组件版本二、问题描述三、问题分析四、解决办法一、组件版本组件版本Hadoop3.0.0+cdh6.1.1Hive2.1.1+cdh6.1.1spark2.4.0+cdh6.1.1二、问题描述在 Spark 向 Hive分区表 写入数据时,抛出异常如下:org.apache.spark......
2024-01-23 07:37 阅读
阅读全文 网友收藏 文章浏览阅读421次。第十题存在如下表:table student(s_id string, s_name string, s_birth string, s_sex string) table course(c_id string, c_name string, t_id string) table teacher(t_id string, t_name string) table score(s_id string, c_id string, s_score int)示例数据:student:01 ......
2024-01-23 12:00 阅读
阅读全文 网友收藏 文章浏览阅读1k次。beeline> !connect jdbc:hive2://localhost:10000/testConnecting to jdbc:hive2://localhost:10000/testEnter username for jdbc:hive2://localhost:10000/test: Enter password for jdbc:hive2://localhost:..._root is not allowed to impersonate evtd...
2024-01-24 09:50 阅读
阅读全文 网友收藏 文章浏览阅读2.3k次,点赞14次,收藏12次。当想使用本地开发环境运行flink读写线上hive数据来运行时报错。我使用maven管理的开发环境依赖。由于代码发布到测试环境集群上跑时并没有报错,而测试环境对应的依赖都是使用放在......
2024-01-23 11:54 阅读
阅读全文 网友收藏 文章浏览阅读178次。一、需要配置的项目1.拷贝hive的配置文件hive-site.xml到spark的conf目录 记得检查hive-site.xml中metastore的url的 配置<property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://bigdata-pro01.kfk.com/metastor......
2024-01-24 04:58 阅读
阅读全文