网友收藏 一、Flume 面试题1.你是如何实现Flume数据传输的监控的使用第三方框架Ganglia实时监控Flume2.Flume的Source,Sink,Channel的作用?你们Source是什么类型Source组件是专门用来收集数据的,可以处理各种类型、各种格式的日志数据,包括avro......
2023-10-09 22:58 阅读
阅读全文 网友收藏 企业真实面试题(重点)1 你是如何实现Flume数据传输的监控的使用第三方框架Ganglia实时监控Flume。2 Flume的Source,Sink,Channel的作用?你们Source是什么类型?1)作用(1)Source组件是专门用来收集数据的,可以处理各种类型、各种......
2023-10-11 21:18 阅读
阅读全文 网友收藏 一般情况下面试大数据岗位的时候都会问到flume,我们之前也对flume进行过总结,不过时间太快了,转眼到了2020年。下面根据本人最新的flume相关面试并总结最准确的答案如下:本文目录一、Flume的Source,Sink,Channel的作用?你们S......
2023-10-11 21:18 阅读
阅读全文 网友收藏 ???? 作者 :“大数据小禅”???? 专栏简介 :本专栏主要分享收集的大数据相关的面试题,涉及到Hadoop,Spark,Flink,Zookeeper,Flume,Kafka,Hive,Hbase等大数据相关技术。大数据面试专栏地址。???? 个人主页 :大数据小禅???? 粉丝福......
2023-10-11 21:18 阅读
阅读全文 网友收藏 flume 面试题集锦1. flume事务上述是官网简介,可以看出事务体现在source到channel和channel到sink2个阶段对于数据的事物控制,其实可以分为3种,at least once,至少一次at most once最多一次exactly once刚好一次顾名思义,刚好一次是最好的,不多也......
2023-10-11 21:18 阅读
阅读全文 网友收藏 flume1.什么是flumeflume是一个分布式的基于流式架构的海量日志采集 聚合 传输的系统有高可用性和高可靠性2.flume由什么组成的?*Agent*:一个jvm进程 以event(事件)为基本单元对数据进行传输由source 、channel 、sink组成source:收集......
2023-10-11 21:01 阅读
阅读全文 网友收藏 Flume面试题1 flume怎么保证数据不丢失?其一:lume使用两个独立的事务分别负责从source到channel以及从channel到sink的事件传递,source向channel写数据时会先将数据写入临时缓冲区putlist,然后检查channel是否可以写入,如果写入成功会......
2023-10-11 21:18 阅读
阅读全文 网友收藏 文章浏览阅读360次。一、Hive 基本面试1、什么是 metastore2、metastore 安装方式有什么区别3、什么是 Managed Table 跟 External Table?4、什么时候使用 Managed Table 跟 External Table?5、hive 有哪些复合数据类型?6、hive 分区有什么好处?7、hiv......
2024-01-22 21:59 阅读
阅读全文 网友收藏 文章浏览阅读3.0k次,点赞30次,收藏173次。大数据技术之_32_大数据面试题_01一、Hive 基本面试1、什么是 metastore2、metastore 安装方式有什么区别3、什么是 Managed Table 跟 External Table?4、什么时候使用 Managed Table 跟 External Table?5、hi......
2024-01-23 16:51 阅读
阅读全文 网友收藏 Flume的Source,Sink,Channel的作用?你们Source是什么类型?1、作用(1)Source组件是专门用来收集数据的,可以处理各种类型、各种格式的日志数据,包括avro、thrift、exec、jms、spooling directory、netcat、sequence generator、syslog、http、legacy......
2023-10-11 21:18 阅读
阅读全文