kafka+Spark+Hive+Hdfs模拟实时数据接入并汇总输出_kafka探活接入数据-CSDN博客

网站介绍:文章浏览阅读3.5k次。​ 目的:模拟数据不断写入,同时不断处理01.启动相关的服务​ Hdfs文件系统​ Zookeeper服务​ Kafka(主题,生产,消费)​ Hive数仓(元数据库mysql)​ Spark能够直接sql操作Hive,不然使用jdbc方式(base) [root@192 ~]# jps3200 SecondaryNameNode2835 NameNode5011 ConsoleProducer85045 Jps2998 DataNode4390 QuorumPeerMain45_kafka探活接入数据