Spark Streaming_spark stream是spark core的api的拓展-CSDN博客

网站介绍:文章浏览阅读127次。SparkStreaming简介SparkStreaming,和SparkSQL⼀样,也是Spark⽣态栈中⾮常重要的⼀个模块,主要是⽤来进⾏流式计算的框架。流式计算框架,从计算的延迟上⾯,⼜可以分为纯实时流式计算和准实时流式计算,SparkStreaming是属于的准实时计算框架。所谓纯实时的计算,指的是来⼀条记录(event事件),启动⼀次计算的作业;离线计算,指的是每次计算⼀个⾮常⼤的⼀批(⽐如⼏百G,好⼏个T)数据;准实时呢,介于纯实时和离线计算之间的⼀..._spark stream是spark core的api的拓展