网站介绍:文章浏览阅读127次。SparkStreaming简介SparkStreaming,和SparkSQL⼀样,也是Spark⽣态栈中⾮常重要的⼀个模块,主要是⽤来进⾏流式计算的框架。流式计算框架,从计算的延迟上⾯,⼜可以分为纯实时流式计算和准实时流式计算,SparkStreaming是属于的准实时计算框架。所谓纯实时的计算,指的是来⼀条记录(event事件),启动⼀次计算的作业;离线计算,指的是每次计算⼀个⾮常⼤的⼀批(⽐如⼏百G,好⼏个T)数据;准实时呢,介于纯实时和离线计算之间的⼀..._spark stream是spark core的api的拓展
- 链接地址:https://blog.csdn.net/CyAurora/article/details/119979772
- 链接标题:Spark Streaming_spark stream是spark core的api的拓展-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:9664
- 网站标签:spark stream是spark core的api的拓展