流式大数据处理的三种框架:Storm,Spark和Flink_storm/spark-CSDN博客

网站介绍:文章浏览阅读3.9w次,点赞8次,收藏84次。storm、spark streaming、flink都是开源的分布式系统,具有低延迟、可扩展和容错性诸多优点,允许你在运行数据流代码时,将任务分配到一系列具有容错能力的计算机上并行运行,都提供了简单的API来简化底层实现的复杂程度。Apache Storm在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(_storm/spark