Spark学习之路——9.Spark ML_sparkml-CSDN博客

网站介绍:文章浏览阅读7.1k次,点赞3次,收藏28次。一、简介基于RDD的API spark.mllib已进入维护模式。Spark ML是Spark MLlib的一种新的API,它有下面的优点:1.面向DataFrame,基于RDD进一步封装,拥有功能更多的API2.具有Pipeline功能,可以实现复杂的机器学习模型3.性能得到提升二、ML Pipeline一个pipeline 在结构上会包含一个或多个Stage,每一个..._sparkml