《大数据处理实践探索》 ---- 使用spark MLlib进行机器学习(4.算子封装)_spark 算子封装-CSDN博客

网站介绍:文章浏览阅读364次。文章大纲扩展spark 原始的算法算法对应参考文献扩展spark 原始的算法比如,我们使用 列选择等一些内容时候,使用select 或者 randomsplit 想把他们加入到 pipeline 中取,因为这些方法不是transform ,那么我们可以对其进行扩展,如:class FillNullSmartFap(override val uid: String) extends Transformer with DefaultParamsWritable {算法对应参考文_spark 算子封装