spark(61) -- SparkMllib -- 基于SparkMllib的数据清洗项目实践_spark 数据清洗-CSDN博客

网站介绍:文章浏览阅读557次。1. 获取数据2. 用户数据的EDA分析实践3. 业务数据的EDA分析实践4. 评分数据的EDA分析实践5. 数据的处理及转换分析实践6. 数值型和类别型数据的处理方案及实践7. 派生特征数据的处理方法及实践8. 文本特征处理方法及实践9. 正则化特征处理方法及实践10. TF-IDF和Word2Vec提取特征实践11. 总结_spark 数据清洗