数据预处理(1)——数据清洗_第1关:数据预处理-数据清洗-CSDN博客

网站介绍:文章浏览阅读3.5k次,点赞3次,收藏11次。一、介绍 数据清洗主要内容是删除原始数据集中的无关数据、重复数据,平滑噪声数据,刷选掉与挖掘主题无关的数据,处理缺失值、异常值等。二、缺失值处理 缺失值处理的方法分为三类:删除记录、数据插补和不处理。常见的数据插补方法如下图:其中,需要介绍的两个插值法为:拉格朗日插值法和牛顿插值法。2.1 拉格朗日插值法2.2 牛顿插值法3、关于拉格朗日插值法的示例#拉格朗日插值代码import p..._第1关:数据预处理-数据清洗