python 数据挖掘(2) -- 数据质量分析_数据挖掘:查看数据的基本情况(平均值、标准差、最小值、最大值以及极差、1/4、1/2-CSDN博客

网站介绍:文章浏览阅读1.1k次。数据质量分析是数据挖掘中数据准备过程重要的一环,是数据预处理的前提。数据质量分析的主要任务是检查原始数据中是否存在脏数据,脏数据包括缺失值,异常值,不一致的值等等。缺失值缺失值就是由于人为或其他任何原因导致的数据缺失问题,缺失值的处理分为删除存在缺失值的属性、对可能的值进行插补、不处理三种情况。异常值异常值就是不合理的数据,常用的检测方法如下:1) 简单的最大最小统计,比如用户..._数据挖掘:查看数据的基本情况(平均值、标准差、最小值、最大值以及极差、1/4、1/2