机器学习之特征选择_基于树的特征选择-CSDN博客

网站介绍:文章浏览阅读1k次。在机器学习中,用于选择相关特征(变量、预测变量等)的子集以用于模型构建。这是机器学习项目过程中的重要一步,也是特征工程以减少训练时间。训练时间和特征空间是正相关的。避免维度灾难。使模型更容易。提高泛化能力,减少过拟合。减少共线性并增强可解释性。当得到一个数据集(类似表格的数据)时,每一列都是一个特征,但并不是所有的列都是有用的或相关的。最好花一些时间在特征选择上。使用特征选择技术的中心前提是数据包含一些冗余或不相关的特征,因此可以删除而不会导致大量信息丢失。有很多方法可以进行特征选择。_基于树的特征选择