文章预览
在实际的机器学习应用中,表格数据是最常见的数据类型。这类数据由固定数量的特征(列)组成,这些特征可以是数值型或分类型,与图像或文本数据相比,缺乏时空结构。表格数据的中等维度和缺乏对称性使得它能够被多种机器学习方法处理。这篇文章挑战了梯度提升决策树(GBDTs)在表格数据分类和回归任务中的主导地位,提出了一种改进的多层感知器(MLP)——RealMLP,以及针对GBDTs和RealMLP的强预调整默认参数。通过在118个数据集的元训练基准上调整RealMLP和默认参数,并在90个数据集的元测试基准上与超参数优化版本进行比较,结果显示RealMLP在中等到大型表格数据集上比起其他神经网络模型来说有着更好的时间与精度之间的权衡,并且在基准分数上与GBDTs具有竞争力。此外,RealMLP的默认参数可以在不进行超参数调整的情况下获得优异的结果
………………………………