今天看啥  ›  专栏  ›  量化前沿速递

Kaggle金牌技巧--错误标签处理方案!

量化前沿速递  · 公众号  ·  · 2024-08-12 12:00

文章预览

标签奇异值处理策略 简介 在很多数据竞赛问题或者实际数据问题中,我们都急于堆叠各种特征和模型融合,但是很多问题中,标签的处理远远比特征工程和模型融合重要。奇异值的标签可能是正常情况,也可能是非正常情况。在后续的文章中,我们会介绍如何判断奇异值是正常的可以预测的,还是非正常情况引入的方法。 本文我们介绍在一些常见问题中,奇异标签出现的情况以及处理的策略。 案例 1.电商的销量预测 这个最常见,每年的双11,618等特殊日期,销量值往往就是奇异值,如果直接把这些数据放入模型进行训练,会给模型带来巨大的干扰,在对其它时间段的预测带来极大的误差。 2.股灾 在漫长的股市中,存在一些极端下跌的情况,在股灾的时候会出现千股直接跌停的情况,而这段时间几乎所有的模型都会失效,同样地,如果在训练中 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览