文章预览
核心观点 模型改进方案 考虑到在基础版本中我们使用的l2数据集中绝大部分人工因子主要是基于大单构建的,而小单和盘口数据所蕴含的信息量也十分巨大,因此本文将构建一些基于小单和盘口的因子以对l2数据集进行信息补充,从而使得l2数据集反映的日内信息更加充分从而给全模型带来增量效果。 基于知识蒸馏的思想在因子单元加权阶段将树模型和神经网络进行集成,先通过教师模型对信息进行过滤,之后将过滤得到的有效信息提供给学生模型进行训练,从而让学生模型能更有效的学习。通过知识蒸馏方法,我们希望集成后的模型既能继承树模型能较好处理分类型数据和泛化能力强的优势,又能继承神经网络能够较好拟合极度非线性函数的优势。 今年年初基于量价的机器学习因子出现了较大回撤,原因在于模型预测的市场风格与真实环境出现
………………………………