文章预览
点击蓝字 关注我们 报告摘要 本篇报告主要介绍了深度学习神经网络LSTM的改进版本——eLSTM 模型的设计原理及性能表现。 在过往报告《扩展长短期记忆网络 xLSTM——人工智能系列之三》中介绍了 xLSTM 网络的原理并对其技术点进行了拆解。eLSTM 即从 xLSTM 中得到灵感,使用指数门控代替了传统 LSTM 模型的 Sigmoid 门控,并采取措施对输出的数值稳定性和指数门的数值稳定性进行了控制,最终得到了性能更优秀的 eLSTM 模型。 本报告设计了控制变量实验对 eLSTM 的性能进行测试,基准模型为 LSTM 模型和 GRU模型。以全A股的日频量价数据作为训练数据集,分别以 eLSTM/LSTM/GRU 模型为基础构建了其余网络结构均相同的选股因子生成模型。在训练过程中,控制模型各项超参数与训练条件相同,并在全 A、沪深 300、中证 500、中证 1000 四个股票池中对三组因子进行了
………………………………