主要观点总结
本文介绍了强化学习模型在行业配置任务中的应用,并讨论了其收益与稳定性的权衡。文章首先提出了强化学习模型在时序数据预测或组合优化任务中的一般框架,然后进行了单次训练模式和拓展训练的对比,发现滚动模型训练在平衡收益与风险方面取得了更好的效果。同时,文章探讨了强化学习模型在不同训练框架下的稳定性和敏感性,发现模型选择、样本区间和随机数种子等因素对模型表现有显著影响。最后,文章强调了模型基于历史数据构建可能存在的失效风险,并建议投资者寻求专业投资顾问的指导及解读。
关键观点总结
关键观点1: 强化学习模型在时序数据预测或组合优化任务中的应用
文章介绍了强化学习模型在金融行业配置任务中的应用,发挥其在序列决策任务上的优势。
关键观点2: 单次训练与拓展训练的对比
文章比较了单次训练模式和拓展训练模式的效果,发现滚动模型训练在平衡收益与风险方面取得了更好的效果。
关键观点3: 强化学习模型的稳定性和敏感性
文章探讨了强化学习模型在不同训练框架下的稳定性和敏感性,发现模型选择、样本区间和随机数种子等因素对模型表现有显著影响。
关键观点4: 模型失效风险
文章强调了模型基于历史数据构建可能存在的失效风险,并建议投资者寻求专业投资顾问的指导及解读。
文章预览
摘要 我们在机器学习系列第一篇报告 《 机器学习系列(1):使用深度强化学习模型探索因子构建范式 》 中使用强化学习模型生成因子表达式,所挖掘的因子在样本外有效性较为显著。本篇报告作为机器学习系列报告的第二篇,我们将回归强化学习的优势领域:组合优化任务。 我们将深度强化学习模型应用到行业配置(行业轮动)中,充分发挥强化学习在序列决策任务上的优势,让强化学习模型选出可能具有相对优势的行业。在尝试了多种创新性训练方法以避免模型的过拟合等关键问题后,我们发现使用 强化学习模型轮动的训练框架 可以最终得到 兼顾稳定与收益 的结果。 公众号内容为报告原文节选,获取原报告请联系分析师或相应销售老师。 强化学习的优势领域:组合优化 我们认为强化学习相较于其他传统机器学习模型而言,与环境交互
………………………………