专栏名称: QuantML
致力于机器学习量化模型最深度研究,每天分享前沿论文,策略模型代码,alpha因子等信息。 商务合作:quantml@126.com
今天看啥  ›  专栏  ›  QuantML

QuantML-Qlib Model | 复现DeepSeek核心结构用于选股

QuantML  · 公众号  ·  · 2025-03-10 22:03
    

文章预览

在之前的文章中,我们分别介绍了DeepSeek核心结构MOE以及MLA,以及如何将其融入QuantML-Qlib框架用于选股。 QuantML-Qlib开发版 | MoE混合专家系统用于提升Transformer表现【附代码】 QuantML-Qlib重磅更新:DeepSeek核心模型结构用于选股 QuantML-Qlib Model | DeepSeek开源FlashMLA结构用于选股 本文我们将MOE以及MLA结构进行结合:一方面采用改进型多头注意力机制(MLA),通过智能参数压缩和混合位置编码策略,使模型能更精准捕捉市场波动规律;另一方面引入专家决策系统(MoE),让多个专业子模型自主竞争,仅激活最优专家进行预测,大幅提升计算效率。该架构特别针对金融数据特性进行优化,包括处理突发数据缺失的填充策略、控制参数更新幅度的梯度裁剪技术,以及聚焦最新市场状态的预测机制。 核心架构解析 2.1 多层级特征处理框架 模型采用三级处理结构:基 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览