文章预览
研究摘要 前言: 本文为国盛金工《“量价淘金”选股因子系列研究》的第九篇报告,也是“因子生产加速”相关研究的首次尝试,从数据存储技术、体系化的因子构建框架这两个角度出发,探索如何系统性、快速、批量挖掘Alpha因子。 Memory Map数据存储技术: 相比于传统的CSV、Parquet等存储形式,Memory
Map减少了显式的文件I/O操作,将数据直接映射到内存中,可大幅提升访问速度。以读取宽表存储形式下、某一交易日所有股票的分钟收盘价数据为例,Memory
Map的读取耗时不到800μs,读取速度约为Parquet的260倍、CSV的330倍。 体系化的因子构建框架——羊群效应因子簇: 我们将事件研究的想法,融入到选股因子的构建中。提炼因子构建流程中的3个关键因素,事件识别、因子定义、数据频率,分别展开详细讨论。在Memory Map数据存储技术的助力下,基于经济
………………………………