主要观点总结
本文利用BGE大语言模型构造并检验了A股市场的科技动量效应。实证结果表明,基于BGE和基于IPC分类构造的科技动量是互补关系而非替代关系,二者均含有关于cross-section的预测信息。
关键观点总结
关键观点1: 引言
介绍了另类数据的应用背景,尤其是科技动量的研究现状。
关键观点2: 方法
介绍了使用BGE大语言模型构造科技动量的方法,包括专利数据的处理、主题划分、科技动量的计算等。
关键观点3: 实证结果
展示了科技动量的实证结果,包括不同投资组合的累计收益曲线、月均超额收益率以及Fama-MacBeth regression的结果。
关键观点4: 结论
总结了文章的主要内容和结果,并指出了未来可能的研究方向。
文章预览
作者: 石川,北京量信投资管理有限公司创始合伙人,清华大学学士、硕士,麻省理工学院博士。 《因子投资:方法与实践》 领衔作者, 《机器学习与资产定价》 译者。 封面来源: www.pexels.com 未经授权,严禁转载。 摘 要 本文针对 A 股,使用 BGE 大语言模型构造并检验科技动量效应。实证结果表明,基于 BGE 和基于 IPC 分类构造的科技动量是互补而非替代关系。二者均含有关于 cross-section 的预测信息。 0 引言 如今,各位对另类数据早已不再陌生。在另类数据的应用中,各种“花式动量”(即从不同信息源所构造的企业间关联导致的动量溢出效应)最深入人心。 早在几年前, Lee et al. (2019) 使用专利数据针对美股构造了科技动量异象,它可以获得常见风险因子无法解释的超额收益。在构造科技动量时,该文使用专利的 IPC 分类(本文附录 A 对 IPC
………………………………