文章预览
本期推荐一篇最新发表在《管理科学MS》上的论文《机器能从中文文本数据中学习多少金融信息?》。在信息爆炸的时代,金融市场参与者面对海量数据,文本数据作为重要信息源,蕴含丰富的市场情绪和投资线索。然而,如何从复杂文本中提取有价值信息一直是金融研究的难题。传统文本分析方法依赖预定义词典或人类经验判断,虽有分析基础,但易受主观偏见和词典局限性影响。因此,如何更客观、高效地利用文本数据进行金融预测,成为亟待解决的问题。本研究旨在探索一种新的机器学习框架——因子增强模型(FarmPredict),直接从文本数据中学习金融信息,不依赖预定义词典或预训练模型。 研究采用因子增强模型这一创新性分析框架,通过无监督学习从高维文本数据中提取隐藏因子和特异成分。具体而言,研究利用主成分分析(PCA)技术
………………………………