2024-09-16 09:11
本条微博链接
通过内在维度和预测惊讶度的分析,揭示了语言模型中间层与大脑活动高相似度的原因在于其进行分层抽象的内在特性,而不是仅仅预测性质驱动了这一相似性。
[CL]《Evidence from fMRI Supports a Two-Phase Abstraction Process in Language Models》E Cheng, R J. Antonello [Universitat Pompeu Fabra Columbia University
………………………………