文章预览
LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 1、[LG] Large Language Models as Markov Chains 2、[CL] Long-Context LLMs Meet RAG:Overcoming Challenges for Long Inputs in RAG 3、[LG] RL,but don't do anything I wouldn't do 4、[LG] Manifolds,Random Matrices and Spectral Gaps:The geometric phases of generative diffusion 5、[LG] Everything Everywhere All at Once:LLMs can In-Context Learn Multiple Tasks in Superposition 摘要:自回归大型语言模型与有限状态马尔可夫链的等效性、克服RAG中长输入的挑战、请不要做我可能不会做的事、生成扩散的几何阶段、LLM可以在叠加的上下文中学习多个任务 1、[LG] Large Language Models as Markov Chains O Zekri, A Odonnat, A Benechehab, L Bleistein... [ENS Paris-Saclay & Huawei Noah’s Ark Lab] 自回归大型语言模型与有限状态马尔可夫链的等效性 要点: 大型语言模型作为马尔可夫链: 本文建立了自回归大型语言模型 (LLM) 与马
………………………………