文章预览
LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 AS - 音频与语音 RO - 机器人 1、[LG] ALTA:Compiler-Based Analysis of Transformers 2、[LG] Reinforcement Learning under Latent Dynamics:Toward Statistical and Algorithmic Modularity 3、[LG] Relaxed Equivariance via Multitask Learning 4、[LG] ExpertFlow:Optimized Expert Activation and Token Allocation for Efficient Mixture-of-Experts Inference 5、[LG] Stick-breaking Attention 摘要:基于编译器的Transformer分析、潜动态下的强化学习、通过多任务学习实现松弛等变性、用优化的专家激活和Token分配实现高效的专家混合推理、Stick-breaking注意力 1、[LG] ALTA: Compiler-Based Analysis of Transformers P Shaw, J Cohan, J Eisenstein, K Lee… [Google DeepMind & Google] ALTA:基于编译器的Transformer分析 要点: ALTA 的介绍:一种新的编程语言和编译器,能够将 ALTA 程序映射到 Transformer 的权重,扩展了先前的工作(RASP,Tracr
………………………………