文章预览
LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 AS - 音频与语音 RO - 机器人 1、[CL] Unveiling the Role of Pretraining in Direct Speech Translation 2、[RO] MaskedMimic:Unified Physics-Based Character Control Through Masked Motion Inpainting 3、[IR] Reducing the Footprint of Multi-Vector Retrieval with Minimal Performance Impact via Token Pooling 4、[LG] Physics-informed kernel learning 5、[CV] MaskBit:Embedding-free Image Generation via Bit Tokens 摘要:揭示预训练在直接语音翻译中的作用、通过掩码运动补全实现基于物理的统一角色控制、通过Token Pooling保持性能的同时减少多向量检索模型存储量、物理驱动核学习、基于比特Token的非嵌入图像生成 1、[CL] Unveiling the Role of Pretraining in Direct Speech Translation B Alastruey, G I. Gállego, M R. Costa-jussà [Meta] 揭示预训练在直接语音翻译中的作用 要点: 本文分析和比较了具有和不具有编码器预训练的直
………………………………