文章预览
LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 1、[CL] Diversity-driven Data Selection for Language Model Tuning through Sparse Autoencoder 2、[CV] Improving the Diffusability of Autoencoders 3、[CV] Designing Parameter and Compute Efficient Diffusion Transformers using Distillation 4、[CL] LServe:Efficient Long-sequence LLM Serving with Unified Sparse Attention 5、[CL] RocketKV:Accelerating Long-Context LLM Inference via Two-Stage KV Cache Compression 摘要:通过稀疏自编码器进行多样性驱动的语言模型微调数据选择、提高自编码器的可扩散性、利用蒸馏技术设计参数/计算高效扩散Transformer、利用统一稀疏注意力提供高效长序列 LLM 服务、通过两阶段KV缓存压缩加速长上下文LLM推断 1、[CL] Diversity-driven Data Selection for Language Model Tuning through Sparse Autoencoder X Yang, S Nie, L Liu, S Gururangan... [Meta GenAI] 通过稀疏自编码器进行多样性驱动的语言模型微调
………………………………