专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

通过将最大更新参数化(μP)引入学习优化器(μLO),实现无需额-20240610060604

爱可可-爱生活  · 微博  · AI  · 2024-06-10 06:06
2024-06-10 06:06 本条微博链接 通过将最大更新参数化(μP)引入学习优化器(μLO),实现无需额外训练成本就可显著提升学习优化器的泛化能力,包括泛化到更宽更深网络以及更长训练展开。 [LG]《μLO: Compute-Efficient Meta-Generalization of Learned Optimizers》B Thérien, C Joseph, B Knyazev, E Oyallon... [Université de Montréa] (2024) 网页链接 #机器学习##人工智能## ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照