专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
今天看啥  ›  专栏  ›  斌叔OKmath

网页链接有没有想过模型合并在大规模情况下是否有效?对于更大的模型-20241010105856

斌叔OKmath  · 微博  ·  · 2024-10-10 10:58
    

文章预览

2024-10-10 10:58 本条微博链接 网页链接 有没有想过模型合并在大规模情况下是否有效?对于更大的模型,这种好处可能就消失了? 也许您考虑过使用模型合并对大型模型进行后期训练,但不确定它是否具有很好的泛化能力? 抄送: @GoogleAI @GoogleDeepMind @uncnlp 🧵👇 很高兴宣布我的实习工作是大规模模型合并!我们探索当你将越来越大的语言模型(最多 64B 个参数!)组合在一起时会发生什么,以及不同的因素(模型大 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览