文章预览
前言: 科研就像一场冒险,而看论文就是你的探险工具!只有通过深入阅读,才能找到宝藏,发现那些意想不到的科研奇遇哦! 1. 弱到强的推理 标题: Weak-to-Strong Reasoning 机构: 复旦大学、上海交通大学、上海AI实验室 相关领域: 模型评估、多模态、训练方法与优化 作者: Yuqing Yang, Yan Ma, Pengfei Liu 分析: 这篇论文主要探讨了在大语言模型超过人类水平能力时,如何为这些模型提供全面且准确的监督。论文提出了一种从弱到强的学习框架,利用较弱的模型来解锁更强模型的潜在能力,并解决了复杂推理任务缺乏有效方法的问题。此外,该框架还能自主优化训练数据,提高模型的推理能力。 地址: https://arxiv.org/pdf/2407.13647 代码: https://github.com/GAIR-NLP/weak-to-strong-reasoning 2. 词汇规模scaling laws: 模型越大,词汇量也应越大
………………………………