如何泛化AI的深度推理能力？

微软亚洲研究院 · 公众号 · AI · 2024-10-22 18:34

文章预览

（本文阅读时间：9分钟）编者按：大语言模型的推理能力一直是人工智能领域的研究热点，但传统依赖大规模数据和参数扩展的预训练方式在提升模型推理能力上逐渐遇到了瓶颈。微软亚洲研究院的最新研究关键计划步骤学习 CPL（Critical Plan Step Learning），旨在将强化学习扩展到更广泛、更复杂的问题场景，并取得了突破性进展。CPL 通过在自我生成的高层次抽象计划上进行强化学习，不仅提升了模型在数学推理任务上的表现，还在多个跨领域推理任务上展现出了卓越的泛化能力。通过大规模预训练，大语言模型（LLMs）在自然语言处理、数学推理等任务中取得了显著进展。然而，传统依赖大规模数据和参数进行扩展的预训练方式在提升模型推理能力上面临着新的挑战。科研人员相信 LLMs 的能力不止于此，在后训练阶段学习人类的慢思考，特别是通 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博