专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发布Q*算法

新智元 · 公众号 · AI · 2024-06-25 20:52

主要观点总结

近日，一篇由中国团队发表的AI论文引起热议。该论文提出了一种名为Q*的模型算法，可以显著提升小模型的推理能力，使其性能达到甚至超越大模型的水平。Q*算法能够帮助小模型在多个数据集上取得显著的性能提升，并大幅降低计算资源需求。该算法由颜水成教授团队与新加坡南洋理工大学团队共同研发。论文中还详细描述了Q*算法的实现方式和实验结果。

关键观点总结

关键观点1: Q*算法帮助小模型提升推理能力

Q*算法能够让小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，这一突破性的成果在AI圈内引发了热议。

关键观点2: Q*算法在多个数据集上取得显著成果

Q*算法在GSM8K、MATH和MBPP数据集上帮助现有开源模型取得性能飞跃，评分超过ChatGPT和Gemini Ultra。

关键观点3: Q*算法的实现方式

研究人员将大语言模型的推理轨迹分解为若干个状态，通过集成Path Cost的g(s_t)函数和Accumulated Reward的Q*(s_t, a_t)到同一个f(s_t)函数内，实现对历史状态收益和未来期望收益的综合考虑。利用A*搜索算法进行状态搜索，提升开源模型在推理任务上的性能。

关键观点4: Q*算法的未来展望

颜水成团队表示，Q*的研究尚在初级阶段，算法在各个环节还有进一步的改进空间。未来，团队会继续深入研究，不断提升国产开源模型推理能力，打破OpenAI闭源封锁，为人工智能前沿技术发展带来全新可能。

文章预览

新智元报道编辑：好困【新智元导读】近日，一篇出自中国团队之手的AI论文在外网引发热议。论文中，研究团队提出了Q*模型算法，帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后，业内相关讨论始终层出不穷。据现有信息汇总，Q*项目被视作OpenAI在探索人工通用智能（Artificial General Intelligence, AGI）道路上的一次重大尝试，有望在包括数学问题解决能力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。（英伟达科学家Jim Fan、图灵奖得主Yann LeCun等参与讨论OpenAI的Q*实现方式）（Meta科学家田渊栋则认为Q*是Q-learning和A*的结合，且天然地适合推理任务，尤其在数学推理方面）不过迄今为止OpenAI没有公开关于Q*算法的具体细节，其效果究竟如何我 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博