专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法

新智元  · 公众号  · AI  · 2024-06-25 20:52
    

主要观点总结

近日,一篇由中国团队发表的AI论文引起热议。该论文提出了一种名为Q*的模型算法,可以显著提升小模型的推理能力,使其性能达到甚至超越大模型的水平。Q*算法能够帮助小模型在多个数据集上取得显著的性能提升,并大幅降低计算资源需求。该算法由颜水成教授团队与新加坡南洋理工大学团队共同研发。论文中还详细描述了Q*算法的实现方式和实验结果。

关键观点总结

关键观点1: Q*算法帮助小模型提升推理能力

Q*算法能够让小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,这一突破性的成果在AI圈内引发了热议。

关键观点2: Q*算法在多个数据集上取得显著成果

Q*算法在GSM8K、MATH和MBPP数据集上帮助现有开源模型取得性能飞跃,评分超过ChatGPT和Gemini Ultra。

关键观点3: Q*算法的实现方式

研究人员将大语言模型的推理轨迹分解为若干个状态,通过集成Path Cost的g(s_t)函数和Accumulated Reward的Q*(s_t, a_t)到同一个f(s_t)函数内,实现对历史状态收益和未来期望收益的综合考虑。利用A*搜索算法进行状态搜索,提升开源模型在推理任务上的性能。

关键观点4: Q*算法的未来展望

颜水成团队表示,Q*的研究尚在初级阶段,算法在各个环节还有进一步的改进空间。未来,团队会继续深入研究,不断提升国产开源模型推理能力,打破OpenAI闭源封锁,为人工智能前沿技术发展带来全新可能。


文章预览

   新智元报道   编辑:好困 【新智元导读】 近日,一篇出自中国团队之手的AI论文在外网引发热议。论文中,研究团队提出了Q*模型算法,帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。 自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。 据现有信息汇总,Q*项目被视作OpenAI在探索人工通用智能(Artificial General Intelligence, AGI)道路上的一次重大尝试,有望在包括数学问题解决能力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。 (英伟达科学家Jim Fan、图灵奖得主Yann LeCun等参与讨论OpenAI的Q*实现方式) (Meta科学家田渊栋则认为Q*是Q-learning和A*的结合,且天然地适合推理任务,尤其在数学推理方面) 不过迄今为止OpenAI没有公开关于Q*算法的具体细节,其效果究竟如何我 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览