Marco-O1：面向开放式解决方案的开放推理模型 | 从“愚蠢”问题中学习提高大模型性能，但效果有限....

AI for Research · 公众号 · · 2024-11-22 21:23

文章预览

前言：科研就像一场冒险，而看论文就是你的探险工具！只有通过深入阅读，才能找到宝藏，发现那些意想不到的科研奇遇哦！ 1. 面向开放式解决方案的开放推理模型标题： Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions 关键词：大语言模型、开放式解决方案、开放推理模型作者： Yu Zhao, Huifeng Yin, Bo Zeng 分析： Marco-o1不仅关注有明确答案的学科，如数学、物理和编程，也更注重开放式问题解决。该模型使用Chain-of-Thought (CoT)微调、Monte Carlo Tree Search (MCTS)、反思机制以及创新的推理策略，优化用于复杂现实世界问题解决任务。地址： https://arxiv.org/pdf/2411.14405 2. 揭秘扩散 Transformer（DiT）中的冗余：系统性研究标题： Unveiling Redundancy in Diffusion Transformers (DiTs): A Systematic Study 机构：腾讯关键词：扩散 Transformer、模型结构 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博