专栏名称: AI for Research
每天分享最新最热的Arxiv论文、一起来关注大模型、AIGC、AGI
目录
相关文章推荐
今天看啥  ›  专栏  ›  AI for Research

Marco-O1:面向开放式解决方案的开放推理模型 | 从“愚蠢”问题中学习提高大模型性能,但效果有限....

AI for Research  · 公众号  ·  · 2024-11-22 21:23
    

文章预览

前言: 科研就像一场冒险,而看论文就是你的探险工具!只有通过深入阅读,才能找到宝藏,发现那些意想不到的科研奇遇哦! 1. 面向开放式解决方案的开放推理模型   标题: Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions   关键词: 大语言模型、开放式解决方案、开放推理模型   作者: Yu Zhao,  Huifeng Yin,  Bo Zeng   分析: Marco-o1不仅关注有明确答案的学科,如数学、物理和编程,也更注重开放式问题解决。该模型使用Chain-of-Thought (CoT)微调、Monte Carlo Tree Search (MCTS)、反思机制以及创新的推理策略,优化用于复杂现实世界问题解决任务。   地址: https://arxiv.org/pdf/2411.14405 2. 揭秘扩散 Transformer(DiT)中的冗余:系统性研究   标题: Unveiling Redundancy in Diffusion Transformers (DiTs): A Systematic Study   机构: 腾讯   关键词: 扩散 Transformer、模型结构 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览