专栏名称: AINLPer
一个专注自然语言处理(NLP)方向的公众号。机器学习(ML)、深度学习(DL)、自然语言处理相关模型理解、热门论文(Paper)分享分析、pytorch、C++、Python、Java ...
今天看啥  ›  专栏  ›  AINLPer

LLM每周速递!学术最前沿:Agent应用、强化学习、RAG、复杂推理、多模态等

AINLPer  · 公众号  · 科技创业 科技自媒体  · 2025-03-23 22:09
    

主要观点总结

文章主要介绍了大模型领域的最新研究进展,包括多尺度注意力、强化学习算法DAPO、大模型多Agent系统、人形机器人、调研报告生成、多模型推理模型等。每部分都有详细的介绍和相关的论文链接。

关键观点总结

关键观点1: 多尺度注意力(Attention)

提出了多尺度注意力(MSA)的新型神经网络架构Atlas,在高分辨率ImageNet 100变体中显著改善长上下文图像建模的计算-性能权衡。

关键观点2: 强化学习算法DAPO

字节提出了DAPO算法,助力RL,开源了一个使用Qwen2.5-32B基础模型在AIME 2024上达到50分的先进大规模强化学习系统,并介绍了算法成功的四大关键技巧。

关键观点3: 视频语言Agent

港理工提出一个新颖的视频-语言 Agent :VideoMind,旨在实现对时序视频理解。在多个视频理解任务上取得了最先进的性能。

关键观点4: 自动化电影生成

NUS提出的MovieAgent系统,能够根据剧本和角色库生成多场景、多镜头的长视频,保持叙事连贯性、角色一致性等。

关键观点5: 人形机器人框架Being-0

北大介绍了Being-0框架,旨在构建能在现实世界中执行复杂任务的人形机器人。包括三个关键部分:Foundation Model、模块化技能库和视觉语言模型。

关键观点6: 调研论文生成

上海AI-Lab介绍了SURVEYFORGE,一个自动化生成调研论文的工具,旨在提高效率并缩小与人类撰写调研论文的质量差距。

关键观点7: 长链推理模型的训练

从头训练长链推理模型的相关工作介绍,通过两阶段SFT和半策略DPO训练,获得具有强大推理能力的模型。

关键观点8: 多模态推理模型

浙大介绍了一个多模态推理模型R1-Onevision,旨在连接视觉感知和深度推理。提出了一种跨模态推理流程,将图像转化为形式化文本表示,实现精确的语言推理。


文章预览

点击上方 “ AINLPer “ ,设为 星标 更多干货,第一时间送达 引言 紧跟技术发展趋势,快速了解大模型最新动态。今天继续总结最近一周的研究动态,本片文章共计梳理了 10篇有关大模型(LLMs)的最新研究进展 ,其中主要包括:多尺度注意力(Attention)、强化学习算DAPO算法、大模型多Agent系统、人形机器人、调研报告生成、多模型推理模型、长CoT推理模型、RAG系统能力提升应等热门研究。 更多精彩内容--> 专注大模型/AIGC、Agent、RAG等学术前沿分享! 伯克利 | 多尺度注意力:Atlas https://arxiv.org/pdf/2503.12355 高效建模大规模图像是机器学习的长期挑战。 「本文作者基于多尺度表示和双向跨尺度通信两大关键思想,提出了多尺度注意力(MSA)」 。基于此,作者设计了新型神经网络架构Atlas,在高分辨率ImageNet 100变体中显著改善长上下文图像建模的计算-性能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览