文章预览
LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 AS - 音频与语音 RO - 机器人 1、[LG] Semi-Supervised One-Shot Imitation Learning 2、[CL] Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers 3、[LG] Continual Learning of Nonlinear Independent Representations 4、[LG] The AI Scientist:Towards Fully Automated Open-Ended Scientific Discovery 5、[RO] Body Transformer:Leveraging Robot Embodiment for Policy Learning 摘要:半监督单样本模仿学习、用相互推理提升小型语言模型的推理能力、非线性独立表示的持续学习、全自动开放式科学发现研究、利用机器人具身的策略学习 1、[LG] Semi-Supervised One-Shot Imitation Learning P Wu, K Hakhamaneshi, Y Du, I Mordatch… [UC Berkeley] 半监督单样本模仿学习 要点: 本文提出半监督单样本模仿学习(OSIL)设置,旨在从单个示范中学习新任务。该设置包含大量无标签的轨迹数据集和每个任务少量的成对示范数据
………………………………