专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

ICLR 2025 | 软提示不再是黑箱？浙大、阿里云重塑Prompt调优思路

PaperWeekly · 公众号 · 科研 · 2025-04-07 13:32

文章预览

本文深入分析了 prompt tuning 的推理机理，并针对分析结果提出了动态提示扰动的方法，提升 LLMs 在复杂推理任务中的表现。论文标题： Improving Complex Reasoning with Dynamic Prompt Corruption: A soft prompt Optimization Approach 期刊/会议： ICLR 2025 论文地址： https://arxiv.org/pdf/2503.13208 作者机构：阿里云智能-飞天实验室引言大语言模型（LLMs）可以通过 “思维链（Chain-of-Thought, CoT）” 来解决复杂的推理问题，但对于不同类型的任务，往往需要人工设计的 “提示（prompt）” 来引导 LLMs 进行有效的推理思考。这些提示，就像是老师在学生解题时给予的微妙提示，能够激发学生的思考，帮助他们找到问题解决的钥匙。 Prompt tuning 通过微调的方法习得这个任务的 Soft Prompt。传统的 Prompt Tuning 方法虽然在常规任务中表现出色，但在复杂推理任务中效果有限，甚至可能降低模 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

研之成理 · 剑桥大学刘永鹏/Erwin Reisner团队EES：光电化学塑料重整耦合催化CO2还原

昨天

研之成理 · 电化学氧化NO制硝酸，Nature Catalysis！

昨天

自然系列 · 科学家在遥远星球发现生命迹象？

昨天

募格学术 · 学生论文致谢，影响导师晚评职称一年？网友：你导这辈子抬不起头

2 天前

科技兽 · 苹果多款 iPad 标识符曝光，iPad mini 7 预计搭载 A17 芯片

9 月前

芯世相 · 20240925 买卖芯片找老王（优势物料，低于市场价）

7 月前

华大医学 · 他们看不见，但爱能带来光@国际盲人节

6 月前

倪叶明创业工作室 · 关于赚不到钱的杂谈

4 周前