专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

NeurIPS 2024 | Transformer长度外推，全新位置编码DAPE大幅提升模型性能

PaperWeekly · 公众号 · 科研 · 2024-10-14 13:50

文章预览

©作者 | 郑传阳单位 | 香港中文大学在当今的人工智能领域，Transformer 模型已成为解决诸多自然语言处理任务的核心。然而，Transformer 模型在处理长文本时常常遇到性能瓶颈。传统的位置编码方法，如绝对位置编码（APE）和相对位置编码（RPE），虽然在许多任务中表现良好，但其固定性限制了其在处理超长文本时的适应性和灵活性。为了应对这一挑战，提出了一种全新的位置编码方法：Data-Adaptive Positional Encoding（DAPE）。DAPE 通过动态调整位置编码，使其能够根据输入上下文和学习到的固定先验进行自适应调整。这种创新方法不仅保留了局部和反局部信息，还在模型训练长度和长度泛化方面显著提升了模型性能。相关研究成果已被 NeurIPS 2024 收录。论文标题： DAPE: Data-Adaptive Positional Encoding for Length Extrapolation 论文地址： https://arxiv.org/abs/2405.14722 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

实验万事屋 · 我这博士生每天都要献祭不少头发，这复旦大学14.6分的SCI文章，做了棕榈酸的ROS氧化应激，让我发际线就又上移了……

18 小时前

弗雷赛斯 · 规范的回复审稿人——标准的Response to reviewer

3 天前

弗雷赛斯 · 优秀国自然技术路线图分享和制作

3 天前

研之成理 · 北京大学Angew：氢化废弃PET为可降解聚酯塑料

6 天前

社会学理论大缸 · 今晚19点讲座丨如何写好文献综述？三大类型和三种写法

6 天前

21世纪经济报道 · 广州重磅：花都买房送“准户口”！

3 月前

淘梦 · 第29届釜山国际电影节推出“纪录片观众奖”（奖金1000万韩元）

3 月前