注册
登录
专栏名称:
机器之心
专业的人工智能媒体和产业服务平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
【gradio-webrtc:基于Gradi ...
·
昨天
爱可可-爱生活
·
【DarkFlare:一个隐蔽的TCP-ov ...
·
昨天
爱可可-爱生活
·
【spaCy ...
·
4 天前
爱可可-爱生活
·
[CL]《Stronger Models ...
·
5 天前
爱可可-爱生活
·
[CL]《Mapping the ...
·
6 天前
今天看啥
›
专栏
›
机器之心
NeurIPS 2024 | Transformer长度外推,全新位置编码DAPE大幅提升模型性能
机器之心
·
公众号
·
AI
· 2024-10-12 12:01
文章预览
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。 投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com 本篇论文已被NeurIPS 2024接收,论文第一作者郑传阳来自香港中文大学,共同作者包括新加波国立大学高伊杭,诺亚实验室石涵、任晓哲、蒋欣、李震国,香港中文大学 黄敏斌、 李靖瑶,香港大学熊璟,香港浸会大学吴国宝,香港中文大学李煜 在当今的人工智能领域,Transformer 模型已成为解决诸多自然语言处理任务的核心。然而,Transformer 模型在处理长文本时常常遇到性能瓶颈。传统的位置编码方法,如绝对位置编码(APE)和相对位置编码(RPE),虽然在许多任务中表 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
【gradio-webrtc:基于Gradio的WebRTC实时-20241122195733
昨天
爱可可-爱生活
·
【DarkFlare:一个隐蔽的TCP-over-CDN隧道工具-20241122201447
昨天
爱可可-爱生活
·
【spaCy Layout:一款能够处理PDF、Word文档等多-20241119140525
4 天前
爱可可-爱生活
·
[CL]《Stronger Models are NOT Str-20241118055916
5 天前
爱可可-爱生活
·
[CL]《Mapping the Podcast Ecosyst-20241117070152
6 天前
Panasonic松下中国
·
松下电器RE100能源解决方案实验升级
3 月前
陈仲凯兔兔
·
人工智能虽好,但更大的问题是……
3 月前
斌叔OKmath
·
很快,很快,就会有《基于Cursor的前端程序员培训》。培训门槛-20240828102315
2 月前
小白测评
·
【新机】曝华为Mate70系列整机已量产 疑似真机照流出
1 月前