专栏名称: 大语言模型和具身智体及自动驾驶

讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

兵团零距离 · 两个月多艘“世界之最”交付这就是中国“船”说 · 22 小时前

头条早知道 · 考研调剂系统每次开放不得低于12小时；商场女 ... · 昨天

桦爸聊升学 · “研”途快讯丨多所自划线院校复试分数线发布！ · 昨天

如东新媒体 · 分数线已公布！ · 2 天前

跨境脉 · 损失惨重！1300个集装箱车厘子将全部销毁！ · 2 天前

今天看啥 › 专栏 › 大语言模型和具身智体及自动驾驶

Transformer 进行长文本建模：综述

大语言模型和具身智体及自动驾驶 · 公众号 · · 2024-06-16 00:01

文章预览

23年2月来自人大等研究机构的论文“A Survey on Long Text Modeling with Transformers”。长文本建模一直是自然语言处理 (NLP) 领域的一项重要技术。随着长文档数量的不断增长，开发能够处理和分析此类文本的有效建模方法非常重要。然而，长文本具有更复杂的语义和特殊特征，对现有的文本模型提出了重要的研究挑战。本文概述基于 Transformer 模型长文本建模的最新进展。首先，介绍长文本建模的形式化定义。然后，作为核心内容，讨论如何处理长输入以满足长度限制并设计改进的 Transformer 架构以有效扩展最大上下文长度。之后讨论如何调整 Transformer 模型捕捉长文本的特殊特征。最后，描述涉及长文本建模的四种典型应用，以及未来的方向。如图是Transformer建模长文本的直观图：长文本表示为tokens序列 X = (x1, . . . , xn)，与 Transformer 可以直接处理的短文本 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

兵团零距离 · 两个月多艘“世界之最”交付这就是中国“船”说

22 小时前

兵团零距离 · 两个月多艘“世界之最”交付这就是中国“船”说

22 小时前

头条早知道 · 考研调剂系统每次开放不得低于12小时；商场女厕马桶为何频频变蹲坑；律师称千禾0酱油存主观误导嫌疑

昨天

桦爸聊升学 · “研”途快讯丨多所自划线院校复试分数线发布！

昨天

桦爸聊升学 · “研”途快讯丨多所自划线院校复试分数线发布！

昨天

如东新媒体 · 分数线已公布！

2 天前

如东新媒体 · 分数线已公布！

2 天前

跨境脉 · 损失惨重！1300个集装箱车厘子将全部销毁！

2 天前

西二旗生活指北 · 我，实习生，配了个P10当助理

9 月前

海通研究 · 海通研究 | 会议、活动、观点20241126

3 月前

歸藏的AI工具箱 · 一个很有意思的前端编程测试#deepseek##AI创造营# R-20250201201621

1 月前

山东市场监管 · 走近3·15｜漫“话”消费维权④

1 周前