专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

研究人员打造合成数据，让模型更高效地学习处理长文本能力

DeepTech深科技 · 公众号 · 科技媒体 · 2024-11-04 17:34

文章预览

2024 年 2 月，一支科研团队在 Transactions of the Association for Computational Linguistics 上发表了一篇题为《迷失在中间：语言模型如何使用长上下文》（ Lost in the Middle：How Language Models Use Long Contexts ）的论文。 “Lost in the Middle”是指大模型在处理长文本的时候，如果关键信息出现在开头或结尾的话，那么模型会更容易注意到这些信息。反之，如果关键信息出现在文本中间，那么模型就会更加容易忽略掉这些信息。因此，大模型的准确率会呈现出 U-型的曲线。同时，领域内的“Needle-in-a-haystack（大海捞针）”测试也展示了同样的结论：如果在一段长文本中加入一小段关键信息，那么文本越长，模型就越容易忽略掉手动嵌入的信息。为了解决这些问题，目前人们主要使用三种方法：其一，使用检索增强生成方法，这通常需要一个额外的检索器，从长文本中 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新腕儿 · 11日付费短剧热度大盘6245万：《许你一场悲欢》连续两日第一

昨天

新浪科技 · #李彦宏称自动驾驶比人开车安全10倍##李彦宏称大模型成本每年降-20250211183000

2 天前

新浪科技 · 【#孕妇酒店半夜吓醒发现老公满脸是血#】#酒店2米吊顶半夜掉了孕-20250211135500

2 天前

新浪科技 · 【#特斯拉上海储能超级工厂投产#：本季度开始产能爬坡，上海速度再-20250211092830

2 天前

新浪科技 · 【王传福：#比亚迪10万级以上标配天神之眼智驾#】在今日的比亚迪-20250210195640

3 天前

手机晶片达人 · 小米在很多欧洲大城市的商场，还是有不少展店。 -20240731020602

6 月前

兴业研究 · 宏观市场丨如何用月度数据预测GDP？

1 月前