牛皮吹破？大模型长输入能力不能拿来做上下文学习

机器学习算法与自然语言处理 · 公众号 · · 2024-05-20 00:00

文章预览

MLNLP 社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。社区的愿景是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进步，特别是初学者同学们的进步。转载自 | 夕小瑶科技说作者 | 谢年年 LLMs已经进入了长序列时代。众多的LLMs已经发布支持从32K到2M tokens的长序列窗口。不过，面对如此庞大的输入，我们不禁要问：这些模型真的能够吃透超长文本，捕捉到其中的精华信息吗？为了解答这一疑问，滑铁卢大学的学者们精心打造了一套名为LongICLBench的基准测试，专门用来评估LLMs在长上下文理解方面的能力。这套基准专注于极端标签分类中的长上下文学习，涵盖了六个难度不一的数据集，标签数量从28到174类不等，输入长度则从2K到50K tokens都有。它要求LLMs必 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

人民网舆情数据中心 · 被曝有人在门店往火锅小便，海底捞及时回应公众关切｜食点药闻

昨天

北京新闻广播 · 承认成绩造假！“考研名师”何凯文道歉

昨天

北京新闻广播 · 承认成绩造假！“考研名师”何凯文道歉

昨天

人民网舆情数据中心 · “银行土”“银行水”走热背后，银行需警惕哪些声誉风险丨金舆之言

2 天前

消费电子杂志社 · 3·15最新发布！港澳居民为何偏爱北上珠海消费？珠海市消委会委托消费保调研报告出炉！

3 天前

消费电子杂志社 · 3·15最新发布！港澳居民为何偏爱北上珠海消费？珠海市消委会委托消费保调研报告出炉！

3 天前

中建装饰集团 · 【创新建证美好】“像造汽车一样造房子”：未来的建筑将会是怎样的？

9 月前

Crossin的编程教室 · Python到底是引用传递还是值传递？网上大多数教程都讲错了

8 月前

算法爱好者 · “剑指 C/C++”，美国 CISA 等机构再发警告：Linux 中 95% 没用内存安全代码！

8 月前