专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

Qwen2.5更新百万超长上下文,推理速度4.3倍加速,网友:RAG要过时了

量子位  · 公众号  · AI  · 2024-11-19 18:31

文章预览

鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 国产大模型,最近有点卷。 这不, 刚在写代码这事儿上刷新SOTA ,Qwen2.5系列又双叒突然更新了—— 一口气读三本《三体》不费事,并且 45秒左右 就能完整总结出这69万token的主要内容,be like: 还真不是糊弄事儿,“大海捞针”实验显示,这个全新的 Qwen2.5-Turbo 在100万token上下文中有全绿的表现。 也就是说,这100万上下文里,有细节Qwen2.5-Turbo是真能100%捕捉到。 没错,Qwen2.5系列新成员 Qwen2.5-Turbo ,这回主打的就是支持超长上下文,并且把性价比卷出了花儿: 上下文长度从128k扩展到 1M ,相当于100万个英文单词或150万个汉字,也就是10部长篇小说、150小时语音记录、30000行代码的量。 更快的推理速度:基于稀疏注意力机制, 处理百万上下文时,首字返回时间从4.9分钟降低到了68秒 ,实现了 4.3倍 加速。 关键是 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览