2024.6横向对比各家LLM的Long Context (合集 V1.10)

孔某人的低维认知 · 公众号 · · 2024-06-07 17:00

文章预览

TLDR 本文构造了一个比大海捞针稍难的长上下文测试方案，并对比了目前支持128k和32k以上的上下文的闭源API LLM模型。仅从这个很狭隘的测试来看，海外头部三家厂商在长上下文上还是领先于国内的。本文的测试代码框架已经开源，方便大家测试其他数据。本系列没有得到任何厂商赞助，目前累计花了4300RMB充值各家平台。 Github地址： https: //github.com/SomeoneKong/llm_long_context_bench202405/tree/bench_32k_v1 https: //github.com/SomeoneKong/llm_long_context_bench202405/tree/bench_128k_v1 合集更新历史：在正文内容上没有太多更新，主要是数据表的更新，可以直接跳去看表格。 V1.10 增加了智谱 6.5发布的新系列模型的结果。由于SiliconFlow对glm-4-9b的适配只支持32k context，所以仅有32k测试结果。增加了阿里 qwen2 新系列开源模型的结果。由于SiliconFlow对该系列模型的适配只支持32k context ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

艾儿天空 · 霞飞双颊新书《时空救援》上线，李知漫万订年上文九十万字被迫结束

5 小时前

艾儿天空 · 骷髅精灵新书《神祇风暴》上线，知稚“这个顶流太棒了”突破万订，厌笔萧生新书4月28号

昨天

艾儿天空 · 《末日：我打造无限列车》《重生08：装备系男神》万订，雾外江山新书，大西瓜回归LOL文

2 天前

艾儿天空 · 2025第12周：王梓钧、李暮歌、掠过的乌鸦、一碗杜康、二蛇、无极书虫等38位作者新书汇总

3 天前

艾儿天空 · 3月第3周起点月票榜：关关公子《鸣龙》上架，两次日冠升至前十

3 天前

高禾投资 · 盛世华诞！热烈庆祝祖国75周年华诞！

5 月前