注册登录

专栏名称: 孔某人的低维认知

孔某人低维认知中世界的投影，世界很复杂，但人的认知总是过于简单。 ####关注领域：LLM技术及应用、认知科学、决策规划、机器学习、提升生产率的技术方案等。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

广东台今日关注 · 广东21地市GDP全出炉！ · 9 小时前

开平广播电视台 · 新冷空气马上到！开平最低温降至→ · 2 天前

广东台今日关注 · 小米SU7在服务区被划破轮胎，60岁男子被当 ... · 2 天前

开平广播电视台 · 一家6口， 5人中招，近期高发！ · 3 天前

今天看啥 › 专栏 › 孔某人的低维认知

2024.5横向对比各家LLM的Long Context（128k篇）

孔某人的低维认知 · 公众号 · · 2024-05-26 17:09

文章预览

TLDR 本文构造了一个比大海捞针稍难的长上下文测试方案，并对比了目前支持128k以上的上下文的闭源API LLM模型。仅从这个很狭隘的测试来看，海外头部三家厂商在长上下文上还是领先于国内的。本文的测试代码框架已经开源，方便大家测试其他数据。本文没有得到任何厂商赞助，累计花了2700RMB充值各家平台。我也是有点测不起了。 Github地址： https://github.com/SomeoneKong/llm_long_context_bench202405/tree/bench_128k_v1 0、前言最近一段时间各家基座LLM爆发了一波更新，>=128k的long context能力已经逐渐普及。而目前对于long context的测试就只有大海捞针，其实大海捞针只是一个最简单的测试，理论上RAG的召回过程做好了也一样能解决。我也是看到别人转的一个测试之后有些手痒，所以尝试将其更完善一些，由此作为一个横向对比的方式，（希望国内各家基座LLM厂商 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

广东台今日关注 · 广东21地市GDP全出炉！

9 小时前

开平广播电视台 · 新冷空气马上到！开平最低温降至→

2 天前

广东台今日关注 · 小米SU7在服务区被划破轮胎，60岁男子被当场抓获！

2 天前

开平广播电视台 · 一家6口， 5人中招，近期高发！

3 天前

CityDiscount都市折扣 · 来了！【Tod's】豆豆鞋/服饰澳洲年中特卖预热开始

8 月前

中建八局 · 中建八局与三峡集团江苏分公司签署战略合作协议

6 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号