突破大模型极限！GLM-4-long百万长文本模型上线bigmodel.cn

包包算法笔记 · 公众号 · · 2024-08-09 12:00

文章预览

最近业务上多了长文本的需求，因为要在prompt里面塞进比较多的rag内容，以供决策，且这些召回的内容，都有可能用到。这非常考验大模型的长文本能力，技术选型上都要着重考察这部分。正巧，上次清影试用后，约了跟智谱的哥们吃饭聊天，吐槽说：“超长文本，有可能还要微调，这可咋办啊？” “你还别说，我还真搞过。” 说完，甩给我一个链接。 “链接对应的地址是bigmodel模型中心的 GLM-4-long 。支持支持高达1M (约150-200万字) 的上下文长度，大约相当于2本红楼梦或者125篇论文。” 然后跟我说，你先试试，我再跟你讲讲其中的几个技术关键点，说不定能用到你的场景呢。 “你先别吹牛，我用我的究极大模型长文测试方法看看”。我准备的这个测试要比大海捞针更难。大海捞针，比较出名了，也是一个被大家已经刷爆了的指标。就是在长文 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

康石石 · 艺术设计类中外合办机构/项目一览：

21 小时前

康石石 · 一汽-大众 | 2025校招、社招设计岗一览，附面经、作品集建议

21 小时前

康石石 · 升学就业全面禁止院校出身歧视？双非生源别高兴太早

21 小时前

青年志Youthology · 青推荐 | 北京酷儿艺术厂牌“环绕寺”11.29在伦敦首秀

昨天

青年志Youthology · 青推荐 | 北京酷儿艺术厂牌“环绕寺”11.29在伦敦首秀

昨天

中国上海国际艺术节 · “10后”与艺术的不期而遇｜“遇见大师·走近经典”濮存昕见面会及系列活动回顾

4 天前

中海外 · 尼泊尔能源、水资源和灌溉部联合部秘KALA NIDHI POUDYAL一行到访中海外

2 月前

盛和塾 · 报名游学丨线路⑥世界大会专场参会团（世界大会邀请函）

1 月前