专栏名称: 包包算法笔记
数据挖掘、机器学习、深度学习、Kaggle竞赛分享与交流。
今天看啥  ›  专栏  ›  包包算法笔记

突破大模型极限!GLM-4-long百万长文本模型上线bigmodel.cn

包包算法笔记  · 公众号  ·  · 2024-08-09 12:00

文章预览

最近业务上多了长文本的需求,因为要在prompt里面塞进比较多的rag内容,以供决策,且这些召回的内容,都有可能用到。这非常考验大模型的长文本能力,技术选型上都要着重考察这部分。 正巧,上次清影试用后,约了跟智谱的哥们吃饭聊天,吐槽说:“超长文本,有可能还要微调,这可咋办啊?” “你还别说,我还真搞过。” 说完,甩给我一个链接。 “链接对应的地址是bigmodel模型中心的 GLM-4-long 。支持支持高达1M (约150-200万字) 的上下文长度,大约相当于2本红楼梦或者125篇论文。” 然后跟我说,你先试试,我再跟你讲讲其中的几个技术关键点,说不定能用到你的场景呢。 “你先别吹牛,我用我的究极大模型长文测试方法看看”。 我准备的这个测试要比大海捞针更难。 大海捞针,比较出名了,也是一个被大家已经刷爆了的指标。就是在长文 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览