文章预览
最近各家模型发的都挺勤,一会一个 SOTA,一会一个遥遥领先。 可能有不少朋友有点「审美疲劳」,但我还是乐在其中的。 加上不是赶上了「价格战」嘛,我就经常去各家开发平台逛逛。 一是为了研究下定价,二是想测试下各种模型能力,是不是像宣传的那么 NB. 这不,前几天「智谱」不是搞了个 DemoDay,看到好多家公司都用智谱的大模型,所以就来智谱 AI 开放平台(bigmodel.cn) 上看看,智谱的模型现在到底搞的咋样了。 结果不看不知道,一看就发现了大的。 智谱 AI 开放平台上, 竟然悄无声息的发了个长文本模型, 还是 100 万 Token 上下文长度的那种 。 什么概念?现在主流的模型基本上都在 128k 这个量级上。根据 36 氪 6 月的一期报道,“ 1M token 的上下文窗口,意味模型 能同时处理 200 万字的输入 ,大概相当于 2 本红楼梦或者 125 篇论文的
………………………………