专栏名称: 孔某人的低维认知
孔某人低维认知中世界的投影,世界很复杂,但人的认知总是过于简单。 ####关注领域:LLM技术及应用、认知科学、决策规划、机器学习、提升生产率的技术方案等。
今天看啥  ›  专栏  ›  孔某人的低维认知

最近对LLM模型层的一些感受

孔某人的低维认知  · 公众号  ·  · 2024-10-08 20:10

文章预览

1、LLM模型生态的总体局势 6月之后无论国内还是国外,各家的进展都不大,只有到最近OpenAI才发了一波有些看点的feature,剩下大家大多是以降价为主。 国内的各家动静则比海外更小,虽然几家大厂都还在小步更新模型,但可能值得一提的只有qwen的闭源模型终于更新了,融合了qwen开源系列的能力,终止了自己的闭源模型落后于自己的开源模型的倒挂状态。 到9月份,OpenAI终于挤出了一些牙膏,能够让人追赶一波,但不知道会有哪些玩家去跟进这条线。对此我的判断是一反常态的,o1系列的方案是应该要去跟的,虽然它并不是万能药,但要说是不是要去做的话,模型层的团队还是要去做的。 在多模态输入方面,支持图像输入的VLM类模型在今年的进展相对显著,但从应用的角度来说,可用的方案仍然还很有限。这方面在未来的一年值得期待。 原生音频 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览