主要观点总结
文章主要讨论了量化机构在大模型领域的活动及大模型领域的发展状况。包括九坤成功复现DeepSeek-R1,发现语言混合降低推理能力等问题,宽则在智能学习实验室人才招聘上的动作,以及梁文锋和王琛的创业经历和大模型领域的发展阶段。
关键观点总结
关键观点1: 九坤成功复现DeepSeek-R1并发现新问题
九坤携手微软团队成功复现DeepSeek-R1,并首次发现语言混合会显著降低推理能力等问题。
关键观点2: 宽则在智能学习实验室人才招聘上的动作
宽则发布了智能学习实验室人才招聘通知,表明该实验室将朝着整个人工智能领域发展。
关键观点3: 梁文锋和王琛的创业经历与大模型领域的发展
梁文锋和王琛都是清华系创业人才,王琛的九坤进入大模型领域的原因包括量化本身需要算法支持以及拥有高性能芯片。王琛的创业经历和九坤的发展也反映了量化机构在大模型领域的活动。
关键观点4: 大模型领域的发展阶段
大模型领域虽好,但仍在发展的较早阶段,未来要看大模型和行业结合孕育而出的产品。投资机构在大模型领域的投资也需谨慎。
文章预览
作者 | 雷教授 来源 | 路边消息社 导 语:技术创新很难复制,否则,拥有技术的大模型六虎,怎么还在挣扎融资和降低成本中不可自拔? 这帮做量化的,捅了大模型的老巢了? 笔者了解到一个最新消息,梁文锋的幻方量化老对手、量化巨头九坤,携手微软团队成功复现DeepSeek-R1,还首次发现了语言混合(例如中英文夹杂)会显著降低推理能力等问题。 怎么又是做量化的? 这还没完,另一量化巨头宽则在2月24日发布了智能学习实验室人才招聘通知,宣称该实验室将朝着整个人工智能启航。 这真是量化人才捅了大模型的老巢? 笔者问了身边的投资人朋友,“难道以后要去量化机构投资大模型团队了?”一些关注AI领域的投资人的第一反应都是:什么?难道我们要找关系拜访王琛了? 一个评论一针见血:见不到梁文锋,还见不到王琛吗? 这个评
………………………………