专栏名称: 我不是Hacker
漏洞情报,漏洞靶场,漏洞复现,安全技术分享,开发技术交流。安全,开发两手抓!
今天看啥  ›  专栏  ›  我不是Hacker

中国大模型「顶流群聊」笔记内容简读

我不是Hacker  · 公众号  ·  · 2023-09-03 20:41
文章来自极客公园,原文比较长,对关键部分进行了摘抄,文章汇总了当下大模型领域明星从业者的一些观点1、算力短缺是个长期。这方面的公司/渠道,会有商业价值。2、李开复认为:Infra(硬件底层)团队必须比 Modelling(模型)团队还要强大。他说很快大家就会发现,做过大模型 Infra 的人比做大模型的人还要贵、更稀缺;而会做 Scaling Law(扩展定律,模型能力随着训练计算量增加而提升)的人比会做大模型 Infra 的人更稀缺。3、李开复就指出,大模型团队每一个位置都要有人才,Pre Train(预训练)、Post Train(训练后)、Multi-Modal(多模态),Scaling Up(可扩展性),Inference(推理)等等都有其重要性。其中,Infra 团队这部分人才更稀缺,更应该被重视。4、李开复就指出,尽管在跟 GPT-3、GPT3.5 等 SOTA(state of the art,先进)模型的各种评比中,Llam ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照