专栏名称: newtype AI
分享关于AI的Why和How。
今天看啥  ›  专栏  ›  newtype AI

制约模型训练的,是带宽

newtype AI  · 公众号  ·  · 2024-10-28 17:18
    

主要观点总结

这篇文章分享了李沐的两篇文章,包括其创业一周年的反思和交大的演讲全文。文章涵盖了李沐关于创业、机器学习、深度学习、模型训练等方面的观点和经验,以及他的个人背景和职业成就。

关键观点总结

关键观点1: 李沐的创业反思和交大演讲内容

李沐分享了其创业一年的反思,包括自建与租卡的经验、吃AI螃蟹的挑战、通过创造价值来实现个体存在意义的观点等。在交大演讲中,他生动比喻机器学习与炼丹,并讨论了模型训练中的硬件挑战、数据的重要性以及AI对职业的影响等。

关键观点2: 李沐的职业生涯和学术成就

介绍了李沐的职业生涯,包括他在上海交通大学的学习经历、在百度和谷歌的工作经历、是深度学习框架MXNet的创始人之一等。他还积极参与AI普及工作,并在科技界享有极高的声誉。

关键观点3: 李沐的新公司Boson AI的聚焦点

李沐在2023年辞职开始创业,专注于大语言模型(LLM)的开发。他的新公司Boson AI致力于利用大语言模型提升产品和服务的效率。


文章预览

www.newtype.pro 分享两篇李沐的文章,一篇是他创业一周年的反思,一篇是他在交大的演讲全文。这两篇我都看了两遍,很有启发。 李沐创业一年反思:「我就是脑子抽了」] 李沐交大演讲全文:创业的动机要么来自欲望,要么来自恐惧 对我有启发的地方 创业反思 自建 vs 租卡:李沐的经验是,租卡三年等于自建。而且成本除了GPU,存储也是大头,训练数据存储都是10PB起跳。 帮助大公司做定制模型,使得Boson收支打平。 现阶段吃AI这个螃蟹,需要CEO非常有决断力,因为投入真的不低。 定制模型可以把成本做到调用API的十分之一,非常诱人。 而且定制模型在垂直领域强,通用能力其实也不弱。 个体存在的意义需要自我定义。 通过创造价值来自我实现,是一种途径。 交大演讲 一个生动的比喻:机器学习是老中医,深度学习特别是大语言模型像炼丹, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览