整理自然语言处理、推荐系统、搜索引擎等AI领域的入门笔记,论文学习笔记和面试资料(关于NLP那些你不知道的事、关于推荐系统那些你不知道的事、NLP百面百搭、推荐系统百面百搭、搜索引擎百面百搭)
今天看啥  ›  专栏  ›  关于NLP那些你不知道的事

DeepSeek-R1 之后:工程曙光、学术地狱

关于NLP那些你不知道的事  · 公众号  ·  · 2025-02-08 07:00
    

文章预览

DeepSeek-R1 之后:工程曙光、学术地狱 作者:PeLi 原文:https://zhuanlan.zhihu.com/p/21569724414 DS-R1 发布之后整个春节每天都有 DeepSeek  的新闻和评论,亲戚朋友随便一个不懂 AI 的人都在讨论我们给了美利坚怎样一记重击。但所谓太阳之下无新事,NeurIPS 24 能收到一万五千篇投稿,全世界能冒出成百上千家 AI 公司,加上在搞 AI 的主要就是中美,那中美谁走出这一步都不奇怪。世上发生的一切都有历史的影子。 我们回过头来看 14 年的视觉 AI 可以发现一个与 LLM  极其相似的演化路线: 算法突破提供新的理论框架 AlexNet (2012)、VGG (2013) SDPA Transformer  (2017) 基本工程化提升实验效率 Caffe (2014) HF transformers (2019)、Triton (2021) 大规模 Scale up  提升模型能力 ResNet (2015)、DenseNet (2016) GPT-3 (2020)、Llama (2023) 进一步工程化降低训练推理成本 PyTorch (2016)、TVM (2018) flash-attn  (2 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览