全网都在扒的DeepSeek团队，是清北应届生撑起一片天

量子位 · 公众号 · AI · 2025-01-04 13:08

主要观点总结

DeepSeek团队凭借超过Llama 3的开源模型DeepSeek-v3大模型在AI圈引起震动。团队成员年轻有才华，包括许多应届生和在读生。该团队注重模型算法和硬件工程的配合，具有独特的运作结构，类似于OpenAI的组织形态。团队成员在多个项目中表现出色，包括DeepSeek-V2、DeepSeekMath、DeepSeek-Prover等。

关键观点总结

关键观点1: DeepSeek团队发布超越Llama 3的开源模型DeepSeek-v3，震撼AI圈。

DeepSeek-v3是团队的重要突破，展示了他们在AI领域的实力。

关键观点2: DeepSeek团队成员以应届生和在读生为主，呈现年轻化特点。

许多团队成员在模型算法和硬件工程方面表现出色，展现了年轻人才的潜力。

关键观点3: DeepSeek注重模型算法和硬件工程的配合，具有独特的运作结构。

团队中有人重视软硬件协同的成果，使得团队能够以较低算力训练出高性能的模型。

关键观点4: DeepSeek与OpenAI有相似的用人理念和组织形态。

DeepSeek在用人方面重视能力和潜力，不拘泥于经验，与OpenAI有相似之处。

关键观点5: DeepSeek在多个项目中表现出色，包括DeepSeek-V2、DeepSeekMath、DeepSeek-Prover等。

这些项目展示了DeepSeek在AI领域的广泛能力和实力。

文章预览

梦晨西风发自凹非寺量子位 | 公众号 QbitAI DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama 3的开源模型，震撼了整个AI圈。紧接着，“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻，也使得人们把目光聚焦向 DeepSeek的人才。这下不只科技圈，全网都在好奇，连小红书上都有人发帖询问，这究竟是一只怎样的团队？国际上，也有人把创始人梁文锋的访谈翻译成英语，还加了注释，试图从中寻找这家公司崛起的蛛丝马迹。量子位整理各种资料发现，DeepSeek团队最大的特点就是年轻。应届生、在读生，特别是来自清北的应届生在其中非常活跃。他们中的一些人，2024年一边在DeepSeek搞研究，另一边新鲜热乎的博士学位论文刚评上奖。他们中有的参与了从DeepSeek LLM v1到DeepSeek-v3的全程，有的只是实习了一段时间也做出重要成果。为DeepSeek提 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 这篇论文揭示了 o1 类大语言模型在解决简单问题时过度思考的现象-20250105060018

昨天

量子位 · 全网都在扒的DeepSeek团队，是清北应届生撑起一片天

2 天前

黄建同学 · 测了Hedra的AI数字人（免费版），视频测了4个数字人，包括英-20250104085144

2 天前

爱可可-爱生活 · 【AuthorTrail：一键查看你在Git仓库中所有历史贡献的-20250103173402

3 天前

宝玉xp · 转发微博-20250103011810

4 天前

HACK之道 · 好用！找到一个帮师傅们接私活的神器

6 月前

国企求职 · 汇丰中国2024冬季实习生招募

2 月前

互联网思维 · 无知的代价（深度好文）

1 月前

思明快报 · 让“闽味”香飘万里！思明这家米其林餐厅，你吃过吗？

2 周前

思明快报 · 让“闽味”香飘万里！思明这家米其林餐厅，你吃过吗？

2 周前